Apple firma con Shutterstock un acuerdo de entre 25 y 50 millones de dólares para entrenar su mod...

Apple ha llegado a un acuerdo con Shutterstock, un repertorio de imágenes, fotos, videos y música, para licenciar su contenido y entrenar un modelo de inteligencia artificial (IA), según informa Reuters. De esta forma los de Cupertino se suman al creciente número de compañías que firman alianzas con proveedores de contenido para acceder a grandes cantidades de datos con el objetivo de alimentar sus sistemas de IA. La existencia de este pacto también es un nuevo testimonio de que Apple trabaja en un modelo de IA.

Reuters añade que antes de Apple otras compañías como Meta, Google y Amazon han llegado a acuerdos de licencia Shutterstock para tener acceso a los cientos de millones de imágenes, vídeos y archivos de música que almacena en su biblioteca. No hay detalles sobre el importe exacto del trato, pero Jarrod Yahes, director financiero de Shutterstock, ha confirmado que este tipo de acuerdos iniciales con empresas tecnológicas oscilan entre los 25 y 50 millones de dólares cada uno, y que la mayoría se amplían con el tiempo.

Las compañías que desarrollan y entrenan sistemas de IA como OpenAI, Google o Meta no siempre son claros sobre la procedencia de los datos que usan para entrenarlos. Estos grandes modelos de lenguaje (LLM, por sus siglas en inglés) necesitan una cantidad muy generosa de datos y no basta con la información pública que hay en Internet. Hace pocos días The New York Times informaba que OpenAI entrenaba GPT, uno de los modelos más avanzados a día de hoy, con transcripciones de vídeos de YouTube, algo que iría en contra de las políticas de la plataforma propiedad de Google, según su director ejecutivo Neal Mohan.

¿Cuánto vale el contenido para entrenar una IA? Reuters ha hablado con decenas de personas con conocimiento de este tipo de acuerdos y descubierto que el precio puede variar en función del contenido y del comprador. Por ejemplo, Daniela Braga, directora ejecutiva de la empresa de datos de IA Defined.ai, dice que las compañías suelen pagar entre 1 y 2 dólares por imagen, entre 2 y 4 dólares por un vídeo de corta duración y entre 100 y 300 dólares por cada hora de vídeo largo, mientras que las tarifas por texto rondan los 0,001 dólares por palabra.

Actualmente estamos asistiendo a una carrera armamentista para desarrollar el sistema de IA más avanzado, una situación que ha llevado a los gigantes tecnológicos como Google, Meta, Microsoft, OpenAI y Apple a cosechar datos por Internet como si no hubiera un mañana. En la red hay mucho contenido público, pero que un texto, imagen o vídeo esté a disposición de cualquiera no significa que no esté protegido por los derechos de autor. Los desafíos legales ya han llegado como demuestra la demanda que The New York Times presentó contra OpenAI y Microsoft por usar sin autorización su contenido para entrenar a ChatGPT.

Este tipo de acuerdos parece que no dejan de crecer. Freepik, un competidor de Shutterstock, dice a Reuters que ha llegado a tratos con dos grandes empresas tecnológicas para licenciar una parte de su archivo de imágenes y que hay cinco acuerdos similares en tramitación. Por su parte, OpenAI tiene alianzas con Associated Press, Axel Springer y Prisa (El País), Google paga 60 millones de dólares al año para tener acceso a su API de datos, mientras que Thomson Reuters, propietaria de Reuters, también ha reconocido tener acuerdos con los que licencia sus noticias para entrenar modelos de lenguaje.

Fuente: venturebeat
Da mal rollo eso de "entrenar" a una IA...
Pronto se van a llenar de basura. Una vez más, creo que un gran avance tecnológico tendrá un enfoque erróneo. En vez de proporcionarle todo tipo de contenido de la más diversa índole y hacer un enfoque pensando en el bienestar de las personas, lo que se le entregue para que aprenda será parcial y buscando siempre el interés comercial como punto más importante. Aunque es previsible, para qué nos vamos a engañar.
Poco dinero me parece... siendo Apple y con lo que está predominando todo el tema de IA...
Si todos entrenan con lo mismo, sus IA serán bastante similares en cuanto a resultados.
Mejor pagar, que luego aparece la marca de agua como pasó con Getty Images. [carcajad]
¿y les darán algo a los dueños de las imágenes alojadas en Shutterstock?
altbrian escribió:¿y les darán algo a los dueños de las imágenes alojadas en Shutterstock?

Ni las gracias.
neofonta escribió:
altbrian escribió:¿y les darán algo a los dueños de las imágenes alojadas en Shutterstock?

Ni las gracias.

Creo que si subes una imagen pierdes automaticamente todos los derecho y el sitio donde la subiste puede hacer lo que quiera con ella sin que tu veas ni un duro.
altbrian escribió:¿y les darán algo a los dueños de las imágenes alojadas en Shutterstock?

¿Y por qué te iban a dar algo? Léete la cláusula y verás de quién es y quién puede hacer lo que quiera con esas imágenes. Es su plataforma y sus normas.
Todo el trabajo artístico de media humanidad dedicado a alimentar a las inteligencias artificiales que comprometerán el futuro inmediato de los mismos.

Vaya movida.
Espera un momento, pero no estaban en tratos con Google para este menester?
JohnLeeHooker escribió:
altbrian escribió:¿y les darán algo a los dueños de las imágenes alojadas en Shutterstock?

¿Y por qué te iban a dar algo? Léete la cláusula y verás de quién es y quién puede hacer lo que quiera con esas imágenes. Es su plataforma y sus normas.


Porque shutterstock es una plataforma en la que los usuarios venden sus imágenes, no es el facebook de mi tía Pepi. Si yo entro ahora a shutterstock y compro una imagen, el propietario de la imagen se lleva un porcentaje de la venta, por lo que la pregunta es bastante válida.

No sé si te has leído las cláusulas de shutterstock, pero dice claramente que eres el propietario de los derechos, aunque ellos pueden licenciarlo en tu nombre. Es decir, que sí, que cualquier imagen que le vendan a Apple es en nombre de los propietarios de los derechos de esas imágenes, y por tanto se van a llevar su parte.

Copyright gives the author(s) of a creative work the exclusive right to display, reproduce, distribute, and financially benefit from the work they create. As a Shutterstock contributor you retain full copyright ownership of your content, but you allow Shutterstock to license the content on your behalf.


Fuentes:
https://support.submit.shutterstock.com ... uage=en_US
La nueva burbuja, los bancos de datos.
Espero que estén metiendo bastante mas dinero que eso si no quieren quedarse atrás. La IA lo va a cambiar todo igual que lo hizo internet en su día y el que no sepa adaptarse desaparecerá.
14 respuestas