Apple, Nvidia y Anthropic han utilizado subtítulos para miles de vídeos desde

April que usar los videos de la plataforma para entrenar modelos y herramientas de inteligencia artificial es una violación de las políticas de la plataforma.

MADRID, 17 de julio (Portaltic/EP) –

Empresas tecnológicas como Apple, Nvidia y Anthropic utilizaron la base de datos EleutherAI , que contiene grabaciones de más de 173.500 vídeos de YouTube, para entrenar inteligencia artificial (IA), en contra de las reglas de la plataforma de Google y sin el permiso de los creadores de la plataforma. April que usar los videos de la plataforma para entrenar modelos y herramientas de inteligencia artificial es una violación de las políticas de la plataforma. Se refería a los supuestos usos que OpenAI pudo haber hecho con Sora, una IA que genera imágenes de vídeo realistas a partir de instrucciones escritas. Posteriormente, Mohan explicó que se debió a un mal uso porque los creadores del contenido decidieron publicar el vídeo. en YouTube esperan que su trabajo esté protegido por los términos de servicio.

Independientemente de las políticas de la plataforma, esto parece ser una práctica común, como muestra un nuevo estudio de Proof News. En este caso, empresas de tecnología líderes, incluidas Apple, Nvidia, Salesforce y Anthropic, entrenaron su IA con grabaciones de miles de videos de YouTube.

No visitarán, son directos, sino más bien. gracias a la base de datos proporcionada por la empresa EleutherAI, en la que el citado medio encontró grabaciones de 173.536 vídeos de YouTube, de más de 48.000 canales, de autores como MIT, Harvard, Wall Street Journal, BBC, MrBeast y PewDiePie, entre otros. .

Aunque la base de datos no incluye imágenes sino sólo el texto de los vídeos -es decir, subtítulos y traducciones a otros idiomas-, los datos se recopilarán y utilizarán para entrenar la IA sin el permiso de sus autores. como informó Proof News.

Salesforce y Anthropic confirmaron al medio antes mencionado el uso de la base de datos EleutherAI, que en realidad forma parte de una colección más grande llamada “Stack” y que también contiene documentos del Parlamento Europeo. Wikipedia en inglés y correos electrónicos corporativos de empleados de Enron se hicieron públicos como parte de una investigación federal en los Estados Unidos. Gran parte de este repositorio está disponible públicamente y también lo utilizan académicos e investigadores.

Sobre el Autor

TRA Noticias

Te interesara ver

Eddy Alcántara destaca RD se ha convertido en referente regional en tecnología para protección de consumidores

La IA facilitará los viajes personalizados, promete el director de Booking

Nobel de Economía francés: la IA destruirá empleos, pero acabará creando crecimiento económico

Sobre el Autor

TRA Noticias