Tecnologia

Apple, Nvidia y Anthropic han utilizado subtítulos para miles de vídeos desde

8229711303.png
8229711303.png
April que usar los videos de la plataforma para entrenar modelos y herramientas de inteligencia artificial es una violación de las políticas de la plataforma.

MADRID, 17 de julio (Portaltic/EP) –

Empresas tecnológicas como Apple, Nvidia y Anthropic utilizaron la base de datos EleutherAI , que contiene grabaciones de más de 173.500 vídeos de YouTube, para entrenar inteligencia artificial (IA), en contra de las reglas de la plataforma de Google y sin el permiso de los creadores de la plataforma. April que usar los videos de la plataforma para entrenar modelos y herramientas de inteligencia artificial es una violación de las políticas de la plataforma. Se refería a los supuestos usos que OpenAI pudo haber hecho con Sora, una IA que genera imágenes de vídeo realistas a partir de instrucciones escritas. Posteriormente, Mohan explicó que se debió a un mal uso porque los creadores del contenido decidieron publicar el vídeo. en YouTube esperan que su trabajo esté protegido por los términos de servicio.

Independientemente de las políticas de la plataforma, esto parece ser una práctica común, como muestra un nuevo estudio de Proof News. En este caso, empresas de tecnología líderes, incluidas Apple, Nvidia, Salesforce y Anthropic, entrenaron su IA con grabaciones de miles de videos de YouTube.

No visitarán, son directos, sino más bien. gracias a la base de datos proporcionada por la empresa EleutherAI, en la que el citado medio encontró grabaciones de 173.536 vídeos de YouTube, de más de 48.000 canales, de autores como MIT, Harvard, Wall Street Journal, BBC, MrBeast y PewDiePie, entre otros. .

Aunque la base de datos no incluye imágenes sino sólo el texto de los vídeos -es decir, subtítulos y traducciones a otros idiomas-, los datos se recopilarán y utilizarán para entrenar la IA sin el permiso de sus autores. como informó Proof News.

Salesforce y Anthropic confirmaron al medio antes mencionado el uso de la base de datos EleutherAI, que en realidad forma parte de una colección más grande llamada “Stack” y que también contiene documentos del Parlamento Europeo. Wikipedia en inglés y correos electrónicos corporativos de empleados de Enron se hicieron públicos como parte de una investigación federal en los Estados Unidos. Gran parte de este repositorio está disponible públicamente y también lo utilizan académicos e investigadores.

TRA Digital

GRATIS
VER