Nvidia, una de las compañías más destacadas en el ámbito de la tecnología, ha sido señalada por realizar scraping de contenido de plataformas como YouTube y Netflix para entrenar sus modelos de inteligencia artificial. Esta técnica, que consiste en extraer información de sitios web mediante software especializado, ha sido usada por Nvidia para avanzar en diversos proyectos comerciales, según un informe de 404 Media.
Proyecto Cosmos
De acuerdo con 404 Media, Nvidia lleva a cabo estas prácticas bajo un proyecto interno conocido como Cosmos. Este proyecto tiene como objetivo entrenar múltiples sistemas de IA, incluyendo el generador de mundos 3D Omniverse, sistemas de conducción autónoma y "humanos digitales". La información filtrada proviene de conversaciones internas, correos electrónicos y documentos de la compañía.
Un antiguo empleado de Nvidia reveló que la empresa instó a sus trabajadores a extraer videos de Netflix, YouTube y otras fuentes, como la plataforma MovieNet y bibliotecas internas de videojuegos, con el fin de entrenar sus modelos de IA. Se les aseguró que contaban con la autorización para utilizar dicho contenido, lo que ha generado controversia en torno a posibles violaciones de derechos de autor.
Para llevar a cabo el scraping, Nvidia utilizó herramientas como el descargador de videos de código abierto 'yt-dlp' y máquinas virtuales que cambiaban direcciones IP, evitando así ser bloqueados por las plataformas afectadas.
Preocupaciones legales
Pese a las inquietudes de algunos empleados sobre la legalidad del proyecto Cosmos, los directores de Nvidia insistieron en que tenían autorización para usar el contenido. En un comunicado, la empresa subrayó que respeta los derechos de los creadores y que sus modelos cumplen con las leyes de derechos de autor. Nvidia argumenta que las leyes de propiedad intelectual protegen expresiones específicas, no los datos o la información en sí, y que el uso justo permite transformar trabajos para entrenar modelos de IA.
Netflix ha rechazado cualquier acuerdo con Nvidia para el uso de sus contenidos, señalando que sus términos de servicio prohíben el scraping. Por su parte, YouTube también expresó su disconformidad, recordando las declaraciones de su CEO, Neal Mohan, quien afirmó que la utilización de videos para entrenar IA es una "clara violación" de sus políticas.