A Nvidia, uma das principais empresas de tecnologia do mundo, foi acusada de extrair conteúdo de plataformas como YouTube e Netflix para treinar seus modelos de inteligência artificial. A técnica, que envolve a extração de informações de sites usando software especializado, foi usada pela Nvidia para avançar em vários projetos comerciais, de acordo com um relatório da 404 Media.
Ao mesmo tempo, a Nvidia tem usado a técnica para treinar seus modelos de inteligência artificial.
Projeto Cosmos
De acordo com a 404 Media, a Nvidia realiza essas práticas em um projeto interno conhecido como Cosmos. Esse projeto visa treinar vários sistemas de IA, incluindo o gerador de mundos 3D Omniverse, sistemas de direção autônoma e "humanos digitais". As informações vazadas são provenientes de conversas internas, e-mails e documentos da empresa.
Um ex-funcionário da Nvidia revelou que a empresa instruiu seus funcionários a extrair vídeos da Netflix, do YouTube e de outras fontes, como a plataforma MovieNet e bibliotecas internas de videogames, para treinar seus modelos de IA. Eles foram assegurados de que tinham permissão para usar esse conteúdo, o que gerou controvérsia sobre possíveis violações de direitos autorais.
Eles foram assegurados de que tinham permissão para usar esse conteúdo, o que gerou controvérsia sobre possíveis violações de direitos autorais.
Para realizar a raspagem, a Nvidia usou ferramentas como o downloader de vídeo de código aberto 'yt-dlp' e máquinas virtuais que mudaram os endereços IP, evitando assim serem bloqueadas pelas plataformas afetadas.
Preocupações legais
Apesar das preocupações de alguns funcionários sobrea legalidade do projeto Cosmos, os diretores da Nvidia insistiram que tinham permissão para usar o conteúdo. Em um comunicado, a empresa enfatizou que respeita os direitos dos criadores e que seus modelos estão em conformidade com as leis de direitos autorais. A Nvidia argumenta que as leis de propriedade intelectual protegem expressões específicas, não os dados ou as informações em si, e que o uso justo permite que as obras sejam transformadas para treinar modelos de IA.
A Nvidia argumenta que as leis de direitos autorais protegem expressões específicas, não os dados ou as informações em si, e que o uso justo permite que as obras sejam transformadas para treinar modelos de IA.
A Netflix rejeitou qualquer acordo com a Nvidia para o uso de seu conteúdo, observando que seus termos de serviço proíbem a raspagem. O YouTube também expressou sua discordância, lembrando as declarações de seu CEO, Neal Mohan, que disse que usar vídeos para treinar IA é uma "clara violação" de suas políticas.