O setor de IA é um espaço em constante expansão. Toda semana, novas ferramentas, dispositivos ou grandes modelos de linguagem (LLMs) são introduzidos na sociedade, revelando uma nova vantagem na vida cotidiana em que a inteligência artificial pode ser útil. No entanto, a criação dessas megaestruturas de software requer uma base de hardware robusta, que não é conhecida por ser barata.
Por isso, a Nvidia, famosa por seus chips e placas de vídeo, é hoje uma das empresas mais valiosas do mundo. A empresa, que oferece hardware de ponta, como seus mais recentes chips H100, tornou-se a principal fornecedora (e, portanto, o gargalo) dessa tecnologia, que é vendida a gigantes da tecnologia como Apple, OpenAI e Amazon para que possam processar os dados usados para treinar seus LLMs mais poderosos e famosos.
Tudo isso fez com que, nos últimos anos, o valor da Nvidia não parasse de crescer em um ritmo vertiginoso, até mesmo insano. As ações da empresa subiram 149% até agora neste ano, tornando-a a segunda ação com melhor desempenho no S&P 500 (SPY) no momento. Ao mesmo tempo, no segundo trimestre deste ano fiscal, a empresa registrou receitas recordes de US$ 30 bilhões, acima dos US$ 28,86 bilhões esperados. Isso representa um aumento de 122% em comparação com o mesmo período em 2023, bem como um aumento de 15% em comparação com o primeiro trimestre.
Diante de números como esses, muitos de nós nos perguntamos qual será o futuro da empresa, para onde ela irá com tanta solvência financeira. Depois de ver os movimentos desse galeão tecnológico, a partir da Insights podemos ver para onde a Nvidia está virando o leme, e é que não só quer dominar o hardware, mas está indo em direção a um mar até então desconhecido para eles, o software.
O modelo de linguagem NVLM 1.0
Em setembro deste ano, a Nvidia lançou seu modelo de IA de código aberto que promete rivalizar com sistemas avançados de empresas como OpenAI e Google, o NVLM 1.0. Ele é capaz de gerar descrições detalhadas de imagens, entender o humor dos memes e executar tarefas complexas de codificação. A variante mais avançada, o NVLM-D-72B, lida com 72 bilhões de parâmetros e compete diretamente com modelos de grande escala, como o GPT-4 e o Llama 3.
O desenvolvimento do NVLM 1.0 se destaca por sua capacidade de processar simultaneamente texto e imagens, realizando tarefas complexas como reconhecimento óptico de caracteres (OCR), raciocínio e geração de instruções passo a passo para problemas matemáticos. A empresa também enfatizou a importância da qualidade e da diversidade dos dados usados para treinar esse modelo, além da simples escala dos dados.
Em nossa opinião, o recurso mais notável desse anúncio é que o NVLM 1.0 está disponível sob padrões de código aberto, o que permite que ele seja usado, modificado e distribuído livremente. Isso segue uma dinâmica em que empresas como a Meta estão liderando o caminho (pelo menos em termos de seus avanços tecnológicos LLM) e beneficia desenvolvedores menores e independentes.
O software de videogame
A Nvidia não está apenas seguindo os passos das grandes empresas de tecnologia ao desenvolver seus próprios LLMs, mas também está procurando avançar o software de seu outro grande mercado, o de videogames. Os chips da Nvidia não são sua fonte de renda mais famosa, mas competem com o outro hardware que ela domina, o das placas gráficas. Esses componentes de computador são vitais para jogar os videogames mais poderosos, e alguns dos modelos mais recentes têm até mesmo aprimoramentos de IA para melhorar o desempenho gráfico.
Mas o negócio de software não está apenas aí, mas na implementação de ferramentas de IA no desenvolvimento de videogames.
Por exemplo, a Nvidia criou a Machinima, uma plataforma que oferece aos usuários ferramentas para criar animações usando gráficos avançados em tempo real, principalmente com a tecnologia das placas de vídeo da Nvidia. Seu objetivo é a geração de conteúdo baseado em jogos, usando o poder da inteligência artificial e da simulação em tempo real. Isso facilita a produção de filmes sem a necessidade de equipamentos técnicos sofisticados ou a intervenção de estúdios profissionais.
Também é relevante o recente anúncio de suas novas ferramentas para desenvolvimento de jogos no Unreal Engine 5 (mecanismo gráfico), apresentadas durante o Unreal Fest Seattle 2024. Esses complementos foram projetados para facilitar a criação de personagens MetaHuman realistas e otimizar a integração da IA no desenvolvimento de jogos. Os principais novos recursos incluem:
Audio2Face-3D: Esse plug-in sincroniza os lábios e anima as expressões faciais dos personagens MetaHuman usando IA, proporcionando realismo nas animações no Unreal Engine 5.
Nemotron-Mini 4B: Permite a geração de respostas interativas em diálogos com personagens, melhorando a fluidez e a naturalidade das interações nos jogos.
RAG (Augmented Generation Retrieval): Aprimora a interação com o personagem ao fornecer informações contextuais, enriquecendo as respostas e ações no jogo.
Além disso, a NVIDIA integrou sua tecnologia ao Autodesk Maya por meio de um plug-in de animação facial baseado em áudio, o que facilita um fluxo de trabalho mais simplificado entre o Maya e o Unreal Engine 5. A empresa também anunciou um microsserviço de renderização que permite o streaming de alta qualidade de personagens MetaHuman em qualquer dispositivo via WebRTC.
Por fim, outro serviço que gostaríamos de destacar é o GeForce Now, uma espécie de "netflix dos videogames" que permite jogar títulos comprados em plataformas como Steam ou Epic Games Store a partir da nuvem. Isso elimina a necessidade de hardware potente, pois os jogos são executados nos servidores da NVIDIA e transmitidos para seu dispositivo. A assinatura da RTX 3080 permite jogos de 1440p e 120 FPS com Ray Tracing ativado, proporcionando uma experiência de jogo de alta qualidade sem a necessidade de um PC potente.