A NVIDIA, amplamente reconhecida por seu domínio em hardware de inteligência artificial graças a suas poderosas GPUs, como a H100 e a nova B200, decidiu entrar também na competitiva arena do software. Tradicionalmente, a NVIDIA lidera a infraestrutura de data center, mas agora está buscando competir no desenvolvimento de modelos de linguagem ampla (LLM). A empresa anunciou seu próprio LLM, batizado de NVLM 1.0, uma família de modelos que se destacam em visão e linguagem.
NVLM 1.0: Um novo modelo multimodal
O NVLM 1.0 é um conjunto de modelos multimodais que, de acordo com a NVIDIA, compete diretamente com grandes nomes do setor, como GPT-4 e Llama 3. O modelo mais proeminente dessa família é o NVLM-D-72B, que apresenta 72 bilhões de parâmetros e demonstrou excelente desempenho em tarefas de visão e linguagem, superando até mesmo o Llama 3 405B em determinados testes, apesar de ser um modelo mais compacto. Um dos aspectos mais interessantes do NVLM 1.0 é sua natureza de código aberto. A NVIDIA planeja liberar os pesos e o código usados para treinar o modelo, facilitando a adaptação e a aplicação do modelo pelos desenvolvedores em seus próprios projetos. Essa abordagem se alinha com a tendência de fornecer recursos abertos, como a Meta fez com o Llama, permitindo maior acessibilidade e flexibilidade no uso da inteligência artificial.
Um modelo versátil para várias aplicações
O NVLM-D-72B tem recursos multimodais que permitem interpretar entradas visuais e textuais. Ele pode analisar imagens, resolver problemas matemáticos passo a passo e até mesmo interpretar memes, o que o torna particularmente versátil. A NVIDIA explicou que o modelo usa técnicas avançadas, como OCR, raciocínio e conhecimento do mundo para obter uma análise abrangente das entradas. A entrada da NVIDIA na arena do software de IA é um novo marco para a empresa. Ao oferecer seu modelo abertamente, a empresa está se posicionando como um concorrente sério de outros gigantes da IA, com uma alternativa atraente para desenvolvedores e especialistas que buscam soluções mais acessíveis e poderosas.