A Nvidia, gigante norte-americana de semicondutores, anunciou recentemente que apoiará o desenvolvimento de inteligência artificial generativa orientada por dados em japonês, expandindo seu serviço de suporte ao desenvolvimento de IA empresarial. Esse suporte abrangerá grandes modelos de linguagem (LLMs) treinados em dados japoneses, fornecidos pelo Instituto de Tecnologia de Tóquio e pelo Grupo Rakuten. Essa iniciativa faz parte de um esforço mais amplo de várias nações para desenvolver inteligência artificial soberana, usando sua própria infraestrutura, dados e redes comerciais, para garantir que os sistemas de IA se alinhem aos valores, leis e interesses locais.
A decisão da Nvidia de expandir seu serviço de suporte para incluir modelos de linguagem treinados no Japão é vista como mais um passo para ajudar o Japão a proteger sua infraestrutura crítica e fortalecer sua competitividade industrial sem depender de outros países para obter dados ou recursos humanos. A medida também foi projetada para melhorar a segurança econômica nacional depois que o iene sofreu quedas históricas no início deste ano.
O CEO da Nvidia, Jensen Huang, enfatizou em março de 2024 a importância de o Japão desenvolver sua própria IA generativa, evitando a dependência de terceiros que possam coletar dados japoneses, criar IA com eles e depois reintroduzi-los no país. "Não há razão para permitir que algum outro terceiro colete esses dados (do Japão), crie uma IA e depois a importe de volta para o Japão", disse Huang, enfatizando a necessidade de preservar a soberania dos dados no desenvolvimento tecnológico.
Microsserviços NIM da Nvidia
Em apoio a esses esforços, a Nvidia lançou quatro novos microsserviços NIM (Nvidia Inference Model) que permitem aos desenvolvedores criar e implantar aplicativos de IA generativa de alto desempenho com mais facilidade. Esses microsserviços oferecem suporte a modelos comunitários populares, adaptados para atender às necessidades regionais, melhorando a interação do usuário por meio de uma compreensão mais precisa e respostas aprimoradas com base nos idiomas locais e na herança cultural.
Entre os modelos disponíveis estão o Llama-3-Swallow-70B, treinado com dados japoneses, e o Llama-3-Taiwan-70B, treinado com dados em mandarim. Esses modelos regionais não apenas fornecem uma compreensão mais profunda das leis e regulamentações locais, mas também refletem melhor os costumes e as normas culturais. O Instituto de Tecnologia de Tóquio, por exemplo, ajustou com precisão o modelo Llama-3-Swallow 70B usando dados japoneses, permitindo uma adaptação mais precisa aos aplicativos locais.
Além disso, a família de modelos 7B da RakutenAI, criada com base no modelo Mistral-7B, foi treinada com conjuntos de dados em inglês e japonês e está disponível como dois microsserviços NIM diferentes para Chat e Instruct. Esses modelos alcançaram pontuações líderes entre os grandes modelos de idioma japonês, obtendo a maior média no benchmark LM Evaluation Harness realizado entre janeiro e março de 2024.
Mercado asiático e global
De acordo com a empresa de pesquisa de mercado ABI Research, espera-se que a receita de software de IA geradora na região Ásia-Pacífico atinja US$ 48 bilhões até 2030, um aumento significativo em relação aos US$ 5 bilhões deste ano. A Nvidia está buscando se beneficiar desse crescimento, aumentando as vendas de seus serviços na região.
Nesse contexto, a Nvidia AI Foundry é uma plataforma essencial para que as empresas personalizem e implantem modelos de IA adaptados a seus processos de negócios e experiência. Ao fornecer um conjunto completo de ferramentas, incluindo modelos básicos populares, a plataforma Nvidia NeMo para ajuste fino e capacidade dedicada na nuvem DGX da Nvidia, os desenvolvedores podem criar modelos personalizados empacotados como microsserviços NIM, garantindo resultados cultural e linguisticamente adequados.
A iniciativa da Nvidia de apoiar o desenvolvimento de IA generativa em japonês não apenas fortalece a posição do Japão na arena tecnológica global, mas também estabelece um precedente para outras nações que buscam desenvolver IA soberana. Países como Cingapura, Emirados Árabes Unidos, Coreia do Sul, Suécia, França, Itália e Índia já estão investindo em infraestrutura de IA soberana, e a disponibilidade de novos microsserviços NIM facilita a implementação de modelos de idioma nativo em seus próprios ambientes por empresas, agências governamentais e universidades.