Kyutai, uma startup francesa, lançou um assistente avançado de IA chamado Moshi, estabelecendo um novo padrão em IA de conversação em tempo real. Lançado em julho de 2024, esse novo assistente desafia o domínio do Vale do Silício nos EUA, oferecendo novos recursos no desenvolvimento da comunicação de IA.

A startup foi fundada em novembro de 2023 com um investimento de 300 milhões de euros e apresentou o Moshi para mostrar a competitividade da Europa no desenvolvimento de IA. O assistente de IA, capaz de processar e gerar áudio e texto simultaneamente, opera com uma latência de apenas 200 milissegundos, consideravelmente menor do que outros sistemas líderes.

Tecnologia

Moshi usa um modelo de linguagem chamado Helium, composto de 7 bilhões de parâmetros, para oferecer interações em tempo real. Ele foi treinado com 100.000 conversas sintéticas e 20 horas de áudio de uma atriz de voz. O Moshi pode expressar 70 emoções e estilos diferentes, proporcionando uma experiência de interação com nuances e semelhante à humana.

A startup conta com o apoio de figuras proeminentes, como Xavier Niel, fundador da Iliad, e Rodolphe Saadé, CEO da CMA CGM.

O compromisso da Kyutai com o desenvolvimento de código-fonte aberto a diferencia. A empresa planeja abrir o código-fonte de seu modelo de linguagem, codec de áudio e toda a pilha de tecnologia, convidando à colaboração - assim como o Sentient Labs - e à inovação global. Essa transparência atende a preocupações éticas e incentiva avanços orientados pela comunidade.

O surgimento da Moshi destaca o papel da Europa na formação do futuro tecnológico. A startup planeja aperfeiçoar o Moshi com base no feedback e nas interações dos usuários, com as versões 1.1, 1.2 e 2.0 já em desenvolvimento.

O Moshi foi projetado para ser executado em dispositivos padrão, como laptops e telefones celulares, sem depender de servidores externos. Esse capacidade de processamento no dispositivo enfatiza a privacidade e a segurança, pois os dados confidenciais não precisam ser transmitidos pela Internet. Isso torna o Moshi altamente acessível e prático para o uso diário, integrando-se perfeitamente a uma variedade de dispositivos e plataformas.