Kyutai, una startup francesa, ha lanzado un asistente de Inteligencia Artificial avanzado llamado Moshi, estableciendo un nuevo estándar en la IA conversacional en tiempo real. Lanzado en julio de 2024, este nuevo asistente desafía el dominio estadounidense de Silicon Valley al ofrecer nuevas capacidades en el desarrollo de la comunicación con la IA.

La startup fue fundada en noviembre de 2023 con una inversión de 300 millones de euros y presentó Moshi para mostrar la competitividad de Europa en el desarrollo de IA. El asistente de IA, capaz de procesar y generar audio y texto simultáneamente, opera con una latencia de solo 200 milisegundos, considerablemente inferior a otros sistemas líderes.

 

Tecnología

Moshi utiliza un modelo de lenguaje llamado Helium, compuesto por 7 mil millones de parámetros, para ofrecer interacciones en tiempo real. Ha sido entrenado con 100.000 conversaciones sintéticas y 20 horas de audio de una actriz de voz. Moshi puede expresar 70 emociones y estilos diferentes, proporcionando una experiencia de interacción matizada y similar a la humana.

La startup cuenta con el respaldo de figuras prominentes como Xavier Niel, fundador de Iliad, y Rodolphe Saadé, CEO de CMA CGM. Eric Schmidt, ex presidente ejecutivo de Google, y Patrick Pérez, CEO de Kyutai, aportan una vasta experiencia y credibilidad al proyecto.

El compromiso de Kyutai con el desarrollo de código abierto lo distingue. La compañía planea liberar el código de su modelo de lenguaje, codec de audio y toda la pila tecnológica, invitando a la colaboración -algo parecido a lo que propone Sentient Labs- e innovación global. Esta transparencia aborda preocupaciones éticas y fomenta avances impulsados por la comunidad.

La aparición de Moshi destaca el papel de Europa en la configuración del futuro tecnológico. La startup planea refinar Moshi basándose en los comentarios e interacciones de los usuarios, con las versiones 1.1, 1.2 y 2.0 ya en desarrollo.

Moshi está diseñado para funcionar en dispositivos estándar como ordenadores portátiles y teléfonos móviles sin depender de servidores externos. Esta capacidad de procesamiento en el dispositivo enfatiza la privacidad y seguridad, ya que los datos sensibles no necesitan ser transmitidos por internet. Esto hace que Moshi sea altamente accesible y práctico para el uso diario, integrándose sin problemas en diversos dispositivos y plataformas.