El sector de la IA es un espacio en constante expansión. Cada semana, nuevas herramientas, dispositivos o grandes modelos de lenguaje (LLM) se presentan ante la sociedad, mostrando una nueva arista del día a día donde la inteligencia artificial puede tener utilidad. No obstante, la creación de estas megaestructuras del software requiere de unos resistentes cimientos de hardware, los cuales no tienen fama de ser baratos.
De ahí que Nvidia, famosa por sus chips y tarjetas gráficas, sea hoy en día una de las empresas más valiosas del mundo. La compañía, que ofrece hardware de alta como sus más recientes chips H100, se ha convertido en el principal suministrador (y por tanto cuello de botella) de esta tecnología, la cual se vende a grandes tecnológicas como Apple, OpenAI o Amazon para que puedan procesar los datos con los que se entrena a sus LLM más potentes y famosos.
Todo esto ha hecho que a lo largo de los últimos años el valor de Nvidia no haya parado de crecer a un ritmo vertiginoso, incluso demencial. Las acciones de la compañía han tenido un incremento de un 149% en lo que va del año, lo que la convierte en la segunda acción de mejor rendimiento del S&P 500 (SPY) actualmente. A su vez, en el segundo trimestre de este año fiscal, la empresa ha cosechado unos ingresos récord cifrados en 30.000 millones de dólares, una cifra superior a los 28.860 millones de dólares esperados. Ello supone un incremento del 122% respecto al mismo periodo de 2023, así como un aumento del 15% respecto al primer trimestre.
Ante números como estos, muchos nos preguntamos cuál será el futuro de la compañía, hacia dónde se dirigirá con una solvencia económica como esta. Tras ver los movimientos de este galeón tecnológico, desde Insights podemos ver hacia donde está girando el timón Nvidia, y es que no solo quiere dominar el hardware, sino que se dirige hacia un mar antes desconocido para los mismos, el software.
El modelo de lenguaje NVLM 1.0
Este septiembre, Nvidia lanzó su modelo de IA de código abierto que promete rivalizar con los sistemas avanzados de empresas como OpenAI y Google, el NVLM 1.0. Este es capaz de generar descripciones detalladas de imágenes, comprender el humor de los memes y realizar tareas complejas de codificación. La variante más avanzada, el NVLM-D-72B, maneja 72.000 millones de parámetros y compite directamente con modelos de gran escala como GPT-4 y Llama 3.
El desarrollo de NVLM 1.0 destaca por su capacidad para procesar simultáneamente texto e imágenes, realizando tareas complejas como el reconocimiento óptico de caracteres (OCR), razonamiento y generación de instrucciones paso a paso para problemas matemáticos. La compañía también ha subrayado la importancia de la calidad y diversidad de los datos utilizados para entrenar este modelo, más allá de la simple escala de los datos.
Bajo nuestro punto de vista, la característica más notoria de este anunció es que el NVLM 1.0 está disponible bajo estándares de código abierto, permitiendo su uso, modificación y distribución libre. Esto sigue una dinámica que compañías como Meta lideran (al menos en lo que se refiere a sus avances en la tecnología de los LLM) y que beneficia a los pequeños desarrolladores independientes.
El software del videojuego
Nvidia no se limita a seguir los pasos de las grandes tecnológicas desarrollando su propio LLM, sino que también está buscando avanzar en el software de su otro gran mercado, los videojuegos. Y es que, los chips de Nvidia no son su fuente de ingresos más famosa, sino que compite con el otro hardware que domina, el de las tarjetas gráficas. Estos componentes de ordenador son vitales para poder jugar a los videojuegos más potentes, incluso algunos de los modelos más modernos cuentan con mejoras de IA para mejorar el rendimiento gráfico.
Pero el negocio del software no se encuentra ahí, sino en la implementación de herramientas de IA en el desarrollo de los videojuegos.
Por ejemplo, Nvidia creó Machinima, una plataforma que da a los usuarios herramientas crear animaciones mediante gráficos avanzados en tiempo real, impulsados principalmente por las tarjetas gráficas de Nvidia. Está orientada a la generación de contenido basado en videojuegos, utilizando el poder de la inteligencia artificial y la simulación en tiempo real. Esto facilita la producción de cinemáticas sin la necesidad de equipamiento técnico sofisticado o la intervención de estudios profesionales.
También es relevante el reciente anuncio de sus nuevas herramientas para el desarrollo de videojuegos en Unreal Engine 5 (motor gráfico), presentadas durante el Unreal Fest Seattle 2024. Estos complementos están diseñados para facilitar la creación de personajes MetaHuman realistas y optimizar la integración de IA en el desarrollo de juegos. Entre las principales novedades, destacan:
Audio2Face-3D: Este plugin sincroniza los labios y anima las expresiones faciales de personajes MetaHuman utilizando IA, proporcionando realismo en las animaciones dentro de Unreal Engine 5.
Nemotron-Mini 4B: Permite la generación de respuestas interactivas en diálogos con personajes, mejorando la fluidez y naturalidad de las interacciones dentro de los juegos.
RAG (Recuperación de Generación Aumentada): Mejora la interacción de personajes al ofrecer información contextual, enriqueciendo las respuestas y acciones en el juego.
Además, NVIDIA ha integrado su tecnología con Autodesk Maya a través de un complemento de animación facial basado en audio, que facilita un flujo de trabajo más ágil entre Maya y Unreal Engine 5. La compañía también ha anunciado un microservicio de renderizado que permite la transmisión de personajes MetaHuman en alta calidad a través de cualquier dispositivo mediante WebRTC.
Por último, otro servicio que destacaríamos es el GeForce Now, una especie de "netflix de videojuegos" que permite jugar títulos comprados en plataformas como Steam o Epic Games Store desde la nube. Esto elimina la necesidad de tener un hardware potente, ya que los juegos se ejecutan en los servidores de NVIDIA y se transmiten a tu dispositivo. La suscripción RTX 3080 permite jugar a 1440p y 120 FPS con Ray Tracing activado, brindando una experiencia de juego de alta calidad sin necesidad de una PC potente.