Los agentes de inteligencia artificial que exploran e interactúan en mundos virtuales representan la próxima gran revolución tecnológica. Una de las primeras IA en seguir este camino se llama Voyager, un agente desarrollado para aprender a jugar Minecraft, el popular videojuego de Microsoft. Aunque las IA están transformando múltiples industrias, Voyager tiene un objetivo más específico por el momento: dominar Minecraft construyendo casas, cazando animales y explorando el vasto entorno del juego.
What if we set GPT-4 free in Minecraft? ⛏️
I’m excited to announce Voyager, the first lifelong learning agent that plays Minecraft purely in-context. Voyager continuously improves itself by writing, refining, committing, and retrieving *code* from a skill library.
GPT-4 unlocks… pic.twitter.com/hjTxk6Qb1x
— Jim Fan (@DrJimFan) May 26, 2023
A diferencia de otros agentes de IA que han sido entrenados en Minecraft, Voyager utiliza el avanzado modelo GPT-4 de OpenAI y tiene la capacidad de escribir su propio código para mejorar su desempeño conforme se adapta al juego. Según sus creadores, Voyager aprende explorando el mundo de Minecraft, utilizando herramientas y reglas básicas para descubrir tantas cosas como le sea posible, similar a cómo lo haría un jugador humano cuando empieza por primera vez. De hecho, el agente es capaz de superar a otros sistemas de IA al obtener 3.3 veces más objetos únicos y recorrer el doble de distancia de manera autónoma.
La IA que se programa a sí misma
Voyager no solo explora el mundo de Minecraft, sino que también se adapta y mejora su rendimiento gracias a su capacidad de autoprogramarse. Esta habilidad le permite optimizar sus decisiones en tiempo real, algo que le distingue de otros agentes de IA. El equipo detrás de este avance está compuesto por estudiantes de prestigiosas universidades como Caltech, Austin y Stanford, con el apoyo de la compañía NVIDIA. Juntos, han creado este agente con la finalidad de sentar las bases para la siguiente generación de IA.
Voyager se basa en tres pilares fundamentales: un plan de aprendizaje automático que guía su exploración, una biblioteca de habilidades que define qué puede hacer dentro del juego, y un sistema de retroalimentación que le permite mejorar sus respuestas ante situaciones complejas. Estos elementos reflejan habilidades similares a las de un jugador humano, quien ajusta sus tareas en función de su progreso, afina sus habilidades y explora el mundo del juego con curiosidad.