Os agentes de inteligência artificial que exploram e interagem em mundos virtuais representam a próxima grande revolução tecnológica. Uma das primeiras IAs a seguir esse caminho chama-se Voyager, um agente desenvolvido para aprender a jogar Minecraft, o popular videogame da Microsoft. Embora as IAs estejam transformando vários setores, o Voyager tem um objetivo mais específico no momento: dominar o Minecraft construindo casas, caçando animais e explorando o vasto ambiente do jogo.
E se liberássemos o GPT-4 no Minecraft? ⛏️
Tenho o prazer de anunciar o Voyager, o primeiro agente de aprendizado contínuo que joga Minecraft puramente no contexto. O Voyager se aprimora continuamente escrevendo, refinando, confirmando e recuperando *código* de uma biblioteca de habilidades.
O GPT-4 desbloqueia... pic.twitter.com/hjTxk6Qb1x
- Jim Fan (@DrJimFan) May 26, 2023
Ao contrário de outros agentes de IA que foram treinados no Minecraft, o Voyager usa o modelo GPT-4 avançado da OpenAI e tem a capacidade de escrever seu próprio código para melhorar seu desempenho à medida que se adapta ao jogo. De acordo com seus criadores, o Voyager aprende explorando o mundo do Minecraft, usando ferramentas e regras básicas para descobrir o maior número possível de coisas, da mesma forma que um jogador humano faria quando estivesse começando. Na verdade, o agente é capaz de superar outros sistemas de IA, obtendo 3,3 vezes mais itens exclusivos e viajando duas vezes mais longe de forma autônoma.
A IA que se autoprograma
O Voyager não apenas explora o mundo do Minecraft, mas também se adapta e melhora seu desempenho graças à sua capacidade de se autoprogramar. Essa capacidade permite que ele otimize suas decisões em tempo real, algo que o diferencia de outros agentes de IA. A equipe por trás da descoberta é composta por estudantes de universidades de prestígio, como Caltech, Austin e Stanford, com o apoio da NVIDIA. Juntos, eles criaram esse agente com o objetivo de estabelecer as bases para a próxima geração de IA.
O Voyager se baseia em três pilares fundamentais: um plano de aprendizado de máquina que orienta sua exploração, uma biblioteca de habilidades que define o que você pode fazer no jogo e um sistema de feedback que permite aprimorar suas respostas a situações complexas. Esses elementos refletem habilidades semelhantes às de um jogador humano, que ajusta suas tarefas com base em seu progresso, aperfeiçoa suas habilidades e explora o mundo do jogo com curiosidade.