A Meta, empresa liderada por Mark Zuckerberg, continua avançando no campo da inteligência artificial generativa com a introdução do MovieGen, uma família de modelos que permite a geração de vídeos com áudio a partir de texto. Essa tecnologia concorre com opções como o Sora da OpenAI e o Gen-3 Alpha, oferecendo ferramentas poderosas para a criação de conteúdo audiovisual.
Inovação em vídeo e áudio generativo
MovieGen é dividido em dois modelos principais. O primeiro, o MovieGen Video, é um modelo transformador de 30 bilhões de parâmetros capaz de gerar clipes de até 16 segundos a 16 quadros por segundo ou 10 segundos a 25 quadros por segundo, com resolução de 1080p. Por outro lado, o MovieGen Audio, com 13 bilhões de parâmetros, gera áudio de até 45 segundos que é sincronizado com os vídeos. Os usuários podem usar prompts para ajustar os resultados, como adicionar sons ambientes ou música de fundo.
Um recurso de destaque do MovieGen é sua capacidade de modificar detalhes específicos dos vídeos gerados sem alterar o conteúdo geral, facilitando a edição. Isso é útil para criadores que precisam fazer mudanças precisas, como alterar a cor de uma peça de roupa ou a direção de um movimento.
Pesquisa e futuro da IA do Meta
Embora a Meta tenha mostrado exemplos impressionantes do MovieGen, como um coala surfando ou uma pessoa fazendo malabarismo com fogo, o acesso público a essa tecnologia ainda não está disponível. Por enquanto, o MovieGen ainda está em fase de pesquisa nos laboratórios de IA da Meta, mas, dado o histórico da empresa, é provável que esteja disponível para os usuários em breve, seguindo o caminho de outras inovações, como os chatbots de IA da Meta em suas plataformas sociais.
Com essa nova aposta, a Meta está se posicionando como uma forte concorrente na criação de conteúdo audiovisual gerado por IA, oferecendo ferramentas que podem transformar a maneira como o vídeo é produzido e editado no futuro.