Project Genie do Google DeepMind é lançado para assinantes criarem universos de IA interativos em tempo real

Project Genie

Project Genie - Divulgação/Google

A Google DeepMind deu início à liberação gradual de sua mais nova ferramenta de inteligência artificial, o Project Genie. A plataforma inovadora permite que usuários gerem e explorem mundos virtuais inteiramente interativos a partir de simples comandos de texto ou do envio de uma imagem. O lançamento oficial ocorreu em 29 de janeiro de 2026, marcando um passo significativo na evolução dos chamados “world models”.

Inicialmente, o acesso ao protótipo de pesquisa está restrito a um público selecionado. Apenas assinantes do plano Google AI Ultra, residentes nos Estados Unidos e com idade mínima de 18 anos, poderão experimentar a tecnologia nesta primeira fase. A empresa sinalizou que a expansão para outras regiões e planos de assinatura ocorrerá progressivamente, conforme a plataforma for aprimorada com base no feedback dos primeiros usuários.

https://twitter.com/GoogleDeepMind/status/2016919756440240479?ref_src=twsrc%5Etfw

A ferramenta se destaca por sua capacidade de renderizar ambientes em tempo real, permitindo uma exploração fluida e dinâmica. As criações podem ser compartilhadas dentro da comunidade, possibilitando que outros usuários modifiquem e remixem os mundos existentes, fomentando um ecossistema criativo e colaborativo.

Como funciona a geração de mundos virtuais

O processo de criação no Project Genie foi projetado para ser intuitivo, mesmo para usuários sem experiência em desenvolvimento de jogos ou modelagem 3D. Tudo começa com um prompt, que pode ser uma descrição textual detalhada do cenário imaginado ou uma imagem de referência que sirva como inspiração visual. O usuário pode especificar elementos cruciais como a perspectiva da câmera, seja em primeira ou terceira pessoa, e o tipo de locomoção do personagem, como correr, voar ou nadar. Uma vez que o comando é inserido, o modelo Genie 3, que serve como o cérebro da operação, interpreta os dados e começa a renderizar o ambiente. O resultado é um mundo virtual com resolução de 720p e uma taxa de 24 quadros por segundo, um equilíbrio que prioriza a interatividade em tempo real sobre a fidelidade gráfica máxima. A exploração é feita por meio de controles de teclado familiares, como as teclas WASD para movimento e as setas para controle da câmera, proporcionando uma experiência semelhante à de um videogame simples.

A tecnologia por trás do modelo Genie 3

O Genie 3 é classificado como um “modelo de mundo geral”, uma área de pesquisa que a Google DeepMind explora há mais de uma década. Diferente das engines de jogos tradicionais, que operam com base em regras de física e interações pré-programadas por desenvolvedores, o Genie 3 aprende essas dinâmicas de forma autônoma. Ele foi treinado com uma vasta quantidade de dados de vídeos da internet, aprendendo a prever como um ambiente reage às ações do usuário e como os quadros subsequentes de uma cena devem se parecer.

Essa abordagem, conhecida como treinamento autorregressivo, permite que o modelo mantenha uma consistência temporal e espacial por um período limitado, geralmente alguns minutos. Isso significa que, ao se mover por um cenário, o modelo “lembra” o que estava atrás do personagem e gera transições coerentes, criando uma sensação de imersão e continuidade. Essa capacidade de simular uma variedade quase infinita de mundos e físicas representa um avanço notável em relação a modelos anteriores, que eram mais restritos em escopo e aplicação, abrindo caminho para o treinamento de agentes de IA em cenários virtuais ilimitados.

Funcionalidades e modos de interação

A plataforma oferece três modos principais de interação para facilitar a criatividade dos usuários. O primeiro é a geração a partir do zero, onde o usuário descreve detalhadamente o mundo que deseja ver, ajustando a aparência do personagem, o ambiente e as regras básicas de locomoção.

O segundo modo é a exploração interativa. Após a geração inicial, o usuário pode navegar livremente pelo cenário enquanto o modelo de IA prevê e renderiza continuamente novos elementos com base nas ações realizadas, criando uma experiência que se desenrola em tempo real.

Por fim, a funcionalidade de “remix” permite que os usuários peguem criações compartilhadas por outros e apliquem novos prompts a elas. Isso possibilita a transformação de um castelo medieval em uma estação espacial futurista, por exemplo, incentivando a colaboração e a evolução constante dos mundos gerados.

Limitações atuais da versão experimental

Como um protótipo em fase inicial, o Project Genie apresenta algumas restrições técnicas importantes que os usuários devem conhecer. A limitação mais notável é a duração das sessões de geração, que estão atualmente limitadas a um máximo de 60 segundos contínuos.

Além do tempo, a consistência do mundo virtual pode apresentar falhas em interações mais longas ou complexas. Em certos momentos, os ambientes podem não seguir estritamente as leis da física ou os detalhes exatos fornecidos no prompt, resultando em elementos visuais inconsistentes ou irreais.

A latência no controle dos personagens também é um ponto de atenção. A resposta aos comandos pode variar dependendo da complexidade da cena que está sendo renderizada, e nem todos os movimentos são executados com precisão imediata, o que pode impactar a fluidez da exploração.

É importante ressaltar que a ferramenta não possui mecânicas de jogos tradicionais, como sistemas de inventário, missões ou interações complexas com objetos. Essas limitações são esperadas para uma tecnologia em estágio experimental e devem ser o foco de aprimoramentos em futuras atualizações.

Primeiras criações e o feedback da comunidade

Os primeiros usuários com acesso à ferramenta já começaram a compartilhar suas criações, demonstrando a versatilidade do Project Genie. Alguns se inspiraram em jogos famosos, gerando cenários que lembram florestas de mundos abertos ou jogos de plataforma clássicos, testando os limites da capacidade de recriação do modelo.

Outros exploraram temas completamente originais, como castelos feitos de marshmallow, paisagens cósmicas com planetas flutuantes e reconstruções de cidades antigas. A flexibilidade do modelo para interpretar prompts variados tem sido um dos pontos mais elogiados, permitindo uma ampla gama de experimentações criativas.

Requisitos para acesso ao protótipo

Para fazer parte do grupo inicial de testadores do Project Genie, é necessário atender a critérios específicos estabelecidos pelo Google. O requisito principal é ser assinante do plano Google AI Ultra, o nível mais avançado e caro dos serviços de inteligência artificial da empresa. Adicionalmente, o acesso está geograficamente limitado aos Estados Unidos, e os usuários devem confirmar ter 18 anos ou mais para utilizar a plataforma. A empresa informou que o rollout será gradual, mesmo para quem cumpre todos os pré-requisitos.

Personalização e controle criativo do usuário

O Project Genie oferece um grau considerável de personalização para aumentar o controle criativo. Na fase inicial de “sketching”, é possível definir parâmetros como iluminação, condições climáticas e até mesmo eventos dinâmicos que devem ocorrer no mundo virtual.

O upload de imagens de referência funciona como um atalho visual, fornecendo ao modelo uma base concreta para expandir e interpretar. Durante a exploração, é possível refinar o ambiente com novos prompts, ajustando elementos em tempo real sem a necessidade de reiniciar todo o processo de geração.

Veja Também