Tecnologia

Project Genie do Google permite criar e explorar mundos 3D interativos com prompts simples de IA

Por Maria

Publicado em 2 de fevereiro de 2026

project genie - QINQIE99/Shutterstock.com

Siga o Mix Vale no GoogleVeja as notícias do Mundo com destaque nas buscas do GoogleAdicionar

O Google começou a liberar o acesso ao Project Genie, uma ferramenta experimental que converte prompts de texto ou imagens em ambientes virtuais 3D interativos. A plataforma está disponível inicialmente apenas para assinantes do plano Google AI Ultra nos Estados Unidos. Usuários qualificados podem gerar cenários variados e navegá-los em tempo real utilizando controles básicos.

O sistema utiliza o modelo Genie 3, desenvolvido pelo Google DeepMind, para manter consistência visual e física durante a exploração. A ferramenta gera novos elementos do ambiente conforme o usuário se movimenta, oferecendo experiências que duram vários minutos sem interrupções significativas. O controle ocorre por meio de setas do teclado ou comandos diretos de movimento.

O Project Genie representa um avanço nos modelos de mundo generativos da empresa. Ele elimina a necessidade de habilidades avançadas de programação para criar protótipos imersivos. A iniciativa abre possibilidades em áreas como desenvolvimento de jogos e simulações educacionais.

Evolução dos modelos genie

A linha Genie iniciou em 2024 com um modelo capaz de gerar ambientes 2D jogáveis a partir de vídeos não rotulados da internet. Essa versão inicial demonstrou a viabilidade de criar mundos dinâmicos sem supervisão direta de ações. O foco estava em aprender representações latentes de movimento e interação.

O Genie 2, apresentado em dezembro de 2024, ampliou as capacidades para cenários tridimensionais mais detalhados. Ele passou a aceitar imagens conceituais e desenhos como entrada, gerando variações realistas de ambientes. A melhoria na generalização permitiu maior diversidade de resultados.

A versão atual, Genie 3, introduziu interatividade em tempo real com taxa de 20 a 24 frames por segundo. O modelo incorpora memória de interações anteriores para manter coerência prolongada. Essa base técnica sustenta o prototype liberado no Google Labs.

Funcionamento técnico da ferramenta

O processo começa com a inserção de um prompt de texto que descreve o ambiente desejado ou o upload de uma imagem de referência. O sistema gera um rascunho inicial em 3D que serve como ponto de partida. Opções de controle incluem visão em primeira ou terceira pessoa.

Conforme o usuário navega, o modelo prevê e cria novas seções do mundo de forma autoregressiva. Ele processa ações em tempo real e ajusta elementos visuais para manter continuidade. Refinamentos são possíveis por meio de prompts adicionais durante a sessão.

A ferramenta permite remixar criações anteriores, combinando características de mundos diferentes. Usuários podem alterar aspectos específicos, como iluminação ou objetos presentes. O resultado final pode ser exportado como vídeo de demonstração.

Prompts textuais descritivos para definir o tema inicial;
Imagens ou esboços como base visual;
Comandos para ajustar física ou escala;
Integração de estilos artísticos específicos.

Exemplos práticos de criação

Usuários têm gerado cenários que vão de paisagens naturais a ambientes fantásticos. Exemplos incluem planetas com anéis visíveis e terrenos irregulares explorados por veículos. Outros envolvem estruturas arquitetônicas impossíveis, como castelos suspensos ou ilhas com cachoeiras invertidas.

A ferramenta reproduz estilos visuais distintos quando solicitado no prompt. Mundos subaquáticos com fauna detalhada surgem com descrições precisas. Cidades futuristas com neon e veículos voadores também são comuns entre os primeiros testes.

As transições entre áreas mantêm fluidez visual durante a navegação. Elementos como iluminação e sombras permanecem consistentes. Sessões prolongadas demonstram capacidade de expansão infinita do ambiente.

Aplicações em diferentes setores

Desenvolvedores de jogos utilizam o Project Genie para prototipagem rápida de níveis e mecânicas. A criação de ambientes testes acelera o processo sem necessidade de modelagem manual tradicional. Equipes validam conceitos narrativos antes de investir em produção completa.

No campo educacional, professores simulam locais históricos ou fenômenos científicos para aulas imersivas. Estudantes exploram civilizações antigas ou ecossistemas complexos de forma interativa. Ajustes personalizados adaptam o conteúdo ao currículo específico.

Treinamento de agentes de inteligência artificial beneficia-se dos mundos infinitos gerados. Algoritmos recebem dados variados para aprender navegação em ambientes desconhecidos. Isso contribui para avanços em robótica e sistemas autônomos.

Áreas como arquitetura e design de interiores também exploram a ferramenta para visualizações preliminares. Clientes navegam propostas de espaços antes da construção física. A interatividade facilita ajustes em tempo real durante apresentações.

Limitações observadas no prototype

O acesso atual restringe-se a assinantes do plano Google AI Ultra nos Estados Unidos. Usuários de outras regiões aguardam expansão gradual do rollout. Maiores de 18 anos com assinatura ativa são elegíveis para participação.

Sessões têm duração limitada para preservar qualidade visual e consistência. Ambientes com múltiplos agentes interativos ainda enfrentam restrições técnicas. O foco permanece em experiências single-player.

Reprodução precisa de texto legível depende de especificação explícita no prompt. Locais reais do mundo físico variam em fidelidade conforme os dados de treinamento utilizados.

Recursos de personalização disponíveis

Usuários definem a perspectiva de câmera no início da criação e podem alterá-la durante a exploração. Modo em primeira pessoa aumenta a sensação de imersão total. Visão em terceira pessoa facilita overview de grandes áreas.

Personagens recebem customizações detalhadas via prompts textuais. Opções incluem veículos, animais ou figuras humanas com características específicas. Movimentos adaptam-se automaticamente ao tipo selecionado.

Remix de elementos permite combinar partes de mundos anteriores em novas criações. Usuários selecionam componentes favoritos para integração rápida. Isso agiliza iterações sucessivas no design.

Exportação de vídeos gravados durante a navegação está disponível para compartilhamento. Demonstrations ajudam na coleta de feedback ou apresentações profissionais. A função registra sessões completas com qualidade alta.

Mudança de condições climáticas;
Adição de objetos específicos;
Ajuste de escala global;
Combinação de múltiplos estilos visuais.

Requisitos e processo de acesso

A ferramenta integra-se diretamente ao ambiente do Google Labs. Assinantes qualificados acessam via navegador padrão com conexão estável à internet. Não há exigência de hardware especializado além do básico.

O rollout iniciou em janeiro de 2026 para usuários nos Estados Unidos. Instruções guiadas auxiliam na primeira criação de mundo. Participantes fornecem feedback que direciona atualizações futuras.

O Google planeja expansões graduais para outras regiões e planos de assinatura. A coleta de dados de uso contribui para refinamentos técnicos. O Project Genie consolida avanços em modelos de mundo generativos acessíveis ao público selecionado.

Tagambientes interativos, Google DeepMind, mundos 3D IA, Project Genie, Tecnlogia