Últimas Notícias

Project Genie do Google é liberado e transforma descrições de texto em mundos virtuais interativos

Project Genie
Project Genie - Divulgação/Google

Uma nova fronteira na criação de conteúdo digital foi aberta pelo Google DeepMind com o lançamento inicial do Project Genie. A ferramenta, um protótipo de pesquisa avançado, permite que usuários gerem e explorem mundos virtuais totalmente interativos a partir de simples comandos de texto ou do envio de uma imagem de referência. Este lançamento representa um passo significativo na democratização do desenvolvimento de ambientes imersivos.

O acesso à tecnologia começou a ser distribuído de forma gradual em 29 de janeiro de 2026, sendo inicialmente restrito a um público específico. Apenas assinantes do plano Google AI Ultra, residentes nos Estados Unidos e com idade superior a 18 anos, podem experimentar o protótipo nesta primeira fase. A empresa sinalizou planos para uma futura expansão global, condicionada aos resultados e ao feedback coletado.

A proposta central do Project Genie é eliminar barreiras técnicas complexas, oferecendo uma interface intuitiva para que qualquer pessoa possa dar vida a suas ideias. Os mundos gerados não são estáticos; eles respondem às ações do usuário em tempo real, criando uma experiência dinâmica e contínua que se assemelha a um videogame criado sob demanda.

As funcionalidades e a experiência do usuário

A interação com o Project Genie foi desenhada para ser direta e focada na criatividade. O usuário inicia o processo descrevendo o universo que deseja criar ou fornecendo uma imagem como inspiração. É possível detalhar aspectos como o estilo visual, a perspectiva da câmera (primeira ou terceira pessoa) e até mesmo a aparência do personagem que será controlado. O modelo de inteligência artificial, denominado Genie 3, interpreta essas instruções e renderiza o ambiente virtual em resolução 720p a uma taxa de 24 quadros por segundo, um equilíbrio pensado para garantir a fluidez da exploração em tempo real.

Uma vez dentro do mundo gerado, a navegação é realizada por meio de controles de teclado familiares, como as teclas WASD e as setas direcionais. A plataforma também incentiva a colaboração e a evolução das criações, permitindo que os usuários compartilhem seus mundos para que outros possam “remixá-los”, aplicando novos prompts e modificando o ambiente original. Além disso, todas as sessões de exploração podem ser gravadas e os vídeos baixados, facilitando o compartilhamento dos resultados em outras plataformas.

A tecnologia por trás do modelo Genie 3

O coração do Project Genie é o Genie 3, um modelo de mundo geral que simula dinâmicas ambientais complexas e prevê os efeitos das ações do usuário. Diferentemente das engines de jogos convencionais, que operam com base em regras de física e interações pré-programadas, o Genie 3 aprende esses padrões de forma autônoma. Seu treinamento é feito com uma vasta quantidade de dados de vídeo da internet, permitindo que ele compreenda conceitos de causa e efeito e mantenha a coerência visual e temporal durante a exploração. Essa abordagem, conhecida como treinamento autorregressivo, permite ao modelo prever os quadros subsequentes de uma cena com base nos anteriores, garantindo que o mundo evolua de maneira lógica por vários minutos. Este avanço é substancial em comparação com versões anteriores da tecnologia, que se concentravam em ambientes mais limitados e com menos interatividade, posicionando o Genie 3 como um marco na pesquisa de inteligência artificial generativa.

Limitações atuais e desafios do protótipo

Por se tratar de uma versão experimental, o Project Genie apresenta algumas restrições técnicas importantes. As sessões de geração e exploração contínua estão atualmente limitadas a uma duração máxima de 60 segundos.

Outro ponto de atenção é a consistência do mundo virtual. Em interações mais longas ou complexas, o ambiente pode apresentar falhas, com elementos que não seguem as leis da física ou que se desviam significativamente do prompt original.

A latência nos controles também pode variar, com alguns movimentos do personagem não respondendo de forma imediata, especialmente em cenas mais detalhadas. Essas limitações são consideradas esperadas pela equipe de desenvolvimento e servem como pontos focais para futuras atualizações.

Quem pode acessar a nova ferramenta

O acesso ao Project Genie nesta fase inicial é exclusivo e requer o cumprimento de critérios específicos. É necessário ser assinante do Google AI Ultra, o plano mais avançado de serviços de inteligência artificial da companhia. Além disso, o usuário deve residir nos Estados Unidos e ter mais de 18 anos, com verificação de idade sendo um passo obrigatório. A liberação do acesso ocorre de forma gradual, e os interessados podem se manter atualizados através da plataforma Google Labs, onde o projeto está hospedado.

Aplicações criativas e o feedback inicial

Os primeiros usuários com acesso ao protótipo já começaram a demonstrar a versatilidade da ferramenta. As criações compartilhadas exibem uma ampla gama de possibilidades, desde a recriação de cenários inspirados em jogos famosos até a concepção de mundos completamente originais.

Exemplos notáveis incluem paisagens fantásticas, como castelos feitos de marshmallow flutuando em rios de chocolate, e ambientes surreais, como cidades antigas submersas em um cosmos estrelado.

A ferramenta também se mostrou capaz de interpretar diferentes tipos de locomoção. Dependendo do prompt, os usuários conseguiram explorar seus mundos voando, nadando ou dirigindo veículos gerados pela IA.

Esse feedback inicial, marcado pelo entusiasmo e pela exploração de usos não previstos, é crucial para o Google DeepMind, que monitora ativamente as criações para guiar o aprimoramento contínuo da tecnologia.

O futuro dos world models no Google

O desenvolvimento de “world models” como o Genie 3 é uma área de pesquisa prioritária para o Google DeepMind há mais de uma década. O objetivo de longo prazo é criar sistemas capazes de simular ambientes complexos para treinar agentes de IA em uma variedade quase infinita de cenários, acelerando o progresso em direção a uma inteligência artificial mais geral e capaz.

Nesse contexto, o Project Genie funciona como uma ponte fundamental entre a pesquisa teórica e a aplicação prática. Ao disponibilizar a tecnologia para um público mais amplo, a empresa consegue coletar dados e feedback valiosos sobre como esses modelos se comportam em situações reais, identificando tanto seu potencial quanto suas fragilidades para orientar os próximos passos da inovação.

To Top