Últimas Notícias

Google libera atualização do Gemini com salto em lógica e criação de sistemas visuais autônomos

Gemini
Gemini - Mehaniq/shutterstock.com

A divisão Google DeepMind oficializou nesta quinta-feira (19) a chegada de uma nova iteração para sua principal família de modelos de inteligência artificial. A atualização, denominada Gemini 3.1 Pro, foi desenvolvida com foco prioritário na ampliação das capacidades de raciocínio complexo, prometendo superar as limitações das versões anteriores em tarefas que exigem síntese de dados e lógica avançada.

O lançamento ocorre em um momento estratégico para o setor tecnológico, onde a simples geração de texto cede espaço para a demanda por agentes capazes de executar fluxos de trabalho completos. A nova ferramenta já se encontra disponível em fase de prévia para desenvolvedores e assinantes de planos avançados, introduzindo melhorias significativas no processamento multimodal que abrange desde códigos de programação até a interpretação de vídeos e áudios.

Gemini Inteligência Artificial
Gemini Inteligência Artificial – Ju Jae-young/ Shutterstock.com

Especialistas apontam que o diferencial desta versão reside na sua arquitetura otimizada para resolver problemas inéditos, afastando-se da dependência exclusiva de padrões memorizados durante o treinamento. A tecnologia foi desenhada para atender tanto usuários finais, através do aplicativo proprietário da empresa, quanto ambientes corporativos que necessitam de automação robusta via API.

Os testes internos de validação demonstraram que o modelo consegue manter a coerência em cadeias de pensamento longas, uma característica essencial para o desenvolvimento de agentes autônomos funcionais. A disponibilização imediata visa acelerar a integração dessas capacidades em produtos de terceiros e nas plataformas de nuvem da companhia.

Salto de desempenho em testes de lógica

A métrica mais expressiva apresentada durante o anúncio refere-se ao desempenho no benchmark ARC-AGI-2, um teste rigoroso desenhado para avaliar a habilidade de uma IA em solucionar padrões lógicos nunca vistos anteriormente. O Gemini 3.1 Pro registrou uma pontuação de 77,1% neste quesito, um resultado que representa mais que o dobro da performance obtida pelo seu antecessor, o Gemini 3 Pro, que alcançou 31,1% na mesma avaliação.

Além da evolução em lógica abstrata, o modelo foi submetido a avaliações comparativas diretas com outras tecnologias de ponta disponíveis no mercado. No teste conhecido como “Humanity’s Last Exam”, a nova versão obteve 44,4% de aproveitamento, superando as soluções concorrentes desenvolvidas pela Anthropic e pela OpenAI, consolidando sua posição em cenários que demandam conhecimento técnico aprofundado.

Essa consistência no raciocínio lógico permite que a ferramenta seja aplicada em situações onde a recuperação simples de informações não é suficiente. O foco da atualização é garantir que o sistema possa navegar por problemas multifacetados sem perder o contexto ou alucinar respostas, elevando o padrão de confiabilidade para uso profissional e acadêmico.

Autonomia em navegação e agentes virtuais

A capacidade de operar como um agente autônomo foi amplamente expandida nesta atualização, com resultados expressivos em benchmarks que simulam atividades profissionais reais. No teste APEX-Agents, que mede a eficiência em tarefas de longo horizonte, o modelo atingiu a marca de 33,5%, indicando uma aptidão superior para gerenciar objetivos que requerem múltiplas etapas para serem concluídos.

Outro destaque foi o desempenho no BrowseComp, uma avaliação focada na busca agentica pela internet combinada com o uso de ferramentas de programação como Python. O Gemini 3.1 Pro alcançou 85,9% de eficácia, demonstrando habilidade para pesquisar, filtrar e extrair informações relevantes da web de maneira autônoma, integrando esses dados diretamente em fluxos de trabalho.

Para ilustrar as competências aprimoradas do novo sistema, a empresa destacou três pilares fundamentais que sustentam a operação dos agentes nesta versão:

  • Capacidade de manter o foco em objetivos complexos ao longo de execuções extensas, sem desvios de finalidade.
  • Integração fluida entre pesquisa na web e execução de código para validação de dados em tempo real.
  • Priorização de fluxos de trabalho que exigem o uso coordenado de múltiplas ferramentas digitais simultaneamente.

Criação de sistemas visuais e codificação

A versatilidade do modelo se estende à síntese de sistemas visuais complexos a partir de comandos de texto simples. Durante as demonstrações técnicas, a inteligência artificial foi capaz de gerar animações no formato SVG que são escaláveis e leves, oferecendo uma alternativa eficiente aos formatos de vídeo tradicionais para interfaces web e aplicações móveis.

Um dos exemplos práticos exibidos envolveu a configuração de um painel de telemetria em tempo real. O modelo processou APIs públicas e dados brutos para construir, do zero, uma interface funcional que visualiza a órbita da Estação Espacial Internacional. O processo envolveu desde a interpretação dos dados de entrada até a codificação da interface gráfica final.

No campo da interpretação criativa, o sistema transformou descrições literárias clássicas em produtos digitais modernos. Ao processar trechos da obra “O Morro dos Ventos Uivantes”, a IA capturou a atmosfera narrativa do livro e projetou um site de portfólio contemporâneo, traduzindo conceitos abstratos e artísticos em código executável e design funcional.

A ferramenta também demonstrou competência na criação de experiências interativas em três dimensões. Foi apresentada uma simulação onde um bando de pássaros virtuais respondia dinamicamente ao rastreamento das mãos do usuário, comprovando a habilidade do modelo em integrar visão computacional com lógica de animação complexa.

Detalhes sobre acesso e integração corporativa

A distribuição do Gemini 3.1 Pro segue um modelo escalonado, priorizando desenvolvedores e clientes corporativos neste primeiro momento. A versão está acessível através de plataformas como AI Studio e Vertex AI, permitindo que empresas testem a tecnologia em seus próprios ambientes e adaptem seus produtos para utilizar o novo motor de raciocínio.

Para os usuários individuais, o acesso foi liberado para os assinantes dos planos Google AI Pro e Ultra, que contam com limites de uso ampliados. A ferramenta também foi integrada ao NotebookLM, potencializando as funções de síntese de documentos e geração de insights para usuários pagantes que utilizam a plataforma para pesquisa e estudos.

Um ponto técnico relevante é a manutenção da janela de contexto de 1 milhão de tokens, uma característica herdada das gerações anteriores da série 3. Isso assegura que o modelo continue apto a analisar grandes volumes de dados, como livros inteiros ou repositórios de código extensos, sem perder a capacidade de referenciar informações específicas dentro do conteúdo processado.

To Top