Últimas Notícias

Google lança nova automação avançada do Gemini para aplicativos no Pixel 10 e linha Galaxy S26

Gemini
Foto: Gemini - Mehaniq/shutterstock.com

O Google iniciou a liberação de um recurso inédito de automação de tarefas em múltiplas etapas para o assistente Gemini em dispositivos móveis selecionados. A nova funcionalidade permite que a inteligência artificial execute ações complexas diretamente dentro de aplicativos de terceiros, sem a necessidade de intervenção manual constante do proprietário do smartphone para cada clique ou rolagem de tela.

A novidade chega inicialmente em formato beta e está restrita aos modelos de ponta mais recentes do mercado de tecnologia móvel. Os aparelhos contemplados nesta primeira fase de implementação incluem as variantes Google Pixel 10, Pixel 10 Pro e Pixel 10 Pro XL, além de toda a série de dispositivos Samsung Galaxy S26, que possuem arquitetura de processamento dedicada para essas funções.

O lançamento oficial ocorreu de forma simultânea nos Estados Unidos e na Coreia, mercados escolhidos estrategicamente para testar a estabilidade da ferramenta em cenários de uso intenso antes de um lançamento global. A ativação do sistema ocorre de maneira simples, exigindo apenas um comando de voz detalhado após o acionamento prolongado do botão lateral do dispositivo.

Execução de comandos complexos no cotidiano

A principal inovação do sistema reside na capacidade de interpretar e executar pedidos que exigem navegação sequencial por diferentes telas, menus e caixas de diálogo. O assistente digital assume o controle temporário da interface do aplicativo escolhido para realizar ações práticas, como solicitar transporte particular de um ponto a outro ou encomendar refeições específicas em plataformas de delivery.

Durante o processo de execução, a inteligência artificial analisa as opções disponíveis na interface gráfica, preenche formulários de endereço e seleciona itens com base no histórico de preferências do usuário. O sistema possui uma trava de segurança que pausa automaticamente a operação e solicita a aprovação final na tela antes de concluir qualquer transação financeira ou confirmar um pedido.

Operação em ambiente virtual isolado

Para garantir a integridade dos dados pessoais, o Gemini executa todas as automações dentro de uma janela virtual segura e totalmente isolada do restante do sistema operacional do smartphone. Esse método de encapsulamento impede que a inteligência artificial acesse informações não autorizadas, leia documentos privados ou modifique configurações críticas do aparelho durante a navegação nos aplicativos de terceiros.

O assistente segue estritamente as instruções fornecidas no comando de voz inicial, limitando sua atuação exclusivamente ao escopo da tarefa solicitada pelo indivíduo. Se o usuário pedir a compra de um café expresso, a ferramenta abrirá apenas o aplicativo da cafeteria correspondente, ignorando completamente mensagens de texto, e-mails de trabalho ou galerias de fotos presentes na memória do dispositivo.

A arquitetura de software desenvolvida para essa função permite que o processo ocorra em segundo plano de forma invisível ou através de uma interface translúcida sobreposta à tela principal. Isso garante que o fluxo normal de uso do telefone não seja interrompido de maneira abrupta, permitindo que a pessoa continue lendo um artigo ou assistindo a um vídeo enquanto o pedido é processado.

Aplicativos compatíveis na fase de testes

Neste momento inicial de testes públicos, a funcionalidade abrange categorias específicas de serviços sob demanda que fazem parte da rotina diária de milhões de consumidores. O suporte oficial de lançamento inclui plataformas populares de entrega de comida, como DoorDash, Grubhub e Uber Eats, facilitando a repetição de pedidos rotineiros com apenas uma frase falada.

No setor de mobilidade urbana, o sistema integra-se de forma nativa aos aplicativos da Uber e da Lyft para otimizar o deslocamento nas cidades. O usuário pode simplesmente informar o destino desejado em linguagem natural, e o assistente se encarrega de abrir o mapa, inserir o endereço exato, comparar categorias de veículos disponíveis e apresentar a estimativa de preço final para aprovação.

Para o abastecimento doméstico, a integração com o serviço Instacart permite a montagem rápida de carrinhos de compras virtuais baseados em listas de compras anteriores ou receitas específicas. A inteligência artificial consegue identificar os produtos solicitados, buscar as melhores opções no catálogo da loja e até sugerir substituições viáveis caso um item específico esteja fora de estoque no estabelecimento selecionado.

No mercado sul-coreano, a fase beta engloba serviços locais de alta demanda para adaptar o modelo de linguagem a diferentes culturas de consumo e interfaces regionais. Aplicativos de grande alcance no país, como Kakao T para mobilidade e Kaemin para alimentação, foram incluídos na lista de compatibilidade para garantir que os testes reflitam o uso real da população local.

Processamento local e otimização de hardware

A exclusividade temporária do recurso para as linhas Pixel 10 e Galaxy S26 deve-se à necessidade imperativa de um hardware altamente otimizado para o processamento de modelos de inteligência artificial diretamente no dispositivo. Esses smartphones são equipados com unidades de processamento neural de última geração, capazes de lidar com a carga computacional massiva exigida pela navegação autônoma em aplicativos sem depender exclusivamente de servidores em nuvem. Essa abordagem de processamento híbrido reduz drasticamente a latência das respostas do assistente e garante que a execução das tarefas ocorra de forma fluida e sem engasgos, mesmo em situações onde a conectividade com a internet móvel se mostre instável ou lenta.

A parceria técnica entre as fabricantes de hardware e a equipe de desenvolvimento do sistema operacional resultou em uma integração profunda entre o assistente virtual e a camada física dos aparelhos móveis. A execução local das tarefas não apenas melhora a velocidade das automações diárias, mas também reduz o consumo de bateria em comparação com processos antigos que exigiam transferência constante de pacotes de dados pela internet. O sistema operacional consegue identificar os padrões de uso do proprietário e alocar recursos de memória RAM de forma dinâmica, assegurando que o telefone mantenha seu desempenho máximo de navegação enquanto o assistente trabalha silenciosamente na execução dos comandos complexos em segundo plano.

Controle contínuo e monitoramento das ações

Apesar do alto grau de autonomia concedido à inteligência artificial para navegar pelas interfaces, a arquitetura do sistema foi desenhada com o objetivo de manter o proprietário do dispositivo no controle absoluto de todas as etapas da operação digital. A qualquer momento durante a execução de uma tarefa complexa, o usuário recebe notificações visuais e alertas em tempo real que detalham exatamente qual ação o assistente está realizando naquele milissegundo, como a seleção de um restaurante específico no catálogo ou a digitação de um endereço de entrega no formulário. Se a ferramenta encontrar uma ambiguidade durante o processo, como duas filiais de uma mesma loja localizadas próximas ao local de destino, ela interrompe o fluxo de automação imediatamente e exibe um painel na tela solicitando um esclarecimento verbal ou um toque para confirmação. Além disso, existe um botão de cancelamento de emergência sempre visível na interface sobreposta, que permite abortar a automação instantaneamente, fechando a janela virtual segura e devolvendo o controle manual da tela. Essa camada rigorosa de supervisão é fundamental para evitar compras acidentais, envios de veículos de transporte para locais incorretos ou qualquer outra ação indesejada que possa gerar transtornos ou prejuízos financeiros, garantindo que a tecnologia atue estritamente como um facilitador de rotinas e nunca como um agente independente sem a devida supervisão humana.

Expansão geográfica e novos idiomas

A disponibilidade atual restrita aos mercados dos Estados Unidos e da Coreia serve como um laboratório em tempo real para o aprimoramento contínuo dos algoritmos de navegação visual e compreensão de contexto. A expansão do recurso para novos países e a inclusão de suporte a outros idiomas ocorrerão de forma gradual ao longo dos próximos meses, dependendo diretamente dos resultados de estabilidade obtidos nesta fase de testes e da adaptação do sistema a diferentes layouts de aplicativos regionais.

Mudança no paradigma de interação móvel

A introdução de agentes autônomos capazes de operar interfaces gráficas no ecossistema móvel representa uma evolução técnica significativa na forma como as pessoas interagem com seus smartphones. A transição de comandos básicos baseados em toques repetitivos na tela para instruções verbais abrangentes que geram ações concretas reduz o tempo gasto em tarefas burocráticas do cotidiano digital.

O foco no desenvolvimento de ferramentas que operam aplicativos de terceiros de forma independente demonstra o amadurecimento das redes neurais aplicadas ao consumo e à produtividade. A expectativa técnica é que o assistente consiga gerenciar rotinas ainda mais complexas e interligadas em atualizações futuras, consolidando os dispositivos premium como verdadeiros centros de comando automatizados para a vida urbana.