O Google anunciou nesta quinta-feira o Gemini 3.1 Flash Live como o modelo de áudio e voz de mais alta qualidade até o momento. Essa versão impulsiona uma série de melhorias significativas no Gemini Live e no Search Live. O modelo já está disponível em versão prévia por meio da API Gemini Live no Google AI Studio. Ele se destaca por oferecer menor latência em relação à versão anterior e maior eficácia no reconhecimento de nuances acústicas como tom e ritmo.
Os desenvolvedores podem testar o novo modelo imediatamente para construir aplicações com conversas multimodais em tempo real. O Gemini 3.1 Flash Live filtra ruído de fundo com mais precisão e consegue discernir melhor a fala relevante em meio a sons ambientais como tráfego ou televisão. Além disso, o sistema suporta mais de 90 idiomas, o que amplia o alcance das interações ao vivo.
- Reconhecimento aprimorado de nuances acústicas como tom e ritmo
- Redução de latência em conversas em tempo real
- Filtragem mais eficaz de ruído de fundo e sons ambientais
- Suporte a mais de 90 idiomas em interações multimodais
Melhorias técnicas no modelo de áudio
O novo modelo aprimora significativamente a capacidade de acionar ferramentas externas durante conversas ao vivo. Ele também apresenta melhor seguimento de instruções complexas, mantendo o agente dentro dos limites operacionais mesmo quando as conversas tomam rumos inesperados. Essas mudanças resultam em respostas mais confiáveis e naturais.
No Gemini Live para dispositivos Android e iOS, o Flash Live 3.1 entrega respostas mais rápidas com menos pausas. O sistema consegue acompanhar o raciocínio da conversa pelo dobro do tempo anterior. Isso permite sessões de brainstorming mais longas sem perda da linha de pensamento.
O Gemini Live ajusta dinamicamente a duração e o tom das respostas para se adequar ao contexto do momento. Usuários relatam interações mais fluidas e menos interrupções durante o uso diário. A integração com o novo modelo contribui para uma experiência geral mais consistente.
Expansão global do Search Live
O Google utiliza o Gemini 3.1 Flash Live para lançar o Search Live de forma global em mais de 200 países. A expansão cobre todos os idiomas e locais onde o Modo IA está disponível atualmente. O recurso permite conversas interativas com a Busca do Google, incluindo áudio e vídeo por meio do Google Lens.
Usuários podem agora realizar buscas conversacionais em tempo real com maior precisão em diferentes regiões. O sistema processa consultas multimodais de maneira mais eficiente em ambientes variados. Essa disponibilidade amplia o acesso a informações por voz em escala mundial.
O Search Live beneficia-se diretamente das melhorias no reconhecimento de fala e na redução de latência. Conversas com a busca tornam-se mais naturais e contextualizadas. A integração de áudio e vídeo facilita a interação em cenários práticos do dia a dia.

Detalhes sobre o suporte a idiomas e multimodais
O suporte a mais de 90 idiomas permite conversas multimodais em tempo real com qualidade elevada. O modelo lida melhor com variações regionais de pronúncia e sotaques. Isso torna o Gemini Live mais acessível para usuários em diferentes países.
Desenvolvedores ganham ferramentas para criar experiências personalizadas com base no novo modelo. A API facilita a integração em aplicativos que exigem interações por voz avançadas. O foco em baixa latência ajuda a manter o fluxo natural das conversas.
Aplicações práticas no uso diário
No dia a dia, o Gemini Live com o novo modelo responde de forma mais ágil a comandos e perguntas complexas. O sistema mantém o contexto por períodos mais longos sem reiniciar o raciocínio. Usuários podem explorar ideias de forma contínua durante sessões prolongadas.
A capacidade de filtrar ruídos ambientais melhora o desempenho em locais movimentados ou com sons de fundo. Conversas em ambientes como ruas ou salas com televisão ficam mais claras. O ajuste dinâmico de tom e duração das respostas adapta-se ao estilo da interação.
Avanços na integração com ferramentas externas
O modelo aprimorado aciona ferramentas externas com maior eficácia durante as conversas. Ele segue instruções do sistema de maneira mais consistente mesmo em diálogos ramificados. Essa estabilidade contribui para resultados mais previsíveis em aplicações práticas.
Desenvolvedores e usuários finais beneficiam-se de interações mais robustas. O Gemini Live torna-se uma ferramenta mais confiável para tarefas que envolvem múltiplas etapas. A combinação de áudio avançado e capacidade de raciocínio estendido amplia as possibilidades de uso.
O Google continua a investir em modelos de áudio para tornar as interações com IA mais naturais. O lançamento do Gemini 3.1 Flash Live representa um passo importante nessa direção. Usuários de Android e iOS podem experimentar as novidades diretamente no aplicativo Gemini Live.
Atualizações relacionadas no ecossistema Gemini
O anúncio inclui melhorias complementares no painel flutuante do Gemini Live no Android. Essas mudanças visam facilitar o acesso rápido às funções de voz. O conjunto de atualizações reforça o compromisso com experiências conversacionais avançadas.
O Search Live agora alcança um público mais amplo com recursos de áudio e vídeo integrados. A expansão global democratiza o acesso a buscas interativas por voz. Usuários em diferentes regiões ganham uma ferramenta mais poderosa para consultas em tempo real.
O Gemini 3.1 Flash Live marca uma evolução notável na qualidade de áudio e voz dos modelos do Google. As melhorias em latência, filtragem de ruído e seguimento de instruções elevam o padrão das interações ao vivo. O lançamento em prévia permite que desenvolvedores explorem novas aplicações desde já.