Tecnologia

Gemini Live altera vozes e muda cadência em atualizações recentes

Gemini
Foto: Gemini - Primakov / Shutterstock.com

Usuários do Gemini Live observam modificações nas opções de voz do assistente de inteligência artificial da Google. As alterações incluem variações na cadência da fala, no tom e até na mistura de sotaques regionais durante interações em tempo real. Essas mudanças ocorrem com frequência após atualizações de modelos, como a recente versão 3.1 Flash Live, e afetam a experiência de conversas personalizadas.

Muitos relatos indicam que as prévias de voz no aplicativo não correspondem ao som real durante o uso do recurso Live. A opção Capella, que reproduz um sotaque feminino britânico, apresenta alterações mais evidentes desde o lançamento inicial. Outras vozes regionais também exibem problemas semelhantes de consistência.

Alterações na cadência e no tom das vozes

As modificações na cadência da fala representam uma das queixas mais comuns entre os usuários que utilizam diferentes opções de voz no Gemini Live. Os padrões de fala ficam mais lentos em várias configurações, enquanto tons agudos são reduzidos de forma perceptível. Em alguns casos, as respostas alternam entre sotaques australianos e variações mais neutras do americano durante conversas contínuas.

Esses ajustes ocorrem de forma gradual após o reset do aplicativo, quando o sotaque selecionado se mantém por um período curto antes de se transformar em uma versão híbrida. A experiência pode se tornar desconfortável para quem espera consistência nas interações. Usuários que realizam conversas mais longas notam essas transições com maior frequência.

Gemini
Gemini – mundissima/ Shutterstock.com

Comparação entre prévia e uso real do recurso

A prévia de áudio disponível nas configurações do Gemini Live muitas vezes diverge do resultado obtido em sessões de conversa ativa. Essa diferença afeta especialmente as vozes personalizadas, que perdem características originais com o passar do tempo. Relatos acumulados nos últimos meses apontam para uma deterioração progressiva em várias opções disponíveis.

  • A cadência mais lenta impacta o fluxo natural das respostas.
  • Tons agudos são suavizados, alterando a personalidade da voz.
  • Misturas de sotaques ocorrem de modo imprevisível em diálogos.
  • O reset temporário do app restaura parcialmente o comportamento inicial.

Essas observações surgem em um contexto de atualizações frequentes nos modelos de IA da Google, que visam melhorar o desempenho geral, mas geram efeitos colaterais nas vozes.

Artefatos de áudio em sessões do Gemini Live

Artefatos sonoros como estalos, estourinhos e chiados aparecem de forma esporádica durante o uso do Gemini Live. Esses ruídos não estão diretamente ligados às mudanças de voz, mas representam outra queixa recorrente em fóruns de suporte da empresa. A ocorrência varia conforme a opção de voz selecionada e nem sempre se repete de forma idêntica.

Muitos usuários conseguem reproduzir o problema em testes específicos, enquanto outros observam os artefatos apenas em condições pontuais. A qualidade do áudio permanece estável em comandos rápidos de voz ou no modo Live integrado ao Android Auto em veículos. Essa diferença sugere que o problema se concentra em sessões de conversa mais prolongadas ou em determinados contextos de uso.

Comportamento em diferentes cenários de interação

As vozes do Gemini Live mantêm maior estabilidade quando o assistente é acionado para comandos breves ou controles por voz simples. No entanto, durante interações conversacionais mais profundas, as alterações na cadência e no tom se tornam mais aparentes. O recurso em carros via Android Auto também preserva melhor as características originais das opções selecionadas.

A Google recebeu questionamentos sobre esses comportamentos, embora não haja confirmação oficial de reconhecimento ou correções em andamento até o momento. Usuários continuam a testar diferentes vozes disponíveis, incluindo Capella, para identificar quais apresentam menos variações ao longo do tempo.

Opções disponíveis e ajustes no aplicativo

O Gemini Live oferece várias vozes personalizáveis com sotaques e tons distintos, como opções que simulam britânico, americano neutro e outras variações regionais. Os usuários podem alterar a seleção diretamente nas configurações do aplicativo para buscar a configuração que melhor se adapta às preferências individuais. A troca de voz nem sempre resolve os problemas de cadência de forma permanente.

  • As opções incluem vozes com características de tom mais elevado ou mais grave.
  • Algumas preservam melhor o sotaque escolhido em sessões iniciais.
  • O reset do app pode restaurar temporariamente o comportamento esperado.
  • Atualizações de modelo influenciam o desempenho geral das vozes.

Essas funcionalidades permitem maior customização, mas as inconsistências relatadas destacam a necessidade de ajustes por parte da empresa responsável pelo desenvolvimento.

Evolução das vozes no Gemini Live ao longo do tempo

Ao longo dos últimos meses, diversas opções de voz do Gemini Live passaram por modificações que alteram aspectos como velocidade da fala e mistura de sotaques. Essas mudanças coincidem com melhorias em outros aspectos dos modelos de IA, incluindo velocidade de resposta e compreensão contextual. O recurso continua em evolução, com atualizações que visam tornar as interações mais fluidas.

Usuários que dependem de vozes específicas para tarefas diárias ou acessibilidade observam impactos diretos na usabilidade. A consistência entre a prévia de áudio e a execução real permanece um ponto de atenção para quem utiliza o assistente em conversas prolongadas. A Google segue aprimorando o sistema, com base em feedbacks recebidos sobre o desempenho das vozes.