News (CN)

Gemini Live 在最近的更新中改变了声音和节奏

Gemini
照片: Gemini - Primakov / Shutterstock.com

Gemini Live 用户注意到谷歌人工智能助手的语音选项发生了变化。这些变化包括语音节奏、语气的变化,甚至实时交互过程中地区口音的混合。这些更改经常发生在模板更新后,例如最近的 Flash Live 3.1 版本,并影响个性化对话体验。

许多报告表明,使用实时功能时,应用程序中的语音预览与实际声音不匹配。再现英国女性口音的卡佩拉选项,自最初推出以来呈现出更明显的变化。其他地区的声音也表现出类似的一致性问题。

语调和语气的变化

语音节奏的变化是在 Gemini Live 中使用不同语音选项的用户最常见的抱怨之一。在各种设置下,语音模式都会变慢,而高音调则明显减少。在某些情况下,在正在进行的对话中,人们会交替使用澳大利亚口音和中性的美国口音。

这些调整会在重置应用程序后逐渐发生,此时所选的口音会在转换为混合版本之前保留一小段时间。对于那些希望交互保持一致的人来说,这种体验可能会变得不舒服。对话时间较长的用户会更频繁地注意到这些转换。

双子座
双子座 – mundissima/Shutterstock.com

资源预览与实际使用对比

Gemini Live 设置中提供的音频预览通常与活动聊天会话中获得的结果不同。这种差异尤其影响个性化的声音,随着时间的推移,个性化的声音会失去原有的特征。近几个月积累的报告表明,几种可用的选择正在逐渐恶化。

  • 较慢的节奏会影响反应的自然流程。
  • 高音变得柔和,改变了声音的个性。
  • 对话中口音的混合是不可预测的。
  • 暂时重置应用程序会部分恢复初始行为。

这些观察结果是在谷歌人工智能模型频繁更新的背景下得出的,这些模型旨在提高整体性能,但会对语音产生副作用。

Gemini Live 会话中的音频伪影

使用 Gemini Live 时,偶尔会出现爆裂声、爆裂声和嘶嘶声等声音伪影。这些噪音与声音变化没有直接关系,但代表了该公司支持论坛上另一项反复出现的投诉。出现的情况根据所选的语音选项而变化,并且并不总是相同地重复。

许多用户能够在特定测试中重现问题,而其他用户仅在特定条件下观察到伪影。通过快速语音命令或车辆中 Android Auto 内置的实时模式,音频质量保持稳定。这种差异表明问题集中在较长的对话会话或某些使用环境中。

不同交互场景下的行为

当助理被要求执行简短命令或简单的语音控制时,Gemini Live 语音可保持更高的稳定性。然而,在更深入的对话互动中,节奏和语气的变化变得更加明显。通过 Android Auto 实现的汽车功能也更好地保留了所选选项的原始特征。

谷歌已收到有关这些行为的询问,但目前尚未正式确认或正在进行修复。用户继续测试不同的可用声音(包括 Capella),以确定哪些声音随着时间的推移变化最小。

可用选项和应用内调整

Gemini Live 提供多种具有不同口音和语气的可定制声音,例如模拟英国、中立美国和其他地区变体的选项。用户可以直接在应用程序的设置中更改选择,以找到最适合个人喜好的设置。改变声音并不总能永久解决节奏问题。

  • 选项包括具有较高或较低音调特征的声音。
  • 有些人更好地保留了在最初的会议中选择的口音。
  • 重置应用程序可能会暂时恢复预期的行为。
  • 模板更新会影响声音的整体性能。

这些功能允许更大程度的定制,但报告的不一致凸显了负责开发的公司需要进行调整。

Gemini Live 上声音随时间的演变

在过去的几个月里,Gemini Live 的几个语音选项进行了修改,改变了说话速度和口音混合等方面。这些变化与人工智能模型其他方面的改进相一致,包括响应速度和上下文理解。该功能不断发展,更新旨在使交互更加流畅。

依赖特定声音来完成日常任务或可访问性的用户会看到对可用性的直接影响。对于那些在长时间对话中使用助手的人来说,音频预览和实际执行之间的一致性仍然是一个关注点。谷歌根据收到的有关语音性能的反馈继续改进系统。