Google Meet 应用程序可在手机上使用人工智能进行同步语音翻译

Google Meet

Google Meet -Saitee / Shutterstock.com

谷歌已开始为 Android 和 iOS 操作系统上的 Google Meet 应用推出新的语音同声翻译工具。该技术利用人工智能在视频会议期间实时处理参与者的语音。自去年以来,该功能已在网络浏览器版本中运行。现在,该功能已扩展到移动设备,以方便任何地方的远程通信。

该系统由 Gemini 模型提供支持,几乎可以立即向听众提供翻译后的音频。此更新旨在打破全球团队和教育环境中的语言障碍。该工具超越了传统的文本字幕。处理后的音频试图保持说话者的原始特征,直接通过手机或平板电脑产生更自然、更流畅的对话体验。

Google Meet – 照片:Thaspol Sangsee / Shutterstock.com

人工智能如何保持通话时的语气

该功能的主要创新在于能够在直播过程中克隆人声。该软件不提供通用的机器人声音。人工智能分析用户的语音模式并生成目标语言的合成版本。原声在背景中保持很低的音量,而配音则在通话中起主导作用。

这种技术方法确保对话的情感背景不会在翻译中丢失。使用该平台的专业人士能够以同样原始的强度传达他们的想法。该工具有效地捕捉人类交流的微妙之处。

  • 该系统识别并再现演讲过程中兴奋或严肃的时刻。
  • 合成语音根据所选语言调整单词的节奏和重点。
  • 会议中只有一名成员需要有兼容的计划才能将该角色释放给其他人。

操作动态仅需要参与者激活该选项并定义所需的收听语言。处理在 Google 云中进行。翻译后的音频以最小的延迟传输,使辩论和演示能够连续进行,不会出现影响理解的突然中断。

发布截止日期和运行所需的包

新功能在移动应用程序中的实施将在 2026 年 4 月期间逐步进行。配置为快速发布的企业域于 2026 年 4 月 8 日开始接收更新。计划发布的环境将从 2026 年 4 月 23 日起访问该工具。用户需要在其操作系统的官方商店中保持应用程序更新。

使用语音翻译需要特定订阅 Google Workspace 生态系统。该公司将新功能限制在针对企业或高级教育用途的最强大的软件包中。传统的免费帐户无法启动声音克隆功能。

符合条件的计划包括 Business Standard、Business Plus、Enterprise Standard 和 Enterprise Plus。 Google AI Pro 和 Ultra 套餐的订阅者也可以获得该功能。在教育领域,该工具是教育+计划的一部分。如果组织者或参与者拥有这些许可证之一,则虚拟房间中的每个人都可以免费收听翻译。

系统初始阶段和扩展阶段可用的语言

首先,技术支持涵盖英语与全球广泛流通的其他五种语言之间的双向对。官方名单包括西班牙语、法语、德语、意大利语和葡萄牙语。这一初步选择涵盖了视频平台上日常进行的商业和学术互动的很大一部分。

该公司已经确认语言库将在未来几个月内增长。土耳其人预计将成为开发计划中的下一个已确认的补充。软件工程师致力于完善人工智能模型。目标是提高检测地区口音和复杂惯用语的准确性。

语言目录的扩展依赖于 Gemini 模型的持续训练。随着系统处理新的语言数据,同声翻译的质量也会提高。谷歌仍然专注于提供尊重应用程序支持的每个地区的语法规则和文化背景的配音。

移动设备上的隐私设置和激活

语音数据安全是新的 Google Meet 功能架构中的一个优先事项。翻译激活不会自动或隐藏地发生。用户需要通过应用程序界面上的特定按钮授予明确的权限。任何参与者都可以在视频通话期间随时撤销此授权。

要在 Android 或 iOS 上启用该功能,该过程需要在智能手机屏幕上点击几下。用户在视频会议期间必须访问由三个点表示的菜单。然后导航到设置区域并找到语音翻译激活键。直观的界面使具有不同技术知识水平的人都可以轻松使用。

企业网络管理员可以完全控制该工具的可用性。管理面板允许您阻止或释放特定员工组的资源。 Google 采用严格的安全协议,以确保处理后的音频在同声翻译会话期间不会被拦截或不当存储。

另见