谷歌已開始在 Android 和 iOS 版 Google Meet 應用程式中推出人工智慧即時語音翻譯功能。該功能自去年以來已在網路版本中推出,現在允許會議參與者直接在智慧型手機或平板電腦上收聽翻譯後的音訊。該技術使用 Gemini 模型幾乎可以立即處理語音,並且最初支援英語和其他語言之間的雙向配對。
該功能超越了傳統字幕,可以在保留特徵的情況下再現說話者的聲音。該工具保持了演講者的原始語氣、重點和節奏,在對話過程中創造了更自然的體驗。用戶報告說,翻譯後的音訊聽起來像流暢的配音,而原始聲音在背景中保持較低的音量。
- 人工智慧會產生模仿語音情緒細微差別的合成聲音。
- 該系統在翻譯的音訊中保留了興奮、嚴肅或驚喜。
- 只有一名參與者需要存取該資源,以便會議中的每個人都可以聽到翻譯。
語音克隆在 Google Meet 中的工作原理
即時語音翻譯透過結合原始音訊和翻譯版本的連續串流進行操作。參與者啟動此選項並選擇目標語言,之後系統處理傳入的語音並以所選語言傳送內容。這種方法減少了全球團隊中的語言障礙,並促進不同語言的專業人員之間的互動。
該功能正在逐步實施中。快速發布網域將於 2026 年 4 月 8 日開始接收更新,而計畫發布網域應於 2026 年 4 月 23 日接收存取權限。可用性取決於 Google Play 商店或 App Store 中應用程式的更新版本。
初始啟動階段支援的語言
目前支援涵蓋英語和其他五種主要語言之間的雙向對。清單包括西班牙語、法語、德語、葡萄牙語和義大利語。最初的覆蓋範圍涵蓋了企業、教育和專業環境中的大多數國際通訊。
谷歌表示,全年將添加新語言,其中特別提到了土耳其語。在區域細微差別和習慣用語方面更準確的人工智慧模型也在開發中,以提高整體翻譯品質。
發布該功能的訂閱計劃
語音翻譯僅適用於擁有特定 Google Workspace 套餐或 AI 相關訂閱的使用者。套餐包括 Business Standard 和 Plus、Enterprise Standard 和 Plus,以及 Google AI Pro 和 Ultra 等選項。 Education Plus 用戶也可以使用此功能。
組織管理員可以在全域層級或按特定群組控制啟動。這種配置允許公司根據其內部資料安全和隱私權政策調整使用情況。
谷歌採取的隱私措施
啟用翻譯需要使用者透過「為我翻譯」選項獲得明確許可。任何參與者都可以在會議期間隨時撤銷此權限。管理員也可以使用工具在必要時限制整個組織的資源。
谷歌強調,它採用嚴格的協定來保護會話期間處理的語音資料。這些規則旨在確保資訊保持安全並處於使用者的控制之下。
如何在行動應用程式中啟用語音翻譯
在 Android 或 iOS 裝置上加入會議後,用戶必須點擊三點選單才能存取「更多選項」。然後選擇“設定”並尋找“語音翻譯”選項將其啟動。如果沒有出現該功能,建議檢查應用程式是否更新至2026年4月版本或更高版本。
此功能要求至少一名通話參與者擁有有效的合格計劃。這意味著會議的所有其他成員都可以從翻譯中受益,而無需額外的個人訂閱。
對國際團隊和教育的好處
向行動裝置的擴展將該工具的覆蓋範圍擴展到了在傳統工作環境之外參加會議的遠端專業人員。分佈在不同國家的外語學生和團隊也受益於可以進行更流暢的對話,而無需完全依賴字幕或手動翻譯。
科技讓每個人以自己喜歡的語言說話,同時以自己的自然語調聽到翻譯,有助於更大程度地參與全球討論。這項特性使得互動更加直接、更少做作。
該功能的預期未來更新
谷歌計劃在未來幾個月內逐步擴大支援的語言數量並提高翻譯準確性。開發團隊繼續致力於開發能夠更好地處理地區口音和特定語言變化的模型。
該公司的「人工智慧優先」策略強化了其以經濟實惠的方式將先進技術整合到 Google Meet 等產品中的承諾。用戶必須保持應用程式更新,以便在其帳戶中可用時立即獲得改進。
Google將 Meet 的即時語音翻譯功能擴展到 Android 和 iOS
此次發布標誌著人工智慧資源融入日常通訊工具又邁出了一步。該功能已經展示了改變不同國籍的人們透過視訊即時協作方式的潛力。

