最新新聞 (TW)

Google Meet 人工智慧可在手機上即時翻譯音訊和原聲

Google Meet
Foto: Google Meet -Saitee / Shutterstock.com

Google Meet 應用程式已開始為 Android 和 iOS 裝置推出新的即時語音翻譯工具。該功能使用 Gemini 人工智慧模型幾乎立即處理參與者的語音。自去年以來,該資源已在網頁瀏覽器版本中運作。此更新允許用戶直接在連接到智慧型手機和平板電腦的揚聲器或耳機上收聽翻譯後的音訊。該系統最初支援英語和企業環境中廣泛使用的其他語言之間的雙向配對。

該技術透過產生保留廣播公司聲音特徵的聲音再現,超越了自動字幕的傳統格式。該工具保持語氣、詞語的強調以及演講者的原始節奏。結果在視訊會議期間創造了更流暢的溝通體驗。翻譯後的音訊就像專業配音一樣,而在通話背景中,參與者的原始聲音仍然可以以明顯較低的音量聽到。

Google見面
Google Meet – 照片:Thaspol Sangsee / Shutterstock.com

音訊處理和更新時間表

同聲翻譯透過連續的資料流進行操作,處理原始音訊並在幾毫秒內提供翻譯版本。會議參與者啟動控制面板中的設定並選擇所需的目標語言。系統捕捉接收到的語音,分析句子的上下文,並以聽眾選擇的語言再現內容。該技術方法減少了跨國團隊的語言障礙。不同語言的專業人士能夠以更清晰的方式進行交互,並且在理解訊息時延遲更少。

該功能的推出計劃是針對整個全球用戶群逐步進行的。配置了快速發布設定檔的網域名稱從 2026 年 4 月 8 日起開始在行動應用程式中接收更新。使用預定發布方案的企業網域將從 2026 年 4 月 23 日起存取該工具。該功能的最終可用性取決於最新版本應用程式的安裝,該應用程式必須直接從官方 Google Play 商店或 App Store 下載。

支援的語言和模板開發

目前的技術支援涵蓋英語和其他五種全球語言之間的雙向翻譯對。最初的相容性清單包括西班牙語、法語、德語、葡萄牙語和義大利語。語言覆蓋範圍涵蓋了在企業環境、教育機構和商業談判中進行的國際交流的很大一部分。這些語言的選擇反映了主要消費市場對公司視訊會議服務的需求。

開發團隊報告說,新的語言包將在未來幾個月內進入應用程式目錄。土耳其語將作為下一個確認包含在系統更新路線圖中的語言出現。工程師致力於改進人工智慧模型,以確保更準確地檢測區域細微差別。對當地習語和俚語的處理也進行了技術改進,以提高向行動用戶提供的翻譯的整體品質。

存取要求和隱私權政策

使用語音翻譯需要連結到特定的 Google Workspace 生態系統計畫或專注於人工智慧工具的訂閱。符合資格的企業套餐包括 Business Standard、Business Plus、Enterprise Standard 和 Enterprise Plus 類別。 Google AI Pro 和 Ultra 等個人訂閱選項也在手機上發布了功能。註冊 Education Plus 計劃的教育機構可以完全使用同步配音功能。

該工具的操作動態要求只有一名通話參與者在其帳戶上啟動了符合條件的計劃。虛擬房間中的單一訂戶的存在允許會議的所有其他成員使用翻譯,而無需購買額外的個人許可證。此格式有助於與使用免費帳戶的外部客戶和業務合作夥伴進行溝通。

該應用程式的安全架構為企業和教育視訊通話期間聲音處理技術的使用制定了嚴格的準則:

  • 啟動該工具需要使用者透過手機螢幕上的授權按鈕明確同意。
  • 參與者保留完全控制權,可以在通話期間隨時撤銷翻譯授權。
  • 資訊科技管理員擁有控制面板來阻止公司基礎設施中的資源。
  • 語音資料處理遵循加密協議,以避免伺服器上不當儲存對話。

隱私框架確保會議中討論的敏感資訊仍然受到平台合規政策的保護。負責應用程式的公司會定期進行審核,以確保人工智慧模型在視訊會議結束後不會保留音訊片段。

行動裝置上的工具配置

在通話過程中,啟動即時配音的過程直接在主應用程式介面中進行。透過手機或平板電腦加入會議室的使用者需要點擊螢幕底部的三點圖示。附加選項選單顯示應用程式的常規設定標籤。參與者必須找到語音翻譯部分並啟動虛擬開關以開始音訊處理。

設定選單中缺少該選項表示該裝置仍在執行過時版本的軟體。用戶必須訪問其作業系統的應用程式商店並檢查從 2026 年 4 月起發布的更新包的可用性。安裝軟體包後重新啟動應用程式可確保正確載入整合到程式原始碼中的新人工智慧模組。

對遠距通訊和教育的影響

行動裝置上的功能的到來擴大了在傳統辦公室之外工作的專業人員的工作可能性。忙碌的銷售代表、現場檢查員和管理人員只需使用行動網路連線和智慧型手機即可參加複雜的國際會議。參加外語課程或虛擬交換計畫的學生還可以找到為後續由母語教師教授的課程提供實踐支援的工具。

保留原始語調的技術減少了機器人翻譯系統中常見的人工感覺。在翻譯的音訊中傳達興奮、嚴肅或驚訝的能力可以拉近對話者的距離,並改善對話情緒背景的解釋。優先開發基於人工智慧的解決方案的策略鞏固了該應用程式在企業通訊平台競爭市場中的地位,提供了優化遠距離人類互動的時間和清晰度的工具。