最新新聞 (TW)

Google在 Gboard 鍵盤上準備了新的 Rambler 系統,並與 Gemini Intelligence 一起改進 Android 上的聽寫

Gemini
Gemini - mundissima/ Shutterstock.com

谷歌正在推進其官方虛擬鍵盤更新的開發。該公司正在準備將 Rambler 工具與 Gemini Intelligence 原生整合到 Gboard 中,Gemini Intelligence 是一個旨在重塑智慧型手機語音聽寫的系統。在技​​術分析過程中,新功能似乎隱藏在應用程式的內部文件中。主要目標涉及解決長音頻自動轉錄的缺陷。

在詳細檢查了Android系統的安裝套件後,確認了該項目。專家設法提前啟用該介面,並在設定選單中顯示新選項。功能按鈕的出現預示著內測階段已接近完成。預計在未來幾個月內進行全球發行。

逆向工程揭示Android系統中隱藏的介面

這項發現是透過應用程式資料包中的程式碼掃描發生的。 Android Authority 入口網站進行了測試,揭露了負責新人工智慧的命令列。開發人員使用逆向工程強制向一般使用者顯示鎖定畫面。該過程允許映射嚮導設定的視覺結構。

啟動的畫面顯示了Google選擇的將鍵盤與最新語言模型統一的路徑。內部選單提供了用於管理捕獲的音訊的特定複選框。該架構建議重點關注本地資訊的智慧處理。這種方法減少了語音辨識對外部伺服器連線的依賴。

早期訪問表明該介面將保持已知的視覺識別。整合在高級配置中謹慎進行,僅需要啟動數位開關。這種簡單性與在後台解碼聲音模式的演算法的複雜性形成鮮明對比。該模型增加了強大的功能,而不會污染主螢幕。

Rambler 技術可修正語法並消除語音停頓

技術差異在於即時根據上下文解釋語音的能力。該工具允許用戶按照思路以自然的方式聽寫整個段落。人工智慧承擔起建構最終文本的責任,確保凝聚力和流動性。該引擎充當處理單字的即時校對器。

當麥克風保持開啟時,資料處理器執行自動編輯任務。主要功能包括:

  • 完全消除口語溝通中常見的猶豫,例如口吃和不自覺地重複音節。
  • 自動消除麥克風拾取的背景噪音並抑制單字之間的長時間停頓。
  • 根據語調和句子上下文準確插入句號、逗號和問號。
  • 糾正口頭和名義協議錯誤,而不改變口述訊息的原始意義。
  • 調整語法以確保清晰度並使其更容易在即時通訊應用程式中快速閱讀。

演算法的校準旨在改進書面表達,而不刪除訊息生成者的身份。該系統經過訓練可以保留地區術語和俚語,重點是糾正即興語言缺陷。技術可以區分語法錯誤和故意的口語表達。此功能代表了對傳統轉錄器的顯著改進。

本地處理確保音訊轉換的敏捷性

直接在硬體上執行轉錄任務代表了聽寫服務的轉變。配備 Gemini Intelligence 的 Gboard 使用裝置的神經處理器來分析語音,而無需將持續的音訊資料包傳送到雲端。此策略減少了語音和單字出現之間的延遲。使用者註意到幾乎即時的回應。

互聯網的部分獨立性解決了覆蓋不穩定地區的使用問題。即使設備經過訊號陰影區域,系統也能維持轉錄準確性。服務的連續性可防止因連線中斷而遺失指定部分。此功能將語言模型儲存在記憶體中。

本地處理方法滿足了對數位隱私日益增長的需求。在設備本身內將語音轉換為文字可以降低與敏感資訊流量相關的風險。語音生物辨識資料和訊息內容仍然僅限於擁有者的硬體。該公司透過限制對第三方伺服器的依賴來增強安全性。

生態系統的擴張加劇了手機市場的競爭

Rambler 的推出鞏固了公司透過生成式人工智慧改變使用者體驗的策略。該計畫在五月宣布,在最近的洩漏事件之前,一直將操作細節限制在實驗室範圍內。虛擬鍵盤是數十億設備之間資料輸入的主要互動點。此次更新將實用應用程式變成了寫作助理。

與 Apple 開發的本地解決方案相比,應用 Gemini Intelligence 印章可帶來直接的競爭優勢。透過免費的上下文轉錄,爭奪行動生產力工具主導地位的鬥爭進入了新的篇章。這家 Android 製造商致力於標準化智慧打字體驗,超越亞洲汽車製造商實施的軟體修改。統一的鍵盤確保同步創新。

分析師預計,新產品的分發將分階段進行,以確保伺服器的穩定性。預計 Pixel 系列智慧型手機將在初始階段獨家獲得該功能。擴展到與作業系統相容的其他設備應該逐步進行。交錯的時間表允許工程師在大規模發布之前糾正任何缺陷。

To Top