Google Gemini 已收到更新,允許在配備 Android 作業系統的裝置上直接連接 WhatsApp。新颖性改变了使用的动态。新功能將人工智慧轉變為能夠執行複雜任務的代理,而不僅僅是簡單地回答問題或聽寫文字。該功能使得發送訊息、從其他應用程式檢索資訊以及即時執行命令成為可能,而無需在手機螢幕上的不同平台之間切換。
這項變更代表了使用者與智慧型手機互動方式的進步,在不同服務之間建立了流暢的溝通。該整合充當了技術橋樑,允許人工智慧從 Google Keep 和 Google Maps 等工具存取數據,以在 Meta Messenger 中製定自動發貨。技術專家指出,這項運動鞏固了從舊式語音助理到自主生產力代理的轉變。
配置需要在作業系統中手動激活
對於所有使用者來說,資源的釋放不會自動發生。配置需要直接存取安裝在智慧型手機上的 Google Gemini 應用程式。該公司確認,該新功能僅適用於 Android 生態系統,使 iPhone 用戶無法進入這個初始實施階段。網頁版人工智慧也不支援該特定功能。
為了啟用應用程式之間的通信,設備所有者需要在首選項選單中執行一個過程。這個過程確保用戶授予人工智慧存取對話內容並能夠代表他們發送訊息的必要權限。激活路徑遵循開發人員制定的特定順序:
- 開啟手機上的 Google Gemini 應用程式。
- 存取使用者設定檔圖示並進入“設定”標籤。
- 導航到名為“個人智慧”的部分,然後選擇“連接應用程式”。
- 找到 WhatsApp 選項並啟動切換按鈕。
完成這些步驟後,虛擬助理從系統獲得授權,可以與信差一起操作。手動啟動的要求反映了作業系統的隱私權政策,在允許第三方軟體操縱個人通訊資料之前需要明確同意。這一安全層可防止該工具在設備管理員事先不知情的情況下執行不必要的操作。
與舊版 Google Assistant 相比的結構差異
新系統的操作與傳統語音指令所使用的架構有很大不同。舊的 Google Assistant 在智慧型手機環境中獨立運作。先前的工具僅限於使用者使用日曆中註冊的姓名呼叫特定聯絡人後聽寫訊息。理解更廣泛的背景或交叉引用不同來源的資訊的能力受到嚴格的技術限制。
Google Gemini 在持續整合邏輯下運作。人工智慧充當手機上安裝的多個應用程式之間的連結。該軟體可以同時存取日曆、記事本和地理定位服務,同時保持訊息傳遞介面隨時可用。這種平行處理功能將該工具轉變為能夠管理需要多個步驟的工作流程的代理,將所有內容整合到單一語音命令中。
這項變化背後的技術演變涉及大規模語言模型的使用。這些演算法可以更精確地處理用戶意圖,識別需要觸發哪些應用程式來履行訂單。結果是更有機的使用者體驗。這台機器接管了打開、複製、貼上和關閉視窗的跑腿工作,只將最終結果傳送到聊天螢幕。
使用案例涉及即時數據交叉
這項技術的實際應用改變了日常任務的動態。在常見的文件共享場景中,手動程序需要用戶登出 WhatsApp,打開 Google Keep,找到所需的註釋,將文字複製到剪貼簿,然後返回 Messenger 貼上內容。在新的更新中,用戶只需說出這句話:「從 Google Keep 獲取我的披薩食譜,並將其發送給 WhatsApp 上的 Mark」。
Google Gemini 在背景執行整個操作序列。該工具檢索所要求的文檔,清晰地格式化文字訊息,然後只需輕輕一按確認即可準備在 Meta 應用程式中發送。同樣的邏輯也適用於共享路線和地理位置。在計劃旅行時,個人可能會要求:“查找從我家到代托納海灘的距離,並將詳細信息通過 WhatsApp 發送給我的朋友。”
收到此指令後,助理立即查閱Google地圖資料庫。系統計算最有效的路線,提取有關路線的基本信息,以可讀的方式構建文本,並在信使中準確打開相應的對話窗口。根本區別在於從簡單的語音到文字轉換器到跨平台自主操作資料的人工智慧代理的轉變。
Android Auto 儀表板引入語音指令操作
服務之間的整合也透過Android Auto系統延伸到汽車環境。駕駛者可以直接啟動車輛媒體面板上的麥克風,或按下方向盤上的語音指令按鈕來發出自然指令。在下班回家的路上,司機可以啟動系統並說:「在 WhatsApp 上向 Sonal 發送訊息,說我將在大約 10 分鐘內到達」。
機載計算機立即處理語音。系統透過 Android Auto 的視覺和聲音介面確認請求的操作並發送訊息。整個過程的發生不需要使用者將視線從道路上移開或觸摸手機螢幕。維護道路安全是該實施的主要重點之一,消除了駕駛汽車時與設備進行手動互動的需要。
道路安全專家評估,改進的語音命令可顯著減少駕駛時的干擾。谷歌雙子座能夠在第一時間理解複雜的句子,減輕了老助手常見的挫折感。先前的版本通常需要重複命令或手動修正軟體誤解的單字。
生態系擴展涵蓋其他第三方平台
啟用 Google Gemini 個人智慧部分中的 WhatsApp 鍵,即可將助理從簡單的技術新穎物轉變為日常生活的實用指揮中心。該公司鼓勵用戶探索應用程式的擴展菜單,以發現自動化日常任務的新方法。透過複雜的語音命令發送文字訊息只是更廣泛的連接項目的初始階段。
除了與 Meta Messenger 的功能合作之外,Google Gemini 還展示了與第三方開發的其他工具的日益增強的兼容性。該系統已經具有與 Spotify 等音訊串流平台整合的功能,允許對音樂和播客播放進行高級控制。 Android 作業系統的開放架構表明,未來幾個月新應用程式可能會採用類似的協定。
人工智慧代理在行動裝置上的整合顯示軟體設計範式的轉變。應用程式不再是孤立的資訊孤島,而是開始充當互連生態系統中的齒輪。谷歌仍然專注於提高 Gemini 的上下文理解能力,旨在為行動系統的全球用戶群提供越來越準確的回應和更快的行動。

