Google Gemini 已收到新的更新,允许在配备 Android 操作系统的设备上直接与 WhatsApp 消息应用程序集成。这一变化将人工智能工具转变为能够执行复杂任务的虚拟代理,而不仅仅是回答孤立问题的简单功能。该功能授权发送消息、检索生态系统中其他应用程序中存储的数据以及实时执行命令,从而无需用户在手机屏幕上手动在不同平台之间切换。
这一新功能代表了用户与智能手机交互方式的重大进步。此次集成充当了一座技术桥梁,将 Meta 的即时通讯工具与这家搜索巨头的本地服务(例如 Google Keep、日历和 Google 地图)连接起来。在单个语音命令中处理多个步骤的能力改变了日常使用的动态,允许以前需要多次屏幕点击的工作流程在后台默默地自动完成。
Android系统资源配置
激活新功能需要用户在智能手机上安装和配置官方 Google Gemini 应用程序。该功能仅适用于 Android 环境,这意味着 iPhone 设备的所有者目前无法使用该工具。该公司还将新功能限制在移动环境中,将网页版助手排除在这一特定的连接更新之外。
为了实现人工智能和信使之间的通信,设备所有者需要在助手自己的设置中执行一个程序。激活路径设计得非常简单,只需在主软件界面上点击几下即可。该过程遵循特定的菜单顺序:
- 打开手机上的 Google Gemini 应用。
- 访问用户配置文件图标并进入“设置”部分。
- 导航到“个人智能”选项,然后选择“连接应用程序”。
- 找到 WhatsApp 选项并激活切换按钮。
完成此过程后,虚拟助手会从操作系统获得必要的权限,以访问 WhatsApp 对话历史记录并执行文本发送命令。激活切换按钮是授权两个应用程序之间数据交换的触发器,确保人工智能在编写任何消息之前了解请求的上下文并识别手机地址簿中的正确联系人。
与旧版 Google Assistant 相比的演变
与旧版 Google Assistant 的传统语音命令相比,Google Gemini 的操作架构呈现出深刻的结构差异。以前的系统以孤立和线性的方式运行,仅限于在按姓名激活特定联系人后转录用户口述的单词。旧技术解释复杂上下文或交叉引用来自不同应用程序数据库的信息的能力有限。
新的人工智能模型以集成的方式发挥作用,充当手机的中央数据处理中心。该软件可以访问笔记、检查日历约会和绘制路线,同时保持消息传递界面处于活动状态。此功能将助手转变为真正的生产力代理,能够解释用户的意图、在源应用程序中搜索必要的信息、格式化内容并将其不间断地传送到目标应用程序。
技术专家指出,这种从简单命令模型到多步骤任务执行系统的转变反映了移动设备上机器学习的演变。减少屏幕时间和自动化重复流程是此更新的主要实际好处,提供更流畅的用户体验,并减少对与设备显示屏的持续手动交互的依赖。
Google Keep 和 Google 地图的实际使用示例
该技术的实际应用可以在日常信息共享场景中观察到。过去,如果用户想要发送保存在笔记中的文档,该过程需要离开 WhatsApp、打开 Google Keep、找到特定文件、复制文本块、返回到 Messenger、粘贴内容并按发送按钮。通过新的集成,流程简化为单个语音命令,例如指令:“从 Google Keep 获取我的披萨食谱,然后通过 WhatsApp 将其发送给 Mark。”
Google Gemini 在用户不可见的情况下执行整个操作。系统找到所请求的注释,提取相关信息,格式化清晰的文本消息,并只需轻轻一按确认即可在信使中准备发送字段。同样的逻辑也适用于共享地理位置数据和路线规划。在安排行程时,智能手机用户可以发出以下命令:“查找从我家到代托纳海滩的距离,并将详细信息通过 WhatsApp 发送给我的朋友。”
使用此命令,虚拟助手会查阅谷歌地图数据库,计算最有效的路线,提取有关旅行时间和里程的基本数据,以易于理解的方式构建文本,并在消息传递应用程序中打开准确的对话窗口。这种通过通信工具交叉引用地理数据的能力说明了简单的语音转文本软件与旨在连接数字生态系统的人工智能代理之间的根本区别。
Android Auto 中通过语音命令进行操作
集成功能还通过 Android Auto 系统扩展到汽车环境。将技术应用于车辆的主要重点是维护道路安全,使驾驶员无需使用手机即可执行复杂的通信任务。可以通过汽车仪表板内置的麦克风或按下方向盘上的语音控制按钮来激活。
在下班回家的路上,司机可以使用自然语言来管理他们的约会。此应用程序的一个实际示例是,当驾驶员激活系统并说:“在 WhatsApp 上向 Sonal 发送消息,说我将在大约 10 分钟后到达。”该软件在机舱噪音中捕获音频,处理句子的意图并识别电话簿中的联系人。
语音处理立即发生,系统在完成发送之前通过 Android Auto 界面请求视觉或听觉确认。执行该任务完全消除了用户将目光从赛道上移开或看智能手机屏幕的需要。通过自动化写入和发送过程来保证在交通中保持注意力,加强人工智能作为驾驶车辆时安全辅助工具的作用。
生态系统扩展以及与 Spotify 的集成
激活应用程序个人智能部分中的连接按钮可将虚拟助手从简单的技术新颖性转变为实用且功能齐全的指挥中心。开发人员鼓励用户探索软件的扩展菜单,以发现自动化日常任务的新方法。通过复杂的语音命令发送格式化文本消息的能力只是该平台提供的第一层可能性。
集成生态系统不断发展,不仅包括通信和生产力工具,还包括娱乐平台。除了与 WhatsApp 建立的连接外,Google Gemini 还展示了与市场上其他高度相关的第三方应用程序的兼容性,包括 Spotify 音频流服务。这些合作伙伴关系的扩展表明助理作为用户与移动设备上安装的所有服务之间的主要中介的趋势。

