News (CN)

谷歌推出基于 Arm 处理器的 Gemma 4,以加速 Android 上的人工智能

Gemma 4
照片: Gemma 4 - Koshiro K/Shutterstock.com

这家科技巨头宣布推出针对移动设备优化的新一代语言模型。与特定硬件架构的直接集成允许在本地执行复杂的任务,无需将数据发送到外部服务器。

此更新代表了当前智能手​​机生态系统的重大技术进步。开发人员现在拥有原生工具来创建更流畅的应用程序,无论互联网连接的质量如何,这些应用程序都会实时响应用户命令。

本地处理改变了应用程序与日常事务交互的方式。直接在设备上运行可确保立即响应、更长的电池寿命以及操作系统中存储的个人信息的更高级别的隐私。

移动处理架构的技术进步

这项创新的基础在于使用 Armv9 架构,该架构为机器学习工作负载提供了安全且高度优化的环境。可扩展矩阵扩展 2 (SME2) 技术的引入充当了重型矩阵运算的催化剂,这对于大规模语言模型的运行至关重要。这种扩展允许在传统手机的热量和功率限制内进行计算。

Arm C1 系列处理器在出厂时就已纳入这些规格。实际结果是即使在长时间使用智能工具的情况下也能保持高性能。

KleidiAI 加速层与 XNNPACK、LiteRT 和 MediaPipe 等基本库结合使用。硬件和软件之间的深度集成创建了直接通信通道,减少了处理瓶颈。当应用程序请求复杂任务时,系统会智能地在处理器内核之间分配负载,确保用户界面保持响应。这种技术协同作用使得在尺寸和散热能力受到物理限制的设备上执行强大的模型成为可能。

速度和效率显着提高

工程测试表明,运行 E2B 模型时响应时间得到了显着改善。与前几代软件相比,进程启动速度提高了五倍以上。

实时响应的生成也带来了相当大的性能提升。处理速度明显加快,虚拟助手和生产力应用程序可以向语音或文本命令提供近乎即时的结果。

扩展对多模式交互的支持

新版本的系统将解释功能扩展到传统文本格式之外。该技术现在可以同时处理音频和图像输入,为最终用户创建更加自然和直观的交互环境。

这种多模式方法促进了教育和无障碍工具的开发。例如,应用程序可以立即分析照片并描述其音频内容,而在媒体格式之间转换时不会出现明显的延迟。

在最近的更新中,多语言支持也得到了改进。内存空间优化允许复杂的语言包在本地运行,确保该技术可以在世界不同地区访问,而不会影响设备存储。

数字无障碍的实际应用

Envision 应用程序针对有视力障碍的人,是这种新的本地处理技术的主要用例。该平台使用智能手机的摄像头来实时读取文本、识别面孔并描述物理环境。

以前,解释复杂的场景需要将捕获的图像发送到云服务器。这一过程依赖于稳定的互联网连接,并且产生的延迟阻碍了用户在公共道路上的移动体验。

随着 SME2 扩展支持本地执行,情况发生了巨大变化。用户捕获图像并直接通过设备的处理器接收环境的详细描述,从而消除了通过移动网络传输数据的步骤。

该应用程序的代表强调,这种自主性改变了该工具的可靠性。在没有蜂窝信号覆盖的区域获得准确响应的能力为低视力用户群体提供了更大的安全性和独立性。

设备上的数据隐私和安全

从云处理迁移到本地执行解决了当今技术行业最大的问题之一:个人信息的安全性。通过将所有敏感数据(例如照片、音频和搜索历史记录)严格保存在智能手机的存储范围内,网络传输过程中泄露或被拦截的风险几乎被消除。

这种去中心化的架构还降低了软件开发人员的运营成本,他们不再需要维护大量服务器基础设施来处理用户请求。手机承担了主处理器的角色,使先进智能工具的访问民主化,并确保信息的控制权完全掌握在设备所有者手中。

开发者生态系统的战略合作伙伴关系

负责硬件和操作系统的公司之间的技术合作旨在简化为移动市场创建解决方案的程序员的日常工作。当应用程序在支持新处理器架构的设备上运行时,会自动启用性能优化。更新的库和开发框架提供了软件工程团队实现高级功能所需的快捷方式,而无需从头开始重写复杂的代码。这种易于集成的方式加快了开发周期,使创新能够更快地到达应用程序商店,从而更快地到达最终​​消费者,从而为移动软件行业建立了新的质量标准。

热管理和能源消耗

能源效率是这一技术更新的核心支柱。处理器资源的智能管理可确保执行复杂的任务不会导致设备过热或日常使用过程中电池快速耗尽。

独立移动运营的未来

该技术的大规模采用标志着移动设备操作方式的结构性变化。随着设备在逻辑处理方面变得自给自足,对高速数据连接的持续依赖开始减少。

全球数百万用户将受益于这一技术转型。快速、安全且独立于网络的工具的民主化重新定义了人们对现代智能手机在日常场景中的功能的期望。