Google 发布 Gemma 4,带有 Apache 2.0 许可证和适用于本地设备的模板
谷歌本周四宣布推出 Gemma 4 系列,该系列由具有可用权重的新型开源人工智能模型组成。此次更新是自一年多前推出 Gemma 3 以来该系列的首次重大进步。开发人员现在拥有 Apache 2.0 许可证,它消除了以前版本中存在的商业限制。
这些模型支持文本、音频和图像输入,最大变体的上下文窗口达到 256,000 个标记。它们主要设计为在经济实惠的硬件上本地运行,包括消费级 GPU 和移动设备。许可证变更有利于商业使用,而无需 Google 施加额外义务。
推理和多模式方面的技术改进
与上一代相比,新模型在推理、数学和遵循指令方面带来了显着进步。它们结合了本机函数调用支持和 JSON 结构化输出生成,这有利于代理工作流程。
代码处理能力针对离线环境进行了优化,性能可与Gemini Pro等云服务相媲美。视觉输入支持可以更准确地实现光学字符识别和图形解释等任务。
- 变体包括针对智能手机低延迟进行优化的有效 2B 和 4B 模型。
- 与高通和联发科的合作促进了与移动设备的集成。
- 较大的模型在单个 80GB H100 GPU 上运行,无需量化。
尺寸变化和能源效率
Gemma 4 系列有四种主要尺寸配置。 26B 专家混合版本和 31B 密集版本提供高性能并在服务器或工作站硬件上运行。有效的 2B 和 4B 优先考虑边缘设备上的执行效率。
26B MoE 模型在推理过程中仅激活 38 亿个参数,从而减少了延迟和功耗。所有变体均可处理 140 多种语言。开发者可以在 Hugging Face、Kaggle 和 Ollama 等平台上下载完整权重。
跨平台立即可用
较大的 31B 和 26B 模型可在 Google 的 AI Studio 中找到。轻量级的E4B和E2B版本可以在AI Edge Gallery中访问。完整的权重可以立即从公共存储库下载。
公司和研究人员可以将模型集成到本地应用程序中,而无需重复产生 API 成本。谷歌还表示,2B 和 4B 版本将作为即将推出的 Android 设备上的 Gemini Nano 4 的基础。
切换到 Apache 2.0 许可证的影响
Apache 2.0 许可证的采用消除了之前自定义许可证的限制,其中包括单方面可更新的不使用策略。开发人员可以更好地控制数据和业务部署。
这一变化应该会鼓励社区中创建新项目,非正式地称为 Gemmaverse。对本地执行的关注强化了为 Gemini 系列封闭模型提供开放替代方案的战略。
针对特定硬件的优化
轻量级版本是与移动芯片制造商合作开发的。它们在日常任务中提供近乎零的延迟,同时保持较低的电池消耗。测试表明在 Raspberry Pi 和 Jetson Nano 等主板上具有良好的性能。
较大的模型即使在密集配置或 MoE 中也能保持效率。减少本地处理中的延迟对于需要隐私和快速响应而无需持续连接服务器的应用程序来说代表着实际收益。
支持多种输入方式
除了文本之外,这些模型还可以本地处理音频和图像。语音识别功能比 Gemma 3 有所改进。多模式功能为实时组合不同类型数据的应用程序提供了可能性。
开发人员可以使用轻量级变体直接在 AI Core Developer Preview 中构建代理流原型。这些实现与即将推出的 Gemini Nano 4 向前兼容。
Gemma 4 系列强化了 Google 提供具有可承受权重的开放模型的承诺。改进的性能、宽松的许可和多样化的硬件支持相结合,为那些寻求本地可运行的人工智能解决方案的人提供了更多的选择。
Veja Tambem em News (CN)
扎克·克雷格的新《生化危机》忽略了游戏,而是专注于一个前所未有的故事和新角色
苹果加速 iPhone 17e 生产并开发配备双摄像头系统的新款 Air 机型
Epic Games 平台向 PC 用户免费发布 12 款高预算游戏
PlayStation 5 Pro 降价加速数字零售销售并消除全球库存
苹果纪念项目测试2027年1.1毫米边缘曲面屏手机
苹果新系统更新优化 iPhone 用户的紧急任务管理
新款便携式 PlayStation 的硬件细节泄露,其图形性能优于 Xbox Series S
Oppo 正式在全球推出 Find X9 Ultra,配备哈苏镜头和强劲电池
蒂姆·库克 (Tim Cook) 展示新款 iPhone 和 iPod 原型机,庆祝苹果公司成立 50 周年
新版可折叠智能手机为冬奥会参赛者带来金牌
三星更新 QuickStar 模块并扩展 One UI 8.5 界面中面板的视觉控制