科技巨头谷歌向全球软件开发市场透露了 Gemma 4 系列的到来。新的开源人工智能模型使研究人员和程序员完全可以使用权重。此次更新标志着自上一代产品一年多前推出以来该产品线的首次重大飞跃。该系统现在在 Apache 2.0 许可证下运行。这一根本性的变化消除了过去版本中限制企业采用的商业障碍。
该平台本身支持同时文本、音频和图像输入。在该软件包最强大的版本中,上下文窗口达到了令人印象深刻的 256,000 个标记。该项目绝对注重在公众可以访问的硬件上进行本地执行。消费类显卡和移动设备可以轻松流畅地运行该系统。新许可证促进了商业产品的创建,无需附加任何条件或对创建公司承担任何义务。
架构和本地处理方面的进步
工程师针对完全离线环境优化了代码处理能力。目前的性能与基于云的顶级服务(例如 Gemini Pro)相当。对函数调用的本机支持改进了与其他软件工具的集成。生成 JSON 格式的结构化输出直接有利于复杂的自动化工作流程。开发人员获得创建解决方案的自主权,而无需依赖与外部服务器的持续连接。
技术改进涵盖逻辑推理和数学问题解决等基本领域。遵循复杂指令的准确性比上一代高得多。视觉输入支持可在扫描文档中实现高保真光学字符识别。图表和表格的解释快速而详细。本地处理延迟的减少对最终用户来说意味着巨大的实际收益。
多模式功能和改进的性能
该架构同时处理音频和图像,没有处理瓶颈。与 Gemma 3 相比,语音识别在质量上呈现出显着的飞跃。多模式功能为现代交互式应用开辟了一系列可能性。实时结合不同类型数据的系统稳定运行。需要严格隐私的应用程序在新一代开放模型中找到了理想的环境。
快速响应,无需将数据发送至云端,保护用户敏感信息。开发人员可以直接在 AI Core Developer Preview 中轻松构建工作流程原型。当前的实施确保了未来与公司在移动领域的下一个版本的兼容性。重点仍然是在任何环境中提供快速、安全的结果。该技术能够快速适应实时处理需求。
不同硬件的尺寸变化
Gemma 4 系列以四种主要尺寸和容量配置投放市场。 26B 专家混合和 31B 密集版本可提供最高水平的计算性能。它们在强大的研究型服务器或工作站硬件上无缝运行。有效 2B 和有效 4B 变体将能源效率放在首位。它们在边缘设备上运行,电池消耗最少,资源有限。
26B MoE模型在数据推理过程中仅激活38亿个参数。该技术特性大大降低了设备的延迟和能耗。所有版本均可流畅地实时处理 140 多种不同语言。该生态系统适应不同的企业和个人处理需求。
- 有效的2B和4B模型保证了市场上常见智能手机的低延迟。
- 与高通和联发科的战略合作伙伴关系促进了与移动处理器的集成。
- 较大的版本在单个 80GB H100 GPU 上运行,无需量化。
更轻的版本是与主要移动芯片制造商的直接合作而诞生的。它们在日常虚拟协助任务中的响应时间接近于零。实际测试证实了在 Raspberry Pi 和 Jetson Nano 等紧凑型板上的顺利运行。该代码的多功能性允许安装在低成本设备上。
新商业许可证结束限制
Apache 2.0 许可证的采用改变了独立软件创建者的格局。这一变化消除了导致市场不信任的旧自定义许可证限制。旧模型包括可以随时单方面更新的禁止使用政策。开发人员现在可以完全控制其产品的数据和商业部署。使用自由推动信息技术领域的创新。
这一战略变化应该会刺激全球编程社区创建大量项目。这群爱好者和专业人士在社交媒体上被非正式地称为 Gemmaverse。对本地执行的关注强化了为开发人员提供开放且强大的替代方案的战略。该公司将这款新颖产品定位为与 Gemini 系列封闭式车型的直接对比。代码的透明度吸引了各种经济规模的研究人员和公司。
智能手机上的即时和未来可用性
较重的 31B 和 26B 型号现已在 Google 的 AI Studio 平台上提供。轻量级的E4B和E2B版本可以被程序员在AI Edge Gallery中快速访问。完整的权重可立即从互联网上的著名公共存储库下载。 Hugging Face、Kaggle 和 Ollama 等平台已经免费托管原始文件。轻松访问加速了全球范围内的技术采用。
企业和研究机构下载后可以立即将模型集成到本地应用程序中。由于没有重复的 API 成本,先进人工智能在初创企业中的使用变得更加民主化。这家科技巨头还确认了未来几个月移动生态系统的结构计划。 2B 和 4B 变体将作为下一代 Gemini Nano 4 的代码库。新功能很快就会覆盖原生 Android 操作系统的设备。

