News (HK)

Google 發布 Gemma 4,帶有 Apache 2.0 許可證和適用於本地設備的模板

Gemma 4
Foto: Gemma 4 - Google

Google 本週四宣布推出 Gemma 4 系列,由具有可用權重的新開源人工智慧模型組成。此次更新是自一年多前推出 Gemma 3 以來該系列的首次重大進步。開發人員現在擁有許可證 Apache 2.0,它消除了先前版本中存在的商業限制。

這些模型支援文字、音訊和圖像輸入,最大變體的上下文視窗達到 256,000 個標記。 Eles 主要設計用於在經濟實惠的硬體上本地運行,包括消費級 GPU 和行動裝置。許可證變更有利於商業使用,無需 Google 規定的額外義務。

推理和多模式的技術改進

與上一代相比,新模型在推理、數學和遵循指示方面帶來了顯著進步。 Eles 結合了對函數呼叫和 JSON 結構化輸出產生的本機支持,這有利於代理工作流程。

程式碼處理能力針對離線環境進行了最佳化,效能可與 Gemini Pro 等雲端服務相媲美。視覺輸入支援使光學字元辨識和圖形解釋等任務更加準確。

  • 變體包括型號 Effective 2B 和 4B,針對智慧型手機上的低延遲進行了最佳化。
  • 與 Qualcomm 和 MediaTek 的合作促進了行動裝置上的整合。
  • 較大的模型在單一 80GB H100 GPU 上運行,無需量化。

尺寸變化和能源效率

Gemma 4 系列有四種主要尺寸配置。版本 26B Mixture 或 Experts 和 31B Dense 提供高效能並在伺服器或工作站硬體上運作。 Já 和 Effective 2B 和 4B 優先考慮邊緣設備上的執行效率。

26B MoE 模型在推理過程中僅啟動 38 億個參數,從而減少了延遲和功耗。 Todas 變體可處理 140 多種語言。開發者可在Hugging Face、Kaggle、Ollama等平台下載完整權重。

跨平台立即可用

較大的 31B 和 26B 型號可在 AI Studio 和 Google 中取得。輕量級 E4B 和 E2B 版本可在 AI Edge Gallery 中取得。完整權重可立即從公共儲存庫下載。

公司和研究人員可以將模型整合到本機應用程式中,而無需重複產生 API 成本。 Google 也表示,變體 2B 和 4B 將作為 Android 設備上即將推出的 Gemini Nano 4 的基礎。

切換到許可證 Apache 2.0 的影響

許可證 Apache 2.0 的採用消除了先前自訂許可證的限制,其中包括單方面可更新的不使用策略。 Desenvolvedores 更好地控制資料和業務部署。

這項變更應該鼓勵在社區中創建新項目,非正式地稱為 Gemmaverse。對本地執行的關注強化了為 Gemini 系列的封閉模型提供開放替代方案的策略。

針對特定硬體的最佳化

輕量級版本是與行動晶片製造商合作開發的。 Elas 在日常任務中提供接近零的延遲,同時保持較低的電池消耗。 Testes 表示在 Raspberry Pi 和 Jetson Nano 等卡上具有良好的性能。

較大的模型即使在密集配置或 MoE 中也能保持效率。減少本地處理中的延遲對於需要隱私和快速回應而無需持續連接伺服器的應用程式來說代表著實際收益。

支援多種輸入方式

除了文字之外,這些模型還可以本地處理音訊和圖像。語音辨識能力較 Gemma 3 有所提升。多模式功能為即時組合不同類型資料的應用程式提供了可能性。

開發人員可以使用輕量級變體直接在 AI Core Developer Preview 中製作代理流原型。 Essas 實現與未來的 Gemini Nano 4 向前相容。

Gemma 4 系列強化了 Google 的承諾,即提供具有可承受重量的開放式型號。改進的性能、寬鬆的授權和多樣化的硬體支援相結合,為那些尋求本地可運行的人工智慧解決方案的人提供了更多的選擇。