最新新聞 (TW)

谷歌發佈人工智慧新產品線Gemma 4並獲得商業許可

Gemma 4
Foto: Gemma 4 - Google

科技巨頭Google向全球軟體開發市場透露了 Gemma 4 系列的到來。新的開源人工智慧模型使研究人員和程式設計師完全可以使用權重。此次更新標誌著自上一代產品一年多前推出以來該產品線的首次重大飛躍。該系統現在在 Apache 2.0 許可證下運行。這一根本性的變化消除了過去版本中限制企業採用的商業障礙。

該平臺本身支援同時文字、音訊和圖像輸入。在該軟體包最強大的版本中,上下文視窗達到了令人印象深刻的 256,000 個標記。該項目絕對注重在公眾可以訪問的硬體上進行本地執行。消費性顯示卡和行動裝置可以輕鬆流暢地運作此系統。新許可證促進了商業產品的創建,無需附加任何條件或對創建公司承擔任何義務。

架構和本地處理的進步

工程師針對完全離線環境優化了程式碼處理能力。目前的效能與基於雲端的頂級服務(例如 Gemini Pro)相當。對函數呼叫的本機支援改進了與其他軟體工具的整合。產生 JSON 格式的結構化輸出直接有利於複雜的自動化工作流程。開發人員獲得創建解決方案的自主權,而無需依賴與外部伺服器的持續連接。

技術改進涵蓋邏輯推理和數學問題解決等基本領域。遵循複雜指令的準確性比上一代高得多。視覺輸入支援可在掃描文件中實現高保真光學字元辨識。圖表和表格的解釋快速而詳細。本地處理延遲的減少對最終用戶來說意味著巨大的實際收益。

多模式功能和改進的性能

該架構同時處理音訊和影像,沒有處理瓶頸。與 Gemma 3 相比,語音辨識在品質上呈現出顯著的飛躍。多模式功能為現代互動式應用開啟了一系列可能性。即時結合不同類型資料的系統穩定運作。需要嚴格隱私的應用程式在新一代開放模型中找到了理想的環境。

快速回應,無需將資料傳送至雲端,保護使用者敏感資訊。開發人員可以直接在 AI Core Developer Preview 中輕鬆建立工作流程原型。目前的實施確保了未來與公司在行動領域的下一個版本的兼容性。重點仍然是在任何環境中提供快速、安全的結果。該技術能夠快速適應即時處理需求。

不同硬體的尺寸變化

Gemma 4 系列以四種主要尺寸和容量配置投放市場。 26B 專家混合和 31B 密集版本可提供最高水準的運算效能。它們在強大的研究型伺服器或工作站硬體上無縫運作。有效 2B 和有效 4B 變體將能源效率放在首位。它們在邊緣設備上運行,電池消耗最少,資源有限。

26B MoE模型在資料推理過程中僅啟動38億個參數。此技術特性大大降低了設備的延遲和能耗。所有版本均可流暢地即時處理 140 多種不同語言。此生態系統可適應不同的企業和個人處理需求。

  • 有效的2B和4B型號保證了市場上常見智慧型手機的低延遲。
  • 與高通和聯發科的策略合作夥伴關係促進了與行動處理器的整合。
  • 較大的版本在單一 80GB H100 GPU 上運行,無需量化。

更輕的版本是與主要行動晶片製造商的直接合作而誕生的。它們在日常虛擬協助任務中的回應時間接近零。實際測試證實了在 Raspberry Pi 和 Jetson Nano 等緊湊型板上的順利運作。此代碼的多功能性允許安裝在低成本設備上。

新商業許可證結束限制

Apache 2.0 授權的採用改變了獨立軟體創作者的格局。這項變更消除了導致市場不信任的舊自訂許可證限制。舊模型包括可以隨時單方面更新的禁止使用政策。開發人員現在可以完全控制其產品的資料和商業部署。使用自由推動資訊科技領域的創新。

這項策略變革應該會刺激全球程式設計社群創造大量專案。這群愛好者和專業人士在社群媒體上被非正式地稱為 Gemmaverse。對本地執行的關注強化了為開發人員提供開放且強大的替代方案的策略。該公司將這款新穎產品定位為與 Gemini 系列封閉式車型的直接對比。代碼的透明度吸引了各種經濟規模的研究人員和公司。

智慧型手機上的即時和未來可用性

較重的 31B 和 26B 型號現已在 Google 的 AI Studio 平台上提供。輕量級的E4B和E2B版本可以被程式設計師在AI Edge Gallery中快速存取。完整的權重可立即從互聯網上的著名公共存儲庫下載。 Hugging Face、Kaggle 和 Ollama 等平台已經免費託管原始文件。輕鬆存取加速了全球範圍內的技術採用。

企業和研究機構下載後可以立即將模型整合到本地應用程式中。由於沒有重複的 API 成本,先進人工智慧在新創企業中的使用變得更加民主化。這家科技巨頭也確認了未來幾個月行動生態系統的結構計畫。 2B 和 4B 變體將作為下一代 Gemini Nano 4 的程式碼庫。新功能很快就會覆蓋原生 Android 作業系統的裝置。