News (HK)

新一代Gemma 4人工智慧在本機裝置上採用Apache 2.0許可證

Gemma 4
Foto: Gemma 4 - Google

這家負責世界上使用最廣泛的搜尋引擎的技術巨頭為開發人員和研究人員提供了一系列新的開源語言模型。最近的更新帶來了支援文字、音訊和圖像輸入的工具,上下文視窗在最強大的版本中達到了 256,000 個標記。這一代的主要區別在於取消了先前的商業限制,允許公司在自己的硬體(從伺服器到手機)上更自由地使用該技術。

商業使用指南的變更

採用新的授權格式消除了該工具先前版本中存在的障礙。開發人員現在可以更好地控制處理的資料和商業部署,而無需遵循系統創建者可能單方面更新的禁止使用政策。

這種結構變化旨在鼓勵程式設計社群內創建新專案。對離線執行的關注強化了提供開放和靈活替代方案的策略,允許新創公司和大公司整合技術,而無需重複的應用程式介面成本。

邏輯推理的技術進步

新系統在解決數學問題和遵循複雜指令的能力方面有了顯著的提升。更新後的架構結合了對函數呼叫的本機支援並以特定資料格式產生結構化輸出,從而優化了自主代理的工作流程。

程式碼處理能力也經過改進,可以在沒有網路連線的環境中正常運作。在這些條件下實現的效能接近完全依賴雲端處理的情報服務所獲得的結果。

多模態訊息處理

除了傳統的文字解釋之外,新一代還可以本地處理音訊檔案和圖像。與去年推出的模型相比,此語音辨識系統表現出更高的準確性,有助於即時轉錄和分析語音命令。

視覺輸入支援可讓您執行進階任務,例如掃描文件中的光學字元辨識。該工具還可以解釋複雜的圖表和表格,以滿足企業部門需求的準確度提取相關數據。

這些不同輸入方式的組合為創建互動式應用程式開啟了一系列可能性。開發人員可以建立解決方案,同時分析使用者所說的內容和裝置相機捕獲的內容,處理所有內容,而無需將資料傳送到外部伺服器。

尺寸和效率變體

此型號系列分為四種主要配置,以滿足不同的硬體需求。更強大的版本,即Mixture、Experts和Dense,針對的是處理海量資料處理的高效能伺服器和專業工作站。

另一方面,較輕的型號經過專門設計,優先考慮能源效率。 Esses 較小的型號非常適合在網路邊緣運行,即直接在最終用戶的設備上運行,從而最大限度地減少電池消耗和外部處理的需要。

基於專家架構的版本在推理過程中僅會啟動其數十億參數中的一小部分。 Essa 技術方法大大減少了反應延遲和能耗,同時保持了理解和產生一百四十多種不同語言文字的能力。

包含神經網路權重的完整文件現已向公眾發布。技術領域的 Profissionais 可以立即下載公認的程式碼託管平台和專注於機器學習的儲存庫上的資料。

針對行動裝置的最佳化

緊湊型版本的開發是與全球市場上行動裝置處理器的主要製造商合作進行的。 Essa 技術協作使得系統能夠在日常任務中以幾乎零延遲的速度提供回應,例如同聲翻譯和總結長文本。實際測試表明,該技術即使在教育和工業項目廣泛使用的低成本開發板和單板機上也能保持穩定的性能。

維持不同硬體配置的效率對於應用生態系統來說是一個顯著的實際效益。減少本地處理的回應時間對於需要高度隱私的服務(例如醫療保健和金融應用程式)至關重要。透過直接在用戶設備上處理訊息,該技術消除了與透過互聯網傳輸敏感數據相關的風險,確保個人資訊免受第三方攔截。

與開發生態系統集成

官方平台上工具的立即可用有助於研究人員和軟體工程師獲得新的人工智慧技術。更高容量的模型可以透過雲端開發工作室進行測試和部署,而行動最佳化版本則位於用於邊緣處理的專用庫中。希望實現內部系統現代化的公司可以將這些解決方案整合到本地基礎設施中,而無需擔心每月為使用第三方介面支付費用。此外,較輕版本的架構將作為未來行動作業系統更新的基本基礎,這表明生成式人工智慧將成為手機中的標準和普遍組件的明顯趨勢,手機將在未來幾年上市,改變用戶與設備日常互動的方式。

擴大開放人工智慧的使用

將改進的性能與寬鬆的許可相結合,擴大了技術領域的選擇範圍。向本地可執行開源模型的轉變增強了開發人員的獨立性,並促進了更多樣化的數位環境的創建,在這種環境中,創新不僅僅依賴大型雲端運算基礎設施。