Google annuncia Gemma 4 con licenza Apache 2.0 e template per dispositivi locali

Gemma 4

Gemma 4 - Google

Google ha annunciato questo giovedì la famiglia Gemma4, composta da nuovi modelli di intelligenza artificiale open source con pesi disponibili. L’aggiornamento rappresenta il primo grande progresso della linea dal lancio di Gemma 3 più di un anno fa. Gli sviluppatori ora dispongono della licenza Apache 2.0, che rimuove le restrizioni commerciali presenti nelle versioni precedenti.

I modelli supportano input di testo, audio e immagini, con finestre di contesto che raggiungono 256mila token nelle varianti più grandi. Eles sono progettati principalmente per essere eseguiti localmente su hardware conveniente, comprese GPU consumer e dispositivi mobili. Il cambio di licenza facilita l’uso commerciale senza obblighi aggiuntivi imposti da Google.

Miglioramenti tecnici nel ragionamento e multimodale

I nuovi modelli apportano progressi significativi nel ragionamento, nella matematica e nel seguire le istruzioni rispetto alla generazione precedente. Eles incorporano il supporto nativo per le chiamate di funzioni e la generazione di output strutturati JSON, a vantaggio dei flussi di lavoro degli agenti.

La capacità di elaborazione del codice è stata ottimizzata per gli ambienti offline, ottenendo prestazioni paragonabili a servizi cloud come Gemini Pro. Il supporto dell’input visivo consente attività come il riconoscimento ottico dei caratteri e l’interpretazione dei grafici con maggiore precisione.

  • Le varianti includono i modelli Effective 2B e 4B ottimizzati per la bassa latenza sugli smartphone.
  • La collaborazione con Qualcomm e MediaTek facilita l’integrazione sui dispositivi mobili.
  • I modelli più grandi funzionano su una singola GPU H100 da 80 GB senza quantizzazione.

Varianti dimensionali ed efficienza energetica

La famiglia Gemma 4 ha quattro configurazioni dimensionali principali. Le versioni 26B Mixture di Experts e 31B Dense offrono prestazioni elevate e funzionano su hardware server o workstation. Já come Effective 2B e 4B danno priorità all’efficienza per l’esecuzione sui dispositivi edge.

Il modello 26B MoE attiva solo 3,8 miliardi di parametri durante l’inferenza, riducendo la latenza e il consumo energetico. Le varianti Todas gestiscono oltre 140 lingue. Gli sviluppatori possono scaricare i pesi completi su piattaforme come Hugging Face, Kaggle e Ollama.

Disponibilità immediata su tutte le piattaforme

I modelli più grandi 31B e 26B sono disponibili in AI Studio e Google. È possibile accedere alle versioni leggere E4B ed E2B in AI Edge Gallery. I pesi completi sono disponibili per il download immediato dai repository pubblici.

Aziende e ricercatori possono integrare i modelli nelle applicazioni locali senza costi API ricorrenti. Google ha anche indicato che le varianti 2B e 4B serviranno come base per il prossimo Gemini Nano 4 sui dispositivi Android.

Impatto del passaggio alla licenza Apache 2.0

L’adozione della licenza Apache 2.0 elimina le restrizioni della precedente licenza personalizzata, che prevedeva politiche di non utilizzo aggiornabili unilateralmente. Desenvolvedores Ottieni un maggiore controllo sui dati e sulle distribuzioni aziendali.

Questo cambiamento dovrebbe incoraggiare la creazione di nuovi progetti nella comunità, conosciuti informalmente come Gemmaverse. L’attenzione all’esecuzione locale rafforza la strategia di offrire alternative aperte ai modelli chiusi della linea Gemini.

Ottimizzazioni per hardware specifico

Le versioni leggere sono state sviluppate in collaborazione con i produttori di chip mobili. Elas offrono una latenza prossima allo zero nelle attività quotidiane mantenendo un consumo della batteria ridotto. Testes indicano buone prestazioni su carte come Raspberry Pi e Jetson Nano.

I modelli più grandi mantengono l’efficienza anche in configurazioni dense o MoE. La riduzione della latenza nell’elaborazione locale rappresenta un vantaggio pratico per le applicazioni che richiedono privacy e risposta rapida senza una connessione costante ai server.

Supporta più modalità di input

Oltre al testo, i modelli elaborano audio e immagini in modo nativo. Il riconoscimento vocale migliora rispetto a Gemma 3. La capacità multimodale apre possibilità per applicazioni che combinano diversi tipi di dati in tempo reale.

Gli sviluppatori possono prototipare flussi di agenti direttamente in AI Core Developer Preview utilizzando le varianti leggere. Le implementazioni Essas sono compatibili con il futuro Gemini Nano 4.

La famiglia Gemma 4 rafforza l’impegno di Google nell’offrire modelli aperti con pesi accessibili. La combinazione di prestazioni migliorate, licenze permissive e supporto hardware diversificato espande le opzioni per coloro che cercano soluzioni AI eseguibili localmente.

Vedi Anche