Google annuncia Gemma 4 con licenza Apache 2.0 e template per dispositivi locali
Google ha annunciato questo giovedì la famiglia Gemma4, composta da nuovi modelli di intelligenza artificiale open source con pesi disponibili. L’aggiornamento rappresenta il primo grande progresso della linea dal lancio di Gemma 3 più di un anno fa. Gli sviluppatori ora dispongono della licenza Apache 2.0, che rimuove le restrizioni commerciali presenti nelle versioni precedenti.
I modelli supportano input di testo, audio e immagini, con finestre di contesto che raggiungono 256mila token nelle varianti più grandi. Eles sono progettati principalmente per essere eseguiti localmente su hardware conveniente, comprese GPU consumer e dispositivi mobili. Il cambio di licenza facilita l’uso commerciale senza obblighi aggiuntivi imposti da Google.
Miglioramenti tecnici nel ragionamento e multimodale
I nuovi modelli apportano progressi significativi nel ragionamento, nella matematica e nel seguire le istruzioni rispetto alla generazione precedente. Eles incorporano il supporto nativo per le chiamate di funzioni e la generazione di output strutturati JSON, a vantaggio dei flussi di lavoro degli agenti.
La capacità di elaborazione del codice è stata ottimizzata per gli ambienti offline, ottenendo prestazioni paragonabili a servizi cloud come Gemini Pro. Il supporto dell’input visivo consente attività come il riconoscimento ottico dei caratteri e l’interpretazione dei grafici con maggiore precisione.
- Le varianti includono i modelli Effective 2B e 4B ottimizzati per la bassa latenza sugli smartphone.
- La collaborazione con Qualcomm e MediaTek facilita l’integrazione sui dispositivi mobili.
- I modelli più grandi funzionano su una singola GPU H100 da 80 GB senza quantizzazione.
Varianti dimensionali ed efficienza energetica
La famiglia Gemma 4 ha quattro configurazioni dimensionali principali. Le versioni 26B Mixture di Experts e 31B Dense offrono prestazioni elevate e funzionano su hardware server o workstation. Já come Effective 2B e 4B danno priorità all’efficienza per l’esecuzione sui dispositivi edge.
Il modello 26B MoE attiva solo 3,8 miliardi di parametri durante l’inferenza, riducendo la latenza e il consumo energetico. Le varianti Todas gestiscono oltre 140 lingue. Gli sviluppatori possono scaricare i pesi completi su piattaforme come Hugging Face, Kaggle e Ollama.
Disponibilità immediata su tutte le piattaforme
I modelli più grandi 31B e 26B sono disponibili in AI Studio e Google. È possibile accedere alle versioni leggere E4B ed E2B in AI Edge Gallery. I pesi completi sono disponibili per il download immediato dai repository pubblici.
Aziende e ricercatori possono integrare i modelli nelle applicazioni locali senza costi API ricorrenti. Google ha anche indicato che le varianti 2B e 4B serviranno come base per il prossimo Gemini Nano 4 sui dispositivi Android.
Impatto del passaggio alla licenza Apache 2.0
L’adozione della licenza Apache 2.0 elimina le restrizioni della precedente licenza personalizzata, che prevedeva politiche di non utilizzo aggiornabili unilateralmente. Desenvolvedores Ottieni un maggiore controllo sui dati e sulle distribuzioni aziendali.
Questo cambiamento dovrebbe incoraggiare la creazione di nuovi progetti nella comunità, conosciuti informalmente come Gemmaverse. L’attenzione all’esecuzione locale rafforza la strategia di offrire alternative aperte ai modelli chiusi della linea Gemini.
Ottimizzazioni per hardware specifico
Le versioni leggere sono state sviluppate in collaborazione con i produttori di chip mobili. Elas offrono una latenza prossima allo zero nelle attività quotidiane mantenendo un consumo della batteria ridotto. Testes indicano buone prestazioni su carte come Raspberry Pi e Jetson Nano.
I modelli più grandi mantengono l’efficienza anche in configurazioni dense o MoE. La riduzione della latenza nell’elaborazione locale rappresenta un vantaggio pratico per le applicazioni che richiedono privacy e risposta rapida senza una connessione costante ai server.
Supporta più modalità di input
Oltre al testo, i modelli elaborano audio e immagini in modo nativo. Il riconoscimento vocale migliora rispetto a Gemma 3. La capacità multimodale apre possibilità per applicazioni che combinano diversi tipi di dati in tempo reale.
Gli sviluppatori possono prototipare flussi di agenti direttamente in AI Core Developer Preview utilizzando le varianti leggere. Le implementazioni Essas sono compatibili con il futuro Gemini Nano 4.
La famiglia Gemma 4 rafforza l’impegno di Google nell’offrire modelli aperti con pesi accessibili. La combinazione di prestazioni migliorate, licenze permissive e supporto hardware diversificato espande le opzioni per coloro che cercano soluzioni AI eseguibili localmente.
Veja Tambem em Notizie (IT)
Uno sconto significativo sul Galaxy S25 Plus riduce il valore a meno di 4500 reais nel negozio online
Il nuovo Resident Evil di Zach Cregger ignora i giochi e si concentra su una storia senza precedenti con nuovi personaggi
Le voci suggeriscono che Nintendo stia preparando un’edizione speciale di Switch 2 con un remake di Ocarina of Time
Apple accelera la produzione dell’iPhone 17e e sviluppa il nuovo modello Air con sistema a doppia fotocamera
La piattaforma Epic Games rilascia dodici giochi ad alto budget senza costi permanenti per gli utenti di PC
Il calo dei prezzi di PlayStation 5 Pro accelera le vendite al dettaglio digitali ed elimina le scorte globali
Il progetto commemorativo di Apple testa il cellulare con bordo da 1,1 millimetri e schermo curvo per il 2027
Il nuovo aggiornamento del sistema Apple ottimizza la gestione delle attività urgenti per gli utenti iPhone
Trapelano dettagli sull’hardware della nuova PlayStation portatile con grafica superiore a Xbox Series S
Oppo lancia ufficialmente il Find X9 Ultra in tutto il mondo con obiettivi Hasselblad e batteria robusta
Tim Cook svela i nuovi prototipi di iPhone e iPod per celebrare il cinquantesimo anniversario di Apple