Google anunță Gemma 4 cu licență Apache 2.0 și șabloane pentru dispozitive locale

Gemma 4

Gemma 4 - Google

Google a anunțat joi aceasta familia Gemma 4, formată din noi modele open source de inteligență artificială cu greutăți disponibile. Actualizarea reprezintă primul progres major în linie de la lansarea Gemma 3 în urmă cu mai bine de un an. Dezvoltatorii au acum licența Apache 2.0, care elimină restricțiile comerciale prezente în versiunile anterioare.

Modelele acceptă introducerea text, audio și imagine, cu ferestre de context care ajung la 256 de mii de jetoane în cele mai mari variante. Eles sunt concepute în principal pentru a rula local pe hardware la prețuri accesibile, inclusiv GPU-uri și dispozitive mobile pentru consumatori. Modificarea licenței facilitează utilizarea comercială fără obligații suplimentare impuse de Google.

Îmbunătățiri tehnice în raționament și multimodal

Noile modele aduc progrese semnificative în raționament, matematică și respectarea instrucțiunilor în comparație cu generația anterioară. Eles încorporează suport nativ pentru apelarea funcțiilor și generarea de ieșiri structurate JSON, care beneficiază de fluxurile de lucru agentice.

Capacitatea de procesare a codului a fost optimizată pentru mediile offline, obținând performanțe comparabile cu serviciile cloud precum Gemini Pro. Suportul de introducere vizuală permite sarcini precum recunoașterea optică a caracterelor și interpretarea graficelor cu o mai mare acuratețe.

  • Variantele includ modelele Effective 2B și 4B optimizate pentru latență scăzută pe smartphone-uri.
  • Colaborarea cu Qualcomm și MediaTek facilitează integrarea pe dispozitivele mobile.
  • Modelele mai mari rulează pe un singur GPU H100 de 80 GB fără cuantizare.

Variante de mărime și eficiență energetică

Familia Gemma 4 are patru configurații principale de dimensiune. Versiunile 26B Mixture din Experts și 31B Dense oferă performanțe înalte și rulează pe hardware de server sau stație de lucru. Já ca și Effective 2B și 4B prioritizează eficiența pentru execuția pe dispozitivele de vârf.

Modelul 26B MoE activează doar 3,8 miliarde de parametri în timpul inferenței, reducând latența și consumul de energie. Variantele Todas gestionează peste 140 de limbi. Dezvoltatorii pot descărca greutățile complete pe platforme precum Hugging Face, Kaggle și Ollama.

Disponibilitate imediată pe platforme

Modelele mai mari 31B și 26B sunt disponibile în AI Studio și Google. Versiunile ușoare E4B și E2B pot fi accesate în AI Edge Gallery. Greutățile complete sunt disponibile pentru descărcare imediată din depozitele publice.

Companiile și cercetătorii pot integra modelele în aplicații locale fără costuri recurente ale API. Google a mai indicat că variantele 2B și 4B vor servi drept bază pentru viitoarele Gemini Nano 4 pe dispozitivele Android.

Impactul trecerii la licență Apache 2.0

Adoptarea licenței Apache 2.0 elimină restricțiile licenței personalizate anterioare, care includea politici de neutilizare actualizabile unilateral. Desenvolvedores Obțineți un control mai mare asupra datelor și implementărilor de afaceri.

Această schimbare ar trebui să încurajeze crearea de noi proiecte în comunitate, cunoscute informal ca Gemmaverse. Accentul pe execuția locală întărește strategia de a oferi alternative deschise la modelele închise ale liniei Gemini.

Optimizări pentru hardware specific

Versiunile ușoare au fost dezvoltate în parteneriat cu producătorii de cipuri mobile. Elas oferă o latență aproape de zero în sarcinile de zi cu zi, menținând în același timp un consum redus de baterie. Testes indică performanțe bune pe carduri precum Raspberry Pi și Jetson Nano.

Modelele mai mari mențin eficiența chiar și în configurația densă sau MoE. Reducerea latenței în procesarea locală reprezintă un câștig practic pentru aplicațiile care necesită confidențialitate și răspuns rapid fără conexiune constantă la servere.

Suportă mai multe modalități de introducere

Pe lângă text, modelele procesează audio și imagini în mod nativ. Recunoașterea vorbirii se îmbunătățește față de Gemma 3. Capacitatea multimodală deschide posibilități pentru aplicații care combină diferite tipuri de date în timp real.

Dezvoltatorii pot prototipuri fluxuri agentice direct în AI Core Developer Preview folosind variantele ușoare. Implementările Essas sunt compatibile înainte cu viitorul Gemini Nano 4.

Familia Gemma 4 consolidează angajamentul lui Google de a oferi modele deschise cu greutăți accesibile. Combinația dintre performanță îmbunătățită, licențiere permisivă și asistență hardware diversă extinde opțiunile pentru cei care caută soluții AI rulabile la nivel local.