Google anunță Gemma 4 cu licență Apache 2.0 și șabloane pentru dispozitive locale
Google a anunțat joi aceasta familia Gemma 4, formată din noi modele open source de inteligență artificială cu greutăți disponibile. Actualizarea reprezintă primul progres major în linie de la lansarea Gemma 3 în urmă cu mai bine de un an. Dezvoltatorii au acum licența Apache 2.0, care elimină restricțiile comerciale prezente în versiunile anterioare.
Modelele acceptă introducerea text, audio și imagine, cu ferestre de context care ajung la 256 de mii de jetoane în cele mai mari variante. Eles sunt concepute în principal pentru a rula local pe hardware la prețuri accesibile, inclusiv GPU-uri și dispozitive mobile pentru consumatori. Modificarea licenței facilitează utilizarea comercială fără obligații suplimentare impuse de Google.
Îmbunătățiri tehnice în raționament și multimodal
Noile modele aduc progrese semnificative în raționament, matematică și respectarea instrucțiunilor în comparație cu generația anterioară. Eles încorporează suport nativ pentru apelarea funcțiilor și generarea de ieșiri structurate JSON, care beneficiază de fluxurile de lucru agentice.
Capacitatea de procesare a codului a fost optimizată pentru mediile offline, obținând performanțe comparabile cu serviciile cloud precum Gemini Pro. Suportul de introducere vizuală permite sarcini precum recunoașterea optică a caracterelor și interpretarea graficelor cu o mai mare acuratețe.
- Variantele includ modelele Effective 2B și 4B optimizate pentru latență scăzută pe smartphone-uri.
- Colaborarea cu Qualcomm și MediaTek facilitează integrarea pe dispozitivele mobile.
- Modelele mai mari rulează pe un singur GPU H100 de 80 GB fără cuantizare.
Variante de mărime și eficiență energetică
Familia Gemma 4 are patru configurații principale de dimensiune. Versiunile 26B Mixture din Experts și 31B Dense oferă performanțe înalte și rulează pe hardware de server sau stație de lucru. Já ca și Effective 2B și 4B prioritizează eficiența pentru execuția pe dispozitivele de vârf.
Modelul 26B MoE activează doar 3,8 miliarde de parametri în timpul inferenței, reducând latența și consumul de energie. Variantele Todas gestionează peste 140 de limbi. Dezvoltatorii pot descărca greutățile complete pe platforme precum Hugging Face, Kaggle și Ollama.
Disponibilitate imediată pe platforme
Modelele mai mari 31B și 26B sunt disponibile în AI Studio și Google. Versiunile ușoare E4B și E2B pot fi accesate în AI Edge Gallery. Greutățile complete sunt disponibile pentru descărcare imediată din depozitele publice.
Companiile și cercetătorii pot integra modelele în aplicații locale fără costuri recurente ale API. Google a mai indicat că variantele 2B și 4B vor servi drept bază pentru viitoarele Gemini Nano 4 pe dispozitivele Android.
Impactul trecerii la licență Apache 2.0
Adoptarea licenței Apache 2.0 elimină restricțiile licenței personalizate anterioare, care includea politici de neutilizare actualizabile unilateral. Desenvolvedores Obțineți un control mai mare asupra datelor și implementărilor de afaceri.
Această schimbare ar trebui să încurajeze crearea de noi proiecte în comunitate, cunoscute informal ca Gemmaverse. Accentul pe execuția locală întărește strategia de a oferi alternative deschise la modelele închise ale liniei Gemini.
Optimizări pentru hardware specific
Versiunile ușoare au fost dezvoltate în parteneriat cu producătorii de cipuri mobile. Elas oferă o latență aproape de zero în sarcinile de zi cu zi, menținând în același timp un consum redus de baterie. Testes indică performanțe bune pe carduri precum Raspberry Pi și Jetson Nano.
Modelele mai mari mențin eficiența chiar și în configurația densă sau MoE. Reducerea latenței în procesarea locală reprezintă un câștig practic pentru aplicațiile care necesită confidențialitate și răspuns rapid fără conexiune constantă la servere.
Suportă mai multe modalități de introducere
Pe lângă text, modelele procesează audio și imagini în mod nativ. Recunoașterea vorbirii se îmbunătățește față de Gemma 3. Capacitatea multimodală deschide posibilități pentru aplicații care combină diferite tipuri de date în timp real.
Dezvoltatorii pot prototipuri fluxuri agentice direct în AI Core Developer Preview folosind variantele ușoare. Implementările Essas sunt compatibile înainte cu viitorul Gemini Nano 4.
Familia Gemma 4 consolidează angajamentul lui Google de a oferi modele deschise cu greutăți accesibile. Combinația dintre performanță îmbunătățită, licențiere permisivă și asistență hardware diversă extinde opțiunile pentru cei care caută soluții AI rulabile la nivel local.
Veja Tambem em News (RO)
Reducerea semnificativă la Galaxy S25 Plus reduce valoarea la sub 4500 de reale în magazinul online
Apple accelerează producția iPhone 17e și dezvoltă un nou model Air cu sistem de cameră dublă
Platforma Epic Games lansează douăsprezece jocuri cu un buget mare, fără costuri permanente pentru utilizatorii de computere
Scăderea prețului PlayStation 5 Pro accelerează vânzările digitale cu amănuntul și elimină stocurile globale
Noua actualizare a sistemului Apple optimizează gestionarea sarcinilor urgente pentru utilizatorii de iPhone
Oppo lansează oficial Find X9 Ultra în întreaga lume cu lentile Hasselblad și baterie robustă
Scurgeri de detalii hardware ale noii PlayStation portabile cu grafică superioară Xbox Series S
Noua ediție a smartphone-ului pliabil aduce un finisaj auriu concurenților la Jocurile de Iarnă
Tim Cook dezvăluie noile prototipuri de iPhone și iPod cu ocazia celei de-a 50-a aniversări a Apple
Leak dezvăluie Lords of the Fallen și Sword Art Online în catalogul PS Plus Essential din aprilie
Sistemul Android primește integrare nativă Gemini Nano 4 pentru procesare offline pe smartphone-uri