Google tillkännager Gemma 4 med Apache 2.0-licens och mallar för lokala enheter

Gemma 4

Gemma 4 - Google

Google tillkännagav i torsdags familjen Gemma 4, som består av nya artificiell intelligensmodeller med öppen källkod med tillgängliga vikter. Uppdateringen representerar det första stora framsteg i raden sedan lanseringen av Gemma 3 för mer än ett år sedan. Utvecklare har nu licens Apache 2.0, som tar bort kommersiella begränsningar som finns i tidigare versioner.

Modellerna stöder text-, ljud- och bildinmatning, med kontextfönster som når 256 tusen tokens i de största varianterna. Eles är främst designade för att köras lokalt på prisvärd hårdvara, inklusive konsument-GPU:er och mobila enheter. Licensändringen underlättar kommersiell användning utan ytterligare skyldigheter enligt Google.

Tekniska förbättringar i resonemang och multimodal

De nya modellerna ger betydande framsteg i resonemang, matematik och att följa instruktioner jämfört med föregående generation. Eles innehåller inbyggt stöd för funktionsanrop och JSON-strukturerad produktion, vilket gynnar agentiska arbetsflöden.

Kodbearbetningsförmågan har optimerats för offlinemiljöer, vilket ger prestanda jämförbar med molntjänster som Gemini Pro. Stöd för visuell inmatning möjliggör uppgifter som optisk teckenigenkänning och graftolkning med större noggrannhet.

  • Varianter inkluderar modellerna Effective 2B och 4B optimerade för låg latens på smartphones.
  • Samarbete med Qualcomm och MediaTek underlättar integration på mobila enheter.
  • Större modeller körs på en enda 80GB H100 GPU utan kvantisering.

Storleksvarianter och energieffektivitet

Gemma 4-familjen har fyra huvudstorlekskonfigurationer. Versionerna 26B Mixture av Experts och 31B Dense erbjuder hög prestanda och körs på server- eller arbetsstationshårdvara. Já som Effective 2B och 4B prioriterar effektivitet för exekvering på kantenheter.

26B MoE-modellen aktiverar bara 3,8 miljarder parametrar under slutledning, vilket minskar latens och strömförbrukning. Todas varianter hanterar över 140 språk. Utvecklare kan ladda ner hela vikten på plattformar som Hugging Face, Kaggle och Ollama.

Omedelbar tillgänglighet över plattformar

De större 31B- och 26B-modellerna finns i AI Studio och Google. De lätta E4B- och E2B-versionerna kan nås i AI Edge Gallery. De fullständiga vikterna finns tillgängliga för omedelbar nedladdning från offentliga arkiv.

Företag och forskare kan integrera modellerna i lokala applikationer utan återkommande API-kostnader. Google indikerade också att varianterna 2B och 4B kommer att fungera som basen för de kommande Gemini Nano 4 på Android enheterna.

Effekten av att byta till licens Apache 2.0

Antagandet av licensen Apache 2.0 eliminerar begränsningarna för den tidigare anpassade licensen, som inkluderade ensidigt uppdateringsbara policyer för användning utan användning. Desenvolvedores Få större kontroll över data och affärsdistributioner.

Denna förändring bör uppmuntra skapandet av nya projekt i samhället, informellt kända som Gemmaverse. Fokus på lokalt genomförande förstärker strategin att erbjuda öppna alternativ till de stängda modellerna av Gemini-linjen.

Optimering för specifik hårdvara

De lätta versionerna har utvecklats i samarbete med tillverkare av mobila chip. Elas levererar nästan noll latens i vardagliga uppgifter samtidigt som den minskar batteriförbrukningen. Testes indikerar bra prestanda på kort som Raspberry Pi och Jetson Nano.

Större modeller bibehåller effektiviteten även i tät konfiguration eller MoE. Att minska latensen i lokal bearbetning är en praktisk vinst för applikationer som kräver integritet och snabb respons utan konstant anslutning till servrar.

Stöd flera inmatningsmodaliteter

Förutom text bearbetar modellerna ljud och bilder inbyggt. Taligenkänning förbättras över Gemma 3. Multimodal förmåga öppnar möjligheter för applikationer som kombinerar olika typer av data i realtid.

Utvecklare kan prototyper av agentflöden direkt i AI Core Developer Preview med de lätta varianterna. Essas implementeringar är framåtkompatibla med framtiden Gemini Nano 4.

Gemma 4-familjen förstärker Google:s engagemang för att erbjuda öppna modeller med lättillgängliga vikter. Kombinationen av förbättrad prestanda, tillåtande licensiering och diverse hårdvarustöd utökar alternativen för dem som söker lokalt körbara AI-lösningar.