Google kunngjør Gemma 4 med Apache 2.0-lisens og maler for lokale enheter

Gemma 4

Gemma 4 - Google

Google kunngjorde denne torsdagen Gemma 4-familien, som består av nye åpen kildekode-modeller for kunstig intelligens med tilgjengelige vekter. Oppdateringen representerer det første store fremskrittet i linjen siden lanseringen av Gemma 3 for mer enn ett år siden. Utviklere har nå lisens Apache 2.0, som fjerner kommersielle restriksjoner i tidligere versjoner.

Modellene støtter tekst-, lyd- og bildeinndata, med kontekstvinduer som når 256 tusen tokens i de største variantene. Eles er først og fremst designet for å kjøre lokalt på rimelig maskinvare, inkludert forbruker-GPUer og mobile enheter. Lisensendringen legger til rette for kommersiell bruk uten ytterligere forpliktelser pålagt av Google.

Tekniske forbedringer i resonnement og multimodal

De nye modellene gir betydelige fremskritt innen resonnement, matematikk og å følge instruksjoner sammenlignet med forrige generasjon. Eles har innebygd støtte for funksjonsanrop og generering av JSON-strukturert utdata, noe som gagner agentiske arbeidsflyter.

Kodebehandlingsevnen er optimalisert for frakoblede miljøer, og oppnår ytelse som kan sammenlignes med skytjenester som Gemini Pro. Visuell input-støtte muliggjør oppgaver som optisk tegngjenkjenning og graftolkning med større nøyaktighet.

  • Varianter inkluderer modellene Effective 2B og 4B optimert for lav ventetid på smarttelefoner.
  • Samarbeid med Qualcomm og MediaTek letter integrasjon på mobile enheter.
  • Større modeller kjører på en enkelt 80 GB H100 GPU uten kvantisering.

Størrelsesvarianter og energieffektivitet

Gemma 4-familien har fire hovedstørrelseskonfigurasjoner. Versjoner 26B Mixture av Experts og 31B Dense tilbyr høy ytelse og kjører på server- eller arbeidsstasjonsmaskinvare. Já som Effective 2B og 4B prioriterer effektivitet for utførelse på kantenheter.

26B MoE-modellen aktiverer bare 3,8 milliarder parametere under inferens, noe som reduserer latens og strømforbruk. Todas varianter håndterer over 140 språk. Utviklere kan laste ned hele vekten på plattformer som Hugging Face, Kaggle og Ollama.

Umiddelbar tilgjengelighet på tvers av plattformer

De større 31B- og 26B-modellene er tilgjengelige i AI Studio og Google. De lette E4B- og E2B-versjonene kan nås i AI Edge Gallery. De fullstendige vektene er tilgjengelige for umiddelbar nedlasting fra offentlige depoter.

Bedrifter og forskere kan integrere modellene i lokale applikasjoner uten tilbakevendende API-kostnader. Google indikerte også at variantene 2B og 4B vil tjene som grunnlag for de kommende Gemini Nano 4 på Android enhetene.

Virkningen av å bytte til lisens Apache 2.0

Innføringen av lisens Apache 2.0 eliminerer begrensningene i den tidligere egendefinerte lisensen, som inkluderte ensidig oppdaterbare retningslinjer for ikke-bruk. Desenvolvedores Få større kontroll over data og forretningsimplementeringer.

Denne endringen bør oppmuntre til etablering av nye prosjekter i samfunnet, uformelt kjent som Gemmaverse. Fokuset på lokal utførelse forsterker strategien om å tilby åpne alternativer til de lukkede modellene av Gemini-linjen.

Optimaliseringer for spesifikk maskinvare

De lette versjonene ble utviklet i samarbeid med produsenter av mobilbrikke. Elas leverer nesten null ventetid i daglige gjøremål, samtidig som det opprettholdes redusert batteriforbruk. Testes indikerer god ytelse på kort som Raspberry Pi og Jetson Nano.

Større modeller opprettholder effektiviteten selv i tett konfigurasjon eller MoE. Å redusere latens i lokal behandling representerer en praktisk gevinst for applikasjoner som krever personvern og rask respons uten konstant tilkobling til servere.

Støtt flere inndatamodaliteter

I tillegg til tekst behandler modellene lyd og bilder naturlig. Talegjenkjenning forbedres over Gemma 3. Multimodal kapasitet åpner for muligheter for applikasjoner som kombinerer ulike typer data i sanntid.

Utviklere kan prototype agentstrømmer direkte i AI Core Developer Preview ved å bruke de lette variantene. Essas-implementeringer er fremoverkompatible med fremtiden Gemini Nano 4.

Gemma 4-familien forsterker Googles forpliktelse til å tilby åpne modeller med tilgjengelige vekter. Kombinasjonen av forbedret ytelse, tillatelig lisensiering og mangfoldig maskinvarestøtte utvider alternativene for de som søker lokalt kjørbare AI-løsninger.