News (DA)

Google annoncerer Gemma 4 med Apache 2.0-licens og skabeloner til lokale enheder

Gemma 4
Foto: Gemma 4 - Google

Google annoncerede i torsdags familien Gemma 4, der består af nye open source kunstig intelligens-modeller med tilgængelige vægte. Opdateringen repræsenterer det første store fremskridt i rækken siden lanceringen af ​​Gemma 3 for mere end et år siden. Udviklere har nu licens Apache 2.0, som fjerner kommercielle begrænsninger i tidligere versioner.

Modellerne understøtter tekst-, lyd- og billedinput med kontekstvinduer, der når op på 256 tusind tokens i de største varianter. Eles er primært designet til at køre lokalt på overkommelig hardware, herunder forbruger-GPU’er og mobile enheder. Licensændringen letter kommerciel brug uden yderligere forpligtelser pålagt af Google.

Tekniske forbedringer i ræsonnement og multimodal

De nye modeller bringer betydelige fremskridt inden for ræsonnement, matematik og at følge instruktioner sammenlignet med den forrige generation. Eles inkorporerer indbygget understøttelse af funktionskald og JSON-struktureret outputgenerering, hvilket gavner agentiske arbejdsgange.

Kodebehandlingsevnen er blevet optimeret til offline-miljøer, hvilket giver en ydeevne, der kan sammenlignes med cloud-tjenester som Gemini Pro. Visuel input-understøttelse muliggør opgaver såsom optisk tegngenkendelse og graffortolkning med større nøjagtighed.

  • Varianter omfatter modellerne Effective 2B og 4B optimeret til lav latenstid på smartphones.
  • Samarbejde med Qualcomm og MediaTek letter integration på mobile enheder.
  • Større modeller kører på en enkelt 80 GB H100 GPU uden kvantisering.

Størrelsesvarianter og energieffektivitet

Gemma 4-familien har fire hovedstørrelseskonfigurationer. Version 26B Mixture af Experts og 31B Dense tilbyder høj ydeevne og kører på server- eller arbejdsstationshardware. Já som Effective 2B og 4B prioriterer effektivitet til udførelse på kant-enheder.

26B MoE-modellen aktiverer kun 3,8 milliarder parametre under inferens, hvilket reducerer latens og strømforbrug. Todas varianter håndterer over 140 sprog. Udviklere kan downloade de fulde vægte på platforme som Hugging Face, Kaggle og Ollama.

Umiddelbar tilgængelighed på tværs af platforme

De større 31B- og 26B-modeller er tilgængelige i AI Studio og Google. De lette E4B- og E2B-versioner kan tilgås i AI Edge Gallery. De fulde vægte er tilgængelige for øjeblikkelig download fra offentlige arkiver.

Virksomheder og forskere kan integrere modellerne i lokale applikationer uden tilbagevendende API-omkostninger. Google angav også, at variant 2B og 4B vil tjene som grundlag for de kommende Gemini Nano 4 på Android enheder.

Virkningen af ​​at skifte til licens Apache 2.0

Vedtagelsen af ​​licens Apache 2.0 eliminerer begrænsningerne i den tidligere brugerdefinerede licens, som inkluderede ensidigt opdaterede politikker, der ikke kan bruges. Desenvolvedores Få større kontrol over data og forretningsimplementeringer.

Denne ændring bør tilskynde til oprettelsen af ​​nye projekter i samfundet, uformelt kendt som Gemmaverse. Fokus på lokal udførelse forstærker strategien med at tilbyde åbne alternativer til de lukkede modeller af Gemini-linjen.

Optimeringer til specifik hardware

Letvægtsversionerne er udviklet i samarbejde med producenter af mobile chip. Elas leverer en ventetid på næsten nul i daglige opgaver, samtidig med at det reducerer batteriforbruget. Testes indikerer god ydeevne på kort som Raspberry Pi og Jetson Nano.

Større modeller bevarer effektiviteten selv i tæt konfiguration eller MoE. Reduktion af latens i lokal behandling repræsenterer en praktisk gevinst for applikationer, der kræver privatliv og hurtig respons uden konstant forbindelse til servere.

Understøtter flere inputmodaliteter

Ud over tekst behandler modellerne lyd og billeder indbygget. Talegenkendelse forbedres over Gemma 3. Multimodal kapacitet åbner muligheder for applikationer, der kombinerer forskellige typer data i realtid.

Udviklere kan prototype agentstrømme direkte i AI Core Developer Preview ved hjælp af letvægtsvarianter. Essas implementeringer er fremadkompatible med fremtiden Gemini Nano 4.

Gemma 4-familien forstærker Google’s forpligtelse til at tilbyde åbne modeller med tilgængelige vægte. Kombinationen af ​​forbedret ydeevne, tilladelig licensering og forskellig hardwaresupport udvider mulighederne for dem, der søger lokalt kørebare AI-løsninger.