News (LV)

Google paziņo par Gemma 4 ar Apache 2.0 licenci un veidnēm vietējām ierīcēm

Gemma 4
Foto: Gemma 4 - Google

Google šo ceturtdien paziņoja par Gemma 4 saimi, kas sastāv no jauniem atvērtā koda mākslīgā intelekta modeļiem ar pieejamajiem svariem. Atjauninājums ir pirmais nozīmīgais sasniegums šajā līnijā kopš Gemma 3 palaišanas vairāk nekā pirms gada. Izstrādātājiem tagad ir licence Apache 2.0, kas noņem iepriekšējās versijās pastāvošos komerciālos ierobežojumus.

Modeļi atbalsta teksta, audio un attēlu ievadi ar konteksta logiem, kas lielākajos variantos sasniedz 256 tūkstošus marķieru. Eles galvenokārt ir paredzēti lokālai darbībai ar pieejamu aparatūru, tostarp patērētāju GPU un mobilajām ierīcēm. Licences maiņa atvieglo komerciālu izmantošanu bez papildu saistībām, ko uzliek Google.

Tehniski uzlabojumi argumentācijā un multimodālajā jomā

Salīdzinot ar iepriekšējo paaudzi, jaunie modeļi sniedz ievērojamus sasniegumus argumentācijā, matemātikā un norādījumu izpildē. Eles ietver vietējo atbalstu funkciju izsaukšanai un JSON strukturētas izvades ģenerēšanai, kas sniedz priekšrocības aģentu darbplūsmām.

Kodu apstrādes iespēja ir optimizēta bezsaistes vidēm, nodrošinot veiktspēju, kas ir salīdzināma ar mākoņpakalpojumiem, piemēram, Gemini Pro. Vizuālās ievades atbalsts ļauj veikt tādus uzdevumus kā optiskā rakstzīmju atpazīšana un grafiku interpretācija ar lielāku precizitāti.

  • Varianti ietver modeļus Effective 2B un 4B, kas optimizēti zemam latentumam viedtālruņos.
  • Sadarbība ar Qualcomm un MediaTek atvieglo integrāciju mobilajās ierīcēs.
  • Lielāki modeļi darbojas ar vienu 80 GB H100 GPU bez kvantēšanas.

Izmēru varianti un energoefektivitāte

Gemma 4 saimei ir četras galvenās izmēru konfigurācijas. Versijas 26B Mixture no Experts un 31B Dense piedāvā augstu veiktspēju un darbojas servera vai darbstacijas aparatūrā. Já kā Effective 2B un 4B prioritāte ir efektivitāte, izpildot malas ierīcēs.

26B MoE modelis izsecināšanas laikā aktivizē tikai 3,8 miljardus parametru, samazinot latentumu un enerģijas patēriņu. Todas varianti ir pieejami vairāk nekā 140 valodās. Izstrādātāji var lejupielādēt pilnus svarus tādās platformās kā Hugging Face, Kaggle un Ollama.

Tūlītēja pieejamība dažādās platformās

Lielāki 31B un 26B modeļi ir pieejami AI Studio un Google. Vieglajām E4B un E2B versijām var piekļūt, izmantojot AI Edge Gallery. Pilni svari ir pieejami tūlītējai lejupielādei no publiskajiem repozitorijiem.

Uzņēmumi un pētnieki var integrēt modeļus vietējās lietojumprogrammās bez atkārtotām API izmaksām. Google arī norādīja, ka 2B un 4B varianti kalpos par pamatu topošajām Gemini Nano 4 uz Android ierīcēm.

Ietekme, pārejot uz licenci Apache 2.0

Licences Apache 2.0 pieņemšana novērš iepriekšējās pielāgotās licences ierobežojumus, kas ietvēra vienpusēji atjaunināmas neizmantošanas politikas. Desenvolvedores Iegūstiet lielāku kontroli pār datiem un biznesa izvietošanu.

Šīm izmaiņām vajadzētu veicināt jaunu projektu izveidi kopienā, ko neoficiāli dēvē par Gemmaverse. Koncentrēšanās uz vietējo izpildi pastiprina stratēģiju piedāvāt atvērtas alternatīvas Gemini līnijas slēgtajiem modeļiem.

Optimizācija noteiktai aparatūrai

Vieglās versijas tika izstrādātas sadarbībā ar mobilo mikroshēmu ražotājiem. Elas nodrošina gandrīz nulles latentumu ikdienas uzdevumos, vienlaikus saglabājot samazinātu akumulatora patēriņu. Testes norāda uz labu veiktspēju tādās kartēs kā Raspberry Pi un Jetson Nano.

Lielāki modeļi saglabā efektivitāti pat blīvā konfigurācijā vai EM. Latentuma samazināšana lokālajā apstrādē ir praktisks ieguvums lietojumprogrammām, kurām nepieciešama privātums un ātra reakcija bez pastāvīga savienojuma ar serveriem.

Atbalstiet vairākas ievades modalitātes

Papildus tekstam modeļi sākotnēji apstrādā audio un attēlus. Runas atpazīšana uzlabojas, salīdzinot ar Gemma 3. Multimodālās iespējas paver iespējas lietojumprogrammām, kas reāllaikā apvieno dažāda veida datus.

Izstrādātāji var izveidot aģentu plūsmu prototipus tieši AI Core Developer Preview, izmantojot vieglos variantus. Essas ieviešana ir saderīga ar turpmāko Gemini Nano 4.

Gemma 4 saime pastiprina Google apņemšanos piedāvāt atvērtus modeļus ar pieejamu svaru. Uzlabotas veiktspējas, pieļaujamās licencēšanas un daudzveidīgā aparatūras atbalsta kombinācija paplašina iespējas tiem, kas meklē lokāli darbināmus AI risinājumus.