Google julkistaa Gemma 4:n, jossa on Apache 2.0 -lisenssi ja malleja paikallisille laitteille
Google julkisti tänä torstaina Gemma 4 -perheen, joka koostuu uusista avoimen lähdekoodin tekoälymalleista ja painoista. Päivitys on ensimmäinen suuri edistysaskel linjan Gemma 3 julkaisemisen jälkeen, mikä on enemmän kuin vuosi sitten. Kehittäjillä on nyt lisenssi Apache 2.0, joka poistaa aiemmissa versioissa esiintyneet kaupalliset rajoitukset.
Mallit tukevat tekstin, äänen ja kuvan syöttöä kontekstiikkunoilla, jotka saavuttavat 256 tuhatta merkkiä suurimmissa versioissa. Eles on ensisijaisesti suunniteltu toimimaan paikallisesti edullisilla laitteistoilla, mukaan lukien kuluttajien grafiikkasuorittimet ja mobiililaitteet. Lisenssimuutos mahdollistaa kaupallisen käytön ilman Google:n asettamia lisävelvoitteita.
Teknisiä parannuksia päättelyyn ja multimodaalisuuteen
Uudet mallit tuovat merkittäviä edistysaskeleita päättelyssä, matematiikassa ja ohjeiden noudattamisessa edelliseen sukupolveen verrattuna. Eles sisältää natiivituen funktiokutsuille ja JSON-strukturoidulle tulosteen luomiselle, mikä hyödyttää agenttityönkulkuja.
Koodinkäsittelykyky on optimoitu offline-ympäristöjä varten, ja sen suorituskyky on verrattavissa pilvipalveluihin, kuten Gemini Pro. Visuaalisen syötteen tuki mahdollistaa esimerkiksi optisen merkintunnistuksen ja kaavioiden tulkinnan entistä tarkemmin.
- Variantteja ovat mallit Effective 2B ja 4B, jotka on optimoitu älypuhelimien alhaiselle latenssille.
- Yhteistyö numeron Qualcomm ja MediaTekin kanssa mahdollistaa integroinnin mobiililaitteisiin.
- Suuremmat mallit toimivat yhdellä 80 Gt:n H100 GPU:lla ilman kvantisointia.
Kokovaihtoehdot ja energiatehokkuus
Gemma 4 -perheessä on neljä pääkokokokoonpanoa. Versiot 26B Mixture/Experts ja 31B Dense tarjoavat korkean suorituskyvyn ja toimivat palvelin- tai työasemalaitteistolla. Já as Effective 2B ja 4B priorisoivat tehokkuutta suoritettaessa reunalaitteita.
26B MoE -malli aktivoi vain 3,8 miljardia parametria päättelyn aikana, mikä vähentää latenssia ja virrankulutusta. Todas versiota käsittelee yli 140 kieltä. Kehittäjät voivat ladata täydet painot alustoille, kuten Hugging Face, Kaggle ja Ollama.
Välitön saatavuus eri alustoilla
Suuremmat 31B- ja 26B-mallit ovat saatavilla versioissa AI Studio ja Google. Kevyet E4B- ja E2B-versiot ovat saatavilla AI Edge Gallery:ssa. Täysi painot ovat ladattavissa välittömästi julkisista arkistoista.
Yritykset ja tutkijat voivat integroida mallit paikallisiin sovelluksiin ilman toistuvia API-kustannuksia. Google ilmoitti myös, että versiot 2B ja 4B toimivat pohjana tuleville Gemini Nano 4 Android-laitteille.
Lisenssiin Apache 2.0 siirtymisen vaikutus
Lisenssin Apache 2.0 käyttöönotto poistaa aiemman mukautetun lisenssin rajoitukset, joihin sisältyi yksipuolisesti päivitettävät käyttökieltokäytännöt. Desenvolvedores Hallitse paremmin tietoja ja yrityskäyttöönottoa.
Tämän muutoksen pitäisi rohkaista uusien hankkeiden luomista yhteisöön, joka tunnetaan epävirallisesti nimellä Gemmaverse. Paikalliseen toteutukseen keskittyminen vahvistaa strategiaa tarjota avoimia vaihtoehtoja Gemini-linjan suljetuille malleille.
Optimoinnit tietyille laitteistoille
Kevyet versiot on kehitetty yhteistyössä mobiilisiruvalmistajien kanssa. Elas tarjoaa lähes nollaviivettä päivittäisissä tehtävissä samalla kun akun kulutus pienenee. Testes osoittavat hyvän suorituskyvyn korteissa, kuten Raspberry Pi ja Jetson Nano.
Suuremmat mallit säilyttävät tehokkuuden myös tiheässä kokoonpanossa tai MoE:ssa. Viiveen vähentäminen paikallisessa käsittelyssä on käytännöllinen hyöty sovelluksille, jotka vaativat yksityisyyttä ja nopeaa reagointia ilman jatkuvaa yhteyttä palvelimiin.
Tukee useita syöttömuotoja
Tekstin lisäksi mallit käsittelevät ääntä ja kuvia natiivisti. Puheentunnistus paranee verrattuna Gemma 3. Multimodaalinen ominaisuus avaa mahdollisuuksia sovelluksille, jotka yhdistävät erityyppisiä tietoja reaaliajassa.
Kehittäjät voivat prototyyppiä agenttivirtoja suoraan AI Core Developer Preview:ssä käyttämällä kevyitä muunnelmia. Essas toteutukset ovat yhteensopivia tulevaisuuden Gemini Nano 4 kanssa.
Gemma 4 -tuoteperhe vahvistaa Google:n sitoutumista avoimien mallien tarjoamiseen esteettömillä painoilla. Parannetun suorituskyvyn, sallivan lisensoinnin ja monipuolisen laitteistotuen yhdistelmä laajentaa vaihtoehtoja niille, jotka etsivät paikallisesti ajettavia tekoälyratkaisuja.
Veja Tambem em News (FI)
Merkittävä alennus Galaxy S25 Plus:sta laskee arvon alle 4500 realiin verkkokaupassa
Amazonin langattomalla CarPlay-sovittimella on 50 % alennus ja korkeat hyväksynnät kuljettajilta
Apple nopeuttaa iPhone 17e:n tuotantoa ja kehittää uutta Air-mallia, jossa on kaksoiskamerajärjestelmä
Epic Games -alusta julkaisee kaksitoista korkean budjetin peliä ilman pysyviä kustannuksia PC-käyttäjille
PlayStation 5 Pron hinnanlasku nopeuttaa digitaalista vähittäismyyntiä ja eliminoi maailmanlaajuiset varastot
Uusi Applen järjestelmäpäivitys optimoi kiireellisten tehtävien hallinnan iPhonen käyttäjille
Vuotaa yksityiskohtia uuden kannettavan PlayStationin laitteistosta, jossa on Xbox Series S:n ylivoimainen grafiikka
Oppo lanseeraa Find X9 Ultran virallisesti maailmanlaajuisesti Hasselblad-linsseillä ja kestävällä akulla
Tim Cook paljastaa uudet iPhone- ja iPod-prototyypit Applen 50-vuotisjuhlan kunniaksi
Uusi versio taitettavasta älypuhelimesta tuo kultaisen viimeistelyn Winter Games -kilpailijoille
Leak paljastaa Lords of the Fallenin ja Sword Art Onlinen huhtikuun PS Plus Essential -luettelossa