News (CS)

Google oznamuje Gemma 4 s licencí Apache 2.0 a šablonami pro místní zařízení

Gemma 4
Foto: Gemma 4 - Google

Google tento čtvrtek oznámila rodinu Gemma 4, která se skládá z nových modelů umělé inteligence s otevřeným zdrojovým kódem s dostupnými váhami. Aktualizace představuje první velký pokrok v řadě od uvedení Gemma 3 na trh před více než rokem. Vývojáři nyní mají licenci Apache 2.0, která odstraňuje komerční omezení existující v předchozích verzích.

Modely podporují textový, zvukový a obrazový vstup s kontextovými okny, která dosahují 256 tisíc tokenů v největších variantách. Eles jsou primárně navrženy tak, aby fungovaly lokálně na cenově dostupném hardwaru, včetně spotřebitelských GPU a mobilních zařízení. Změna licence usnadňuje komerční použití bez dalších povinností uložených Google.

Technická vylepšení v uvažování a multimodální

Nové modely přinášejí oproti předchozí generaci výrazný pokrok v uvažování, matematice a dodržování pokynů. Eles obsahují nativní podporu pro volání funkcí a generování strukturovaného výstupu JSON, což přináší výhody agentním pracovním tokům.

Schopnost zpracování kódu byla optimalizována pro offline prostředí a dosáhla výkonu srovnatelného s cloudovými službami, jako je Gemini Pro. Podpora vizuálního vstupu umožňuje úkoly, jako je optické rozpoznávání znaků a interpretace grafů s větší přesností.

  • Mezi varianty patří modely Effective 2B a 4B optimalizované pro nízkou latenci na chytrých telefonech.
  • Spolupráce s Qualcomm a MediaTek usnadňuje integraci na mobilních zařízeních.
  • Větší modely běží na jediném 80GB GPU H100 bez kvantizace.

Velikostní varianty a energetická účinnost

Řada Gemma 4 má čtyři hlavní konfigurace velikosti. Verze 26B Mixture z Experts a 31B Dense nabízejí vysoký výkon a běží na hardwaru serveru nebo pracovní stanice. Já jako Effective 2B a 4B upřednostňují efektivitu pro provádění na okrajových zařízeních.

Model 26B MoE aktivuje během inference pouze 3,8 miliardy parametrů, čímž snižuje latenci a spotřebu energie. Todas variant zvládne více než 140 jazyků. Vývojáři si mohou stáhnout plné váhy na platformách, jako jsou Hugging Face, Kaggle a Ollama.

Okamžitá dostupnost napříč platformami

Větší modely 31B a 26B jsou k dispozici v AI Studio a Google. Odlehčené verze E4B a E2B jsou dostupné v AI Edge Gallery. Úplné hmotnosti jsou k dispozici pro okamžité stažení z veřejných úložišť.

Společnosti a výzkumní pracovníci mohou integrovat modely do místních aplikací bez opakujících se nákladů na API. Google také uvedlo, že varianty 2B a 4B budou sloužit jako základ pro nadcházející Gemini Nano 4 na zařízeních Android.

Dopad přechodu na licenci Apache 2.0

Přijetí licence Apache 2.0 odstraňuje omezení předchozí vlastní licence, která zahrnovala jednostranně aktualizovatelné zásady nepoužívání. Desenvolvedores Získejte větší kontrolu nad daty a obchodním nasazením.

Tato změna by měla podpořit vytváření nových projektů v komunitě, neformálně známých jako Gemmaverse. Zaměření na místní provádění posiluje strategii nabízení otevřených alternativ k uzavřeným modelům řady Gemini.

Optimalizace pro konkrétní hardware

Odlehčené verze byly vyvinuty ve spolupráci s výrobci mobilních čipů. Elas poskytuje téměř nulovou latenci při každodenních úkolech při zachování snížené spotřeby baterie. Testes značí dobrý výkon na kartách jako Raspberry Pi a Jetson Nano.

Větší modely si zachovávají účinnost i v husté konfiguraci nebo MoE. Snížení latence při místním zpracování představuje praktický přínos pro aplikace, které vyžadují soukromí a rychlou odezvu bez neustálého připojení k serverům.

Podpora více vstupních modalit

Kromě textu modely nativně zpracovávají zvuk a obrázky. Rozpoznávání řeči je lepší než Gemma 3. Multimodální schopnost otevírá možnosti pro aplikace, které kombinují různé typy dat v reálném čase.

Vývojáři mohou prototypovat agentní toky přímo v AI Core Developer Preview pomocí odlehčených variant. Implementace Essas jsou dopředně kompatibilní s budoucností Gemini Nano 4.

Řada Gemma 4 posiluje závazek Google nabízet otevřené modely s přístupnými závažími. Kombinace vylepšeného výkonu, tolerantního licencování a rozmanité hardwarové podpory rozšiřuje možnosti pro ty, kteří hledají lokálně spustitelná řešení AI.