Google обявява Gemma 4 с лиценз Apache 2.0 и шаблони за локални устройства

Gemma 4

Gemma 4 - Google

Google обяви този четвъртък семейството Gemma 4, съставено от нови модели с отворен код с изкуствен интелект с налични тегла. Актуализацията представлява първия голям напредък в линията от пускането на пазара на Gemma 3 преди повече от година. Разработчиците вече имат лиценз Apache 2.0, който премахва търговските ограничения, присъстващи в предишните версии.

Моделите поддържат въвеждане на текст, аудио и изображение, с контекстни прозорци, които достигат 256 хиляди токена в най-големите варианти. Eles са предназначени основно да работят локално на достъпен хардуер, включително потребителски графични процесори и мобилни устройства. Промяната на лиценза улеснява търговската употреба без допълнителни задължения, наложени от Google.

Технически подобрения в разсъжденията и мултимодалността

Новите модели носят значителен напредък в разсъжденията, математиката и следването на инструкции в сравнение с предишното поколение. Eles включва вградена поддръжка за извикване на функции и генериране на структуриран JSON изход, което е от полза за агентните работни потоци.

Възможностите за обработка на кодове са оптимизирани за офлайн среди, като се постига производителност, сравнима с облачните услуги като Gemini Pro. Поддръжката на визуално въвеждане позволява задачи като оптично разпознаване на знаци и интерпретация на графики с по-голяма точност.

  • Вариантите включват модели Effective 2B и 4B, оптимизирани за ниска латентност на смартфони.
  • Сътрудничеството с Qualcomm и MediaTek улеснява интеграцията на мобилни устройства.
  • По-големите модели работят с един 80GB H100 GPU без квантуване.

Варианти на размери и енергийна ефективност

Семейството Gemma 4 има четири основни конфигурации на размера. Версии 26B Mixture от Experts и 31B Dense предлагат висока производителност и работят на хардуер на сървър или работна станция. Já като Effective 2B и 4B дават приоритет на ефективността за изпълнение на крайни устройства.

Моделът 26B MoE активира само 3,8 милиарда параметъра по време на извод, намалявайки латентността и консумацията на енергия. Todas варианта обработват над 140 езика. Разработчиците могат да изтеглят пълните тегла на платформи като Hugging Face, Kaggle и Ollama.

Незабавна наличност в различни платформи

По-големите модели 31B и 26B се предлагат в AI Studio и Google. Олекотените E4B и E2B версии могат да бъдат достъпни в AI Edge Gallery. Пълните тегла са достъпни за незабавно изтегляне от публични хранилища.

Компаниите и изследователите могат да интегрират моделите в локални приложения без повтарящи се разходи за API. Google също посочи, че варианти 2B и 4B ще служат като основа за предстоящите Gemini Nano 4 на Android устройства.

Въздействие на преминаването към лиценз Apache 2.0

Приемането на лиценз Apache 2.0 елиминира ограниченията на предишния потребителски лиценз, който включваше едностранно актуализирани политики за неизползване. Desenvolvedores Получете по-голям контрол върху данните и бизнес внедряванията.

Тази промяна трябва да насърчи създаването на нови проекти в общността, известни неофициално като Gemmaverse. Фокусът върху локалното изпълнение подсилва стратегията за предлагане на отворени алтернативи на затворените модели от линията Gemini.

Оптимизации за специфичен хардуер

Олекотените версии са разработени в партньорство с производители на мобилни чипове. Elas осигурява почти нулево забавяне при ежедневни задачи, като същевременно поддържа намалена консумация на батерия. Testes показват добра производителност на карти като Raspberry Pi и Jetson Nano.

По-големите модели поддържат ефективност дори в гъста конфигурация или MoE. Намаляването на латентността при локална обработка представлява практическа полза за приложения, които изискват поверителност и бърз отговор без постоянна връзка със сървъри.

Поддържа множество модалности на въвеждане

В допълнение към текста, моделите обработват естествено аудио и изображения. Разпознаването на реч се подобрява над Gemma 3. Мултимодалната способност отваря възможности за приложения, които комбинират различни типове данни в реално време.

Разработчиците могат да създават прототипи на агентни потоци директно в AI Core Developer Preview, като използват олекотените варианти. Essas реализациите са съвместими с бъдещето Gemini Nano 4.

Семейството Gemma 4 затвърждава ангажимента на Google да предлага отворени модели с достъпни тежести. Комбинацията от подобрена производителност, разрешително лицензиране и разнообразна хардуерна поддръжка разширява възможностите за тези, които търсят локално работещи AI решения.