Google обявява Gemma 4 с лиценз Apache 2.0 и шаблони за локални устройства
Google обяви този четвъртък семейството Gemma 4, съставено от нови модели с отворен код с изкуствен интелект с налични тегла. Актуализацията представлява първия голям напредък в линията от пускането на пазара на Gemma 3 преди повече от година. Разработчиците вече имат лиценз Apache 2.0, който премахва търговските ограничения, присъстващи в предишните версии.
Моделите поддържат въвеждане на текст, аудио и изображение, с контекстни прозорци, които достигат 256 хиляди токена в най-големите варианти. Eles са предназначени основно да работят локално на достъпен хардуер, включително потребителски графични процесори и мобилни устройства. Промяната на лиценза улеснява търговската употреба без допълнителни задължения, наложени от Google.
Технически подобрения в разсъжденията и мултимодалността
Новите модели носят значителен напредък в разсъжденията, математиката и следването на инструкции в сравнение с предишното поколение. Eles включва вградена поддръжка за извикване на функции и генериране на структуриран JSON изход, което е от полза за агентните работни потоци.
Възможностите за обработка на кодове са оптимизирани за офлайн среди, като се постига производителност, сравнима с облачните услуги като Gemini Pro. Поддръжката на визуално въвеждане позволява задачи като оптично разпознаване на знаци и интерпретация на графики с по-голяма точност.
- Вариантите включват модели Effective 2B и 4B, оптимизирани за ниска латентност на смартфони.
- Сътрудничеството с Qualcomm и MediaTek улеснява интеграцията на мобилни устройства.
- По-големите модели работят с един 80GB H100 GPU без квантуване.
Варианти на размери и енергийна ефективност
Семейството Gemma 4 има четири основни конфигурации на размера. Версии 26B Mixture от Experts и 31B Dense предлагат висока производителност и работят на хардуер на сървър или работна станция. Já като Effective 2B и 4B дават приоритет на ефективността за изпълнение на крайни устройства.
Моделът 26B MoE активира само 3,8 милиарда параметъра по време на извод, намалявайки латентността и консумацията на енергия. Todas варианта обработват над 140 езика. Разработчиците могат да изтеглят пълните тегла на платформи като Hugging Face, Kaggle и Ollama.
Незабавна наличност в различни платформи
По-големите модели 31B и 26B се предлагат в AI Studio и Google. Олекотените E4B и E2B версии могат да бъдат достъпни в AI Edge Gallery. Пълните тегла са достъпни за незабавно изтегляне от публични хранилища.
Компаниите и изследователите могат да интегрират моделите в локални приложения без повтарящи се разходи за API. Google също посочи, че варианти 2B и 4B ще служат като основа за предстоящите Gemini Nano 4 на Android устройства.
Въздействие на преминаването към лиценз Apache 2.0
Приемането на лиценз Apache 2.0 елиминира ограниченията на предишния потребителски лиценз, който включваше едностранно актуализирани политики за неизползване. Desenvolvedores Получете по-голям контрол върху данните и бизнес внедряванията.
Тази промяна трябва да насърчи създаването на нови проекти в общността, известни неофициално като Gemmaverse. Фокусът върху локалното изпълнение подсилва стратегията за предлагане на отворени алтернативи на затворените модели от линията Gemini.
Оптимизации за специфичен хардуер
Олекотените версии са разработени в партньорство с производители на мобилни чипове. Elas осигурява почти нулево забавяне при ежедневни задачи, като същевременно поддържа намалена консумация на батерия. Testes показват добра производителност на карти като Raspberry Pi и Jetson Nano.
По-големите модели поддържат ефективност дори в гъста конфигурация или MoE. Намаляването на латентността при локална обработка представлява практическа полза за приложения, които изискват поверителност и бърз отговор без постоянна връзка със сървъри.
Поддържа множество модалности на въвеждане
В допълнение към текста, моделите обработват естествено аудио и изображения. Разпознаването на реч се подобрява над Gemma 3. Мултимодалната способност отваря възможности за приложения, които комбинират различни типове данни в реално време.
Разработчиците могат да създават прототипи на агентни потоци директно в AI Core Developer Preview, като използват олекотените варианти. Essas реализациите са съвместими с бъдещето Gemini Nano 4.
Семейството Gemma 4 затвърждава ангажимента на Google да предлага отворени модели с достъпни тежести. Комбинацията от подобрена производителност, разрешително лицензиране и разнообразна хардуерна поддръжка разширява възможностите за тези, които търсят локално работещи AI решения.
Veja Tambem em News (BG)
Безжичният CarPlay адаптер на Amazon има 50% отстъпка и високи рейтинги на одобрение от шофьорите
Apple ускорява производството на iPhone 17e и разработва нов модел Air със система с двойна камера
Платформата Epic Games пуска дванадесет високобюджетни игри без постоянни разходи за потребителите на компютри
Спадът в цената на PlayStation 5 Pro ускорява дигиталните продажби на дребно и елиминира глобалните запаси
Новата системна актуализация на Apple оптимизира управлението на спешни задачи за потребителите на iPhone
Leak разкрива Lords of the Fallen и Sword Art Online в априлския каталог на PS Plus Essential
Производителите актуализират премиум сензори за снимки на смартфони с акцент върху мащабирането и изкуствения интелект
Производителят OPPO потвърждава официалната дата за представяне на нови смартфони Find X9 Ultra и Pro с акцент върху камерите
Новият смартфон Xiaomi 18 Pro Max интегрира две 200 MP камери и процесор от последно поколение
Apple разработва нов сгъваем iPhone и подготвя специално издание за отбелязване на 20 години на марката
Изтичане на подробности за хардуера на новата преносима PlayStation с превъзходна графика спрямо Xbox Series S