Нове покоління штучного інтелекту Gemma 4 використовує ліцензію Apache 2.0 на локальних пристроях
Технологічний гігант, відповідальний за найпопулярнішу пошукову систему в світі, зробив доступною нову сімейство мовних моделей з відкритим кодом, призначених для розробників і дослідників. Нещодавнє оновлення пропонує інструменти, які підтримують введення тексту, аудіо та зображень, з контекстними вікнами, які досягають позначки в 256 тисяч токенів у найнадійніших версіях. Основною відмінністю цього покоління є усунення попередніх комерційних обмежень, що дозволяє компаніям більш вільно використовувати технологію на власному апаратному забезпеченні, від серверів до мобільних телефонів.
Зміна правил комерційного використання
Прийняття нового формату ліцензування усуває бар’єри, які існували в попередніх версіях інструменту. Тепер розробники мають більший контроль над обробленими даними та комерційними розгортаннями без необхідності дотримуватися політик забороненого використання, які можуть бути в односторонньому порядку оновлені розробником системи.
Ця структурна зміна спрямована на заохочення створення нових проектів у спільноті програмістів. Зосередження на виконанні в автономному режимі посилює стратегію пропозиції відкритих і гнучких альтернатив, що дозволяє стартапам і великим корпораціям інтегрувати технологію без повторних витрат на інтерфейс програмування додатків.
Технічний прогрес у логічному міркуванні
Нові системи представляють суттєві покращення в здатності розв’язувати математичні задачі та слідувати складним інструкціям. Оновлена архітектура включає вбудовану підтримку викликів функцій і генерування структурованого виводу в певних форматах даних, що оптимізує робочий процес автономних агентів.
Потужність обробки програмного коду також зазнала покращень, щоб належним чином працювати в середовищах без підключення до Інтернету. Продуктивність, досягнута в цих умовах, близька до результатів, отриманих розвідувальними службами, які покладаються виключно на хмарну обробку.
Мультимодальна обробка інформації
На додаток до традиційної інтерпретації тексту, нове покоління обробляє аудіофайли та зображення нативно. Система розпізнавання мовлення демонструє вищу точність порівняно з моделями, випущеними в минулому році, полегшуючи транскрипцію та аналіз голосових команд у режимі реального часу.
Підтримка візуального введення дозволяє виконувати такі складні завдання, як оптичне розпізнавання символів у відсканованих документах. Інструмент також може інтерпретувати складні графіки та таблиці, вилучаючи відповідні дані з рівнем точності, який відповідає вимогам корпоративного сектору.
Поєднання цих різних модальностей введення відкриває ряд можливостей для створення інтерактивних програм. Розробники можуть структурувати рішення, які одночасно аналізують те, що говорить користувач і те, що знімає камера пристрою, обробляючи все без надсилання даних на зовнішні сервери.
Варіанти розміру та ефективності
Сімейство моделей було розділено на чотири основні конфігурації для задоволення різних потреб у обладнанні. Надійніші версії, відомі як Mixture з Experts і Dense, призначені для високопродуктивних серверів і професійних робочих станцій, які обробляють масивні дані.
З іншого боку, легші варіанти були спеціально розроблені для пріоритету енергоефективності. Менші моделі Esses ідеально підходять для роботи на межі мережі, тобто безпосередньо на обладнанні кінцевих користувачів, мінімізуючи споживання акумулятора та потребу у зовнішній обробці.
Версія на основі експертної архітектури активує лише частину з мільярдів параметрів під час процесу логічного висновку. Технічний підхід Essa суттєво зменшує затримку відповіді та споживання енергії, зберігаючи здатність розуміти та генерувати тексти понад ста сорока різними мовами.
Повні файли з вагами нейронної мережі тепер оприлюднені. Profissionais зі сфери технологій може негайно завантажити матеріал на визнаних платформах розміщення коду та репозиторіях, орієнтованих на машинне навчання.
Оптимізація під мобільні пристрої
Розробка компактних версій відбувалася в партнерстві з основними виробниками процесорів для мобільних пристроїв на світовому ринку. Essa Результатом технічної співпраці стали системи, здатні надавати відповіді з практично нульовою затримкою в повсякденних завданнях, таких як синхронний переклад і узагальнення довгих текстів. Практичні випробування демонструють, що технологія підтримує стабільну продуктивність навіть на недорогих платах розробки та одноплатних комп’ютерах, які широко використовуються в освітніх і промислових проектах.
Підтримка ефективності в різних апаратних конфігураціях є значним практичним вигодою для екосистеми додатків. Зменшення часу відповіді при локальній обробці має вирішальне значення для служб, які вимагають високого рівня конфіденційності, наприклад програм охорони здоров’я та фінансів. Завдяки обробці інформації безпосередньо на пристрої користувача ця технологія усуває ризики, пов’язані з передачею конфіденційних даних через Інтернет, гарантуючи, що особиста інформація залишається захищеною від перехоплення третіми особами.
Інтеграція з екосистемою розробки
Негайна доступність інструментів на офіційних платформах полегшує доступ дослідників та розробників програмного забезпечення до нових технологій штучного інтелекту. Моделі більшої ємності можна протестувати та розгорнути за допомогою студій хмарної розробки, тоді як версії, оптимізовані для мобільних пристроїв, зберігаються в спеціальних галереях для крайової обробки. Компанії, які хочуть модернізувати свої внутрішні системи, можуть інтегрувати ці рішення у свою локальну інфраструктуру, не турбуючись про щомісячні витрати за використання інтерфейсів сторонніх розробників. Крім того, архітектура полегшених варіантів слугуватиме фундаментальною основою для майбутніх оновлень мобільних операційних систем, що вказує на чітку тенденцію до того, що генеративний штучний інтелект стане стандартним і повсюдним компонентом мобільних телефонів, які з’являться на ринку в найближчі роки, змінюючи спосіб щоденної взаємодії користувачів зі своїми пристроями.
Розширення використання відкритого штучного інтелекту
Поєднання покращеної продуктивності з дозвільним ліцензуванням розширює спектр можливостей для технологічного сектора. Перехід до локально виконуваних моделей з відкритим кодом зміцнює незалежність розробників і сприяє створенню більш різноманітного цифрового середовища, де інновації не покладаються виключно на великі інфраструктури хмарних обчислень.
Veja Tambem em News (UA)
Значна знижка на Galaxy S25 Plus знижує вартість нижче 4500 реалів в онлайн-магазині
Apple прискорює виробництво iPhone 17e і розробляє нову модель Air з системою подвійної камери
Платформа Epic Games випускає дванадцять високобюджетних ігор безкоштовно для користувачів ПК
Зниження ціни на PlayStation 5 Pro прискорює цифрові роздрібні продажі та ліквідує глобальні запаси
Нове оновлення системи Apple оптимізує керування терміновими завданнями для користувачів iPhone
Oppo офіційно випускає в усьому світі Find X9 Ultra з лінзами Hasselblad і надійним акумулятором
Витік інформації про апаратне забезпечення нової портативної PlayStation із чудовою графікою, ніж у Xbox Series S
Нова версія складного смартфона приносить золоту фініш учасникам Зимових ігор
Тім Кук показує нові прототипи iPhone та iPod на святкуванні п’ятдесятиріччя Apple
Витік розкриває Lords of the Fallen і Sword Art Online у квітневому каталозі PS Plus Essential
Система Android отримує вбудовану інтеграцію Gemini Nano 4 для офлайн-обробки на смартфонах