Новое поколение искусственного интеллекта Gemma 4 использует лицензию Apache 2.0 на локальных устройствах
Технологический гигант, ответственный за самую используемую поисковую систему в мире, представил новое семейство языковых моделей с открытым исходным кодом, предназначенное для разработчиков и исследователей. Недавнее обновление содержит инструменты, поддерживающие ввод текста, аудио и изображений, с контекстными окнами, которые в самых надежных версиях достигают отметки в 256 тысяч токенов. Основным отличием этого поколения является снятие прежних коммерческих ограничений, что позволяет компаниям более свободно использовать эту технологию на своем оборудовании, от серверов до мобильных телефонов.
Изменение правил коммерческого использования
Принятие нового формата лицензирования устраняет барьеры, существовавшие в предыдущих версиях инструмента. Разработчики теперь имеют больший контроль над обработанными данными и коммерческим развертыванием без необходимости следовать политикам запрещенного использования, которые могут быть в одностороннем порядке обновлены создателем системы.
Это структурное изменение направлено на поощрение создания новых проектов внутри сообщества программистов. Акцент на автономном выполнении усиливает стратегию предложения открытых и гибких альтернатив, позволяя стартапам и крупным корпорациям интегрировать технологии без постоянных затрат на интерфейс программирования приложений.
Технические достижения в области логических рассуждений
Новые системы существенно улучшают способность решать математические задачи и следовать сложным инструкциям. Обновленная архитектура включает встроенную поддержку вызовов функций и создания структурированного вывода в определенных форматах данных, что оптимизирует рабочий процесс автономных агентов.
Возможности обработки программного кода также подверглись усовершенствованиям для правильной работы в средах без подключения к Интернету. Достигнутая в этих условиях производительность близка к результатам, полученным спецслужбами, которые полагаются исключительно на облачные обработки.
Мультимодальная обработка информации
Помимо традиционной интерпретации текста, новое поколение естественным образом обрабатывает аудиофайлы и изображения. Система распознавания речи демонстрирует превосходную точность по сравнению с моделями, выпущенными в прошлом году, облегчая транскрипцию и анализ голосовых команд в режиме реального времени.
Поддержка визуального ввода позволяет выполнять сложные задачи, такие как оптическое распознавание символов в отсканированных документах. Инструмент также может интерпретировать сложные графики и таблицы, извлекая соответствующие данные с уровнем точности, отвечающим требованиям корпоративного сектора.
Сочетание этих различных способов ввода открывает ряд возможностей для создания интерактивных приложений. Разработчики могут структурировать решения, которые одновременно анализируют то, что говорит пользователь, и то, что снимает камера устройства, обрабатывая все без отправки данных на внешние серверы.
Варианты размера и эффективности
Семейство моделей разделено на четыре основные конфигурации для удовлетворения различных потребностей в оборудовании. Более надежные версии, известные как Mixture of Experts и Dense, предназначены для высокопроизводительных серверов и профессиональных рабочих станций, которые обрабатывают большие объемы данных.
С другой стороны, более легкие варианты были специально разработаны с учетом приоритета энергоэффективности. Эти модели меньшего размера идеально подходят для работы на границе сети, то есть непосредственно на оборудовании конечных пользователей, что позволяет свести к минимуму расход заряда батареи и необходимость внешней обработки.
Версия на основе экспертной архитектуры активирует лишь часть из миллиардов параметров в процессе вывода. Этот технический подход радикально снижает задержку ответа и энергопотребление, сохраняя при этом способность понимать и генерировать текст на более чем ста сорока различных языках.
Полные файлы с весами нейронной сети теперь доступны для общественности. Профессионалы в области технологий могут сразу же загрузить материалы на признанные платформы хостинга кода и репозитории, ориентированные на машинное обучение.
Оптимизация для мобильных устройств
Разработка компактных версий проходила в партнерстве с основными производителями процессоров для мобильных устройств на мировом рынке. Результатом этого технического сотрудничества стали системы, способные предоставлять ответы практически с нулевой задержкой при выполнении повседневных задач, таких как синхронный перевод и обобщение длинных текстов. Практические испытания показывают, что технология сохраняет стабильную производительность даже на недорогих макетных платах и одноплатных компьютерах, широко используемых в образовательных и промышленных проектах.
Поддержание эффективности в различных конфигурациях оборудования представляет собой значительную практическую выгоду для экосистемы приложений. Сокращение времени ответа при локальной обработке имеет решающее значение для услуг, требующих высокого уровня конфиденциальности, таких как приложения в сфере здравоохранения и финансов. Обрабатывая информацию непосредственно на устройстве пользователя, технология исключает риски, связанные с передачей конфиденциальных данных через Интернет, обеспечивая защиту личной информации от перехвата третьими лицами.
Интеграция с экосистемой разработки
Немедленная доступность инструментов на официальных платформах облегчает исследователям и разработчикам программного обеспечения доступ к новым технологиям искусственного интеллекта. Модели большей емкости можно протестировать и развернуть в студиях облачной разработки, а версии, оптимизированные для мобильных устройств, находятся в специальных галереях для периферийной обработки. Компании, желающие модернизировать свои внутренние системы, могут интегрировать эти решения в свою локальную инфраструктуру, не беспокоясь об ежемесячных расходах на использование сторонних интерфейсов. Кроме того, архитектура более легких вариантов послужит фундаментальной основой для будущих обновлений мобильных операционных систем, указывая на четкую тенденцию того, что генеративный искусственный интеллект станет стандартным и повсеместным компонентом в сотовых телефонах, которые появятся на рынке в ближайшие годы, изменяя способ повседневного взаимодействия пользователей со своими устройствами.
Расширение использования открытого искусственного интеллекта
Сочетание повышения производительности с разрешительным лицензированием расширяет диапазон возможностей для технологического сектора. Переход к локально исполняемым моделям с открытым исходным кодом укрепляет независимость разработчиков и способствует созданию более разнообразной цифровой среды, в которой инновации не зависят исключительно от крупных инфраструктур облачных вычислений.
Veja Tambem em News (RU)
Платформа Epic Games выпускает двенадцать высокобюджетных игр бесплатно для пользователей ПК
Падение цен на PlayStation 5 Pro ускоряет цифровые розничные продажи и устраняет глобальные запасы
Новое обновление системы Apple оптимизирует управление срочными задачами для пользователей iPhone
Утечка подробностей об оборудовании новой портативной PlayStation с графикой, превосходящей Xbox Series S
Oppo официально представляет Find X9 Ultra по всему миру с линзами Hasselblad и надежным аккумулятором
Новая версия складного смартфона принесет золото участникам Зимних игр
Тим Кук представляет новые прототипы iPhone и iPod на праздновании пятидесятилетия Apple
Samsung обновляет модуль QuickStar и расширяет визуальное управление панелью в интерфейсе One UI 8.5
Система Android получает встроенную интеграцию Gemini Nano 4 для автономной обработки на смартфонах.
Утечка раскрывает Lords of the Fallen и Sword Art Online в апрельском каталоге PS Plus Essential.
Новый смартфон Xiaomi 18 Pro Max объединяет две камеры по 200 Мп и процессор последнего поколения.