News (RU)

Google анонсирует Gemini 3.1 Pro с вдвое лучшими аргументами в расширенных тестах

Gemini
Foto: Gemini - Mehaniq/shutterstock.com

Google объявил в этот четверг (19) о выпуске Gemini 3.1 Pro, значительного обновления семейства моделей искусственного интеллекта компании. Новая модель выделяется своими достижениями в расширенных рассуждениях: производительность в логических тестах более чем удвоилась по сравнению с предыдущим Gemini 3 Pro. Предварительная версия теперь доступна разработчикам и подписчикам платного плана, ориентированная на сложные задачи, требующие синтеза информации и тщательного решения проблем.

Выпуск происходит на этапе внутреннего тестирования и проверки рабочих процессов с автономными агентами. Обычные пользователи получают доступ к версии через приложение Gemini с увеличенными ограничениями для владельцев подписок Google AI Pro и Ultra. Компании и разработчики используют этот инструмент через API Gemini, включая такие платформы, как AI Studio, Vertex AI и Android Studio.

Объявление было сделано компанией Google DeepMind, которая позиционирует Gemini 3.1 Pro как самую продвинутую модель компании для решения задач, требующих интеллекта, выходящего за рамки простых ответов. Обновление включает в себя улучшения в мультимодальном рассуждении, охватывающем текст, изображения, аудио, видео и полные репозитории кода.

Производительность в тестах рассуждения

Gemini 3.1 Pro набрал 77,1% в ARC-AGI-2, тесте, который оценивает способность решать совершенно новые логические схемы. Этот результат более чем вдвое превышает производительность Gemini 3 Pro, который набрал 31,1% по тому же показателю.

Модель также превзошла конкурентов по строгим оценкам. В последнем экзамене человечества он набрал 44,4%, опередив модели Anthropic и OpenAI. Эти достижения укрепляют позиции Gemini 3.1 Pro в задачах, требующих специальных знаний и глубокого мышления.

Улучшение логического рассуждения позволяет более последовательно решать сложные проблемы. Основное внимание уделяется практическим приложениям, где простого извлечения обученных шаблонов недостаточно.

Прогресс в агентских и поисковых задачах

В рейтинге APEX-Agents, который измеряет производительность при выполнении долгосрочных профессиональных задач, Gemini 3.1 Pro набрал 33,5%. Этот индекс указывает на улучшение способности поддерживать цели на более длительных этапах.

Модель получила 85,9% баллов в BrowseComp — оценке агентного поиска в Интернете в сочетании с использованием таких инструментов, как Python. Этот результат подчеркивает эффективность автономного поиска и извлечения соответствующей информации.

Эти достижения способствуют созданию более надежных автономных агентов. Google подчеркивает, что в модели приоритет отдается рабочим процессам, включающим несколько шагов и интеграцию инструментов.

Gemini Inteligência Artificial
Искусственный интеллект Близнецов – Джу Джэ Ён/ Shutterstock.com

Возможности системного синтеза и визуального создания

Gemini 3.1 Pro демонстрирует возможность упростить сложные системы с помощью текстовых подсказок. В демонстрациях он создавал масштабируемую анимацию SVG непосредственно из описаний, создавая более легкие визуальные эффекты по сравнению с традиционными видео.

Другое приложение включало настройку общедоступного потока телеметрии для создания функциональной информационной панели, которая визуализирует орбиту Международной космической станции в режиме реального времени. Модель обрабатывала API и данные для предоставления рабочего интерфейса.

Модель также закодировала интерактивные 3D-эффекты. В одном примере моделировался полет стаи птиц, которые реагируют на отслеживание рук пользователя, с использованием компьютерного зрения и анимации.

Примеры творческого кодирования

В ходе теста литературной интерпретации Gemini 3.1 Pro преобразовал описания из книги «Грозовой перевал» в современный интерфейс портфолио. ИИ уловил атмосферный тон работы и создал современный и функциональный веб-сайт.

Эти демонстрации иллюстрируют способность рассуждения переводить абстрактные концепции в исполняемый код. Модель генерирует визуальные и интерактивные структуры на основе повествовательных подсказок.

Акцент на мультимодальном синтезе расширяет возможности использования в дизайне, образовании и быстром прототипировании.

Планы доступа и подписки

Gemini 3.1 Pro находится в предварительной версии и интегрирован в приложение Gemini с расширенными ограничениями для подписчиков планов Google AI Pro и Ultra. Эти планы предлагают приоритетный доступ к самой умной модели в линейке.

В NotebookLM версия также доступна только платным пользователям. Инструмент обладает расширенными возможностями синтеза документов и получения аналитической информации.

Разработчики получают доступ к предварительной версии через API на таких платформах, как AI Studio и Vertex AI. Компании используют эту модель в корпоративной среде с Gemini Enterprise.

Доступность для разработчиков и компаний

Интеграция с Vertex AI позволяет экспериментировать в масштабе предприятия. Google подчеркивает, что предварительная версия служит для уточнения потоков с автономными агентами перед широким выпуском.

Модель поддерживает контекстное окно из 1 миллиона токенов, поддерживая анализ больших объемов данных. Эта функция остается той же, что и в предыдущих поколениях серии Gemini 3.

Обновление усиливает экосистему инструментов Google для искусственного интеллекта, применяемых в профессиональных сценариях.

Veja Tambem em News (RU)

Платформа Epic Games выпускает двенадцать высокобюджетных игр бесплатно для пользователей ПК

Платформа Epic Games выпускает двенадцать высокобюджетных игр бесплатно для пользователей ПК

Падение цен на PlayStation 5 Pro ускоряет цифровые розничные продажи и устраняет глобальные запасы

Падение цен на PlayStation 5 Pro ускоряет цифровые розничные продажи и устраняет глобальные запасы

Новое обновление системы Apple оптимизирует управление срочными задачами для пользователей iPhone

Новое обновление системы Apple оптимизирует управление срочными задачами для пользователей iPhone

Утечка подробностей об оборудовании новой портативной PlayStation с графикой, превосходящей Xbox Series S

Утечка подробностей об оборудовании новой портативной PlayStation с графикой, превосходящей Xbox Series S

Oppo официально представляет Find X9 Ultra по всему миру с линзами Hasselblad и надежным аккумулятором

Oppo официально представляет Find X9 Ultra по всему миру с линзами Hasselblad и надежным аккумулятором

Новая версия складного смартфона принесет золото участникам Зимних игр

Новая версия складного смартфона принесет золото участникам Зимних игр

Тим Кук представляет новые прототипы iPhone и iPod на праздновании пятидесятилетия Apple

Тим Кук представляет новые прототипы iPhone и iPod на праздновании пятидесятилетия Apple

Samsung обновляет модуль QuickStar и расширяет визуальное управление панелью в интерфейсе One UI 8.5

Samsung обновляет модуль QuickStar и расширяет визуальное управление панелью в интерфейсе One UI 8.5

Система Android получает встроенную интеграцию Gemini Nano 4 для автономной обработки на смартфонах.

Система Android получает встроенную интеграцию Gemini Nano 4 для автономной обработки на смартфонах.

Утечка раскрывает Lords of the Fallen и Sword Art Online в апрельском каталоге PS Plus Essential.

Утечка раскрывает Lords of the Fallen и Sword Art Online в апрельском каталоге PS Plus Essential.

Новый смартфон Xiaomi 18 Pro Max объединяет две камеры по 200 Мп и процессор последнего поколения.

Новый смартфон Xiaomi 18 Pro Max объединяет две камеры по 200 Мп и процессор последнего поколения.

Apple разрабатывает новый складной iPhone и готовит специальную версию в честь 20-летия бренда

Apple разрабатывает новый складной iPhone и готовит специальную версию в честь 20-летия бренда