Google анонсирует Gemini 3.1 Pro с вдвое лучшими аргументами в расширенных тестах
Google объявил в этот четверг (19) о выпуске Gemini 3.1 Pro, значительного обновления семейства моделей искусственного интеллекта компании. Новая модель выделяется своими достижениями в расширенных рассуждениях: производительность в логических тестах более чем удвоилась по сравнению с предыдущим Gemini 3 Pro. Предварительная версия теперь доступна разработчикам и подписчикам платного плана, ориентированная на сложные задачи, требующие синтеза информации и тщательного решения проблем.
Выпуск происходит на этапе внутреннего тестирования и проверки рабочих процессов с автономными агентами. Обычные пользователи получают доступ к версии через приложение Gemini с увеличенными ограничениями для владельцев подписок Google AI Pro и Ultra. Компании и разработчики используют этот инструмент через API Gemini, включая такие платформы, как AI Studio, Vertex AI и Android Studio.
Объявление было сделано компанией Google DeepMind, которая позиционирует Gemini 3.1 Pro как самую продвинутую модель компании для решения задач, требующих интеллекта, выходящего за рамки простых ответов. Обновление включает в себя улучшения в мультимодальном рассуждении, охватывающем текст, изображения, аудио, видео и полные репозитории кода.
Производительность в тестах рассуждения
Gemini 3.1 Pro набрал 77,1% в ARC-AGI-2, тесте, который оценивает способность решать совершенно новые логические схемы. Этот результат более чем вдвое превышает производительность Gemini 3 Pro, который набрал 31,1% по тому же показателю.
Модель также превзошла конкурентов по строгим оценкам. В последнем экзамене человечества он набрал 44,4%, опередив модели Anthropic и OpenAI. Эти достижения укрепляют позиции Gemini 3.1 Pro в задачах, требующих специальных знаний и глубокого мышления.
Улучшение логического рассуждения позволяет более последовательно решать сложные проблемы. Основное внимание уделяется практическим приложениям, где простого извлечения обученных шаблонов недостаточно.
Прогресс в агентских и поисковых задачах
В рейтинге APEX-Agents, который измеряет производительность при выполнении долгосрочных профессиональных задач, Gemini 3.1 Pro набрал 33,5%. Этот индекс указывает на улучшение способности поддерживать цели на более длительных этапах.
Модель получила 85,9% баллов в BrowseComp — оценке агентного поиска в Интернете в сочетании с использованием таких инструментов, как Python. Этот результат подчеркивает эффективность автономного поиска и извлечения соответствующей информации.
Эти достижения способствуют созданию более надежных автономных агентов. Google подчеркивает, что в модели приоритет отдается рабочим процессам, включающим несколько шагов и интеграцию инструментов.
Возможности системного синтеза и визуального создания
Gemini 3.1 Pro демонстрирует возможность упростить сложные системы с помощью текстовых подсказок. В демонстрациях он создавал масштабируемую анимацию SVG непосредственно из описаний, создавая более легкие визуальные эффекты по сравнению с традиционными видео.
Другое приложение включало настройку общедоступного потока телеметрии для создания функциональной информационной панели, которая визуализирует орбиту Международной космической станции в режиме реального времени. Модель обрабатывала API и данные для предоставления рабочего интерфейса.
Модель также закодировала интерактивные 3D-эффекты. В одном примере моделировался полет стаи птиц, которые реагируют на отслеживание рук пользователя, с использованием компьютерного зрения и анимации.
Примеры творческого кодирования
В ходе теста литературной интерпретации Gemini 3.1 Pro преобразовал описания из книги «Грозовой перевал» в современный интерфейс портфолио. ИИ уловил атмосферный тон работы и создал современный и функциональный веб-сайт.
Эти демонстрации иллюстрируют способность рассуждения переводить абстрактные концепции в исполняемый код. Модель генерирует визуальные и интерактивные структуры на основе повествовательных подсказок.
Акцент на мультимодальном синтезе расширяет возможности использования в дизайне, образовании и быстром прототипировании.
Планы доступа и подписки
Gemini 3.1 Pro находится в предварительной версии и интегрирован в приложение Gemini с расширенными ограничениями для подписчиков планов Google AI Pro и Ultra. Эти планы предлагают приоритетный доступ к самой умной модели в линейке.
В NotebookLM версия также доступна только платным пользователям. Инструмент обладает расширенными возможностями синтеза документов и получения аналитической информации.
Разработчики получают доступ к предварительной версии через API на таких платформах, как AI Studio и Vertex AI. Компании используют эту модель в корпоративной среде с Gemini Enterprise.
Доступность для разработчиков и компаний
Интеграция с Vertex AI позволяет экспериментировать в масштабе предприятия. Google подчеркивает, что предварительная версия служит для уточнения потоков с автономными агентами перед широким выпуском.
Модель поддерживает контекстное окно из 1 миллиона токенов, поддерживая анализ больших объемов данных. Эта функция остается той же, что и в предыдущих поколениях серии Gemini 3.
Обновление усиливает экосистему инструментов Google для искусственного интеллекта, применяемых в профессиональных сценариях.
Veja Tambem em News (RU)
Платформа Epic Games выпускает двенадцать высокобюджетных игр бесплатно для пользователей ПК
Падение цен на PlayStation 5 Pro ускоряет цифровые розничные продажи и устраняет глобальные запасы
Новое обновление системы Apple оптимизирует управление срочными задачами для пользователей iPhone
Утечка подробностей об оборудовании новой портативной PlayStation с графикой, превосходящей Xbox Series S
Oppo официально представляет Find X9 Ultra по всему миру с линзами Hasselblad и надежным аккумулятором
Новая версия складного смартфона принесет золото участникам Зимних игр
Тим Кук представляет новые прототипы iPhone и iPod на праздновании пятидесятилетия Apple
Samsung обновляет модуль QuickStar и расширяет визуальное управление панелью в интерфейсе One UI 8.5
Система Android получает встроенную интеграцию Gemini Nano 4 для автономной обработки на смартфонах.
Утечка раскрывает Lords of the Fallen и Sword Art Online в апрельском каталоге PS Plus Essential.
Новый смартфон Xiaomi 18 Pro Max объединяет две камеры по 200 Мп и процессор последнего поколения.