Kimi K2.6 от китайского стартапа Moonshot AI превосходит конкурентов в тестах кода и агентов

Kimi

Kimi - site www.kimi.com

Модель Kimi K2.6 от Moonshot AI была запущена 21 апреля 2026 года. Система имеет экспертную архитектуру микширования с общим числом 1 триллион параметров и активирует около 32 миллиардов за один запрос. Он обрабатывает контекст примерно из 260 000 токенов и включает в себя мультимодальные возможности для изображений и видео.

Запуск продемонстрировал производительность в практических испытаниях. Компания сообщила о 58,6% в SWE-Bench Pro, показателе, который оценивает реальную модификацию кода. Другие результаты включают 83,2% в BrowseComp, задаче, связанной с просмотром веб-страниц. Moonshot AI сравнил эти цифры с такими моделями, как GPT-5.4 от OpenAI и Claude Opus 4.6 от Anthropic.

Kimi K2.6 выпущен с открытым исходным кодом. Веса доступны на таких платформах, как Hugging Face. Готовая поддержка существует в таких механизмах вывода, как vLLM и OpenRouter.

Модель ориентирована на автономное выполнение задач.

Самая большая изюминка выходит за рамки тестов. Модель выполняет длинные последовательности действий без постоянного вмешательства. В отчетах компании упоминается более 4000 вызовов инструментов и непрерывная работа в течение более 12 часов. Один упомянутый случай касался автономного управления инфраструктурой в течение пяти дней.

OpenAI ChatGPT – Фото: Один художник / Shutterstock.com

В ходе этой операции система обнаруживала, идентифицировала, исправляла и проверяла сбои сервера и облака. Обычно для этого процесса требуется команда людей, работающая 24 часа в сутки в течение семи дней. Здесь Кими К2.6 действовал в одиночку.

Конструкция позволяет параллельно работать до 300 субагентов. Эта структура помогает разложить сложные задачи на более мелкие части, которые выполняются одновременно. Moonshot AI называет это интеграционной инженерией, при которой фокус перемещается с изолированной модели на системы, объединяющие несколько агентов.

Пекинский стартап имеет технический опыт

Moonshot AI была основана в марте 2023 года в Пекине. Название на китайском языке происходит от альбома The Dark Side of the Moon группы Pink Floyd. Основатель и генеральный директор Ян Жилин выбрал дату основания, приуроченную к 50-летию пластинки.

Ян Жилин окончил Университет Цинхуа по специальности компьютерные науки. Он получил докторскую степень в Университете Карнеги-Меллона менее чем за четыре года. Во время учебы он проходил стажировку в Google Brain и был соавтором таких работ, как Transformer-XL и XLNet, которые повлияли на современные языковые модели.

В состав соучредителей входят бывшие участники рок-группы, в которой Ян был барабанщиком. Компания поддерживает конференц-залы, названные в честь западных групп.

До Kimi K2.6 компания Moonshot выпускала более ранние версии семейства Kimi. К ним относятся акцент на длинном контексте и функциях автономных агентов. В марте 2026 года разработчики заметили, что американский инструмент программирования Cursor использовал более раннюю версию Kimi в качестве основы для основных функций. У Cursor более 1 миллиона активных пользователей в день, а годовой доход исчисляется миллиардами долларов.

Смотрите Также

Запуск усиливает дебаты об экосистемах ИИ

Случай с Cursor привлек внимание, поскольку продемонстрировал практическое применение китайской модели в инструменте, разработанном в США. Открытие произошло без первоначального раскрытия со стороны Cursor. После этого руководители подтвердили использование открытой базы с дополнительными корректировками.

Это произошло на фоне дискуссий о возможном разделении американской и китайской экосистем искусственного интеллекта. Аргументы ссылаются на различия в нормативных требованиях, безопасности и ценности. На практике, когда появились открытые и конкурентоспособные модели, инженеры отдавали приоритет производительности и стоимости.

Kimi K2.6 имеет встроенную поддержку нескольких языков программирования, таких как Python, Rust и Go. Он генерирует пользовательские интерфейсы на основе описаний на естественном языке, включая анимацию и визуальные эффекты. Мультимодальность позволяет обрабатывать изображения и видео прямо в основной модели.

Технические подробности Кими K2.6

  • Архитектура: смесь экспертов (MoE) с 1 триллионом общих параметров.
  • Активные параметры на запрос: около 32 миллиардов
  • Контекстное окно: около 260 тысяч токенов
  • Возможности: мультимодальность (текст, изображение, видео), генерация кода, работа агента.
  • Доступность: открытые веса в Hugging Face, интеграция с vLLM и OpenRouter.
  • Выделенные тесты: 58,6% на SWE-Bench Pro, 83,2% на BrowseComp.

Moonshot AI позиционирует модель для долгосрочных сценариев. Примеры включают оптимизацию кода в больших репозиториях, создание полноценных веб-сайтов и автоматизацию рабочих процессов, требующих десятков или сотен шагов.

Запуск состоялся 21 апреля 2026 года. Модель теперь доступна на сайте Кими, в приложении и через API. Варианты включают режимы чата, рассуждений и работы в качестве агента.

Сообщество тестирует реальные варианты использования

Разработчики сообщили о первоначальном тестировании вскоре после запуска. Некоторые упомянули выполнение инфраструктурных задач без вмешательства в течение длительных периодов времени. Другие подчеркнули возможность создания сложных интерфейсов с визуальными элементами из простых подсказок.

Выпуск с открытым исходным кодом облегчает экспериментирование в различных средах. Компании и исследователи могут корректировать модель или интегрировать ее в свои собственные разработки. Это контрастирует с закрытым подходом некоторых американских лабораторий.

Акцент на автономных агентах отражает более широкую тенденцию в этой области. Вместо отдельных ответов на вопросы системы теперь стремятся выполнить комплексные задачи с помощью планирования, выполнения и исправления ошибок с течением времени.

Moonshot AI указывает на то, что Kimi K2.6 представляет собой прогресс в способности поддерживать полезную работу в течение часов или дней. Эта функция может снизить потребность в человеческом контроле при выполнении повторяющихся или сложных задач разработки программного обеспечения.

Смотрите Также