Nvidia выпускает бесплатное обновление для RTX AI с ускорением LLM до 40% и оптимизированным NVFP4

    Categories: News (RU)
Nvidia

Nvidia - Foto: Hepha1st0s / Shutterstock.com

Nvidia анонсировала бесплатное обновление, которое повышает производительность искусственного интеллекта на компьютерах, оснащенных картами RTX. Это улучшение напрямую принесет пользу пользователям, работающим с большими языковыми моделями (LLM) и задачами по созданию генеративного контента. Оптимизации появятся в январе 2026 года и включают встроенную поддержку новых точных форматов, которые сокращают потребление памяти VRAM. Компания по-прежнему сосредоточена на том, чтобы сделать графические процессоры RTX ведущей платформой для локальных рабочих нагрузок искусственного интеллекта. Эти изменения закрепляют накопленные за годы достижения в области ускорения ИИ для потребителей. Пакет сочетает в себе улучшения скорости обработки и эффективности графических ресурсов.

Обновление разбито на основные компоненты, которые влияют на различные аспекты генеративного ИИ. Пользователи ПК с RTX получают немедленный доступ к этим инструментам без дополнительных затрат.

Nvidia – Джек Хонг/shutterstock.com

Эта инициатива укрепляет позиции карт RTX как премиального варианта для локального исполнения передовых моделей.

Улучшения в работе LLM

Первая часть обновления направлена ​​на увеличение скорости работы с большими языковыми моделями. Внутреннее тестирование Nvidia показывает выигрыш до 40% на популярных LLM, таких как Nemotron Nano V2 и вариантах GPT с открытым исходным кодом.

Эти оптимизации применимы непосредственно к средам Windows с TensorRT-LLM. Пользователи сообщают о более коротком времени отклика местных чат-ботов и текстовых помощников.

Это улучшение особенно выгодно авторам, которые интегрируют LLM в повседневные рабочие процессы. Nvidia добилась аналогичных успехов с 2023 года, когда представила начальные ускорения для серий RTX 30 и 40.

Встроенная поддержка NVFP4 и сокращение объёма видеопамяти.

Встроенная поддержка NVFP4 представляет собой одну из наиболее технических новых функций обновления. Этот точный формат позволяет сжимать модели до 60% по сравнению с традиционными версиями BF16.

Сжатие переносит часть обработки в системную память, освобождая VRAM для других задач. В таких инструментах, как ComfyUI, NVFP4 обеспечивает увеличение обработки изображений до 4,6 раз с помощью Flux.1 и Flux.2.

Пользователи карт предыдущего поколения сохраняют широкую совместимость. Сокращение использования графической памяти позволяет запускать более крупные модели при скромных настройках.

Генерация видео с помощью модели LTX-2

Nvidia сотрудничает с Lightricks для оптимизации модели LTX-2, лидера в области создания аудио-видео с открытым исходным кодом. Эта модель создает синхронизированные клипы в собственном разрешении 4K со скоростью 50 кадров в секунду.

Благодаря поддержке NVFP8 LTX-2 обеспечивает вдвое большую скорость, чем современные карты RTX. Высококачественное видео создается примерно за 20 секунд на совместимом оборудовании.

Модель выделяется своей способностью создавать длинный контент со встроенным звуком. Создатели коротких видеороликов получают мощный инструмент для быстрого локального производства.

Супер разрешение для генеративных видео

Функция суперразрешения видео RTX теперь распространяется и на видео, созданное искусственным интеллектом. Этот инструмент масштабирует контент с 720p до 4K, обеспечивая значительный прирост детализации и резкости.

Интеграция появится в ComfyUI в феврале 2026 года. Весь процесс создания и масштабирования 10-секундного клипа 4K сокращает его с 15 минут до всего 3 минут.

Эта оптимизация выгодна производителям, которым быстро требуется продукция с высоким разрешением. Технология использует преимущества специального ускорения графических процессоров RTX для поддержания высокого качества.

Общие преимущества для пользователей RTX

  • Выполнение LLM с ускорением до 40 % при выполнении локальных задач.
  • Генеративные модели на 60 % меньше с NVFP4 и NVFP8.
  • Прирост до 4,6 раз на конвейерах изображений в ComfyUI.
  • Генерация видео 4K с синхронизированным звуком за меньшее время.
  • Автоматически повышайте качество видео GenAI до более высокого разрешения.

Интеграция с экосистемой ComfyUI

ComfyUI получает оптимизацию, специфичную для Nvidia, для генеративных рабочих процессов. Платформа напрямую выигрывает от поддержки NVFP4 в Flux и аналогичных моделях.

Пользователи настраивают сложные конвейеры с меньшими требованиями к графическим ресурсам. Постоянное сотрудничество между разработчиками обеспечивает регулярные обновления.

Эти изменения упрощают эксперименты с большими моделями на обычных настольных компьютерах.

Накопленные достижения на платформах RTX

Nvidia опирается на фундамент, заложенный с момента выпуска ускорений TensorRT-LLM. Предыдущие обновления добавили множители производительности в серии RTX 30 и 40.

Компания позиционирует графические процессоры RTX как комплексное решение для локального искусственного интеллекта. Дифференциация происходит в отношении интегрированных НПУ, которые ограничиваются базовыми задачами.

Новым владельцам карт доступен широчайший набор инструментов.

Практическое применение в создании контента

Создатели изображений и видео набирают скорость в ежедневных итерациях. LTX-2 позволяет создавать профессиональные клипы, не полагаясь на облачные сервисы.

Уменьшение объема видеопамяти делает возможной многозадачность при одновременной работе моделей. Профессионалы в области дизайна и редактирования используют генеративный искусственный интеллект с большей гибкостью.

Эти инструменты сохраняют полную конфиденциальность при локальном запуске.

Техническая перспектива форматов NVFP

Форматы NVFP4 и NVFP8 обеспечивают баланс точности и эффективности на Blackwell и более ранних архитектурах. Квантование поддерживает качество, близкое к версиям с более высокой точностью.

Разработчики быстро адаптируют под эти форматы существующие модели. Передача нагрузки в ОЗУ расширяет возможности графических процессоров с ограниченной видеопамятью.

Такой подход продлевает срок службы оборудования прошлого поколения.

Обновление усиливает приверженность Nvidia повышению производительности локального искусственного интеллекта. Пользователи RTX получают передовые инструменты без дополнительной оплаты. Улучшения варьируются от текста до видео высокого разрешения. Платформа продолжает развиваться, уделяя особое внимание эффективности и скорости.