Гігант апаратних технологій Nvidia оголосив про оновлення програмного забезпечення, яке принесе безпосередню користь власникам його відеокарт серії RTX. Новинка фокусується на оптимізації виконання завдань генеративного штучного інтелекту, роблячи використання складних мовних моделей швидшим і доступнішим на персональних комп’ютерах. Оновлення, яке є безкоштовним, обіцяє значний стрибок у продуктивності для користувачів і розробників.
Основною особливістю оновлення є прискорення до 40% у виконанні великих мовних моделей (LLM), таких як сімейство GPT і Nemotron. Покращення Essa є результатом оптимізації бібліотеки компанії TensorRT-LLM, яка тепер дозволяє ефективніше обробляти завдання AI безпосередньо на апаратному забезпеченні користувача, не покладаючись виключно на хмарні служби чи спеціалізоване серверне обладнання.
Завдяки новому оновленню користувачі та розробники, які використовують свої графічні процесори RTX для локального виконання завдань штучного інтелекту, помітять значне скорочення часу відгуку та збільшення обчислювальної потужності. Isso відкриває двері для створення контенту та експериментів із більш просунутими моделями штучного інтелекту, навіть на споживчих конфігураціях апаратного забезпечення, цементуючи ПК як все більш надійну платформу для епохи ШІ.

Оптимізація підвищує продуктивність LLM
Основою цього підвищення продуктивності є остання версія бібліотеки TensorRT-LLM. Nvidia продемонстрував у внутрішньому тестуванні, що популярні моделі з відкритим кодом, такі як Nemotron Nano V2, продемонстрували приріст швидкості до 40% порівняно з попередніми версіями програмного забезпечення. Удосконалення Esse робить взаємодію з чат-ботами та іншими інструментами ШІ більш плавною та ефективною.
Це прискорення має вирішальне значення для професіоналів, які покладаються на LLM для щоденних завдань, таких як програмісти, дослідники та творці контенту. Можливість швидше запускати ці моделі на локальній машині не тільки підвищує продуктивність, але й забезпечує більшу конфіденційність і контроль над обробленими даними, що є важливою відмінністю від хмарних рішень.
Нова технологія для зменшення використання VRAM
Ще одним ключовим нововведенням Nvidia є підтримка високоточного формату NVFP4. Технологія Essa забезпечує інтелектуальне стиснення моделей штучного інтелекту, що призводить до зменшення споживання відеопам’яті (VRAM) до 60%. На практиці це означає, що більші та складніші моделі можуть працювати на відеокартах із меншою ємністю VRAM.
Оптимізація використання пам’яті є однією з найбільших проблем для локального запуску ШІ. Завдяки формату NVFP4 бар’єр входу для користувачів із апаратним забезпеченням середнього класу значно зменшується, демократизуючи доступ до найсучасніших інструментів штучного інтелекту, які раніше були обмежені системами з великим обсягом виділеної пам’яті.
Це покращення реалізовано за допомогою техніки, яка за потреби вивантажує частину даних у оперативну пам’ять системи, звільняючи VRAM для більш важливих операцій. Testes з інструментом ComfyUI показали, що продуктивність конвеєрів, які використовують такі моделі, як Flux.1 і Flux.2, може зрости до 4,6 разів, дозволяючи набагато швидше генерувати високоякісні зображення.
Прогрес у створенні відео ШІ
Оновлення Nvidia не обмежується мовними моделями. Компанія також покращила генерацію відео, оптимізувавши модель LTX-2, розроблену у співпраці з Lightricks. Інструмент, який перетворює текст на відео, тепер здатний генерувати кліпи з роздільністю до 4K зі швидкістю 50 кадрів на секунду.
Завдяки підтримці формату NVFP8 модель LTX-2 досягає вдвічі більшої швидкості генерації, ніж новітні карти RTX. Isso означає, що високоякісне відео, яке раніше створювалося приблизно за 20 секунд, тепер можна створити менш ніж вдвічі швидше, що є значним прогресом для творців візуального контенту.
Ця технологія полегшує створення творчого та динамічного контенту, дозволяючи користувачам швидше перетворювати текстові ідеї в детальні відео. Інструмент пропонує точний контроль над кінцевим результатом, включаючи визначення символів, стилів і рухів камери за допомогою простих текстових команд.
Збільшена швидкість і можливість генерувати вміст 4K позиціонують карти RTX як потужне та доступне рішення для створення відео за допомогою ШІ, відкриваючи нові можливості для цифрового маркетингу, освіти та розваг.
Покращена якість зображення завдяки RTX VSR
Nvidia розширив функціональність своєї технології RTX Video Super Resolution (VSR), яка використовує ШІ для покращення якості відео в реальному часі. Agora, інструмент також можна застосовувати до контенту, створеного штучним інтелектом, наприклад, створеного моделлю LTX-2. Isso дозволяє користувачам виводити відео з нижчою роздільною здатністю, наприклад 720p, і перетворювати його на 4K зі значно вищою якістю зображення, з більшою різкістю та покращеними деталями.
Ця функція особливо корисна для прискорення робочого процесу творців вмісту. Завдяки створенню кліпів із нижчою роздільною здатністю час виробництва значно скорочується. Posteriormente, VSR піклується про підвищення якості до професійних стандартів без необхідності тривалих процесів візуалізації. Інтеграція з плагіном ComfyUI, наприклад, скоротила час для створення та покращення кліпу 4K з 15 хвилин до лише 3 хвилин, демонструючи ефективність комбінованого рішення.
Інтеграція з екосистемою розробника
Одним із найважливіших аспектів цього оновлення є його глибока інтеграція з популярними інструментами у сценарії генеративного штучного інтелекту, з акцентом на ComfyUI. Робочий простір Este, заснований на вузлах, є одним із улюблених серед ентузіастів і професіоналів для створення складних робочих процесів ШІ. Надаючи пряму підтримку та оптимізацію для цих платформ, Nvidia гарантує, що його інновації швидко потраплять до рук спільноти, яка потім може досліджувати та розширювати можливості апаратного забезпечення. Компанія активно співпрацює з розробниками цих інструментів, щоб забезпечити постійне та ефективне впровадження нових технологій, таких як підтримка формату NVFP4 у таких моделях, як Flux. Співпраця Essa зміцнює екосистему навколо графічних процесорів RTX, цементуючи їх не лише як компоненти для ігор, але як основну платформу для розробки та запуску ШІ споживчого рівня. Стратегія Nvidia зрозуміла: використовуйте потужність свого Tensor Cores і зрілість стека програмного забезпечення, щоб запропонувати більш універсальне та потужне рішення, ніж виділені Unidades і Processamento Neural (NPU), які починають з’являтися в конкуруючих процесорах. Isso гарантує, що широка аудиторія, від любителів до професіоналів, зможе негайно скористатися останніми досягненнями в продуктивності ШІ.
Майбутнє локального ШІ на картах RTX
Цією серією оновлень Nvidia посилює свою стратегію позиціонування відеокарт RTX у центрі місцевої революції штучного інтелекту. Забезпечуючи приріст продуктивності, зменшуючи вимоги до пам’яті та прискорюючи створення вмісту, компанія дає змогу зростаючій базі користувачів досліджувати, створювати та впроваджувати інновації за допомогою найпередовіших технологій штучного інтелекту безпосередньо на власних комп’ютерах.