News (MR)

Nvidia च्या मोफत अपडेटमुळे नवीन तंत्रज्ञानासह RTX कार्डांवर LLM चा वेग ४०% पर्यंत वाढतो

Nvidia
Nvidia - Foto: Hepha1st0s / Shutterstock.com

Nvidia ने एक विनामूल्य सॉफ्टवेअर अपडेट जाहीर केले आहे जे त्याच्या RTX ग्राफिक्स कार्डसह सुसज्ज असलेल्या संगणकांवर कृत्रिम बुद्धिमत्ता कार्यप्रदर्शन लक्षणीयरीत्या वाढवण्याचे वचन देते. ऑप्टिमायझेशनचा संच स्थानिक पातळीवर मोठ्या लँग्वेज मॉडेल्स (LLMs) चालवणाऱ्या वापरकर्त्यांना थेट फायदा देतो, तसेच जनरेटिव्ह कंटेंट निर्मिती कार्यांना गती देतो. सुधारणा, ज्यामध्ये VRAM मेमरी वापर कमी करण्यासाठी नवीन सुस्पष्ट स्वरूपासाठी समर्थन समाविष्ट आहे, ग्राहक वातावरणात AI वर्कलोडसाठी अग्रगण्य व्यासपीठ म्हणून RTX GPU ची स्थिती मजबूत करते, अधिक वेग आणि कार्यक्षमता प्रदान करते.

नवीन पॅकेज प्रक्रियेची गती आणि ग्राफिक संसाधन व्यवस्थापनातील प्रगती एकत्र करते, 2023 पासून कंपनी राबवत असलेल्या सुधारणांची मालिका सुरू ठेवते. अपडेटसह, RTX कार्ड असलेल्या PC वापरकर्त्यांना या साधनांमध्ये कोणत्याही अतिरिक्त खर्चाशिवाय त्वरित प्रवेश मिळतो, ज्यांना पूर्वी विशेष हार्डवेअर किंवा क्लाउड सेवांमध्ये प्रवेश आवश्यक होता अशा प्रगत AI मॉडेल्सचा वापर लोकशाहीकरण करते. हा उपक्रम Nvidia च्या GPU ला एकात्मिक NPUs (न्यूरल प्रोसेसिंग युनिट्स) पासून वेगळे करण्याच्या धोरणाला बळकटी देतो, जे सामान्यतः अधिक मूलभूत कार्यांपुरते मर्यादित असतात.

चॅटबॉट्स चालवण्यापासून ते उच्च-रिझोल्यूशन व्हिडिओ तयार करण्यापर्यंत जनरेटिव्ह आर्टिफिशियल इंटेलिजेंसच्या विविध पैलूंवर प्रभाव पाडणारे हे अपडेट अनेक प्रमुख घटकांमध्ये मोडते. विंडोज ऑपरेटिंग सिस्टीम आणि एआय इकोसिस्टममधील लोकप्रिय साधनांसह अखंडपणे कार्य करण्यासाठी ऑप्टिमायझेशन डिझाइन केले आहे, जे विकासक आणि सामग्री निर्माते जे त्यांच्या वर्कफ्लोसाठी स्थानिक प्रक्रिया शक्तीवर अवलंबून असतात त्यांच्यासाठी द्रव अंमलबजावणी सुनिश्चित करतात.

Nvidia
Nvidia – जॅक हाँग/shutterstock.com

भाषेच्या मॉडेल्समध्ये अभिव्यक्त वेग

या अद्यतनाचा एक स्तंभ म्हणजे मोठ्या भाषेच्या मॉडेल्सच्या अंमलबजावणीसाठी गती वाढवणे. Nvidia द्वारे केले जाणारे अंतर्गत चाचणी निमोट्रॉन नॅनो V2 आणि GPT कुटुंबातील अनेक ओपन सोर्स प्रकारांसारख्या लोकप्रिय LLM वर 40% पर्यंत कामगिरी वाढ दर्शवते. ही कामगिरी उडी TensorRT-LLM लायब्ररीमध्ये लागू केलेल्या ऑप्टिमायझेशनचा थेट परिणाम आहे, जे आता जलद आणि अधिक कार्यक्षम अनुमानांना अनुमती देते.

व्यवहारात, वापरकर्त्यांना मजकूर सहाय्यक आणि स्थानिक पातळीवर चालणाऱ्या चॅटबॉट्समध्ये कमी प्रतिसाद वेळ लक्षात येईल. या सुधारणेचा विशेषत: विकासक आणि निर्मात्यांना फायदा होतो जे त्यांच्या दैनंदिन दिनचर्यामध्ये LLM समाकलित करतात, ज्यामुळे अधिक चपळ पुनरावृत्ती आणि अधिक प्रवाही वापरकर्ता अनुभव मिळतो. प्रवेग RTX 40 मालिका कार्ड्स आणि RTX 30 मालिका मॉडेल्सना लागू होतो, फायद्याची व्याप्ती व्यापक वापरकर्ता आधारापर्यंत विस्तारित करते.

[[MVG_PROTECTED_BLOCK_0]

ही प्रगती 2023 मध्ये Nvidia द्वारे सुरू केलेल्या प्रयत्नांची सातत्य दर्शवते, जेव्हा TensorRT-LLM द्वारे प्रथम प्रवेग सादर केला गेला. कंझ्युमर हार्डवेअरवर क्लिष्ट AI कार्ये देखील कार्यक्षमतेने कार्यान्वित करता येतील याची खात्री करून, कंपनी तिच्या GPUs मध्ये उपस्थित असलेल्या Tensor Cores मधून जास्तीत जास्त क्षमता मिळविण्यासाठी आपले सॉफ्टवेअर सुधारत आहे.

नवीन NVFP4 तंत्रज्ञान VRAM वापर अनुकूल करते

आणखी एक अत्यंत संबंधित तांत्रिक नवीनता म्हणजे NVFP4 अचूक स्वरूपासाठी नेटिव्ह सपोर्टचा परिचय. हे क्वांटायझेशन तंत्रज्ञान AI मॉडेल्सना BF16 फॉरमॅट वापरून पारंपारिक आवृत्तीच्या तुलनेत 60% पर्यंत संकुचित करण्याची परवानगी देते. कॉम्प्रेशनमुळे मॉडेलने व्हिडिओ मेमरी (VRAM) मध्ये व्यापलेली जागा कमालीची कमी होते, हे मोठे LLM चालवण्यासाठी सर्वात महत्त्वाचे संसाधनांपैकी एक आहे.

हे कॉम्प्रेशन प्रोसेसिंग लोडचा काही भाग सिस्टमच्या RAM मेमरीमध्ये हस्तांतरित करून कार्य करते, VRAM ला इतर एकाचवेळी क्रियाकलापांसाठी मुक्त करते. ComfyUI सारख्या प्रतिमा निर्मिती साधनांमध्ये, उदाहरणार्थ, NVFP4 वापरल्याने Flux.1 आणि Flux.2 सारख्या मॉडेल्सचा वापर करणाऱ्या पाइपलाइनच्या कामगिरीमध्ये 4.6 पट वाढ होऊ शकते. याचा अर्थ वापरकर्ते उच्च-गुणवत्तेच्या प्रतिमा जलद आणि अधिक कार्यक्षमतेने व्युत्पन्न करू शकतात.

VRAM वापरातील कपात मोठ्या आणि अधिक जटिल मॉडेल्सच्या प्रवेशाचे लोकशाहीकरण करते. मागील पिढ्यांमधील मॉडेल्ससह लहान मेमरी क्षमता असलेले व्हिडिओ कार्ड असलेले वापरकर्ते, पूर्वी अव्यवहार्य असलेले मॉडेल चालवण्याची शक्यता प्राप्त करतात. हे ऑप्टिमायझेशन विद्यमान हार्डवेअरचे आयुष्य वाढवते आणि मुख्य प्रवाहातील डेस्कटॉपवरील AI प्रयोगाच्या सीमांना धक्का देते.

समर्थन NVFP8 फॉरमॅटपर्यंत देखील विस्तारित आहे, जे कॉम्प्रेशन आणि अचूकता यांच्यात भिन्न संतुलन प्रदान करते, जे व्हिडिओ निर्मितीसारख्या इतर अनुप्रयोगांमध्ये विशेषतः उपयुक्त बनवते. या नवीन स्वरूपांद्वारे ऑफर केलेली लवचिकता विकासक आणि वापरकर्त्यांना प्रत्येक प्रकारच्या कार्यासाठी सर्वोत्कृष्ट कॉन्फिगरेशन निवडण्याची परवानगी देते, गरजेनुसार सिस्टम संसाधनांचा वापर अनुकूल करते.

LTX-2 मॉडेलसह व्हिडिओ निर्मितीमध्ये प्रगती

दृकश्राव्य सामग्री निर्मितीच्या क्षेत्रात, व्हिडिओ आणि ऑडिओ निर्मितीसाठी आघाडीच्या मुक्त स्रोत मॉडेलपैकी एक, LTX-2 ऑप्टिमाइझ करण्यासाठी Nvidia ने Lightricks सोबतचे सहकार्य वाढवले ​​आहे. हे मॉडेल संपूर्णपणे सिंक्रोनाइझ केलेल्या ऑडिओसह 4K पर्यंत नेटिव्ह रिझोल्यूशनवर 50 फ्रेम्स प्रति सेकंदात क्लिप तयार करण्यास सक्षम आहे, एक संगणकीयदृष्ट्या गहन कार्य जे आता अधिक प्रवेशयोग्य बनले आहे.

NVFP8 अचूक स्वरूपासाठी समर्थन दिल्याबद्दल धन्यवाद, LTX-2 मॉडेल नवीनतम RTX कार्डांवर दुप्पट जनरेशन गती प्राप्त करू शकते. सुसंगत हार्डवेअरवर, एक उच्च-गुणवत्तेचा व्हिडिओ अंदाजे 20 सेकंदात तयार केला जाऊ शकतो, या कार्यासाठी कमी कालावधी. हे तंत्रज्ञान एकात्मिक ऑडिओसह दीर्घ स्वरूपाची सामग्री तयार करण्याच्या क्षमतेसाठी वेगळे आहे, निर्मात्यांना डेटावर संपूर्ण सर्जनशील नियंत्रण आणि गोपनीयता राखून जलद, स्थानिक उत्पादनासाठी एक शक्तिशाली साधन ऑफर करते.

जनरेटिव्ह सामग्रीसाठी RTX व्हिडिओ सुपर रिझोल्यूशन

लोकप्रिय RTX व्हिडिओ सुपर रिझोल्यूशन (VSR) वैशिष्ट्य, जे AI चा वापर रिअल टाइममध्ये व्हिडिओंची गुणवत्ता सुधारण्यासाठी करते, जनरेटिव्ह आर्टिफिशियल इंटेलिजन्सद्वारे तयार केलेले व्हिडिओ देखील कव्हर करण्यासाठी विस्तारित केले गेले आहे. टूल कमी रिझोल्यूशन, जसे की 720p, पासून 4K पर्यंत सामग्री वाढवते, प्रतिमेच्या तपशील आणि तीक्ष्णतेच्या पातळीवर लक्षणीय सुधारणा लागू करते.

एकीकरण फेब्रुवारी 2026 मध्ये ComfyUI प्लॅटफॉर्मवर येणे अपेक्षित आहे. या ऑप्टिमायझेशनसह, 10-सेकंद 4K क्लिप तयार करण्याची आणि वाढवण्याची संपूर्ण प्रक्रिया, ज्याला 15 मिनिटे लागू शकतात, ती फक्त 3 मिनिटांपर्यंत कमी केली जाईल. हे प्रवेग थेट सामग्री उत्पादकांना लाभ देते ज्यांना उच्च-रिझोल्यूशन परिणामांची आवश्यकता असते, RTX GPUs च्या विशिष्ट हार्डवेअर क्षमतांचा फायदा घेऊन उत्कृष्ट व्हिज्युअल गुणवत्ता राखण्यासाठी.

RTX इकोसिस्टम आणि स्थानिक AI चे लोकशाहीकरण

हे अद्यतन RTX प्लॅटफॉर्मला कृत्रिम बुद्धिमत्ता विकसित करण्यासाठी आणि जागेवर चालवण्यासाठी निश्चित आणि सर्वात परिपूर्ण उपाय म्हणून स्थान देण्याच्या Nvidia च्या दृष्टीला एकत्रित करते. LLM मध्ये 40% पर्यंत परफॉर्मन्स नफा मिळवून, NVFP4 सारख्या नवीन अचूक फॉरमॅटसह VRAM चा वापर 60% पर्यंत कमी करून आणि 4K व्हिडिओ निर्मितीला नाटकीयपणे गती देऊन, कंपनी केवळ वापरकर्त्याचा अनुभव सुधारत नाही, तर प्रतिस्पर्धी हार्डवेअर सोल्यूशन्सपासून स्पष्ट फरक देखील प्रस्थापित करते, ज्यामध्ये एकात्मिक NPU ला कमी मर्यादा असते. AI कार्यांची मागणी करत आहे. Nvidia ची रणनीती एका मजबूत इकोसिस्टमवर आधारित आहे जी शक्तिशाली हार्डवेअर, जसे की Tensor Cores आणि सतत विकसित होणारे सॉफ्टवेअर, जसे की TensorRT-LLM लायब्ररी एकत्र करते. हे विकसक आणि संशोधकांपासून ते सामग्री निर्माते आणि उत्साही अशा अनेक वापरकर्त्यांना त्यांच्या डेस्कटॉपवर जनरेटिव्ह AI च्या सीमा एक्सप्लोर करण्यासाठी सक्षम करते. ऑन-प्रिमाइसेस चालवण्यामुळे कमी विलंबता, डेटा आणि गोपनीयतेवर पूर्ण नियंत्रण आणि क्लाउड सेवा आणि त्यांच्याशी संबंधित खर्चावरील अवलंबित्व दूर करणे यासारखे महत्त्वपूर्ण फायदे मिळतात. या साधनांसह, Nvidia अत्याधुनिक AI तंत्रज्ञानाचा प्रवेश प्रभावीपणे लोकशाहीकरण करत आहे, कुठूनही नवकल्पनांना सक्षम बनवत आहे.

ComfyUI प्लॅटफॉर्मसह सुधारित एकीकरण

ComfyUI प्लॅटफॉर्म, जनरेटिव्ह AI वर्कफ्लो तयार करण्यासाठी सर्वात लोकप्रिय नोड-आधारित वातावरणांपैकी एक, या अपडेटमध्ये Nvidia-विशिष्ट ऑप्टिमायझेशन प्राप्त करते. Flux सारख्या इमेज मॉडेल्समध्ये NVFP4 फॉरमॅट सपोर्टचा थेट फायदा या टूलला होतो, ज्यामुळे वापरकर्त्यांना ग्राफिक्स संसाधनांवर कमी मागणी असलेल्या जटिल पाइपलाइन कॉन्फिगर करता येतात.

ओपन सोर्स इकोसिस्टममधील Nvidia आणि डेव्हलपर्स यांच्यात सुरू असलेले सहकार्य हे सुनिश्चित करते की सॉफ्टवेअर सुधारणा त्वरीत एकत्रित केल्या जातात आणि समुदायासाठी उपलब्ध केल्या जातात. हे बदल मोठ्या मॉडेल्स आणि प्रगत वर्कफ्लोसह प्रयोग सुलभ करतात, ज्यामुळे तंत्रज्ञान व्यापक प्रेक्षकांसाठी अधिक प्रवेशयोग्य बनते.

सामग्री निर्मात्यांसाठी व्यावहारिक फायदे

प्रतिमा आणि व्हिडिओ निर्मितीसह काम करणाऱ्या व्यावसायिकांसाठी, वेगवान वाढ जलद पुनरावृत्ती आणि अधिक गतिमान वर्कफ्लोमध्ये अनुवादित होते. क्लाउड सेवांवर अवलंबून न राहता LTX-2 मॉडेलसह व्यावसायिक क्लिप व्युत्पन्न करण्याची क्षमता आणि VRAM वापर कमी केल्यामुळे एकाच वेळी सक्रिय अनेक मॉडेल्ससह मल्टीटास्किंग करता येते, उत्पादकता आणि सर्जनशील लवचिकता वाढते.

To Top