Google ने इस गुरुवार को Gemma 4 परिवार की घोषणा की, जो उपलब्ध भार के साथ नए ओपन सोर्स कृत्रिम बुद्धिमत्ता मॉडल से बना है। यह अपडेट एक साल से भी अधिक समय पहले जेम्मा 3 के लॉन्च के बाद से इस लाइन में पहली बड़ी प्रगति का प्रतिनिधित्व करता है। डेवलपर्स के पास अब Apache 2.0 लाइसेंस है, जो पिछले संस्करणों में मौजूद व्यावसायिक प्रतिबंधों को हटा देता है।
मॉडल टेक्स्ट, ऑडियो और छवि इनपुट का समर्थन करते हैं, संदर्भ विंडो के साथ जो सबसे बड़े वेरिएंट में 256 हजार टोकन तक पहुंचते हैं। वे मुख्य रूप से उपभोक्ता जीपीयू और मोबाइल उपकरणों सहित किफायती हार्डवेयर पर स्थानीय रूप से चलने के लिए डिज़ाइन किए गए हैं। लाइसेंस परिवर्तन Google द्वारा लगाए गए अतिरिक्त दायित्वों के बिना व्यावसायिक उपयोग की सुविधा प्रदान करता है।
तर्क और मल्टीमॉडल में तकनीकी सुधार
पिछली पीढ़ी की तुलना में नए मॉडल तर्क, गणित और निर्देशों का पालन करने में महत्वपूर्ण प्रगति लाते हैं। वे मूल फ़ंक्शन कॉलिंग समर्थन और JSON संरचित आउटपुट पीढ़ी को शामिल करते हैं, जिससे एजेंटिक वर्कफ़्लो को लाभ होता है।
कोड प्रोसेसिंग क्षमता को ऑफ़लाइन वातावरण के लिए अनुकूलित किया गया है, जिससे जेमिनी प्रो जैसी क्लाउड सेवाओं के बराबर प्रदर्शन प्राप्त हो रहा है। विज़ुअल इनपुट समर्थन ऑप्टिकल कैरेक्टर पहचान और ग्राफ़ व्याख्या जैसे कार्यों को अधिक सटीकता के साथ सक्षम बनाता है।
- वेरिएंट में स्मार्टफ़ोन पर कम विलंबता के लिए अनुकूलित प्रभावी 2बी और 4बी मॉडल शामिल हैं।
- क्वालकॉम और मीडियाटेक के साथ सहयोग मोबाइल उपकरणों में एकीकरण की सुविधा प्रदान करता है।
- बड़े मॉडल बिना परिमाणीकरण के एकल 80GB H100 GPU पर चलते हैं।
आकार प्रकार और ऊर्जा दक्षता
जेम्मा 4 परिवार में चार मुख्य आकार विन्यास हैं। विशेषज्ञों का 26बी मिश्रण और 31बी डेंस संस्करण उच्च प्रदर्शन प्रदान करते हैं और सर्वर या वर्कस्टेशन हार्डवेयर पर चलते हैं। प्रभावी 2बी और 4बी किनारे वाले उपकरणों पर निष्पादन के लिए दक्षता को प्राथमिकता देते हैं।
26B MoE मॉडल अनुमान के दौरान केवल 3.8 बिलियन मापदंडों को सक्रिय करता है, जिससे विलंबता और बिजली की खपत कम हो जाती है। सभी वेरिएंट 140 से अधिक भाषाओं को संभालते हैं। डेवलपर्स हगिंग फेस, कागल और ओलामा जैसे प्लेटफार्मों पर पूर्ण वजन डाउनलोड कर सकते हैं।
सभी प्लेटफार्मों पर तत्काल उपलब्धता
बड़े 31B और 26B मॉडल Google के AI स्टूडियो में उपलब्ध हैं। हल्के E4B और E2B संस्करणों को AI एज गैलरी में एक्सेस किया जा सकता है। संपूर्ण भार सार्वजनिक रिपॉजिटरी से तत्काल डाउनलोड के लिए उपलब्ध हैं।
कंपनियां और शोधकर्ता एपीआई लागत की पुनरावृत्ति के बिना मॉडल को स्थानीय अनुप्रयोगों में एकीकृत कर सकते हैं। Google ने यह भी संकेत दिया कि 2B और 4B वेरिएंट एंड्रॉइड डिवाइस पर आगामी जेमिनी नैनो 4 के लिए आधार के रूप में काम करेंगे।
Apache 2.0 लाइसेंस पर स्विच करने का प्रभाव
अपाचे 2.0 लाइसेंस को अपनाने से पिछले कस्टम लाइसेंस के प्रतिबंध समाप्त हो जाते हैं, जिसमें एकतरफा अद्यतन करने योग्य नो-यूज़ नीतियां शामिल थीं। डेवलपर्स को डेटा और व्यावसायिक परिनियोजन पर अधिक नियंत्रण प्राप्त होता है।
इस परिवर्तन से समुदाय में नई परियोजनाओं के निर्माण को प्रोत्साहन मिलना चाहिए, जिन्हें अनौपचारिक रूप से जेम्मावर्स के नाम से जाना जाता है। स्थानीय निष्पादन पर ध्यान जेमिनी लाइन के बंद मॉडलों के लिए खुले विकल्प पेश करने की रणनीति को मजबूत करता है।
विशिष्ट हार्डवेयर के लिए अनुकूलन
हल्के संस्करण मोबाइल चिप निर्माताओं के साथ साझेदारी में विकसित किए गए थे। वे बैटरी की खपत कम रखते हुए रोजमर्रा के कार्यों में लगभग शून्य विलंबता प्रदान करते हैं। परीक्षण रास्पबेरी पाई और जेटसन नैनो जैसे बोर्डों पर अच्छे प्रदर्शन का संकेत देते हैं।
बड़े मॉडल सघन विन्यास या MoE में भी दक्षता बनाए रखते हैं। स्थानीय प्रसंस्करण में विलंबता को कम करना उन अनुप्रयोगों के लिए एक व्यावहारिक लाभ का प्रतिनिधित्व करता है जिन्हें सर्वर से निरंतर कनेक्शन के बिना गोपनीयता और तेज़ प्रतिक्रिया की आवश्यकता होती है।
एकाधिक इनपुट तौर-तरीकों का समर्थन करें
पाठ के अलावा, मॉडल ऑडियो और छवियों को मूल रूप से संसाधित करते हैं। वाक् पहचान में जेम्मा 3 की तुलना में सुधार शामिल हैं। मल्टीमॉडल क्षमता उन अनुप्रयोगों के लिए संभावनाएं खोलती है जो वास्तविक समय में विभिन्न प्रकार के डेटा को जोड़ते हैं।
डेवलपर्स हल्के वेरिएंट का उपयोग करके सीधे एआई कोर डेवलपर पूर्वावलोकन में एजेंटिक प्रवाह को प्रोटोटाइप कर सकते हैं। ये कार्यान्वयन आगामी जेमिनी नैनो 4 के साथ आगे-संगत हैं।
जेम्मा 4 परिवार सुलभ वजन के साथ खुले मॉडल पेश करने की Google की प्रतिबद्धता को मजबूत करता है। बेहतर प्रदर्शन, अनुमेय लाइसेंसिंग और विविध हार्डवेयर समर्थन का संयोजन स्थानीय रूप से चलने योग्य एआई समाधान चाहने वालों के लिए विकल्पों का विस्तार करता है।

