Google ने तर्क में छलांग और स्वायत्त विज़ुअल सिस्टम के निर्माण के साथ जेमिनी अपडेट जारी किया है

Gemini

Gemini - Mehaniq/shutterstock.com

Google डीपमाइंड डिवीजन ने इस गुरुवार (19) को कृत्रिम बुद्धिमत्ता मॉडल के अपने मुख्य परिवार के लिए एक नए पुनरावृत्ति के आगमन की आधिकारिक घोषणा की। जेमिनी 3.1 प्रो नामक अपडेट को जटिल तर्क क्षमताओं के विस्तार पर प्राथमिकता के साथ विकसित किया गया था, जो डेटा संश्लेषण और उन्नत तर्क की आवश्यकता वाले कार्यों में पिछले संस्करणों की सीमाओं को दूर करने का वादा करता है।

यह लॉन्च प्रौद्योगिकी क्षेत्र के लिए एक रणनीतिक क्षण में होता है, जहां सरल पाठ पीढ़ी संपूर्ण वर्कफ़्लो निष्पादित करने में सक्षम एजेंटों की मांग को पूरा कर रही है। नया टूल अब डेवलपर्स और उन्नत योजना ग्राहकों के लिए पूर्वावलोकन चरण में उपलब्ध है, जो प्रोग्रामिंग कोड से लेकर वीडियो और ऑडियो व्याख्या तक मल्टीमॉडल प्रोसेसिंग में महत्वपूर्ण सुधार पेश करता है।

जेमिनी आर्टिफिशियल इंटेलिजेंस – जू जे-यंग/ शटरस्टॉक.कॉम

विशेषज्ञ बताते हैं कि इस संस्करण में अंतर नई समस्याओं को हल करने के लिए इसकी अनुकूलित वास्तुकला में निहित है, जो प्रशिक्षण के दौरान याद किए गए पैटर्न पर विशेष निर्भरता से दूर है। प्रौद्योगिकी को कंपनी के मालिकाना एप्लिकेशन और कॉर्पोरेट वातावरण दोनों के माध्यम से अंतिम उपयोगकर्ताओं की सेवा के लिए डिज़ाइन किया गया था, जिन्हें एपीआई के माध्यम से मजबूत स्वचालन की आवश्यकता होती है।

आंतरिक सत्यापन परीक्षणों से पता चला कि मॉडल विचार की लंबी श्रृंखलाओं में सामंजस्य बनाए रख सकता है, जो कार्यात्मक स्वायत्त एजेंटों के विकास के लिए एक आवश्यक विशेषता है। तत्काल उपलब्धता का उद्देश्य तीसरे पक्ष के उत्पादों और कंपनी के क्लाउड प्लेटफार्मों में इन क्षमताओं के एकीकरण में तेजी लाना है।

तर्क परीक्षणों में प्रदर्शन में उछाल

घोषणा के दौरान प्रस्तुत सबसे महत्वपूर्ण मीट्रिक एआरसी-एजीआई-2 बेंचमार्क पर प्रदर्शन को संदर्भित करता है, जो पहले से अनदेखे तार्किक पैटर्न को हल करने के लिए एआई की क्षमता का मूल्यांकन करने के लिए डिज़ाइन किया गया एक कठोर परीक्षण है। जेमिनी 3.1 प्रो ने इस संबंध में 77.1% का स्कोर दर्ज किया, जो कि इसके पूर्ववर्ती, जेमिनी 3 प्रो द्वारा प्राप्त प्रदर्शन के दोगुने से भी अधिक का प्रतिनिधित्व करता है, जिसने समान मूल्यांकन में 31.1% हासिल किया था।

अमूर्त तर्क में विकास के अलावा, मॉडल को बाजार में उपलब्ध अन्य अत्याधुनिक प्रौद्योगिकियों के साथ प्रत्यक्ष तुलनात्मक मूल्यांकन के अधीन किया गया था। In the test known as “Humanity’s Last Exam”, the new version achieved 44.4%, surpassing competing solutions developed by Anthropic and OpenAI, consolidating its position in scenarios that require in-depth technical knowledge.

तार्किक तर्क में यह स्थिरता उपकरण को उन स्थितियों में लागू करने की अनुमति देती है जहां सरल जानकारी पुनर्प्राप्ति पर्याप्त नहीं है। अद्यतन का फोकस यह सुनिश्चित करना है कि सिस्टम संदर्भ खोए बिना या मतिभ्रम प्रतिक्रियाओं के बिना बहुआयामी समस्याओं को हल कर सकता है, पेशेवर और अकादमिक उपयोग के लिए विश्वसनीयता के स्तर को बढ़ा सकता है।

नेविगेशन और वर्चुअल एजेंटों में स्वायत्तता

इस अद्यतन में एक स्वायत्त एजेंट के रूप में काम करने की क्षमता का काफी विस्तार किया गया है, जिसमें बेंचमार्क में प्रभावशाली परिणाम मिले हैं जो वास्तविक पेशेवर गतिविधियों का अनुकरण करते हैं। एपेक्स-एजेंट परीक्षण में, जो लंबे-क्षितिज कार्यों में दक्षता को मापता है, मॉडल 33.5% अंक तक पहुंच गया, जो उन उद्देश्यों को प्रबंधित करने के लिए एक बेहतर योग्यता का संकेत देता है जिन्हें पूरा करने के लिए कई चरणों की आवश्यकता होती है।

एक अन्य मुख्य आकर्षण ब्राउजकॉम्प में प्रदर्शन था, एक मूल्यांकन जो पायथन जैसे प्रोग्रामिंग टूल के उपयोग के साथ संयुक्त एजेंटिक इंटरनेट खोज पर केंद्रित था। जेमिनी 3.1 प्रो ने 85.9% प्रभावशीलता हासिल की, जो वेब से प्रासंगिक जानकारी को स्वायत्त रूप से खोजने, फ़िल्टर करने और निकालने की क्षमता का प्रदर्शन करता है, इस डेटा को सीधे वर्कफ़्लो में एकीकृत करता है।

नई प्रणाली की बेहतर क्षमताओं को दर्शाने के लिए, कंपनी ने तीन मूलभूत स्तंभों पर प्रकाश डाला जो इस संस्करण में एजेंटों के संचालन का समर्थन करते हैं:

  • उद्देश्य से विचलन के बिना, व्यापक निष्पादन के दौरान जटिल उद्देश्यों पर ध्यान बनाए रखने की क्षमता।
  • वास्तविक समय डेटा सत्यापन के लिए वेब खोज और कोड निष्पादन के बीच सहज एकीकरण।
  • उन वर्कफ़्लो को प्राथमिकता देना जिनके लिए एक साथ कई डिजिटल उपकरणों के समन्वित उपयोग की आवश्यकता होती है।

विज़ुअल सिस्टम और कोडिंग बनाना

मॉडल की बहुमुखी प्रतिभा सरल टेक्स्ट कमांड से जटिल दृश्य प्रणालियों के संश्लेषण तक फैली हुई है। तकनीकी प्रदर्शनों के दौरान, कृत्रिम बुद्धिमत्ता एसवीजी प्रारूप में एनिमेशन उत्पन्न करने में सक्षम थी जो स्केलेबल और हल्के वजन वाले हैं, जो वेब इंटरफेस और मोबाइल एप्लिकेशन के लिए पारंपरिक वीडियो प्रारूपों का एक कुशल विकल्प पेश करते हैं।

दिखाए गए व्यावहारिक उदाहरणों में से एक में वास्तविक समय टेलीमेट्री डैशबोर्ड स्थापित करना शामिल है। मॉडल ने स्क्रैच से एक कार्यात्मक इंटरफ़ेस बनाने के लिए सार्वजनिक एपीआई और कच्चे डेटा को संसाधित किया जो अंतर्राष्ट्रीय अंतरिक्ष स्टेशन की कक्षा की कल्पना करता है। इस प्रक्रिया में इनपुट डेटा की व्याख्या से लेकर अंतिम ग्राफिकल इंटरफ़ेस को कोड करने तक सब कुछ शामिल था।

रचनात्मक व्याख्या के क्षेत्र में, प्रणाली ने क्लासिक साहित्यिक विवरणों को आधुनिक डिजिटल उत्पादों में बदल दिया। वुथरिंग हाइट्स के अंशों को संसाधित करके, एआई ने पुस्तक के कथात्मक माहौल पर कब्जा कर लिया और एक समकालीन पोर्टफोलियो वेबसाइट डिजाइन की, जो अमूर्त और कलात्मक अवधारणाओं को निष्पादन योग्य कोड और कार्यात्मक डिजाइन में अनुवादित करती है।

टूल ने तीन आयामों में इंटरैक्टिव अनुभव बनाने में भी क्षमता प्रदर्शित की। एक सिमुलेशन प्रस्तुत किया गया जहां आभासी पक्षियों के झुंड ने उपयोगकर्ता के हाथों की ट्रैकिंग पर गतिशील रूप से प्रतिक्रिया दी, जिससे जटिल एनीमेशन तर्क के साथ कंप्यूटर दृष्टि को एकीकृत करने की मॉडल की क्षमता साबित हुई।

कॉर्पोरेट पहुंच और एकीकरण के बारे में विवरण

जेमिनी 3.1 प्रो का वितरण एक क्रमबद्ध मॉडल का अनुसरण करता है, इस बिंदु पर डेवलपर्स और कॉर्पोरेट ग्राहकों को प्राथमिकता देता है। संस्करण एआई स्टूडियो और वर्टेक्स एआई जैसे प्लेटफार्मों के माध्यम से पहुंच योग्य है, जिससे कंपनियों को अपने स्वयं के वातावरण में प्रौद्योगिकी का परीक्षण करने और नए रीज़निंग इंजन का उपयोग करने के लिए अपने उत्पादों को अनुकूलित करने की अनुमति मिलती है।

व्यक्तिगत उपयोगकर्ताओं के लिए, Google AI प्रो और अल्ट्रा प्लान के ग्राहकों के लिए एक्सेस जारी किया गया था, जिनकी उपयोग सीमा बढ़ गई है। टूल को नोटबुकएलएम के साथ भी एकीकृत किया गया था, जो अनुसंधान और अध्ययन के लिए मंच का उपयोग करने वाले भुगतान करने वाले उपयोगकर्ताओं के लिए दस्तावेज़ संश्लेषण और अंतर्दृष्टि निर्माण कार्यों को बढ़ाता है।

एक प्रासंगिक तकनीकी बिंदु 1 मिलियन टोकन संदर्भ विंडो का रखरखाव है, जो श्रृंखला 3 की पिछली पीढ़ियों से विरासत में मिली एक सुविधा है। यह सुनिश्चित करता है कि मॉडल संसाधित सामग्री के भीतर विशिष्ट जानकारी को संदर्भित करने की क्षमता खोए बिना, बड़ी मात्रा में डेटा, जैसे संपूर्ण पुस्तकें या व्यापक कोड रिपॉजिटरी का विश्लेषण करने में सक्षम रहता है।