Google DeepMind ने प्रोजेक्ट जिनी को लॉन्च करना शुरू कर दिया है, जो एक शोध प्रोटोटाइप है जो उपयोगकर्ताओं को कृत्रिम बुद्धिमत्ता द्वारा उत्पन्न इंटरैक्टिव आभासी दुनिया बनाने और तलाशने की अनुमति देता है। यह सेवा प्रारंभ में केवल संयुक्त राज्य अमेरिका में Google AI Ultra योजना के ग्राहकों के लिए उपलब्ध है, जिनकी आयु कम से कम 18 वर्ष है। रोलआउट 29 जनवरी, 2026 को शुरू हुआ और कंपनी भविष्य में अन्य क्षेत्रों तक पहुंच बढ़ाने की योजना बना रही है।
यह टूल उपयोगकर्ताओं द्वारा भेजे गए टेक्स्ट संकेतों या छवियों से वास्तविक समय के वातावरण उत्पन्न करने के लिए अगस्त 2025 में पेश किए गए जिनी 3 मॉडल का उपयोग करता है। दुनिया को 24 फ्रेम प्रति सेकंड की दर से 720p रिज़ॉल्यूशन में प्रस्तुत किया जाता है, जिससे कैमरे को स्थानांतरित करने के लिए WASD कुंजी और तीर जैसे बुनियादी नियंत्रण के साथ नेविगेशन की अनुमति मिलती है।
प्रतिभागी अपने अन्वेषणों के वीडियो डाउनलोड कर सकते हैं और नए विवरणों के साथ रीमिक्स करने के लिए अन्य उपयोगकर्ताओं के लिए रचनाएँ साझा कर सकते हैं।
प्रोटोटाइप की मुख्य विशेषताएं
प्रोजेक्ट जिनी इंटरेक्शन के तीन मुख्य तरीके प्रदान करता है जो आभासी वातावरण बनाना और तलाशना आसान बनाता है। उपयोगकर्ता पाठ के माध्यम से वांछित दुनिया का वर्णन करके या संदर्भ चित्र भेजकर, मुख्य चरित्र की उपस्थिति, दृष्टि के परिप्रेक्ष्य और चलने के तरीके जैसे विवरणों को समायोजित करके शुरू करते हैं।
प्रारंभिक पीढ़ी के बाद, आप वास्तविक समय में पर्यावरण का पता लगा सकते हैं क्योंकि मॉडल आपके द्वारा किए गए कार्यों के आधार पर नए तत्वों की भविष्यवाणी और प्रतिपादन करता है। यह टूल आपको मौजूदा रचनाओं को रीमिक्स करने की भी अनुमति देता है, अन्य उपयोगकर्ताओं या स्वयं द्वारा उत्पन्न दुनिया में नए संकेत लागू करता है।
- पाठ या छवि से दुनिया की उत्पत्ति
- कीबोर्ड नियंत्रण के साथ इंटरैक्टिव अन्वेषण
- रीमिक्सिंग रचनाएँ मंच पर साझा की गईं
- अन्वेषण सत्रों के वीडियो डाउनलोड करें
ये विकल्प प्रोटोटाइप को रचनात्मक प्रयोग के लिए सुलभ बनाते हैं, हालांकि अभी भी इसका दायरा सीमित है।
प्रोजेक्ट जिनी के अंदर कदम रखें: हमारा प्रायोगिक अनुसंधान प्रोटोटाइप जो आपको आभासी दुनिया बनाने, संपादित करने और अन्वेषण करने की सुविधा देता है। 🌎pic.twitter.com/HQr1FRNlpy
– गूगल डीपमाइंड (@GoogleDeepMind)29 जनवरी 2026
जिन्न 3 के पीछे की तकनीक
जिनी 3 एक सामान्य विश्व मॉडल है जो पर्यावरणीय गतिशीलता का अनुकरण करने और विभिन्न वातावरणों में कार्यों के प्रभावों की भविष्यवाणी करने में सक्षम है। पारंपरिक गेम इंजनों के विपरीत, यह पूर्व-क्रमादेशित नियमों की आवश्यकता के बिना, ऑटोरेग्रेसिव प्रशिक्षण के माध्यम से भौतिकी पैटर्न और इंटरैक्शन सीखता है।
मॉडल नेविगेशन के दौरान सुसंगत बदलाव उत्पन्न करने के लिए पिछले तत्वों को याद करते हुए कुछ मिनटों तक अस्थायी स्थिरता बनाए रखता है। यह क्षमता जिनी 1 और जिनी 2 जैसे पिछले संस्करणों की तुलना में सुधार का प्रतिनिधित्व करती है, जो अधिक प्रतिबंधित वातावरणों पर केंद्रित थे।
प्रोजेक्ट जिनी के साथ एकीकरण रोजमर्रा के उपयोगकर्ताओं को नियंत्रित वातावरण में इन सुविधाओं का परीक्षण करने की अनुमति देता है। वर्तमान रिज़ॉल्यूशन और फ्रेम दर वास्तविक समय की अन्तरक्रियाशीलता की मांग को पूरा करते हैं, अधिकतम ग्राफिक गुणवत्ता पर तरलता को प्राथमिकता देते हैं।
लॉन्च के समय पहचानी गई सीमाएँ
प्रोटोटाइप में तकनीकी प्रतिबंध हैं जो संपूर्ण उपयोगकर्ता अनुभव को प्रभावित करते हैं। जनरेशन सत्र 60 सेकंड तक सीमित हैं, और विश्व स्थिरता लंबी या अधिक जटिल बातचीत में टूट सकती है।
कुछ मामलों में, वातावरण वास्तविक भौतिकी के नियमों या दिए गए संकेत के विवरण का सख्ती से पालन नहीं करता है, जिसके परिणामस्वरूप तत्व कम यथार्थवादी होते हैं। पात्रों को नियंत्रित करते समय विलंबता दृश्य की जटिलता के आधार पर भिन्न होती है, और सभी गतिविधियां तत्काल सटीकता के साथ प्रतिक्रिया नहीं करती हैं।
- प्रति पीढ़ी अधिकतम अवधि 60 सेकंड
- संभावित दृश्य और शारीरिक विसंगतियाँ
- वर्णों को नियंत्रित करते समय परिवर्तनीय विलंबता
- पारंपरिक खेल यांत्रिकी का अभाव
प्रायोगिक संस्करण में ये सीमाएँ अपेक्षित हैं और भविष्य के अद्यतनों में इनमें सुधार किया जाना चाहिए।
उपयोगकर्ता द्वारा निर्मित दुनिया के उदाहरण
शुरुआती पहुंच वाले उपयोगकर्ताओं ने प्रोजेक्ट जिनी के साथ बनाई गई रचनाओं में विविधता का प्रदर्शन किया। कुछ प्रसिद्ध खेलों से प्रेरित वातावरण उत्पन्न हुए, जैसे खुले जंगलों या क्लासिक प्लेटफार्मों के समान परिदृश्य, मनोरंजन की संभावनाएं तलाशना।
अन्य ने मूल विषयों पर ध्यान केंद्रित किया, जैसे मार्शमैलो महल, ब्रह्मांडीय परिदृश्य या पुनर्निर्मित प्राचीन शहर। प्रारंभिक संकेत में दिए गए विवरण के आधार पर उपकरण वाहनों, तैराकी या उड़ान के साथ प्रयोग की अनुमति देता है।
ये प्रदर्शन अलग-अलग संकेतों की व्याख्या के लिए मॉडल के लचीलेपन को उजागर करते हैं। समुदाय पहले-व्यक्ति के रोमांच से लेकर तीसरे-व्यक्ति के दृश्यों तक, विभिन्न शैलियों में अन्वेषण दिखाने वाले लघु वीडियो साझा कर रहा है।
विश्व मॉडल विकास का संदर्भ
विश्व मॉडलों ने एक दशक से अधिक समय से Google DeepMind में प्राथमिकता वाले अनुसंधान क्षेत्र का प्रतिनिधित्व किया है। ये सिस्टम वातावरण के विकास और कार्यों के प्रभावों का अनुकरण करते हैं, जो असीमित परिदृश्यों में एआई एजेंटों को प्रशिक्षित करने के आधार के रूप में कार्य करते हैं।
जिनी 3 सरल इनपुट से इंटरैक्टिव वातावरण की अभूतपूर्व विविधता उत्पन्न करके इस दिशा में आगे बढ़ता है। ऑटोरेग्रेसिव दृष्टिकोण बुनियादी दृश्य और भौतिक सुसंगतता को बनाए रखते हुए बाद के फ्रेम की भविष्यवाणी की अनुमति देता है।
यह प्रगति कृत्रिम सामान्य बुद्धि में दीर्घकालिक लक्ष्यों में योगदान करती है। प्रोजेक्ट जिनी इन मॉडलों के वास्तविक दुनिया के अनुप्रयोगों पर प्रतिक्रिया एकत्र करने के लिए एक व्यावहारिक इंटरफ़ेस के रूप में कार्य करता है।
पहुंच और विस्तार आवश्यकताएँ
वर्तमान में, एक्सेस के लिए Google AI अल्ट्रा प्लान की सदस्यता की आवश्यकता होती है, जो Google की AI सेवाओं का सबसे उन्नत स्तर है। प्रोटोटाइप संयुक्त राज्य अमेरिका में उपयोगकर्ताओं के लिए प्रतिबंधित है, जिसमें 18 वर्ष से अधिक उम्र वालों के लिए आयु सत्यापन शामिल है।
कंपनी ने बताया कि प्रारंभिक पात्र दर्शकों के भीतर भी रोलआउट धीरे-धीरे होगा। परीक्षण और तकनीकी समायोजन की प्रगति के रूप में अन्य देशों के लिए विस्तार योजनाएं लागू की जाएंगी।
इच्छुक उपयोगकर्ता Google लैब्स पर अपडेट का अनुसरण कर सकते हैं, जहां प्रोजेक्ट जिनी होस्ट किया गया है। प्लेटफ़ॉर्म पूर्ण पहुंच से पहले प्रेरणा के लिए नमूना उत्पन्न दुनिया को भी प्रदर्शित करता है।
उपलब्ध अनुकूलन सुविधाएँ
अनुकूलन स्केचिंग चरण में शुरू होता है, जहां उपयोगकर्ता दुनिया के विस्तृत मापदंडों को परिभाषित करते हैं। प्रकाश, जलवायु, मौजूद वस्तुओं और नियंत्रित चरित्र के व्यवहार जैसे तत्वों को निर्दिष्ट करना संभव है।
छवि अपलोड विकल्प प्रक्रिया को गति देता है, मॉडल की व्याख्या और विस्तार के लिए दृश्य आधार के रूप में कार्य करता है। पीढ़ी के बाद, नए संकेतों के माध्यम से समायोजन पूर्ण पुनरारंभ की आवश्यकता के बिना पर्यावरण को परिष्कृत करता है।
- परिप्रेक्ष्य निर्धारित करना (प्रथम या तृतीय व्यक्ति)
- हरकत के तरीकों का चुनाव (दौड़ना, तैरना, उड़ना)
- प्रॉम्प्ट में गतिशील घटनाओं का समावेश
- अन्वेषण के दौरान वास्तविक समय समायोजन
ये सुविधाएँ वर्तमान तकनीकी सीमाओं के भीतर रचनात्मक नियंत्रण बढ़ाती हैं।
प्रारंभिक सामुदायिक प्रतिक्रिया
विश्वसनीय परीक्षकों ने उपयोगों की एक प्रभावशाली श्रृंखला की सूचना दी है जिसकी शुरुआत में विकास टीम को उम्मीद नहीं थी। कई लोगों ने सरल विचारों से कुछ ही सेकंड में गहन अनुभव उत्पन्न करने की क्षमता पर प्रकाश डाला।
अन्य लोगों ने गेम डिज़ाइन या आभासी शिक्षा जैसे क्षेत्रों में तेजी से प्रोटोटाइप की संभावना की ओर इशारा किया है। रचनाएँ साझा करने से सहयोग को बढ़ावा मिलता है, उपयोगकर्ता अद्वितीय विविधताएँ बनाने के लिए अन्य लोगों की दुनिया को रीमिक्स करते हैं।
सामान्य प्रतिक्रिया सुलभ विश्व मॉडल की अवधारणा में उच्च रुचि को इंगित करती है। कंपनी प्रोटोटाइप के अगले संस्करणों में सुधार को प्राथमिकता देने के लिए इन रिटर्न की निगरानी करती है।