Hindi News

वास्तविक समय, इंटरैक्टिव एआई यूनिवर्स बनाने के लिए ग्राहकों के लिए Google डीपमाइंड का प्रोजेक्ट जिनी लॉन्च किया गया

Project Genie
Project Genie - Divulgação/Google

Google DeepMind ने अपने नवीनतम कृत्रिम बुद्धिमत्ता उपकरण, प्रोजेक्ट जिनी को क्रमिक रूप से जारी करना शुरू कर दिया है। नवोन्मेषी प्लेटफ़ॉर्म उपयोगकर्ताओं को सरल टेक्स्ट कमांड का उपयोग करके या एक छवि भेजकर पूरी तरह से इंटरैक्टिव आभासी दुनिया बनाने और तलाशने की अनुमति देता है। आधिकारिक लॉन्च 29 जनवरी, 2026 को हुआ, जो तथाकथित “विश्व मॉडल” के विकास में एक महत्वपूर्ण कदम था।

प्रारंभ में, अनुसंधान प्रोटोटाइप तक पहुंच चयनित दर्शकों तक ही सीमित है। केवल Google AI अल्ट्रा योजना के ग्राहक, जो संयुक्त राज्य अमेरिका में रहते हैं और कम से कम 18 वर्ष की आयु के हैं, इस पहले चरण में प्रौद्योगिकी को आज़मा सकेंगे। कंपनी ने संकेत दिया कि अन्य क्षेत्रों और सदस्यता योजनाओं में विस्तार उत्तरोत्तर होगा क्योंकि शुरुआती उपयोगकर्ताओं की प्रतिक्रिया के आधार पर प्लेटफ़ॉर्म में सुधार किया गया है।

यह उपकरण वास्तविक समय में वातावरण को प्रस्तुत करने की अपनी क्षमता के लिए जाना जाता है, जिससे तरल और गतिशील अन्वेषण की अनुमति मिलती है। रचनाओं को समुदाय के भीतर साझा किया जा सकता है, जिससे अन्य उपयोगकर्ता मौजूदा दुनिया को संशोधित और रीमिक्स करने में सक्षम हो सकते हैं, जिससे एक रचनात्मक और सहयोगी पारिस्थितिकी तंत्र को बढ़ावा मिलेगा।

आभासी दुनिया की पीढ़ी कैसे काम करती है

प्रोजेक्ट जिनी में निर्माण प्रक्रिया को सहज बनाने के लिए डिज़ाइन किया गया है, यहां तक ​​कि उन उपयोगकर्ताओं के लिए भी जिनके पास गेम डेवलपमेंट या 3डी मॉडलिंग का कोई अनुभव नहीं है। यह सब एक संकेत से शुरू होता है, जो कल्पित परिदृश्य का एक विस्तृत पाठ्य विवरण या एक संदर्भ छवि हो सकता है जो दृश्य प्रेरणा के रूप में कार्य करता है। उपयोगकर्ता कैमरे के परिप्रेक्ष्य जैसे महत्वपूर्ण तत्वों को निर्दिष्ट कर सकता है, चाहे वह पहले या तीसरे व्यक्ति में हो, और चरित्र की हरकत का प्रकार, जैसे दौड़ना, उड़ना या तैरना। एक बार कमांड दर्ज करने के बाद, जिनी 3 मॉडल, जो ऑपरेशन के मस्तिष्क के रूप में कार्य करता है, डेटा की व्याख्या करता है और पर्यावरण को प्रस्तुत करना शुरू करता है। परिणाम 720p रिज़ॉल्यूशन और 24 फ्रेम प्रति सेकंड की दर के साथ एक आभासी दुनिया है, एक संतुलन जो अधिकतम ग्राफिकल निष्ठा पर वास्तविक समय की अन्तरक्रियाशीलता को प्राथमिकता देता है। अन्वेषण परिचित कीबोर्ड नियंत्रणों के माध्यम से किया जाता है, जैसे गति के लिए WASD कुंजियाँ और कैमरा नियंत्रण के लिए तीर कुंजियाँ, जो एक सरल वीडियो गेम जैसा अनुभव प्रदान करती हैं।

जिनी 3 मॉडल के पीछे की तकनीक

जिनी 3 को “सामान्य विश्व मॉडल” के रूप में वर्गीकृत किया गया है, अनुसंधान का एक क्षेत्र जिसे Google DeepMind ने एक दशक से अधिक समय तक खोजा है। पारंपरिक गेम इंजनों के विपरीत, जो डेवलपर्स द्वारा पूर्व-प्रोग्राम किए गए भौतिकी नियमों और इंटरैक्शन के आधार पर काम करते हैं, जिनी 3 इन गतिशीलता को स्वायत्त रूप से सीखता है। इसे बड़ी मात्रा में इंटरनेट वीडियो डेटा पर प्रशिक्षित किया गया था, जिससे यह अनुमान लगाया जा सके कि कोई वातावरण उपयोगकर्ता के कार्यों पर कैसे प्रतिक्रिया करता है और किसी दृश्य के बाद के फ्रेम कैसे दिखने चाहिए।

यह दृष्टिकोण, जिसे ऑटोरेग्रेसिव प्रशिक्षण के रूप में जाना जाता है, मॉडल को सीमित समय, आमतौर पर कुछ मिनटों के लिए अस्थायी और स्थानिक स्थिरता बनाए रखने की अनुमति देता है। इसका मतलब यह है कि, किसी परिदृश्य से गुजरते समय, मॉडल “याद रखता है” कि चरित्र के पीछे क्या था और सुसंगत बदलाव उत्पन्न करता है, जिससे विसर्जन और निरंतरता की भावना पैदा होती है। दुनिया और भौतिकी की लगभग अनंत विविधता का अनुकरण करने की यह क्षमता पिछले मॉडलों की तुलना में एक उल्लेखनीय प्रगति का प्रतिनिधित्व करती है, जो दायरे और अनुप्रयोग में अधिक प्रतिबंधित थे, जिससे असीमित आभासी परिदृश्यों में एआई एजेंटों को प्रशिक्षित करने का मार्ग प्रशस्त हुआ।

सुविधाएँ और इंटरैक्शन मोड

प्लेटफ़ॉर्म उपयोगकर्ताओं की रचनात्मकता को सुविधाजनक बनाने के लिए बातचीत के तीन मुख्य तरीके प्रदान करता है। पहला स्क्रैच से पीढ़ी है, जहां उपयोगकर्ता चरित्र की उपस्थिति, पर्यावरण और आंदोलन के बुनियादी नियमों को समायोजित करते हुए उस दुनिया का विस्तार से वर्णन करता है जिसे वे देखना चाहते हैं।

दूसरा मोड इंटरएक्टिव एक्सप्लोरेशन है। प्रारंभिक पीढ़ी के बाद, उपयोगकर्ता स्वतंत्र रूप से परिदृश्य को नेविगेट कर सकता है जबकि एआई मॉडल लगातार किए गए कार्यों के आधार पर नए तत्वों की भविष्यवाणी करता है और प्रस्तुत करता है, जिससे वास्तविक समय में सामने आने वाला अनुभव तैयार होता है।

अंत में, “रीमिक्स” कार्यक्षमता उपयोगकर्ताओं को दूसरों द्वारा साझा की गई रचनाओं को लेने और उन पर नए संकेत लागू करने की अनुमति देती है। इससे मध्ययुगीन महल को भविष्य के अंतरिक्ष स्टेशन में बदलना संभव हो जाता है, उदाहरण के लिए, उत्पन्न दुनिया के सहयोग और निरंतर विकास को प्रोत्साहित करना।

परीक्षण संस्करण की वर्तमान सीमाएँ

प्रारंभिक चरण के प्रोटोटाइप के रूप में, प्रोजेक्ट जिनी में कुछ महत्वपूर्ण तकनीकी बाधाएँ हैं जिनके बारे में उपयोगकर्ताओं को पता होना चाहिए। सबसे उल्लेखनीय सीमा जनरेशन सत्रों की लंबाई है, जो वर्तमान में अधिकतम 60 निरंतर सेकंड तक सीमित है।

समय के अलावा, आभासी दुनिया की स्थिरता लंबी या अधिक जटिल बातचीत में खामियां पेश कर सकती है। कभी-कभी, वातावरण भौतिकी के नियमों या प्रॉम्प्ट में दिए गए सटीक विवरणों का सख्ती से पालन नहीं कर पाता है, जिसके परिणामस्वरूप असंगत या अवास्तविक दृश्य तत्व उत्पन्न होते हैं।

पात्रों को नियंत्रित करने में विलंब भी ध्यान देने योग्य बात है। प्रस्तुत किए जा रहे दृश्य की जटिलता के आधार पर आदेशों की प्रतिक्रिया भिन्न हो सकती है, और सभी गतिविधियों को तत्काल सटीकता के साथ निष्पादित नहीं किया जाता है, जो अन्वेषण की तरलता को प्रभावित कर सकता है।

यह ध्यान रखना महत्वपूर्ण है कि टूल में पारंपरिक गेम मैकेनिक्स नहीं हैं, जैसे इन्वेंट्री सिस्टम, मिशन या वस्तुओं के साथ जटिल इंटरैक्शन। ये सीमाएँ प्रायोगिक चरण की प्रौद्योगिकी के लिए अपेक्षित हैं और भविष्य के अपडेट में सुधार का फोकस होना चाहिए।

पहली रचनाएँ और सामुदायिक प्रतिक्रिया

टूल तक पहुंच रखने वाले पहले उपयोगकर्ताओं ने प्रोजेक्ट जिनी की बहुमुखी प्रतिभा का प्रदर्शन करते हुए अपनी रचनाएं साझा करना शुरू कर दिया है। कुछ प्रसिद्ध खेलों से प्रेरित थे, जो खुली दुनिया के जंगलों या क्लासिक प्लेटफ़ॉर्म गेम से मिलते-जुलते परिदृश्य तैयार करते थे, मॉडल की पुन: निर्माण करने की क्षमता की सीमाओं का परीक्षण करते थे।

दूसरों ने पूरी तरह से मूल विषयों की खोज की, जैसे मार्शमैलो से बने महल, तैरते ग्रहों के साथ ब्रह्मांडीय परिदृश्य और प्राचीन शहरों का पुनर्निर्माण। विभिन्न संकेतों की व्याख्या करने के लिए मॉडल का लचीलापन इसके सबसे प्रशंसित बिंदुओं में से एक रहा है, जो रचनात्मक प्रयोगों की एक विस्तृत श्रृंखला की अनुमति देता है।

प्रोटोटाइप तक पहुंच के लिए आवश्यकताएँ

प्रोजेक्ट जिनी परीक्षकों के प्रारंभिक समूह का हिस्सा बनने के लिए, आपको Google द्वारा स्थापित विशिष्ट मानदंडों को पूरा करना होगा। मुख्य आवश्यकता Google AI Ultra योजना का ग्राहक होना है, जो कंपनी की कृत्रिम बुद्धिमत्ता सेवाओं का सबसे उन्नत और महंगा स्तर है। इसके अतिरिक्त, पहुंच भौगोलिक रूप से संयुक्त राज्य अमेरिका तक सीमित है, और उपयोगकर्ताओं को यह पुष्टि करनी होगी कि प्लेटफ़ॉर्म का उपयोग करने के लिए उनकी आयु 18 वर्ष या उससे अधिक है। कंपनी ने बताया कि रोलआउट धीरे-धीरे होगा, यहां तक ​​कि उन लोगों के लिए भी जो सभी आवश्यक शर्तें पूरी करते हैं।

उपयोगकर्ता अनुकूलन और रचनात्मक नियंत्रण

प्रोजेक्ट जिनी रचनात्मक नियंत्रण बढ़ाने के लिए काफी हद तक अनुकूलन प्रदान करता है। प्रारंभिक “स्केचिंग” चरण में, प्रकाश व्यवस्था, मौसम की स्थिति और यहां तक ​​कि आभासी दुनिया में होने वाली गतिशील घटनाओं जैसे मापदंडों को परिभाषित करना संभव है।

संदर्भ छवियां अपलोड करना एक दृश्य शॉर्टकट के रूप में कार्य करता है, जो मॉडल को विस्तार और व्याख्या करने के लिए एक ठोस आधार देता है। अन्वेषण के दौरान, संपूर्ण पीढ़ी प्रक्रिया को पुनरारंभ किए बिना वास्तविक समय में तत्वों को समायोजित करके, नए संकेतों के साथ पर्यावरण को परिष्कृत करना संभव है।

To Top