वैज्ञानिकों का कहना है कि जब विशेष रूप से गवाहों की मौखिक रिपोर्टों पर लागू किया जाता है, तो मशीन लर्निंग और कृत्रिम बुद्धिमत्ता प्रणालियों में अज्ञात उड़ने वाली वस्तुओं के बारे में अस्पष्टताओं को हल करने की सीमित क्षमता होती है। निष्कर्ष उन परियोजनाओं को चुनौती देता है जिनका उद्देश्य प्राकृतिक भाषा प्रसंस्करण और बड़े भाषा मॉडल का उपयोग करके दृश्य कथाओं को वर्गीकृत करना है।
शोधकर्ताओं द्वारा एक मशीन लर्निंग पाइपलाइन प्रस्तुत करने के बाद बहस में तेजी आई, जो “कथा नाटक” के लिए राष्ट्रीय यूएफओ रिपोर्टिंग सेंटर की रिपोर्टों का विश्लेषण करती है। प्रस्ताव संरचित सुविधाओं, मुफ्त पाठ विश्लेषण, ग्रेडिएंट बूस्टिंग मॉडल और एकीकृत व्याख्याशीलता को जोड़ता है। विधि के समर्थकों का तर्क है कि गवाह विश्लेषण के लिए प्रासंगिक भाषाई संरचना के साथ उपलब्ध अज्ञात विसंगतिपूर्ण घटनाओं (यूएपी) का सबसे लंबा सार्वजनिक रिकॉर्ड तैयार करते हैं।
साक्ष्य के स्रोत के रूप में गवाहों की सीमाएँ
वैज्ञानिक मामलों में मानवीय गवाही की विश्वसनीयता में दस्तावेजी कमी है। कानूनी प्रणाली में, मौत की सज़ा पाए कैदियों की रिहाई के 51 मामलों में, 45.9% में अविश्वसनीय व्हिसलब्लोअर शामिल थे, जबकि 25.2% प्रत्यक्षदर्शियों द्वारा गलत पहचान के कारण हुए। ये संख्याएँ घटनाओं की सटीक रिपोर्ट करने की मानवीय क्षमता में गंभीर खामियों को उजागर करती हैं।
कार दुर्घटनाओं की रिपोर्टें इस कमज़ोरी का स्पष्ट उदाहरण देती हैं। एक ही घटना के बारे में अलग-अलग लोगों से एकत्र की गई कहानियों में अक्सर महत्वपूर्ण विरोधाभास होते हैं। यह देखते हुए कि केवल एक ही भौतिक वास्तविकता है, सभी संस्करण एक साथ सही नहीं हो सकते। कथात्मक अतिरेक वस्तुनिष्ठ उपकरण की कमी की भरपाई नहीं करता है।
शोधकर्ता इस बात पर प्रकाश डालते हैं कि मनुष्य विश्वसनीय वैज्ञानिक डिटेक्टर के रूप में कार्य नहीं करते हैं। चयन में पक्षपात, गवाहों के बीच आख्यानों का क्रॉस-संदूषण और सुसंगत कहानियां बनाने की प्रवृत्ति गवाही के माध्यम से एकत्र किए गए डेटा की गुणवत्ता को कमजोर करती है। लागू एल्गोरिदम की परिष्कार की परवाह किए बिना, ये समस्याएं किसी भी बाद के विश्लेषण को परेशान करती हैं।

गुणवत्ता डेटा बनाम अनिश्चित जानकारी की मात्रा
कम महत्व की रिपोर्टों की प्रचुरता उनकी वैज्ञानिक उपयोगिता की कमी की भरपाई नहीं करती है। कई यूएफओ देखे जाने का परिणाम गलत पहचान वाली प्राकृतिक घटनाओं या स्थलीय प्रौद्योगिकियों के कारण होता है, जो विषम डेटासेट के शोर से अस्पष्ट हो जाते हैं। अधिक भ्रामक आख्यानों को एकत्रित करने से देखी गई वस्तुओं की वास्तविक प्रकृति के बारे में अस्पष्टताएं हल नहीं होती हैं।
एवी लोएब के नेतृत्व में गैलीलियो प्रोजेक्ट विपरीत प्राथमिकता निर्धारित करता है: कई अवलोकन दिशाओं से एक साथ कैप्चर किए गए उच्च गुणवत्ता वाले डेटा प्राप्त करना। यह डिज़ाइन आपको आकाश में वस्तुओं की दूरी, गति और त्वरण का अनुमान लगाने की अनुमति देता है। विश्वसनीय दूरी माप के बिना, यह आकलन करना असंभव हो जाता है कि कोई गतिशील वस्तु कितनी विषम है।
अंतर्राष्ट्रीय फुटबॉल महासंघ (फीफा) इस सिद्धांत को एक अलग संदर्भ में दर्शाता है। उन्नत एआई सिस्टम का उपयोग करके गोलकीपरों, रेफरी और प्रशंसकों की कहानियों का विश्लेषण करने के बजाय, इकाई ने गोल लाइन टेक्नोलॉजी (जीएलटी) और वीडियो असिस्टेंट रेफरी (वीएआर) को अपनाया। जीएलटी यह पुष्टि करने के लिए 14 हाई-स्पीड कैमरों का उपयोग करता है कि गेंद ने रेखा को पार किया है या नहीं, एक सेकंड के भीतर रेफरी को परिणाम भेजता है। समग्र सटीकता सुनिश्चित करने के लिए VAR वास्तविक समय में फ़ुटेज की समीक्षा करता है। कथावस्तु नहीं, उपकरणीकरण अस्पष्टताओं का समाधान करता है।
व्याख्यात्मक चुनौती की प्रकृति
जब जानकारी सीमित होती है, तो बुद्धिमत्ता गंभीर बाधाओं के भीतर काम करती है। कैमरे से दूरी के संदर्भ के बिना जारी किए गए धुंधले यूएफओ वीडियो, इस सवाल का समाधान नहीं करते हैं कि क्या वस्तुएं मानव प्रौद्योगिकियों की प्रदर्शन सीमाओं से विचलित होती हैं। डेटा की गुणवत्ता यह निर्धारित करती है कि क्या अनुमान लगाया जा सकता है, न कि मॉडल की जटिलता।
परिष्कृत एआई मॉडल, मशीन लर्निंग, बड़े भाषा मॉडल, प्राकृतिक भाषा प्रसंस्करण का एक समूह खराब डेटा और विश्वसनीय व्याख्या के बीच की खाई को पाट नहीं सकता है। आपस में जुड़ी कहानियों का पाठ्य विश्लेषण, जो अक्सर गवाहों के बीच साझा की गई जानकारी से दूषित होता है, कलाकृतियों का निर्माण करता है जो देखी गई घटना की वास्तविकता से अधिक कथा की सामाजिक संरचना को दर्शाता है।
राष्ट्रपति ट्रम्प ने 17 अप्रैल, 2026 को घोषणा की कि वर्गीकृत यूएफओ फ़ाइलों की पहली लहर जल्द ही जारी की जाएगी। केंद्रीय प्रश्न यह है: क्या जारी किए गए वीडियो सबसे दिलचस्प होंगे, या केवल सबसे नाटकीय रूप से प्रलेखित होंगे? पकड़ी गई वस्तुओं की दूरी, गति और त्वरण की जानकारी के बिना, कच्चे माल की व्यापक रिहाई मूलभूत अस्पष्टताओं को हल किए बिना अटकलों को बढ़ावा दे सकती है।
कठोर जाँच को प्राथमिकताएँ
गैलीलियो प्रोजेक्ट से जुड़े शोधकर्ता असामान्य घटनाओं की जांच के लिए एक स्पष्ट पदानुक्रम स्थापित करते हैं:
- एक साथ डेटा कैप्चर के लिए उच्च-रिज़ॉल्यूशन मल्टी-एंगल इंस्ट्रूमेंटेशन
- कई दृष्टिकोणों से भौतिक मापदंडों (दूरी, गति, त्वरण) का अनुमान
- वाद्य विश्लेषण के माध्यम से ज्ञात प्राकृतिक घटनाओं और स्थलीय प्रौद्योगिकियों का बहिष्कार
- स्वैच्छिक रिपोर्ट एकत्र न करके निरंतर निगरानी के माध्यम से चयन पूर्वाग्रह को कम करना
- बड़ी मात्रा में अस्पष्ट आख्यानों की तुलना में उच्च गुणवत्ता वाले डेटा को प्राथमिकता देना
समान विवरणों पर गवाहों का अभिसरण इन विवरणों को मान्य नहीं करता है। साझा की गई कहानियाँ अक्सर जानकारी के परस्पर संदूषण को दर्शाती हैं, सत्य पर अभिसरण को नहीं। अंतर्निहित भौतिक वास्तविकता कथात्मक सहमति से स्वतंत्र रहती है।
भविष्य के डेटा रिलीज़ के लिए निहितार्थ
यूएफओ पर सरकारी फाइलों के जारी होने से राज्य सत्ता में उपलब्ध डेटा की वास्तविक गुणवत्ता का आकलन करने का अवसर मिलता है। यदि वीडियो में वाद्य संदर्भ, कैप्चर प्लेटफ़ॉर्म, कैमरा कैलिब्रेशन, ज्यामितीय मापदंडों के बारे में जानकारी का अभाव है, तो वे वैज्ञानिक ज्ञान की तुलना में अटकलों में अधिक योगदान देंगे।
उच्च-गुणवत्ता वाला डेटा हजारों महान भाषा मॉडलों के बराबर है। पूर्ण भौतिक संदर्भ वाली एक छवि बिना किसी पुष्टि के एक हजार शब्दों से अधिक हो जाती है। यह आधार असामान्य घटनाओं के साथ-साथ किसी भी कठोर वैज्ञानिक जांच पर काम करने के लिए मार्गदर्शन करता है। कम्प्यूटेशनल परिष्कार उपयुक्त उपकरणीकरण का विकल्प नहीं है और न ही यह जानबूझकर खराब डेटा कैप्चर करने की भरपाई करता है।