20 फेब्रुवारी रोजी दुपारी सामग्री वितरण प्रणालीमधील तीव्र आउटेजमुळे इंटरनेट पायाभूत सुविधांवर परिणाम झाला, ज्यामुळे जागतिक स्तरावर स्टीम प्लॅटफॉर्मवर प्रवेश अवरोधित झाला. ऑस्टिन वेळेनुसार दुपारी 1:38 च्या सुमारास ही घटना सुरू झाली आणि परिणामी त्यांच्या गेम लायब्ररी आणि ऑनलाइन सेवांमध्ये प्रवेश करू न शकलेल्या वापरकर्त्यांकडून मोठ्या प्रमाणावर तक्रारी आल्या. क्लाउडफ्लेअर सर्व्हरमधील बिघाडांमुळे ही समस्या आढळून आली, मोठ्या पोर्टलच्या ऑपरेशन आणि सुरक्षिततेसाठी आवश्यक असलेले नेटवर्क, ज्यामुळे लाखो लोकांच्या कनेक्टिव्हिटीवर परिणाम होणारी साखळी प्रतिक्रिया निर्माण झाली.
रिअल-टाइम मॉनिटरिंग डेटाने इव्हेंटची विशालता हायलाइट केली, सेवा आउटेजचा मागोवा घेण्यात विशेष असलेल्या वेबसाइटवर 431,000 पृष्ठ दृश्यांचे शिखर रेकॉर्ड केले, सर्व काही फक्त एका तासाच्या अंतरावर. अपयश एका विशिष्ट प्रदेशापुरते मर्यादित नव्हते, त्वरीत अनेक खंडांमध्ये पसरले आणि डिजिटल मनोरंजन सेवांचे कंटेंट डिलिव्हरी नेटवर्क (CDN) आणि वितरित DNS सिस्टमवर असलेले गंभीर अवलंबित्व उघड झाले.
क्लाउडफ्लेअरने अस्थिरतेचे स्त्रोत ओळखण्यासाठी कार्य केले, सार्वजनिकरित्या त्याच्या पायाभूत सुविधांमध्ये कनेक्टिव्हिटी त्रुटींचे अस्तित्व मान्य केले. तंत्रज्ञांनी 1.1.1.1 सेवा मुख्यपृष्ठावर त्रुटी दरांमध्ये लक्षणीय वाढ पाहिली, तसेच बॉट व्यवस्थापन आणि कामगार AI सेवेतील गुंतागुंत. नेवार्क डेटा सेंटर (EWR) द्वारे प्रक्रिया केलेल्या HTTP विनंत्यांची उच्च विलंबता ही ओळखण्यात आलेला आणखी एक महत्त्वाचा मुद्दा होता, ज्याने अंतिम वापरकर्त्यांद्वारे समजल्या जाणाऱ्या मंदपणा आणि दुर्गमतेमध्ये निर्णायकपणे योगदान दिले.
तांत्रिक व्यत्यय निदान
आधुनिक इंटरनेटचे आर्किटेक्चर क्लाउडफ्लेअर सारख्या सेवांवर अवलंबून आहे, जे मूळ सर्व्हर आणि वापरकर्त्यांमधील महत्त्वपूर्ण मध्यस्थ म्हणून काम करतात, DDoS हल्ल्यांपासून संरक्षण देतात आणि रहदारी ऑप्टिमायझेशन करतात. जेव्हा हा मध्यम स्तर अयशस्वी होतो, तेव्हा गेमिंग कंपनीचे सर्व्हर सामान्यपणे कार्यरत असले तरीही अंतिम सेवेचा प्रवेश बंद केला जातो. जेव्हा नेटवर्कच्या विशिष्ट नोड्समध्ये असलेल्या समस्यांनी कॅस्केड प्रभाव निर्माण केला तेव्हा या परस्परावलंबनाची जटिलता स्पष्ट झाली.
या घटनेदरम्यान गोळा केलेली आकडेवारी दर्शवते की वापरकर्त्यांना आलेल्या बहुतेक अडचणी, सुमारे 46%, सर्व्हरशी थेट कनेक्शनशी संबंधित होत्या. डोमेन नेम सिस्टम (DNS) मधील समस्या 29% घटनांचे प्रतिनिधित्व करतात, तर ऍप्लिकेशन प्रोग्रामिंग इंटरफेस (API) मध्ये अपयश 18% शी संबंधित होते. हे आकडे दाखवतात की अयशस्वी झाल्यामुळे नेटवर्क ऑपरेशनच्या अनेक खांबांवर परिणाम झाला, ॲड्रेस रिझोल्यूशन आणि प्रभावी डेटा वितरण या दोहोंमध्ये तडजोड झाली.
जरी क्लाउडफ्लेअरची पायाभूत सुविधा उच्च रिडंडंसीसाठी डिझाइन केली गेली असली तरी, विविध सेवा वेक्टरमधील त्रुटींच्या संयोगामुळे स्वयंचलितपणे रहदारीचे मार्ग बदलणे कठीण झाले. लेटन्सी, किंवा वापरकर्त्याची विनंती आणि सर्व्हरचा प्रतिसाद यांच्यातील प्रतिसाद वेळ, अशा पातळीवर वाढला ज्यामुळे रिअल-टाइम डेटा कम्युनिकेशन अशक्य झाले, ऑनलाइन गेम आणि प्लॅटफॉर्मच्या स्टोअरमधील डिजिटल व्यवहारांसाठी काहीतरी आवश्यक आहे.
सिस्टम स्थितींमध्ये भिन्नता
अस्थिरतेच्या काळात, स्टीमकडून खेळाडूंची धारणा आणि अधिकृत स्थिती अहवाल यांच्यात लक्षणीय विसंगती होती. लाखो वापरकर्ते लॉग इन करण्यास किंवा गेम खरेदी करण्यास अक्षम असताना, वाल्वच्या मॉनिटरिंग डॅशबोर्डने सूचित केले की स्टीम स्टोअर, समुदाय आणि वेब API सामान्यपणे कार्यरत आहेत. ही परिस्थिती उद्भवते कारण प्लॅटफॉर्मची अंतर्गत प्रणाली कार्यक्षम असू शकते, परंतु वापरकर्त्याला त्यांच्याकडे घेऊन जाणारा “रस्ता” – सामग्री वितरण नेटवर्क – अवरोधित केला होता.
तथापि, सर्व उपप्रणाली सुरक्षितपणे उदयास आल्या नाहीत. काउंटर-स्ट्राइक प्लेअर इन्व्हेंटरीमध्ये लक्षणीय विलंब झाला आहे, ज्यामुळे आभासी आयटम पाहणे आणि व्यवस्थापन करणे प्रतिबंधित होते. या प्रकारचे अपयश थेट गेमच्या अर्थव्यवस्थेवर आणि वापरकर्त्याच्या अनुभवावर परिणाम करते, व्यवहार अवरोधित करते आणि सामन्यांदरम्यान स्किन आणि उपकरणे वापरण्यास प्रतिबंध करते, ज्यामुळे रणनीतिक नेमबाज समुदायामध्ये विशिष्ट तक्रारी निर्माण होतात.
खेळाडूंना योग्य सर्व्हरवर निर्देशित करण्यासाठी जबाबदार असलेले कनेक्शन व्यवस्थापक (CMs) यांचा उपलब्धता दर 93.7% होता. लाखो एकाचवेळी वापरकर्त्यांच्या प्रमाणात ही संख्या जास्त असल्यासारखे वाटत असले तरी, उर्वरित 6.3% शेकडो हजारो लोकांना डिस्कनेक्ट करण्यास सक्षम असलेल्या अपयशाचे प्रतिनिधित्व करतात. या उर्वरित नोड्सवरील ओव्हरलोड, क्लाउडफ्लेअर मार्गे जाण्यास असमर्थतेसह, ग्राहकांनी अनुभवलेली “ब्लॅकआउट” परिस्थिती निर्माण केली.
आंतरराष्ट्रीय परिस्थितीचे निरीक्षण
दोषांच्या भौगोलिक वितरणाने एक विषम परिस्थिती प्रकट केली. युरोपमध्ये, ॲमस्टरडॅम आणि लंडन सारख्या शहरांनी त्यांच्या कनेक्शन व्यवस्थापकांना स्थिर स्थितीत ठेवण्यास व्यवस्थापित केले, तर फ्रँकफर्ट, स्टॉकहोम आणि व्हिएन्ना यांनी “उच्च भार” नोंदवले, जे संकेत देते की नेटवर्क अपयशांची भरपाई करण्याचा प्रयत्न करण्यासाठी त्यांचे सर्व्हर क्षमतेने कार्य करत आहेत. हेलसिंकीने मिश्रित चित्र सादर केले, सामान्य कनेक्शनसाठी डेटा अनुपलब्ध, परंतु विशिष्ट काउंटर-स्ट्राइक सेवांमध्ये स्थिरता.
अमेरिकन खंडावर, पायाभूत सुविधांनी अधिक सापेक्ष लवचिकता दर्शविली. अटलांटा, शिकागो, डॅलस, लॉस एंजेलिस आणि सिएटलसह, युनायटेड स्टेट्समधील मोठ्या डेटा केंद्रांनी कमी किंवा सामान्य लोडवर ऑपरेशन्स चालू ठेवल्या. दक्षिण अमेरिकेत, साओ पाउलो, ब्युनोस आयर्स, लिमा आणि सँटियागो मधील कनेक्शन पॉईंट्सने देखील ऑपरेशनल स्थितीची नोंदणी केली आहे, जे सूचित करते की या प्रदेशांमधील रहदारी कदाचित पर्यायी मार्गांद्वारे मार्गस्थ केली गेली असावी किंवा त्या विशिष्ट वेळी स्थानिक नोड्सवर क्लाउडफ्लेअर अयशस्वी होण्याचे प्रमाण कमी होते.
दुसरीकडे, आशियाला बऱ्याच अडचणींचा सामना करावा लागला. हाँगकाँगचे “ओव्हरबर्डन” म्हणून वर्गीकरण करण्यात आले, हे दर्शविते की संकटाच्या काळात मागणी उपलब्ध प्रक्रिया क्षमतेपेक्षा जास्त होती. दुबई आणि सिंगापूरमध्येही जास्त भार नोंदवला गेला. चीनमध्ये, बीजिंग आणि ग्वांगडोंग सारख्या महत्त्वाच्या केंद्रांनी कनेक्शन व्यवस्थापकांसाठी डेटाची अनुपलब्धता दर्शविली, ज्यामुळे जगातील सर्वात मोठ्या प्लेअर बेससाठी प्रवेशामध्ये तीव्र व्यत्यय आला.
वितरण नेटवर्कमधील असुरक्षा
20 फेब्रुवारीची घटना देखील इंटरनेट इन्फ्रास्ट्रक्चर क्षेत्रातील आणखी एक दिग्गज अकामाई येथे अस्थिरतेच्या अहवालाशी जुळली. क्लाउडफ्लेअर आउटेजशी कोणताही पुष्टी केलेला थेट दुवा नसला तरीही कंपनीने त्याच्या प्रमाणपत्र तरतूदी प्रणालीमध्ये वारंवार होणाऱ्या अपयशाची नोंद केली. जगातील दोन सर्वात मोठ्या CDN प्रदात्यांमध्ये एकाच वेळी समस्या येण्याने जागतिक संगणक नेटवर्कच्या प्रणालीगत नाजूकपणाबद्दल इशारा दिला जातो.
अंतिम ग्राहकासाठी, करार केलेल्या सेवा वापरण्याची अशक्यता लक्षात घेता कोणता प्रदाता अयशस्वी होत आहे यामधील फरक अप्रासंगिक आहे. निराशेने मंच आणि सोशल मीडियाचा ताबा घेतला, जिथे खेळाडूंनी स्पर्धात्मक सामन्यांमध्ये अचानक व्यत्यय आणला आणि खेळांमधील प्रगती गमावली. आधुनिक गेमिंगचे “नेहमी ऑनलाइन” स्वरूप हे आउटेज विशेषतः प्लॅटफॉर्मच्या प्रतिष्ठेला हानिकारक बनवते.
नेटवर्क अभियांत्रिकी कार्यसंघ घटनेच्या प्रतिकृती टाळण्यासाठी सिस्टम स्थिरतेचे परीक्षण करणे सुरू ठेवतात. अयशस्वी झाल्यानंतरचे विश्लेषण हे समजून घेण्यासाठी महत्त्वाचे ठरेल की रिडंडंसी प्रारंभिक प्रभाव कमी करण्यात कशी अयशस्वी झाली आणि DNS किंवा CDN सेवेतील अपयशामुळे भविष्यात जागतिक मनोरंजन प्लॅटफॉर्मवर प्रवेश पूर्णपणे बंद होणार नाही याची खात्री करण्यासाठी कोणते उपाय लागू केले जाऊ शकतात.

