News (TE)

క్లౌడ్‌ఫ్లేర్‌లో గ్లోబల్ వైఫల్యం ఆవిరి సేవలకు అంతరాయం కలిగిస్తుంది మరియు అనేక దేశాల్లోని ఆటగాళ్లను నిరాశపరిచింది

Cloudflare
Cloudflare - T. Schneider/ shutterstock.com

కంటెంట్ పంపిణీ వ్యవస్థలలో తీవ్రమైన అంతరాయం ఫిబ్రవరి 20 మధ్యాహ్నం ఇంటర్నెట్ ఇన్‌ఫ్రాస్ట్రక్చర్‌ను తాకింది, ప్రపంచ స్థాయిలో ఆవిరి ప్లాట్‌ఫారమ్‌కు ప్రాప్యతను నిరోధించింది. ఈ సంఘటన ఆస్టిన్ సమయానికి మధ్యాహ్నం 1:38 గంటలకు ప్రారంభమైంది మరియు వారి గేమ్ లైబ్రరీలు మరియు ఆన్‌లైన్ సేవలను యాక్సెస్ చేయలేకపోయిన వినియోగదారుల నుండి భారీ సంఖ్యలో ఫిర్యాదులు వచ్చాయి. క్లౌడ్‌ఫ్లేర్ సర్వర్‌లలో వైఫల్యాల కారణంగా సమస్య గుర్తించబడింది, ఇది పెద్ద పోర్టల్‌ల ఆపరేషన్ మరియు భద్రతకు అవసరమైన నెట్‌వర్క్, మిలియన్ల మంది వ్యక్తుల కనెక్టివిటీని ప్రభావితం చేసే చైన్ రియాక్షన్‌ను ప్రేరేపించింది.

రియల్-టైమ్ మానిటరింగ్ డేటా ఈవెంట్ యొక్క పరిమాణాన్ని హైలైట్ చేసింది, సర్వీస్ అంతరాయాలను ట్రాక్ చేయడంలో ప్రత్యేకించబడిన వెబ్‌సైట్‌లో గరిష్టంగా 431,000 పేజీ వీక్షణలను రికార్డ్ చేసింది, అన్నీ కేవలం ఒక గంట వ్యవధిలో. వైఫల్యం నిర్దిష్ట ప్రాంతానికి పరిమితం కాలేదు, అనేక ఖండాల్లో త్వరగా వ్యాపించింది మరియు డిజిటల్ ఎంటర్‌టైన్‌మెంట్ సేవలు కంటెంట్ డెలివరీ నెట్‌వర్క్‌లు (CDNలు) మరియు పంపిణీ చేయబడిన DNS సిస్టమ్‌లపై ఉన్న క్లిష్టమైన ఆధారపడటాన్ని బహిర్గతం చేసింది.

Steam

క్లౌడ్‌ఫ్లేర్ అస్థిరత యొక్క మూలాన్ని గుర్తించడానికి పనిచేసింది, దాని మౌలిక సదుపాయాలలో కనెక్టివిటీ లోపాల ఉనికిని బహిరంగంగా అంగీకరిస్తుంది. సాంకేతిక నిపుణులు 1.1.1.1 సర్వీస్ హోమ్ పేజీలో ఎర్రర్ రేట్లలో గణనీయమైన పెరుగుదలను గమనించారు, అలాగే బోట్ నిర్వహణ మరియు వర్కర్స్ AI సేవలో సంక్లిష్టతలను గమనించారు. నెవార్క్ డేటా సెంటర్ (EWR) ద్వారా ప్రాసెస్ చేయబడిన HTTP అభ్యర్థనలలో అధిక జాప్యం గుర్తించబడిన మరొక క్లిష్టమైన అంశం, ఇది తుది వినియోగదారులు గ్రహించిన మందగింపు మరియు ప్రాప్యతకు నిర్ణయాత్మకంగా దోహదపడింది.

సాంకేతిక అంతరాయ నిర్ధారణ

ఆధునిక ఇంటర్నెట్ నిర్మాణం క్లౌడ్‌ఫ్లేర్ వంటి సేవలపై ఆధారపడి ఉంటుంది, ఇది మూలం సర్వర్లు మరియు వినియోగదారుల మధ్య కీలకమైన మధ్యవర్తులుగా పనిచేస్తుంది, DDoS దాడులు మరియు ట్రాఫిక్ ఆప్టిమైజేషన్ నుండి రక్షణను అందిస్తుంది. ఈ మధ్య పొర విఫలమైనప్పుడు, గేమింగ్ కంపెనీ సర్వర్‌లు సాధారణంగా పనిచేస్తున్నప్పటికీ, తుది సేవకు యాక్సెస్ కత్తిరించబడుతుంది. నెట్‌వర్క్ యొక్క నిర్దిష్ట నోడ్‌లలో ఉన్న సమస్యలు క్యాస్కేడ్ ప్రభావాన్ని సృష్టించినప్పుడు ఈ పరస్పర ఆధారపడటం యొక్క సంక్లిష్టత స్పష్టమైంది.

సంఘటన సమయంలో సేకరించిన గణాంకాలు, వినియోగదారులు ఎదుర్కొంటున్న చాలా ఇబ్బందులు, దాదాపు 46%, సర్వర్‌కు ప్రత్యక్ష కనెక్షన్‌కు సంబంధించినవి అని సూచిస్తున్నాయి. డొమైన్ నేమ్ సిస్టమ్ (DNS)లోని సమస్యలు 29% సంఘటనలను సూచిస్తాయి, అయితే అప్లికేషన్ ప్రోగ్రామింగ్ ఇంటర్‌ఫేస్ (API)లో వైఫల్యాలు 18%కి అనుగుణంగా ఉన్నాయి. ఈ సంఖ్యలు వైఫల్యం నెట్‌వర్క్ ఆపరేషన్ యొక్క బహుళ స్తంభాలను ప్రభావితం చేసిందని, అడ్రస్ రిజల్యూషన్ మరియు సమర్థవంతమైన డేటా డెలివరీ రెండింటినీ రాజీ చేసిందని నిరూపిస్తున్నాయి.

క్లౌడ్‌ఫ్లేర్ యొక్క ఇన్‌ఫ్రాస్ట్రక్చర్ అధిక రిడెండెన్సీ కోసం రూపొందించబడినప్పటికీ, వివిధ సర్వీస్ వెక్టర్‌లలోని లోపాల ఏకరూపత ట్రాఫిక్‌ని ఆటోమేటిక్‌గా రీరూట్ చేయడం కష్టతరం చేసింది. లేటెన్సీ లేదా వినియోగదారు అభ్యర్థన మరియు సర్వర్ ప్రతిస్పందన మధ్య ప్రతిస్పందన సమయం, ఆన్‌లైన్ గేమ్‌లు మరియు ప్లాట్‌ఫారమ్ స్టోర్‌లో డిజిటల్ లావాదేవీలకు అవసరమైన రియల్ టైమ్ డేటా కమ్యూనికేషన్‌ను అసాధ్యం చేసే స్థాయిలకు పెరిగింది.

సిస్టమ్ స్థితిగతులలో విభేదం

అస్థిరత సమయంలో, ప్లేయర్ అవగాహన మరియు స్టీమ్ నుండి అధికారిక స్థితి నివేదికల మధ్య గుర్తించదగిన వ్యత్యాసం ఉంది. మిలియన్ల మంది వినియోగదారులు లాగిన్ లేదా గేమ్‌లను కొనుగోలు చేయలేకపోయినప్పటికీ, వాల్వ్ యొక్క పర్యవేక్షణ డాష్‌బోర్డ్‌లు ఆవిరి స్టోర్, సంఘం మరియు వెబ్ API సాధారణంగా పనిచేస్తున్నట్లు సూచించాయి. ప్లాట్‌ఫారమ్ యొక్క అంతర్గత సిస్టమ్‌లు క్రియాత్మకంగా ఉండవచ్చు, కానీ వినియోగదారుని వారి వద్దకు తీసుకెళ్లే “రహదారి” – కంటెంట్ డెలివరీ నెట్‌వర్క్ – బ్లాక్ చేయబడినందున ఈ పరిస్థితి ఏర్పడుతుంది.

అయినప్పటికీ, అన్ని ఉపవ్యవస్థలు క్షేమంగా ఉద్భవించలేదు. కౌంటర్-స్ట్రైక్ ప్లేయర్ ఇన్వెంటరీలు గణనీయమైన జాప్యాలను ఎదుర్కొన్నాయి, వర్చువల్ ఐటెమ్‌ల వీక్షణ మరియు నిర్వహణను నిరోధించాయి. ఈ రకమైన వైఫల్యం గేమ్ యొక్క ఆర్థిక వ్యవస్థ మరియు వినియోగదారు అనుభవాన్ని నేరుగా ప్రభావితం చేస్తుంది, లావాదేవీలను నిరోధించడం మరియు మ్యాచ్‌ల సమయంలో స్కిన్‌లు మరియు పరికరాల వినియోగాన్ని నిరోధించడం, ఇది వ్యూహాత్మక షూటర్ సంఘంలో నిర్దిష్ట ఫిర్యాదులను సృష్టించింది.

కనెక్షన్ మేనేజర్‌లు (CMలు), ఆటగాళ్లను సముచితమైన సర్వర్‌లకు మళ్లించే బాధ్యత, 93.7% లభ్యత రేటును కలిగి ఉంది. ఇది అధిక సంఖ్యలో కనిపిస్తున్నప్పటికీ, లక్షలాది మంది ఏకకాల వినియోగదారుల స్థాయిలో, మిగిలిన 6.3% వందల వేల మంది వ్యక్తులను డిస్‌కనెక్ట్ చేయగల వైఫల్యాన్ని సూచిస్తుంది. ఈ మిగిలిన నోడ్‌లపై ఓవర్‌లోడ్, క్లౌడ్‌ఫ్లేర్ ద్వారా రూట్ చేయలేకపోవడం, వినియోగదారులు అనుభవించే “బ్లాక్‌అవుట్” దృశ్యాన్ని సృష్టించింది.

అంతర్జాతీయ పరిస్థితిని పర్యవేక్షిస్తోంది

లోపాల యొక్క భౌగోళిక పంపిణీ భిన్నమైన దృష్టాంతాన్ని వెల్లడించింది. ఐరోపాలో, ఆమ్‌స్టర్‌డామ్ మరియు లండన్ వంటి నగరాలు తమ కనెక్షన్ మేనేజర్‌లను స్థిరమైన స్థితిలో ఉంచగలిగాయి, అయితే ఫ్రాంక్‌ఫర్ట్, స్టాక్‌హోమ్ మరియు వియన్నా “హై లోడ్” అని నివేదించాయి, నెట్‌వర్క్ వైఫల్యాలను భర్తీ చేయడానికి తమ సర్వర్లు సామర్థ్యంతో పనిచేస్తున్నాయని సంకేతాలు ఇచ్చాయి. హెల్సింకి ఒక మిశ్రమ చిత్రాన్ని అందించింది, సాధారణ కనెక్షన్ కోసం డేటా అందుబాటులో లేదు, కానీ నిర్దిష్ట కౌంటర్-స్ట్రైక్ సేవల్లో స్థిరత్వం.

అమెరికన్ ఖండంలో, మౌలిక సదుపాయాలు ఎక్కువ సాపేక్ష స్థితిస్థాపకతను ప్రదర్శించాయి. అట్లాంటా, చికాగో, డల్లాస్, లాస్ ఏంజిల్స్ మరియు సీటెల్‌తో సహా యునైటెడ్ స్టేట్స్‌లోని పెద్ద డేటా సెంటర్‌లు తక్కువ లేదా సాధారణ లోడ్‌లో కార్యకలాపాలను నిర్వహించాయి. దక్షిణ అమెరికాలో, సావో పాలో, బ్యూనస్ ఎయిర్స్, లిమా మరియు శాంటియాగోలోని కనెక్షన్ పాయింట్‌లు కూడా కార్యాచరణ స్థితిని నమోదు చేశాయి, ఈ ప్రాంతాలలో ట్రాఫిక్ ప్రత్యామ్నాయ మార్గాల ద్వారా మళ్లించబడి ఉండవచ్చు లేదా క్లౌడ్‌ఫ్లేర్ వైఫల్యం స్థానిక నోడ్‌లలో ఆ నిర్దిష్ట సమయంలో తక్కువ సంభావ్యతను కలిగి ఉందని సూచిస్తుంది.

మరోవైపు, ఆసియా గణనీయమైన ఇబ్బందులను ఎదుర్కొంది. హాంకాంగ్‌ను “అధిక భారం”గా వర్గీకరించారు, ఇది సంక్షోభ సమయంలో అందుబాటులో ఉన్న ప్రాసెసింగ్ సామర్థ్యాన్ని మించి డిమాండ్ ఉందని సూచిస్తుంది. దుబాయ్ మరియు సింగపూర్‌లు కూడా అధిక భారాన్ని నివేదించాయి. చైనాలో, బీజింగ్ మరియు గ్వాంగ్‌డాంగ్ వంటి ముఖ్యమైన కేంద్రాలు కనెక్షన్ మేనేజర్‌ల కోసం డేటా లభ్యతను చూపించాయి, ప్రపంచంలోని అతిపెద్ద ప్లేయర్ బేస్‌లలో ఒకదానికి యాక్సెస్‌లో తీవ్రమైన అంతరాయాన్ని సూచిస్తున్నాయి.

పంపిణీ నెట్‌వర్క్‌లలో దుర్బలత్వం

ఫిబ్రవరి 20 నాటి సంఘటన మరొక ఇంటర్నెట్ ఇన్‌ఫ్రాస్ట్రక్చర్ దిగ్గజం అకామైలో అస్థిరత నివేదికలతో సమానంగా ఉంది. క్లౌడ్‌ఫ్లేర్ అంతరాయానికి ధృవీకరించబడిన ప్రత్యక్ష లింక్ లేనప్పటికీ, కంపెనీ తన సర్టిఫికేట్ ప్రొవిజనింగ్ సిస్టమ్‌లో పునరావృత వైఫల్యాలను నివేదించింది. ప్రపంచంలోని రెండు అతిపెద్ద CDN ప్రొవైడర్లలో ఏకకాలంలో సంభవించే సమస్యలు గ్లోబల్ కంప్యూటర్ నెట్‌వర్క్ యొక్క దైహిక దుర్బలత్వం గురించి హెచ్చరికను లేవనెత్తుతాయి.

అంతిమ వినియోగదారునికి, ఒప్పందం కుదుర్చుకున్న సేవను ఉపయోగించడం అసంభవం కారణంగా ఏ ప్రొవైడర్ విఫలమవుతున్నారనేది అసంబద్ధం. ఫోరమ్‌లు మరియు సోషల్ మీడియాను ఫ్రస్ట్రేషన్ స్వాధీనం చేసుకుంది, ఇక్కడ ఆటగాళ్ళు పోటీ మ్యాచ్‌లకు ఆకస్మిక అంతరాయాన్ని మరియు గేమ్‌లలో పురోగతిని కోల్పోయారని నివేదించారు. ఆధునిక గేమింగ్ యొక్క “ఎల్లప్పుడూ ఆన్‌లైన్” స్వభావం ఈ అంతరాయాలను ప్రత్యేకంగా ప్లాట్‌ఫారమ్‌ల కీర్తిని దెబ్బతీస్తుంది.

సంఘటన యొక్క ప్రతిరూపాలను నిరోధించడానికి నెట్‌వర్క్ ఇంజనీరింగ్ బృందాలు సిస్టమ్‌ల స్థిరత్వాన్ని పర్యవేక్షిస్తూనే ఉన్నాయి. ప్రారంభ ప్రభావాన్ని తగ్గించడంలో రిడెండెన్సీ ఎలా విఫలమైంది మరియు DNS లేదా CDN సేవలో వైఫల్యం భవిష్యత్తులో గ్లోబల్ ఎంటర్‌టైన్‌మెంట్ ప్లాట్‌ఫారమ్‌లకు యాక్సెస్‌ను పూర్తిగా స్తంభింపజేయకుండా ఉండేలా ఏ చర్యలు అమలు చేయవచ్చో అర్థం చేసుకోవడానికి పోస్ట్-ఫెయిల్యూర్ విశ్లేషణ కీలకం.

To Top