เมื่อวันพฤหัสบดีที่ 7 พฤษภาคม เกิดเหตุขัดข้องในหน่วยคลาวด์ (AWS) ของ Amazon ในโซนศูนย์ข้อมูลทางตอนเหนือของรัฐเวอร์จิเนีย เหตุการณ์ดังกล่าวส่งผลกระทบทันทีต่อแพลตฟอร์มทางการเงินที่สำคัญทั่วโลก บริษัทต่างๆ รวมถึง CME Group ซึ่งเป็นหนึ่งในตลาดอนุพันธ์ที่ใหญ่ที่สุดในโลก และ Coinbase ซึ่งเป็นบริษัทแลกเปลี่ยนสกุลเงินดิจิทัล รายงานปัญหาเกี่ยวกับการดำเนินการซื้อขายของตนเนื่องจากข้อบกพร่อง
Coinbase ระบุถึงปัญหาบนแพลตฟอร์มอย่างรวดเร็วเนื่องจากการหยุดทำงานของ AWS ซึ่งบ่งชี้ถึงการพึ่งพาที่สำคัญในโครงสร้างพื้นฐาน ในทางกลับกัน CME Group เตือนผู้ใช้เกี่ยวกับการขาดการเชื่อมต่ออันเป็นผลมาจากการบำรุงรักษาที่จำเป็น โดยไม่ได้ระบุลิงก์โดยตรงไปยังความล้มเหลวของ Amazon ในขั้นต้น แม้ว่าปัญหาจะเกิดขึ้นพร้อมกันก็ตาม
การหยุดทำงานส่งผลกระทบต่อบริการทางการเงินและการค้า
เหตุการณ์ที่ศูนย์ข้อมูล AWS ทำให้เกิดความไม่เสถียรในบริการออนไลน์หลายอย่าง โดยส่งผลกระทบอย่างมีนัยสำคัญต่อภาคการเงิน ผู้ใช้ Coinbase เผชิญกับความเสื่อมโทรมในประสิทธิภาพการดำเนินงานของพวกเขา แม้ว่าบริษัทจะมั่นใจได้ว่าเงินทุนของลูกค้ายังคงปลอดภัยในระหว่างการหยุดทำงาน แพลตฟอร์มสกุลเงินดิจิทัลทำงานอย่างหนักเพื่อเปิดใช้งานการซื้อขายอีกครั้งโดยเร็วที่สุด
ในกรณีของกลุ่ม CME บริษัทได้เสร็จสิ้นงานบำรุงรักษาที่จำเป็นในระบบของตนแล้ว ทำให้ผู้ใช้สามารถเข้าถึงแพลตฟอร์มการซื้อขาย CME Direct ได้อีกครั้ง อย่างไรก็ตาม องค์กรไม่ได้ระบุรายละเอียดถึงสาเหตุของปัญหาด้านเทคนิคและความล่าช้า การเชื่อมต่อระหว่างกันของเทคโนโลยีระดับโลกทำให้การดำเนินงานที่สำคัญหลายอย่างประสบความล้มเหลวในโครงสร้างพื้นฐานขั้นพื้นฐาน
สาเหตุของเหตุการณ์และมาตรการการกู้คืนของ AWS
Amazon Web Services ระบุว่าการหยุดทำงานมีสาเหตุมาจากอุณหภูมิที่เพิ่มขึ้นภายในศูนย์ข้อมูลที่ได้รับผลกระทบแห่งเดียว ช่างเทคนิคของบริษัททำงานเพื่อฟื้นฟูความสามารถของระบบทำความเย็น สัญญาณเริ่มต้นของการฟื้นตัวถูกสังเกตหลังจากใช้วิธีแก้ปัญหาเพื่อลดความร้อนที่มากเกินไป
แพลตฟอร์มการประมวลผลแบบคลาวด์เปลี่ยนเส้นทางการรับส่งข้อมูลสำหรับบริการต่างๆ เป็นส่วนหนึ่งของความพยายามในการทำให้สถานการณ์เป็นปกติ การดำเนินการนี้ย้ายกระแสข้อมูลออกจาก Availability Zone ที่ได้รับผลกระทบ “Availability Zone” คือศูนย์ข้อมูลทางกายภาพตั้งแต่หนึ่งแห่งขึ้นไปที่เชื่อมต่อและได้รับการออกแบบให้ทำงานอัตโนมัติภายในภูมิภาค AWS
- ความพยายามในการฟื้นฟูรวมถึง:
- การเปิดใช้งานกำลังการผลิตเพิ่มเติมในระบบทำความเย็น
- การเปลี่ยนเส้นทางการรับส่งข้อมูลไปยังโซนความพร้อมใช้งานทางเลือก
- การตรวจสอบสภาพแวดล้อมในศูนย์ข้อมูลอย่างต่อเนื่อง
- สื่อสารเชิงรุกกับลูกค้าที่ได้รับผลกระทบเกี่ยวกับสถานะการกู้คืน
ผลที่ตามมาสำหรับผู้ใช้และการดำเนินการทางการตลาด
การหยุดทำงานของ AWS ในรัฐเวอร์จิเนียเน้นให้เห็นถึงช่องโหว่ของบริการดิจิทัลที่ต้องอาศัยโครงสร้างพื้นฐานระบบคลาวด์เป็นอย่างมาก สำหรับ Coinbase การรับรองความปลอดภัยของเงินทุนของลูกค้าถือเป็นสิ่งสำคัญอันดับแรก บริษัทได้แสดงให้เห็นถึงความมุ่งมั่นที่จะกลับมาให้บริการการซื้อขายต่อโดยทันที การหยุดทำงานที่ยืดเยื้อเป็นเวลานานอาจมีผลกระทบทางการเงินอย่างมากต่อผู้ใช้และการดำเนินงานของการแลกเปลี่ยนเอง
ตลาดอนุพันธ์ของ CME Group ก็ประสบกับช่วงเวลาที่ไม่มีเสถียรภาพเช่นกัน แม้ว่าบริษัทจะไม่ได้รับการยืนยันการเชื่อมโยงโดยตรงไปยัง AWS ในทันทีก็ตาม ความจำเป็นในการดำเนินการบำรุงรักษาที่จำเป็นท่ามกลางปัญหาทางเทคนิคเหล่านี้ เน้นย้ำถึงความกดดันที่ผู้ประกอบการตลาดรายใหญ่ต้องเผชิญในการรักษาความต่อเนื่องของการบริการ เหตุการณ์เหล่านี้แสดงให้เห็นถึงความเปราะบางของระบบสมัยใหม่และความสำคัญของความซ้ำซ้อน
ประวัติการขัดข้องครั้งใหญ่ในโครงสร้างพื้นฐานคลาวด์
นี่ไม่ใช่ครั้งแรกที่ Amazon Web Services ประสบปัญหาขัดข้องครั้งใหญ่ ในเดือนตุลาคมปีที่แล้ว กระแสไฟดับทั่วโลกทำให้เกิดปัญหากับเว็บไซต์หลายพันแห่ง รวมถึงแอปยอดนิยมอย่าง Snapchat และ Reddit นั่นถือเป็นการขัดข้องทางอินเทอร์เน็ตครั้งใหญ่ที่สุดนับตั้งแต่เหตุการณ์ CrowdStrike ทำงานผิดปกติในปี 2024 ซึ่งทำให้ระบบเทคโนโลยีในโรงพยาบาล ธนาคาร และสนามบินเป็นอัมพาต โดยเน้นย้ำถึงความเปราะบางของเทคโนโลยีที่เชื่อมต่อถึงกัน
ในเดือนหลังจากการหยุดทำงานของ AWS ตลาดฟิวเจอร์สทั่วโลกได้รับผลกระทบเป็นเวลาหลายชั่วโมง CME Group ประสบปัญหาไฟฟ้าดับยาวนานที่สุดในรอบหลายปี โดยต้องระงับการซื้อขายหุ้น พันธบัตร สินค้าโภคภัณฑ์ และสกุลเงิน ในขณะนั้น CME ถือว่าความล้มเหลวเกิดจากการระบายความร้อนล้มเหลวในศูนย์ข้อมูลที่ดำเนินการโดย CyrusOne เหตุการณ์ที่เกิดซ้ำเหล่านี้เน้นย้ำถึงความซับซ้อนและความท้าทายในการรักษาโครงสร้างพื้นฐานดิจิทัลระดับโลก

