ไหนอาการมันเป็นยังไง? เฟสบุ๊คชี้แจงสาเหตุล่ม-ทำไมแก้นาน
682 VIEWS
October 6, 2021
news
ไหนอาการมันเป็นยังไง? เฟสบุ๊คชี้แจงสาเหตุล่ม-ทำไมแก้นาน
หลังจากการล่ม หรือหยุดให้บริการครั้งใหญ่ของ Facebook พวกเขาก็ได้เผยแพร่บล็อกโพสต์ที่มีรายละเอียดว่าเกิดอะไรขึ้น
อ้างอิงจาก Santosh Janardhan รองประธานฝ่ายโครงสร้างพื้นฐานของบริษัท การหยุดทำงานเริ่มต้น ด้วยระบบการเมนเทนแนนซ์ที่ควรดำเนินการตามปกติ แต่ถึงจุดหนึ่ง มีการออกคำสั่งประเมินความพร้อมใช้งานของเครือข่ายแกนหลักที่เชื่อมต่อสิ่งอำนวยความสะดวกของคอมพิวเตอร์ที่แตกต่างกันของ Facebook ทั้งหมด ซึ่งคำสั่งดังกล่าวกลับทำให้ระบบเหล่านั้นล่มไปโดยไม่ได้ตั้งใจ Janardhan กล่าวว่าข้อบกพร่องในระบบตรวจสอบภายในของบริษัทไม่ได้มีการป้องกันการคำสั่งประเภทดังกล่าวไว้
ปัญหานั้นทำให้เกิดปัญหารองซึ่งทำให้การหยุดทำงานขึ้น เมื่อเซิร์ฟเวอร์ DNS ของ Facebook ไม่สามารถเชื่อมต่อกับศูนย์ข้อมูลหลักของบริษัทได้ พวกเขาจึงหยุดข้อมูลการกำหนดเส้นทางของโปรโตคอลเกตเวย์ (BGP) ที่อุปกรณ์ทุกเครื่องบนอินเทอร์เน็ตที่จำเป็นต้องเชื่อมต่อกับเซิร์ฟเวอร์
"ผลลัพธ์ คือเซิร์ฟเวอร์ DNS ของเราไม่สามารถเข้าถึงได้แม้ว่าจะยังทำงานอยู่" Janardhan กล่าว “สิ่งนี้ทำให้อินเทอร์เน็ตที่เหลือไม่สามารถค้นหาเซิร์ฟเวอร์ของเราได้”
ตามที่เราศึกษาปัญหาไปเมื่อวานนี้ สิ่งที่ทำให้สถานการณ์ที่ยากลำบากยิ่งแย่ลงไปอีกก็คือการหยุดทำงานทำให้วิศวกรของ Facebook เชื่อมต่อกับเซิร์ฟเวอร์ที่จำเป็นต้องแก้ไขไม่ได้ นอกจากนี้ การสูญเสียฟังก์ชันการทำงานของ DNS หมายความว่าพวกเขาไม่สามารถใช้เครื่องมือภายในหลายอย่างที่ต้องพึ่งพาเพื่อตรวจสอบและแก้ไขปัญหาเครือข่ายในสถานการณ์ปกติได้ นั่นหมายความว่าบริษัทต้องส่งบุคลากรไปยังศูนย์ข้อมูล
Janardhan กล่าวว่า "อุปกรณ์เหล่านี้เข้าถึงได้ยาก และเมื่อคุณเข้าไปข้างในแล้ว ฮาร์ดแวร์และเราเตอร์ได้รับการออกแบบให้ปรับเปลี่ยนได้ยาก แม้ว่าคุณจะมีการเข้าถึงทางกายภาพก็ตาม"
Janardhan ยังกล่าวอีกว่า เมื่อสามารถกู้คืนเครือข่ายแกนหลักได้ Facebook ก็ระมัดระวังที่จะไม่เปิดใช้งานทุกอย่างในคราวเดียว เนื่องจากความต้องการด้านพลังงานและการประมวลผลที่พุ่งสูงขึ้นอาจทำให้เกิดปัญหามากขึ้น "ความล้มเหลวทุกอย่างเป็นโอกาสในการเรียนรู้และพัฒนาให้ดีขึ้น และยังมีสิ่งใหม่อีกมากให้เราได้เรียนรู้จากสิ่งนี้" “หลังจากทุกปัญหา ทั้งเล็กและใหญ่ เราทำการตรวจสอบอย่างละเอียดเพื่อทำความเข้าใจว่าเราจะทำให้ระบบของเรามีความยืดหยุ่นมากขึ้นได้อย่างไร ซึ่งกระบวนการนั้นกำลังอยู่ในขั้นตอนดำเนินงานอยู่”
Niponpan Sasidhorn