Skype ออกชี้แจงสาเหตุที่เครือข่ายล่ม

by lew
29 December 2010 - 16:53

การล่มของ Skype เมื่อหลายวันก่อนสร้างความวิตกกังวลให้กับ Skype ได้เป็นวงกว้างว่าเกิดอะไรขึ้นกับเครือข่ายโทรศัพท์ผ่านอินเทอร์เน็ตที่คนใช้งานมากที่สุดในโลกแห่งหนึ่งนี้ ทาง CIO ของ Skype คือ Lars Rabbe ก็ออกมาชี้แจงเรื่องที่เกิดขึ้น

ความผิดพลาดของเครือข่าย Skype เกิดขึ้นจากสองสาเหตุต่อเนื่องกัน คือคลัสเตอร์ชุดหนึ่งที่มีไว้รองรับข้อความแชตแบบออฟต์ไลน์เกิดไม่สามารถรองรับปริมาณข้อความทั้งหมดได้ทัน ทำให้ข้อความจำนวนมากส่งออกไปช้ากว่าที่ควรจะเป็น ความผิดพลาดนี้ไปกระตุ้นบั๊กใน Skype รุ่น 5.0.0.152 ที่ไม่สามารถรองรับข้อความที่มาช้าเกินไปได้ เกิดการแครชไปทั้งหมด

ผู้ใช้งาน Skype รุ่น 5.0.0.152 นั้นมีจำนวนคิดเป็น 25-50% ของผู้ใช้งานทั้งหมด โดยส่วนมากได้รับการอัพเดตให้เป็นรุ่น 5.0.0.156 ไปแล้ว แต่การที่ผู้ใช้ 20% หายไปจากระบบของ Skype นั้นส่งผลกระทบเป็นวงกว้างกว่านั้น เนื่องจาก Skpye อาศัยผู้ใช้ในระบบช่วยส่งต่อข้อมูลให้กับผู้ใช้คนอื่นๆ (เนื่องจากกระบวนการเต็มๆ เป็นความลับไม่มีเอกสารเผยแพร่ถ้าสนใจอาจอ่านเอกสารงานวิจัยที่ศึกษากระบวนการเลือกเครื่องเพื่อส่งข้อมูลต่อได้ (PDF) และบล็อกของ Disruptive Telephony) เครื่องส่งต่อข้อมูลที่ล่มไปเหล่านี้ทำให้โหนดอื่นๆ ต้องรับทราฟฟิกเกินขนาดและพากันล่มตามไปในเวลาต่อมา

โครงสร้างของ Skype ที่อาศัยเครื่องของผู้ใช้เองช่วยกันส่งต่อข้อมูลเสียงเช่นนี้ ทำให้ระบบยากแก่การกู้คืนเนื่องจาก supernode ที่ฟื้นขึ้นมาจะต้องแบกรับทราฟฟิกจำนวนมากอย่างรวดเร็วจนกระทั่งแครชไป ทาง Skype เองต้องเข้ามากู้ระบบคืนด้วยการวาง mega-supernode หลายพันเครื่องเพื่อรองรับทราฟฟิกด้วยตัวเองแทนที่จะพึ่งเครื่องของผู้ใช้เพียงอย่างเดียว จนกระทั่งระบบค่อยๆ คืนตัวขึ้นมา

นี่อาจจะเป็นอีกบั๊กที่ร้ายแรงที่สุดในปี 2010 นี้

ที่มา - Skype

Blognone Jobs Premium