การล่มของ Skype เมื่อหลายวันก่อนสร้างความวิตกกังวลให้กับ Skype ได้เป็นวงกว้างว่าเกิดอะไรขึ้นกับเครือข่ายโทรศัพท์ผ่านอินเทอร์เน็ตที่คนใช้งานมากที่สุดในโลกแห่งหนึ่งนี้ ทาง CIO ของ Skype คือ Lars Rabbe ก็ออกมาชี้แจงเรื่องที่เกิดขึ้น
ความผิดพลาดของเครือข่าย Skype เกิดขึ้นจากสองสาเหตุต่อเนื่องกัน คือคลัสเตอร์ชุดหนึ่งที่มีไว้รองรับข้อความแชตแบบออฟต์ไลน์เกิดไม่สามารถรองรับปริมาณข้อความทั้งหมดได้ทัน ทำให้ข้อความจำนวนมากส่งออกไปช้ากว่าที่ควรจะเป็น ความผิดพลาดนี้ไปกระตุ้นบั๊กใน Skype รุ่น 5.0.0.152 ที่ไม่สามารถรองรับข้อความที่มาช้าเกินไปได้ เกิดการแครชไปทั้งหมด
ผู้ใช้งาน Skype รุ่น 5.0.0.152 นั้นมีจำนวนคิดเป็น 25-50% ของผู้ใช้งานทั้งหมด โดยส่วนมากได้รับการอัพเดตให้เป็นรุ่น 5.0.0.156 ไปแล้ว แต่การที่ผู้ใช้ 20% หายไปจากระบบของ Skype นั้นส่งผลกระทบเป็นวงกว้างกว่านั้น เนื่องจาก Skpye อาศัยผู้ใช้ในระบบช่วยส่งต่อข้อมูลให้กับผู้ใช้คนอื่นๆ (เนื่องจากกระบวนการเต็มๆ เป็นความลับไม่มีเอกสารเผยแพร่ถ้าสนใจอาจอ่านเอกสารงานวิจัยที่ศึกษากระบวนการเลือกเครื่องเพื่อส่งข้อมูลต่อได้ (PDF) และบล็อกของ Disruptive Telephony) เครื่องส่งต่อข้อมูลที่ล่มไปเหล่านี้ทำให้โหนดอื่นๆ ต้องรับทราฟฟิกเกินขนาดและพากันล่มตามไปในเวลาต่อมา
โครงสร้างของ Skype ที่อาศัยเครื่องของผู้ใช้เองช่วยกันส่งต่อข้อมูลเสียงเช่นนี้ ทำให้ระบบยากแก่การกู้คืนเนื่องจาก supernode ที่ฟื้นขึ้นมาจะต้องแบกรับทราฟฟิกจำนวนมากอย่างรวดเร็วจนกระทั่งแครชไป ทาง Skype เองต้องเข้ามากู้ระบบคืนด้วยการวาง mega-supernode หลายพันเครื่องเพื่อรองรับทราฟฟิกด้วยตัวเองแทนที่จะพึ่งเครื่องของผู้ใช้เพียงอย่างเดียว จนกระทั่งระบบค่อยๆ คืนตัวขึ้นมา
นี่อาจจะเป็นอีกบั๊กที่ร้ายแรงที่สุดในปี 2010 นี้
ที่มา - Skype