Atlassian กู้ระบบได้ครบแล้ว เบื้องต้นสื่อสารพลาดจะลบแอปเดียวแต่เผลอลบทั้งไซต์

by lew
19 April 2022 - 12:02

Atlassian ประกาศกู้ระบบได้ครบถ้วนในวันนี้ สิ้นสุดปัญหายาวนาน 2 สัปดาห์หลังจากลูกค้าบางส่วนไม่สามารถเข้าใช้ระบบได้ตั้งแต่วันที่ 5 เมษายนที่ผ่านมา

ทางบริษัทระบุว่ากำลังเตรียมรายงานหลังเกิดเหตุต่อไป แต่เบื้องต้นสาเหตุความผิดพลาดมาจากสองปัญหาซ้อนทับกัน ได้แก่

  • การสื่อสารผิดพลาด: ทาง Atlassian ต้องการลบแอปพลิเคชั่น Insight – Asset Management ทิ้งเนื่องจากรวมเข้าเป็นส่วนหนึ่งของ Jira Service Management เรียบร้อยแล้ว แต่ปรากฎว่าระหว่างการสื่อสารข้ามทีม ทีมงานส่งหมายเลขประจำไซต์คลาวด์ไปให้ทีมที่รันสคริปต์ลบข้อมูล
  • รันสคริปต์ผิดโหมด: สคริปต์สั่งลบข้อมูลมีทั้งการสั่ง mark for deletion หรือการเตรียมลบข้อมูลซึ่งกู้ข้อมูลกลับได้ง่าย และการลบข้อมูลถาวรที่กู้กลับได้ยาก ทีมรันสคริปต์รันผิดโหมดทำให้ข้อมูลถูกลบไปทันที

แม้ว่าข้อมูลลูกค้าทั้งหมดจะถูกสำรองไว้ และมีการทดสอบข้อมูลสำรองเรื่อยๆ แต่ทีมงานก็ไม่เคยเตรียมการสำหรับการกู้ข้อมูลสำหรับลูกค้ามากถึง 400 องค์กรเช่นนี้ ทำให้ทีมงานตัดสินใจค่อยๆ กู้ระบบกลับมาทีละ 60 องค์กรจนกินเวลายาวนาน

ที่มา - Atlassian

Blognone Jobs Premium