แอดมินเว็บโซเชียล Firefish คอนฟิก Gitops ผิดลบข้อมูลทั้ง namespace, แถมคอนฟิก backup พลาดกู้ข้อมูลไม่ได้

by lew
28 August 2023 - 06:41

Lily Cohen ผู้ดูแลระบบของ Firefish Social เว็บเครือข่ายสังคมออนไลน์ รายงานถึงเหตุการณ์ข้อมูลหาย ว่าเป็นอุบัติเหตุระหว่างการจัดไฟล์คอนฟิกใหม่ ทำให้ข้อมูลสูญหาย แถมพบว่าระบบสำรองข้อมูลที่คอนฟิกเอาไว้ทำงานผิดพลาดจนข้อมูลไม่ได้ backup ไว้จริง

ปัญหาเริ่มต้นจากการย้ายไฟล์ yaml จัดโครงสร้างใหม่ แต่ปรากฎว่า yaml บางส่วนถูกจัดไปอยู่ในโฟลเดอร์ที่ ArgoCD มองไม่เห็น ส่งผลให้ ArgoCD ลบข้อมูลใน namespace ที่ถูกย้ายไฟล์คอนฟิกออกไปทั้งหมดทันที รวมถึงข้อมูลผู้ใช้ทั้งหมดที่อยู่ใน Persistent Volume Claims (PVC)

ปัญหาร้ายแรงขึ้นเมื่อ Velero ที่คอนฟิกสำหรับสำรองข้อมูลทุก 6 ชั่วโมงนั้น กลับไม่ได้คอนฟิกให้สำรองข้อมูลใน PVC ไว้ด้วย ผลกระทบครั้งนี้ทำให้เว็บสื่อสังคมออนไลน์ในความดูแลของ Firefish สามเว็บ ได้แก่ firefish.lgbt, musician.social, และ outdoors.lgbt สูญหายไปทั้งหมด

ที่มา - Firefish

ภาพโดย JasonPinaster

Blognone Jobs Premium