สาขาวิทยาศาสตร์ข้อมูล (data science) เป็นสาขาที่ได้รับความนิยมสูงในช่วงหลายปีที่ผ่านมา แต่คนภายนอกอาจจะนึกไม่ออกนักว่ามันใช้ทำอะไรได้บ้าง ล่าสุดสิงคโปร์เผยแพร่กระบวนการหาสาเหตุของรถไฟฟ้าขัดข้องที่รบกวนประชาชนสิงคโปร์มาหลายเดือน
รถไฟฟ้าสิงคโปร์สาย Circle Line มีปัญหาขัดข้องอยู่เนืองๆ มาหลายเดือนจากการที่ระบบเบรกฉุกเฉินทำงานโดยหาสาเหตุไม่ได้ จุดเกิดความขัดข้องกระจายไปตามสถานีต่างๆ ขบวนรถที่ได้รับผลกระทบ และกระจายไปตามช่วงเวลา ทำให้ไม่แน่ชัดว่ามีระบบที่ส่วนใดบกพร่องกันแน่
ทีมวิเคราะห์พบว่าที่จริงแล้ว การบกพร่องมีแนวทางการ "เคลื่อนที่" ไปตามสถานีเรื่อยๆ ทีมวิเคราะห์จึงตั้งสมมติฐานว่าอาจจะมีขบวนรถไฟที่บกพร่อง ทิ้งสัญญาณรบกวนไปตามเส้นทาง ก่อปัญหาให้กับรถขบวนถัดๆ ไป การตั้งสมมติฐานแล้วนำข้อมูล "รถต้นเหตุ" มาเทียบกับเหตุการณ์จริง ทีมงานพบว่าเหตุการณ์ 73% เข้ากับสมมติฐานรถต้นเหตุ และคาดว่าจะมีรถเพียงขบวนเดียว
ทีมงานหารถต้นเหตุและพบว่ารถ PV46 เข้ากับข้อมูล หลังจากนั้นจึงทดสอบเมื่อต้นเดือนพฤศจิกายนที่ผ่านมา และยืนยันได้ว่า PV46 เป็นสาเหตุจริงๆ
โค้ดทั้งหมดที่ใช้วิเคราะห์ข้อมูลอยู่บน GitHub
ที่มา - blog.data.gov.sg