Reuters สร้างอัลกอริทึมของตัวเองเพื่อดูว่ามีอะไรใน Twitter มาเป็นข่าวด่วนได้บ้าง

by sunnywalker
2 December 2016 - 02:28

สำนักข่าวเก่าแก่ Reuters ไล่ตามเทคโนโลยีไม่แพ้สำนักข่าวหน้าใหม่ ล่าสุดพัฒนาเครื่องมืออัลกอริทีม เพื่อคอยมอนิเตอร์เนื้อหาจากอีเวนท์ใหญ่ในทวิตเตอร์ และจับเนื้อหาที่เกี่ยวข้องกันมาเป็นข่าวสั้น ช่วยประหยัดทั้งเวลาและกำลังคน

ยกตัวอย่างเช่นมีเหตุการ์ระเบิดก่อการร้ายในที่ใดที่หนึ่ง อัลกอริทีมจะจับเอาคำที่เกี่ยวข้องกับเหตุการณ์ จากฟีดทวิตเตอร์ที่มีคนรายงานเหตุการณ์นั้น จับคำที่เกี่ยวข้องเช่น attack, bomb สร้างข้อมูล นำคำต่างๆ มารวมกัน

Reg Chua บรรณาธิการบริหารข้อมูลและนวัตกรรมของ Reuters กล่าวว่าการทำงานข่าวต้องเร็ว และความคิดพื้นฐานของ Reuters คือต้องเป็นแห่งแรก ที่แรก เราจึงคิดหาวิธีสร้างระบบที่จะทำให้เราติดตามข่าวสารได้เร็ว แน่นอนว่าบุคลากรช่วยตรงนี้ได้ แต่ไม่ว่าจะโยนคนลงไปมากเท่าไหร่ก็ไม่ช่วยแก้ปัญหาทั้งหมดได้

การตรวจจับข้อมูล จับคำที่เกี่ยวข้องกับเหตุการณ์นั้นไม่ยาก ที่ยากกว่าคือทำอย่างไรให้อัลกอริทึม หาอีเวนท์ที่น่าทำเป็นข่าวจริงๆ ไม่ใช่อีเวนท์สแปม

การแก้ปัญหานี้คือให้อัลกอริทึมคำนึงถึงปัจจัยพื้นฐานหลายอย่างเช่น จับเฉพาะแอคเคาท์ที่ตรวจสอบแล้วว่าเป็นของจริง พิจารณาจำนวนคนฟอลโล่ ดูว่าใครบ้างที่เป็นคนรายงานข่าว ผลการทำงานมาสักพักพบว่าทวีตที่มีแต่ตัวอักษรพิมพ์ใหญ่ (capital letter) มีความน่าเชื่อถือน้อยกว่าทวีตทั่วไป

ที่มา - Niemanlab

Blognone Jobs Premium