กูเกิลเปิดฐานข้อมูลวิดีโอบน YouTube 8 ล้านคลิป เพื่อใช้เทรน AI ประมวลผลวิดีโอ

by mk
29 September 2016 - 16:09

ปัญหาอย่างหนึ่งในวงการ AI คือการหาชุดข้อมูล (dataset) ขนาดใหญ่พอเพื่อใช้เทรน AI ให้สามารถเรียนรู้จากชุดข้อมูลตัวอย่างได้ ในวงการประมวลผลภาพ มีโครงการ ImageNet คอยทำหน้าที่นี้ให้ แต่พอเป็นการประมวลผลวิดีโอกลับไม่มีชุดข้อมูลในลักษณะเดียวกัน

Google Research จึงเปิดโครงการ YouTube-8M ที่มีฐานข้อมูลวิดีโอ YouTube ถึง 8 ล้าน URL, มีความยาววิดีโอรวมกัน 5 แสนชั่วโมง และมาพร้อมกับป้ายคำ label ของวิดีโอที่ครบถ้วนและหลากหลาย เพื่อให้ระบบ AI สามารถประมวลผลวิดีโอแล้วทดสอบการแยกแยะวิดีโอ เทียบกับป้ายคำที่มีอยู่แล้วได้ ในชุดข้อมูลของกูเกิลยังแคปหน้าจอทุก 1 วินาทีด้วยเทคนิค machine learning เพื่อให้ง่ายต่อการนำไปประมวลผลต่อ และช่วยให้ไฟล์รวมมีขนาดเล็กลง (จากวิดีโอทั้งหมดมีขนาดระดับ petabyte ลงมาเหลือ 1.5 TB)

กูเกิลเลือกวิดีโอที่มีสถานะเป็น public และมีคนดูมากกว่า 1,000 ครั้ง นอกจากนี้ยังเน้นความหลากหลายของวิดีโอ เพื่อให้กระจายครอบคลุมหัวข้อต่างๆ ผู้ที่นำไปใช้ต่อในงานเฉพาะด้าน (เช่น ประมวลผลวิดีโอกีฬาเพียงอย่างเดียว) จะได้มีขนาดข้อมูลที่ใหญ่มากพอ

ที่มา - Google Research Blog

Blognone Jobs Premium