กูเกิลเปิดชุดข้อมูล YouTube-BoundingBoxes วิดีโอพร้อมกรอบวัตถุกว่า 5 ล้านรายการ

by lew
7 February 2017 - 16:55

การฝึกระบบปัญญาประดิษฐ์โดยเฉพาะในกลุ่ม deep learning ต้องการข้อมูลที่มีความแม่นยำสูงจำนวนมากแต่ชุดข้อมูลที่ใช้ในวงการวิจัยมักมีปริมาณไม่มากนัก ตอนนี้กูเกิลก็เปิดชุดข้อมูลของตัวเองขนาดใหญ่ถึง 5 ล้านรายการ ต่อจากปีที่แล้วที่กูเกิลเปิดชุดข้อมูลภาพ 9 ล้านรายการ

ชุดข้อมูล YouTube-BoundingBoxes (YT-BB) เป็นข้อมูลจากวิดีโอที่มีวัตถุในภาพ 23 ชนิด เช่น แมว, หมา, วัว, รถไฟ, เครื่องบิน, รถ, ม้าลาย, ม้า, หมี, ต้นไม้กระถาง รวมทั้งหมด 5 ล้านรายการ โดยแต่ละภาพจะถูกล้อมกรอบสี่เหลี่ยมตำแหน่งของวัตถุเหล่านั้นเอาไว้ (ตามชื่อ bounding boxes)

ชุดข้อมูลนี้มีขนาดใหญ่กว่าชุดข้อมูลสำหรับทดสอบการหาวัตถุ (object detection) ชุดอื่นๆ มาก ข้อมูลเช่น ImageNet มีขนาดข้อมูล 1.03 ล้านรายการ, ชุดข้อมูล COCO มีขนาด 2.53 ล้านรายการ, หรือ PASCAL VOC ที่นิยมในงานวิจัยมีเพียง 27,400 รายการเท่านั้น

ภาพทั้งหมดนำมาจากวิดีโอ 210,000 รายการ และถูกล้อมกรอบอย่างพอดีกับวัตถุโดยมีความแม่นยำไม่ต่ำกว่า 95%

ดาวน์โหลดได้ฟรีวันนี้ โดยสัญญาอนุญาตเป็น Creative Commons (BY) 4.0

ที่มา - Google Research

Blognone Jobs Premium