กูเกิลเปิดข้อมูลบรรยายภาพ 9 ล้านภาพ สำหรับการฝึก AI

by lew
8 October 2016 - 06:41

กูเกิลเปิดฐานข้อมูล Open Images เป็นข้อมูล URL ภาพกว่า 9 ล้านภาพจากแหล่งต่างๆ เช่น Flickr และข้อมูลบรรยายภาพเหล่านั้น สำหรับใช้ฝึกระบบปัญญาประดิษฐ์

ความยากของการฝึกระบบปัญญาประดิษฐ์ขึ้นใหม่ คือการหาข้อมูลที่บรรยายว่าบนภาพนั้นมีอะไรบ้าง เช่น รถยนต์, คนเดินถนน, ทางเท้า ฯลฯ ปกติแล้วงานวิจัยที่ต้องการพัฒนาระบบปัญญาประดิษฐ์จะต้องใช้ฐานข้อมูลที่มีอยู่จำกัด หรือไม่ก็สร้างฐานข้อมูลขึ้นเองซึ่งมีต้นทุนสูง

ฐานข้อมูล Open Images เป็นไฟล์ CSV ที่ต้องไปดาวน์โหลดรูปมาเอง ตัวฐานข้อมูลมีทั้งแบบบรรยายด้วยมนุษย์ขนาด 9MB รวม 167057 ภาพ และแบบบรรยายด้วยซอฟต์แวร์ขนาดถึง 450MB รวม 9011219 ภาพ

กระบวนการดาวน์โหลดคงต้องเขียนโปรแกรมดาวน์โหลดเอาเอง ใครอยากลองใช้อย่าลืมเตรียมพื้นที่ดิสก์ให้เพียงพอ

ที่มา - Google Research

Blognone Jobs Premium