MIT ถอนชุดข้อมูลฝึก AI หลังพบภาพถูกบรรยายด้วยคำหยาบและดูถูก, ขอให้นักวิจัยอื่นเลิกใช้งาน

by lew
2 July 2020 - 06:09

MIT ถอนชุดข้อมูล Tiny Images ออกจากเว็บหลังจากมีรายงานว่าภาพหลายพันภาพถูกบรรยายด้วยคำหยาบและดูถูก เช่น โสเภณี, พวกล่อลวงเด็ก (child molester), ไอ้มืด (nigger) รวมถึงมีภาพไม่เหมาะสม จนทำให้ให้วิจัย Computer Science and Artificial Intelligence Lab (CSAIL) ตัดสินใจถอดชุดข้อมูลออกจากเว็บ และขอให้นักวิจัยกลุ่มอื่นเลิกใช้ชุดข้อมูลนี้และลบออกจากเว็บเช่นกัน

Tiny Images เป็นชุดข้อมูลภาพ 80 ล้านภาพที่มีขนาดเพียง 32x32 พิกเซล โดยเป็นภาพที่ดาวน์โหลดจากอินเทอร์เน็ตแล้วย่อลงมา โดยชุดข้อมูลสร้างจากการใช้คำค้นใน WordNet นำคำในรายการไปค้นจาก search engine หาภาพแล้วนำมาจับคู่กับคำค้น

ศาสตราจารย์ Antonio Torralba จาก CSAIL ระบุว่าทีมวิจัยควรตรวจสอบภาพด้วยมือก่อนใส่ในชุดข้อมูล แต่ภาพที่ย่อไปแล้วนี้มีขนาดเล็กจนตรวจสอบได้ยาก (ทีมวิจัยไม่ได้เก็บภาพขนาดเต็มไว้) จึงตัดสินใจถอดชุดข้อมูลออกไปทั้งชุด

ที่มา - The Register

Blognone Jobs Premium