Alibaba Group Holding บริษัทอินเทอร์เน็ตยักษ์ใหญ่ของจีนได้จับ Deep Neural Network ที่ตนเองพัฒนามาทดสอบกับแบบทดสอบ the Stanford Question Answering Dataset (SQuAD) ซึ่งเป็นชุดคำถามกว่า 100,000 คำถาม จากเนื้อหาบนวิกิพีเดียกว่า 500 บทความ ซึ่งเท่ากับว่าการจะตอบคำถามได้ ต้องอ่านทำความเข้าใจบทความเหล่านั้นก่อน
ปรากฎว่าปัญญาประดิษฐ์ของ Alibaba ทำคะแนนไปได้ 82.44 คะแนน เหนือคะแนนสูงสุดที่มนุษย์เคยทำได้เอาไว้ที่ 82.304 โดย Alibaba ระบุว่า การทดลองนี้สะท้อนว่าปัญญาประดิษฐ์ สามารถตอบคำถามเชิงวัตถุประสงค์ (อาทิ ฝนเกิดจากอะไร ดังที่สามารถพบได้ตามคำถามการอ่านจับใจความ) ได้ดีกว่ามนุษย์ และสามารถนำไปประยุกต์ได้หลากหลาย โดยเฉพาะการโต้ตอบกับมนุษย์อย่าง Customer Service
Alibaba ระบุด้วยว่านับเป็นครั้งแรกที่ปัญญาประดิษฐ์สามารถเอาชนะมนุษย์ในการทดสอบลักษณะนี้ได้ อย่างไรก็ดีหลังการประกาศของ Alibaba เพียงหนึ่งวัน ไมโครซอฟท์ก็ประกาศว่า ปัญญาประดิษฐ์ของตัวเองก็สามารถทำแบบทดสอบเดียวกันนี้ชนะมนุษย์ และได้คะแนนสูงถึง 82.650 เช่นกัน