ทีม Microsoft Artificial Intelligence and Research (ที่เพิ่งก่อตั้ง) ประสบความสำเร็จกับระบบแยกแยะเสียงพูด (speech recognition) ที่มีความผิดพลาดน้อยเทียบเท่ากับมนุษย์ผู้เชี่ยวชาญด้านการถอดเสียงพูดแล้ว
ไมโครซอฟท์สามารถพัฒนาระบบถอดเสียงพูดที่มีอัตราความผิดพลาด (word error rate หรือ WER) ที่ 5.9% ซึ่งใกล้เคียงกับการถอดเสียงโดยมนุษย์ และถือเป็นระบบแยกแยกเสียงตัวแรกที่มีความแม่นยำถึงระดับนี้
ระบบของไมโครซอฟท์ใช้เทคนิค neural network เรียนรู้เสียงพูดของมนุษย์ โดยใช้ชุดพัฒนา CNTK ตัวเดียวกับที่ไมโครซอฟท์เปิดซอร์สโค้ดขึ้นไว้บน GitHub
ที่มา - Microsoft
ทีมวิจัยระบบเสียงพูดของไมโครซอฟท์