Baidu ยักษ์ใหญ่แห่งวงการค้นหาจากประเทศจีน เปิดตัวเทคโนโลยีใหม่จากแผนกพัฒนาของตัวเองในชื่อ "Deep Speech" ที่เคลมว่าสามารถพลิกโฉมการสั่งด้วยเสียงในปัจจุบันได้เลย
Deep Speech เป็นระบบสั่งงานด้วยเสียงที่ออกแบบมาเพื่อใช้งานในสภาพแวดล้อมจริง ที่สามารถใช้งานได้แม้ว่าจะมีเสียงดังรบกวน เช่นในร้านอาหาร บนรถโดยสาร หรือการใช้งานที่ผู้พูดอยู่ห่างจากไมโครโฟน เป็นต้น โดยคีย์ของเทคโนโลยีนี้คือการใช้จีพียูมาช่วยประมวลผล ร่วมกับฐานข้อมูลขนาดใหญ่ของ Baidu เองที่เก็บมามากกว่า 100,000 ชั่วโมงด้วยกัน
Baidu ได้ทดสอบ Deep Speech ในสถานการณ์จริงและพบว่ามีความผิดพลาดของคำเพียงแค่ 16.5% เท่านั้น รวมถึงให้ผลลัพธ์ที่แม่นยำกว่าคู่แข่งมากกว่า 10% ในสภาวะที่มีเสียงรบกวนมาก (แต่ไม่ได้บอกว่าทดสอบด้วยภาษาอะไร)
หัวหน้านักวิทยาศาสตร์ของ Baidu บอกว่า Deep Speech จะเป็นตัวแปรสำคัญสำหรับพลิกโฉมอุปกรณ์พกพาในอนาคต และเป็นก้าวแรกสู่ความพยายามพูดคุยกับอุปกรณ์อัจฉริยะอื่นๆ ในอนาคต รวมถึงหุ่นยนต์ในสภาพแวดล้อมจริงไปอีกขั้น
ใครที่สนใจรายละเอียดของ Deep Speech สามารถหาอ่านได้จากงานวิจัย Deep Speech: Scaling Up End-to-End Speech Recognition ครับ
ที่มา - อีเมลประชาสัมพันธ์