Baidu เปิดตัว SwiftScribe บริการถอดความเสียงเป็นตัวอักษร

by nutmos
14 March 2017 - 01:55

Baidu เสิร์ชเอนจินรายใหญ่จากจีนได้เปิดตัว SwiftScribe เว็บแอพที่ใช้ในการถอดความเสียงที่อัดโดยใช้ AI ช่วยในการถอดความ

เทคโนโลยีหลักของ SwiftScribe นั้นคือ Deep Speech 2 ซึ่งเป็นเอนจินด้านการจำแนกเสียง โดยเป็น neural network ที่ถูกเทรนโดยใช้ข้อมูลเสียงนับพันชั่วโมง

วิธีใช้ SwiftScribe เพียงแค่ผู้ใช้อัพโหลดไฟล์เสียงในรูปแบบไฟล์ wav หรือ mp3 ระบบก็จะประมวลผลให้โดยอัตโนมัติ ซึ่งระบบของ Baidu รองรับไฟล์ได้ถึง 1 ชั่วโมง และใช้เวลาเพียง 20 นาทีในการถอดความ แต่การถอดความก็ยังไม่ค่อยสมบูรณ์นัก ผู้ใช้ยังจำเป็นต้องใส่เครื่องหมายวรรคตอน, เปลี่ยนตัวอักษรตัวเล็ก/ใหญ่ และต้องแก้บางคำที่ซับซ้อนด้วย

SwiftScribe ของ Baidu เป็นบริการเปิดให้ใช้งานฟรี แต่ Wu บอกในอนาคตหวังว่าจะเปลี่ยนเป็นธุรกิจ ส่วนฟีเจอร์อื่น ๆ เช่น การรองรับไฟล์หลากหลายฟอร์แมต, เพิ่มเครื่องหมายวรรคตอน จะตามมาในอนาคต

ที่มา - Baidu Research, VentureBeat

Blognone Jobs Premium