กูเกิลเปิดตัว Cloud Text-to-Speech บริการสร้างเสียงพูดเหมือนมนุษย์ ใช้เทคโนโลยีเดียวกับ Assistant

by lew
28 March 2018 - 02:00

DeepMind นำเสนองานวิจัย WaveNet โมเดลปัญญาประดิษฐ์ deep learning สำหรับสร้างเสียงพูดและเสียงดนตรีมาตั้งแต่ปี 2016 และนำมาใช้กับ Google Assistant เมื่อปีที่แล้ว ตอนนี้มันก็กลายเป็นสินค้าบน Google Cloud Platform แล้ว แต่ยังไม่รองรับภาษาไทย

กูเกิลระบุว่ามีจำนวนเสียงให้เลือกกว่า 30 เสียงแล้วแต่ภาษา เช่น ภาษาอังกฤษแบบสหรัฐฯ มี 6 เสียง บริการรองรับภาษา SSML (Speech Synthesis Markup Language) สำหรับการกำหนดจังหวะหายใจ การเน้นเสียง หรือการปรับความเร็วในบางช่วง เพื่อความสมจริงยิ่งขึ้นด้วย

ค่าบริการต่อ 1 ล้านตัวอักษรสำหรับสำหรับระบบธรรมดาอยู่ที่ 4 ดอลลาร์ (ฟรี 4 ล้านอักษรแรก) และ WaveNet อยู่ที่ 16 ดอลลาร์ (ฟรี 1 ล้านตัวอักษรแรก)

ที่มา - Google Cloud Platform

Blognone Jobs Premium