OpenVoice โมเดล AI เลียนแบบเสียงใครก็ได้ เปิดให้ดาวน์โหลดแล้ว

by lew
2 January 2024 - 02:15

MyShell ผู้ให้บริการปัญญาประดิษฐ์สร้างตัวตนออนไลน์ ปล่อยโมเดล OpenVoice สำหรับการเลียนแบบเสียงพูดโดยอาศัยตัวอย่างเสียงไม่มากนัก

โมเดลปัญญาประดิษฐ์เลียนเสียงพูดมีงานวิจัยออกมาเรื่อยๆ จำนวนมาก OpenVoice ชูจุดเด่นว่าสามารถควบคุมน้ำเสียง, จังหวะพูด ได้ละเอียดกว่า ทำให้มีความเป็นไปได้ที่จะสร้างเสียงที่สมจริงขึ้น

โมเดลแยกออกเป็นสองส่วน คือการแปลงข้อความเป็นเสียงพูด จากนั้นค่อยแปลงเสียงที่ได้ให้น้ำเสียงเหมือนกันเสียงพูดของบุคคลเป้าหมายอีกที เรียกว่า Tone Color Converter

ตัวโมเดลพร้อมค่า weight เปิดให้ดาวน์โหลดไปใช้งานได้แต่จำกัดห้ามใช้งานเชิงการค้า และทาง MyShell ระบุว่าอาจจะมีแนวทางในการตรวจจับว่าเสียงสร้างขึ้นมาจากโมเดล OpenVoice อยู่

ที่มา - ArXiV, GitHub

Blognone Jobs Premium