Stability.ai โชว์โมเดล Stable Audio ปัญญาประดิษฐ์สร้างเพลง ชูจุดเด่นที่สามารถสร้างเพลงที่ขึ้นต้นและลงท้ายได้ขึ้น พร้อมกับการทำงานที่เร็ว โมเดลรันบน NVIDIA A100 ใบเดียวสามารถสร้างเพลงยาว 95 วินาทีได้ใน 1 วินาทีเท่านั้น
สถาปัตยกรรมของ Stable Audio รวมเอาข้อมูลเวลาของเสียงที่กำลังสร้างเข้าไปด้วย ทำให้ควบคุมความยาวของเพลงโดยรวมได้ ตัวโมเดล diffusion หลักมีขนาด 907 ล้านพารามิเตอร์ ฝึกกับไฟล์เสียง 800,000 ไฟล์ รวมกว่า 19,500 ชั่วโมง
ตอนนี้ทาง Stability.ai ยังปล่อยเฉพาะตัวอย่างไฟล์เสียงที่สร้างมา แต่ระบุว่าในอนาคตจะปล่อยโมเดลโอเพนซอร์สพร้อมซอร์สโค้ดออกมาภายหลัง เมื่อเดือนที่แล้ว Meta เพิ่งปล่อยโมเดล MusicGen สำหรับสร้างเพลงออกมาเช่นกัน
ที่มา - Stability.ai
ภาพสร้างจากปัญญาประดิษฐ์ Ideogram