OpenAI สาธิต AI สร้างเสียงเลียนแบบเหมือนจริง ใช้อินพุทเสียงต้นฉบับเพียง 15 วินาที

by arjin

30 March 2024 - 02:50

OpenAI นำเสนอเทคโนโลยีที่พัฒนาอยู่ด้าน AI โดยเป็นโมเดลสร้างเสียงเสมือนชื่อว่า Voice Engine มีจุดเด่นคือใช้ข้อมูลตั้งต้นคือ เสียงพูดต้นฉบับความยาว 15 วินาที และข้อความตัวหนังสือของเสียงต้นแบบนั้น ผลลัพธ์ที่ได้เป็นเสียงพูดที่มีจังหวะ และการแสดงออกอารมณ์เหมือนกับต้นฉบับ

โมเดล Voice Engine นี้ OpenAI นำมาใช้งานแล้วสำหรับความสามารถการตอบด้วยเสียงของ ChatGPT ซึ่งใช้ชุดข้อมูลเสียงตั้งต้นก่อน แต่ไม่มีแผนเปิดให้ใช้งานทั่วไปกับสาธารณะ เนื่องจากมีความเสี่ยงสูงในการนำไปใช้งานที่ไม่เหมาะสม

อย่างไรก็ตาม OpenAI มองว่า Voice Engine มีประโยชน์มากหากนำไปใช้งานกับกลุ่มที่เหมาะสมแบบเจาะจง ซึ่ง OpenAI สาธิตการใช้งานหลายกรณี เช่น ใช้สร้างเสียงบรรยายในบทเรียนสำหรับเด็ก, ใช้สร้างเสียงพากย์ทับคอนเทนต์ในภาษาต่าง ๆ โดยคงจังหวะและอารมณ์ไว้, ใช้แปลภาษาท้องถิ่นเพื่อการสื่อสาร เช่น การแพทย์ในพื้นที่ห่างไกล, ช่วยเหลือผู้ป่วยหรือคนที่มีปัญหาการออกเสียง (ดูตัวอย่างทั้งหมดได้จากที่มา)

อ่านถึงตรงนี้ก็คงเห็นความเสี่ยงหลายอย่าง จึงทำให้ OpenAI ตัดสินใจไม่เผยแพร่เครื่องมือนี้ในเวลานี้ จนกว่าจะได้วิธีจัดการที่เหมาะสมกว่าปัจจุบัน อย่างไรก็ตาม OpenAI เตือนว่าทุกคนควรตระหนักว่าเทคโนโลยีสร้างเสียงปลอมนั้นได้มาถึงจุดนี้แล้ว แม้ว่า OpenAI จะไม่เผยแพร่ให้คนทั่วไปใช้งานก็ตาม ทุกคนจึงควรระมัดระวัง ขณะเดียวกันหน่วยงานกำกับดูแลก็ควรหารือถึงแนวทางรับมือกับการมาของเทคโนโลยีนี้ด้วยเช่นกัน

ที่มา: OpenAI ภาพ Pixabay

Read on Full Site

Blognone Jobs Premium