รู้จัก Hudson AI สตาร์ทอัพเกาหลีที่ทำระบบแปลภาษา แปลงเสียงและลิปซิงค์นักแสดงในภาพยนตร์

by nismod
20 June 2024 - 09:35

หนึ่งในปัญหาใหญ่ของวงการภาพยนตร์, ซีรีส์ที่ทุกวันนี้มีภาพยนตร์ ซีรีส์คุณภาพดีมากมาย ที่ไม่ใช่ภาษาท้องถิ่นของประเทศที่ฉายโดยเฉพาะภาษาอังกฤษ คือความไม่พอใจของคนดู ที่ไม่อยากอ่านซับไตเติล โดยเฉพาะในสหรัฐ Hudson AI สตาร์ทอัพภายใต้ Creative Labs ของซัมซุงในเกาหลีใต้ เลยพยายามจะแก้ปัญหานี้ด้วย AI

ผลสำรวจจาก Morning Consult ของสหรัฐ สำรวจผู้ชมใน 15 ประเทศทั่วโลก พบว่ามีเพียงผู้ชมในเกาหลีใต้และจีนเท่านั้น ที่เลือกตอบว่าพอใจในการอ่านซับไตเติลสูงถึง 70% ส่วนประเทศฝั่งตะวันตกอย่างสหรัฐหรือยุโรป ส่วนใหญ่จะชอบให้ลงเสียงพากย์ทับมากกว่า

Hyunjin Shin ซีอีโอและผู้ก่อตั้ง Hudson AI บอกว่าในอุตสาหกรรมภาพยนตร์ ไม่ใช่ภาพยนตร์หรือซีรีส์ทุกเรื่อง แม้นักวิจารณ์จะชอบมากแค่ไหน ก็ใช่ว่าจะถูกซื้อไปฉายในประเทศหนึ่ง พร้อมกับการลงทุนแปลและพากย์เสียงทับ อย่างกรณีของ Parasite ของเกาหลีใต้ที่ได้ออสการ์ แต่ฉายในสหรัฐแค่ไม่กี่โรง แถมมีแต่ซับไตเติลด้วย (ซึ่ง Bong Joon-ho ผู้กำกับพูดบนเวทีลูกโลกทองคำว่า ซับไตเติลเป็นแค่ one-inch barrier) ซึ่งประเด็นนี้กลายเป็นอุปสรรคให้แง่ธุรกิจสำหรับผู้จัดจำหน่ายภาพยนตร์ต่างประเทศ

Hudson AI เลยถูกตั้งขึ้นมาเพื่อแก้ปัญหานี้ โดยเจ้าตัวเดิมทำงานอยู่ในซัมซุงอิเล็คททรอนิคส์ ที่เกาหลีใต้ และเสนอไอเดียนี้ ก่อนจะได้รับเลือกให้เข้าร่วมโครงการ accelerator ภายในบริษัทที่ชื่อว่า Creative Labs (C-Labs) และตั้งเป้าว่าจะแก้ปัญหาด้านกำแพงภาษา ให้กับอุตสาหกรรมภาพยนตร์ ด้วยการใช้ AI มาแปลงเสียงพูด พร้อมปรับปากตัวละคร ให้เป็นภาษาท้องถิ่น

กระบวนการในแปลงเสียงพูดมีอยู่หลักๆ ทั้งหมด 3 ส่วนคือ

  • แปลภาษา ด้วยการใช้โมเดล LLM ที่มีอยู่ในตลาด พร้อมเปิดให้นักแปลเจ้าของภาษามาขัดเกลาการถอดความสุดท้ายอีกครั้ง
  • Voice Conversion กระบวนการนี้ทาง Hudson AI สร้างโมเดลในลักษณะ text-to-speech ขึ้นมาเอง โดยโมเดลสามารถเรียนรู้และรักษาโทนเสียง น้ำเสียง และความนุ่มลึกของเสียงนักแสดงต้นฉบับเอาไว้ให้ได้มากที่สุด เพื่อรักษาอรรถรสของฉากนั้นๆ
  • Lip Sync เป็นอีกโมเดล AI ที่ Hudson AI พัฒนาขึ้นมาเอง ในการปรับรูปหน้าช่วงปากของนักแสดง ให้ขยับออกมาให้เคียงเสียงพูด ที่ถูกแปลออกมาแล้วได้มากที่สุด

Shin บอกว่า จุดเด่นของ Hudson AI คือความเป็นธรรมชาติ ของน้ำเสียงและการขยับปากของนักแสดง ซึ่งถึงแม้เทคโนโลยี text-to-speech จะมีมานานแล้ว แต่ก็ยังคงทำได้ไม่ดีในการถ่ายทอดเรื่องนี้ รวมถึงบอกด้วยว่าเป้าหมายของบริษัท ไม่ใช่การมาแทนที่การลงเสียงพากย์ แต่หวังเพียงแค่ช่วยอำนวยความสะดวกและกำแพงด้านการดูภาพยนตร์, ซีรีส์ต่างประเทศเป็นหลัก

ปัจจุบัน Hudson AI เพิ่งรับเงินลงทุนรอบ seed funding ไป 700 ล้านวอน (ราวๆ 18 ล้านบาท) ประมาณต้นปีที่แล้ว และเริ่มทดสอบกับบริษัทภาพยนตร์ ทั้งภายในประเทศและต่างประเทศแล้ว โดยวางแผนจะให้บริการจริงๆ ในรูปแบบของ SaaS

Blognone Jobs Premium