ตรวจจับใบหน้ายังไม่พอ หลายบริษัทเทคกำลังพัฒนาระบบอ่านริมฝีปากด้วย

by sunnywalker
17 June 2021 - 04:03

ปัจจุบันระบบจดจำใบหน้ามีการใช้งานทั้งในแง่ความสะดวกสบายอย่างการสแกนใบหน้าเพื่อทำธุรกรรมและการยืนยันตัวตนเพื่อความปลอดภัยในการทำกิจกรรมต่างๆ บนออนไลน์ ระบบจดจำใบหน้ายังถูกใช้งานในแง่ความมั่นคงและสอดส่องประชาชนด้วย

ล่าสุดเว็บไซต์ Motherbord ออกรายงานพบว่าตอนนี้หลายๆ บริษัทเทคโนโลยีกำลังวิจัยพัฒนาระบบอ่านริมฝีปาก เริ่มจาก Liopa เป็นสตาร์ทอัพในไอร์แลนด์ พัฒนาแอปพลิเคชั่น SRAVI (Speech Recognition App for the Voice Impaired) เป็นแอปอ่านปากเพื่อประโยชน์ทางการแพทย์ ในกรณีที่คนไข้ต้องการอะไรบางอย่างแต่ไม่สามารถเปล่งเสียงพูดออกมาได้ ก็สามารถใช้แอป SRAVI ช่วยอ่านริมฝีปากคนไข้ โดยขณะนี้ SRAVI กำลังอยู่ในขั้นตอนขอใบรับรองเป็นหนึ่งในอุปกรณ์การแพทย์

อย่างไรก็ตาม ระบบอ่านริมฝีปากจะสร้างความกังวลเมื่อมันถูกนำไปใช้ในวัตถุประสงค์อื่นที่คุกคามสิทธิพลเมืองและความเป็นส่วนตัว ซึ่ง Motherbord พบว่ามีหลายบริษัทกำลังพัฒนาระบบนี้โดยยังไม่เผยจุดประสงค์ว่าจะใช้งานกับใครบ้าง ไม่ว่าจะเป็น Google, Huawei, Samsung และ Sony ต่างกำลังค้นคว้าเกี่ยวกับระบบ VSR (visual speech recognition) และดูเหมือนว่าจะมีความก้าวหน้าอย่างรวดเร็ว


ภาพจาก SRAVI

ตัวแอป SRAVI ก็ไม่ใช่แอปพลิเคชั่นเดียวที่ Liopa ทำ ทางบริษัทกำลังพัฒนาระบบเดียวกันร่วมกับกับหน่วยงานวิจัยด้านการป้องกันประเทศของสหราชอาณาจักรเพื่อพัฒนาเครื่องมือที่จะช่วยอ่านปากจากฟุตเทจกล้องวงจรปิด

Motherbord ยังพบบริษัทอีกแห่งหนึ่งที่อ้างว่าขายระบบ AI สำหรับการอ่านริมฝีปาก และได้การตอบรับอย่างเต็มที่ Amarjot Singh ผู้ก่อตั้งและซีอีโอ ของ Skylark Labs บอกกับ Motherboard ว่าบริษัทได้นำเสนอชุดเทคโนโลยี ซึ่งรวมถึงการจดจำใบหน้าและอัลกอริธึมการตรวจจับความรุนแรงและอาวุธให้กับหน่วยงานตำรวจในอินเดีย


ภาพจาก Skylark Labs

เมื่อพูดถึงประสิทธิภาพของระบบอ่านริมฝีปาก ระบบสามารถจับคีย์เวิร์ดจากการพูดเป็นคำได้ แต่ยังจับคำจากการพูดยาวๆ แบบต่อเนื่องไม่ได้ดีเท่าที่ควร งานวิจัยล่าสุดเกี่ยวกับระบบอ่านริมฝีปากที่ Google Deepmind ตีพิมพ์ออกมา ต้องย้อนไปตั้งแต่ปี 2018 พบว่า AI ยังมีความผิดพลาดในการตรวจจับคำถึง 41% การอ่านปากจากคลิปวิดีโอที่ไม่ระบุหัวข้อและบริบท มีอัตราความแม่นยำ 93% และ 86% เมื่อระบุหัวข้อ

ในการใช้ระบบอ่านริมฝีปากจับคีย์เวิร์ดจากคำพูดเป็นคำๆ พบว่าระบบประเภทเดียวกันกับที่บริษัท Liopa และ Skylark Labs ใช้มีความแม่นยำสูง จากเว็บไซต์ paperswithcode.com พบอัตราความแม่นยำตั้งแต่ 83-88%

แม้ระบบอ่านริมผีปากกำลังอยู่ในช่วงเริ่มต้นของการพัฒนา แต่ในขณะที่โลกได้รับบทเรียนจากระบบจดจำใบหน้าแล้ว นักวิชาการหลายคนจึงออกความเห็นว่า การพัฒนาเทคโนโลยีไม่ควรส่งผลเสียต่อผู้ใช้งาน และหากพัฒนาต้องมีการเฝ้าระวังและให้คนจากหลายภาคส่วนเข้ามามีส่วนร่วมตั้งแต่ระยะแรก เพื่อพิจารณาผลกระทบที่เกิดขึ้น

ที่มา - VICE

Blognone Jobs Premium