ร่วมบริจาคเสียงพูดภาษาไทยด้วย Mozilla Common Voice

by tontan
10 April 2021 - 11:47

เทคโนโลยีการรู้จำเสียง (Speech Recognition) เป็นเทคโนโลยีที่ช่วยให้เราสื่อสารหรือสั่งงานกับคอมพิวเตอร์ได้ง่ายขึ้น ซึ่งระบบดังกล่าวเป็นที่นิยมกันอย่างเผยแพร่ ตัวอย่างเช่น ใช้งานในระบบผู้ช่วยอัจฉริยะ, ใช้สร้างคำบรรยายในวิดีโอ และใช้พิมพ์ข้อความตามเสียง เป็นต้น อย่างไรก็ตามเทคโนโลยีการรู้จำเสียงทุกภาษาต้องการชุดข้อมูลเสียงขนาดใหญ่สำหรับมาทำเทคโนโลยีดังกล่าว ยิ่งมีข้อมูลมากเท่าไร ความแม่นยำยิ่งสูงขึ้น แต่ชุดข้อมูลเสียงขนาดใหญ่จำนวนมากที่ถูกสร้างโดยบริษัทใหญ่ ๆ เราไม่สามารถใช้งานได้ เนื่องจากราคาที่แพงหรือติดลิขสิทธิ์ จึงทำให้บริษัทเล็ก ๆ หรือนักพัฒนาไม่สามารถเข้าถึงชุดข้อมูลดังกล่าวได้

Mozilla ในฐานะองค์กรที่ไม่หวังผลกำไรจึงได้ทำโครงการ Common Voice ขึ้นมา เพื่อสร้างชุดข้อมูลเสียงสำหรับสร้างเทคโนโลยีการรู้จำเสียง ให้ทุกคนสามารถร่วมบริจาคเสียง ตรวจสอบเสียง และเพิ่มประโยคเข้าไปในระบบได้ โดยชุดข้อมูลเป็นสาธารณะประโยชน์ที่ทุกคนบนโลกสามารถใช้งานได้ นอกจากนั้น Mozilla ยังสร้างเครื่องมือสำหรับเทคโนโลยีการรู้จำเสียง ชื่อว่า Deep Speech

สำหรับภาษาไทย ทาง Mozilla ได้เปิดรับบริจาคเสียงตั้งแต่ปีที่ผ่านมา ปัจจุบันมีจำนวน 17 ชั่วโมง และชั่วโมงที่ตรวจสอบแล้ว 12 ชั่วโมง โดยเป้าหมายคือ 10,000 ชั่วโมง เพื่อให้ได้ชุดข้อมูลเสียงที่นำไปใช้งานกับเทคโนโลยีการรู้จำเสียงได้จริง

ร่วมบริจาค/ตรวจสอบเสียงภาษาไทยอย่างไร?

เข้าไปที่ commonvoice.mozilla.org/th โดยไม่จำเป็นต้อง Login (แต่ Login ได้เพื่อให้ข้อมูลพวกอายุหรือเพศและจัดอันดับผู้บริจาค) จากนั้นคลิกที่รูปไมค์ เพื่อบริจาคเสียง โดยกดปุ่มไมค์เพื่อบริจาคเสียง แล้วกดหยุด จากนั้นคลิกส่ง ทำจนครบแล้วส่งเสียงได้ โดยพยายามพูดให้ครบตามที่ประโยคกำหนด ไม่ขาดหรือเกิน

หากพบประโยคที่มี "ๆ", ภาษาอังกฤษ หรือ ตัวเลข ปนมา อย่าลืมกดปุ่ม รายงาน

หรือ คลิกปุ่ม > เพื่อตรวจสอบเสียงโดยการฟัง จากนั้นกดปุ่ม > เพื่อฟัง ฟังจบแล้วกด ใช่ หรือ ไม่ ทำจนครบแล้วส่งได้เลย

สำหรับเกณฑ์ในการฟัง ง่าย ๆ คือ เสียงพูดครบตามที่ประโยคกำหนด ฟังรู้เรื่อง

เพิ่ม/ตรวจสอบประโยคก่อนนำไปรับบริจาค

ต่อมาเป็นส่วนในการเพิ่ม/ตรวจสอบประโยคก่อนนำประโยคไปรับบริจาคเสียง โดยเข้าไปที่ commonvoice.mozilla.org/sentence-collector ให้ Login จากนั้นไป Profile เลือก Thai แล้วไปที่ REVIEW กด ?ถูกใจ สำหรับประโยคที่ถูกตามเกณฑ์ หรือ ?ไม่ถูกใจ สำหรับประโยคที่ไม่ถูกต้องตามเกณฑ์

สำหรับเกณฑ์ประโยคมีดังนี้

  • ไม่เอาประโยคที่มีการสะกดผิด
  • ไม่เอาประโยคผิดไวยากรณ์ ประโยคขาด ไม่สมบูรณ์ มีคำขาด ๆ เกิน ๆ หรือคำแปลกที่คนไทยไม่พูดกัน อ่านแล้วงง
  • ประโยคต้องอ่านได้ภายใน 10 วินาที (ประมาณ 100 ตัวอักษร)
  • ไม่เอาตัวย่อ เช่น สศช. กทม.
  • ไม่เอา ๆ / ฯลฯ/ ฯ / ()
  • ตัวเลขต้องเป็นคำอ่านเท่านั้น เช่น สองพันห้าร้อยหกสิบสาม
  • ไม่เอาประโยคที่มีภาษาอังกฤษ

ที่มา: งานที่พวกเรามาช่วยกันรีวิวประโยค Mozilla Common Voice

สำหรับการเพิ่มประโยค กดไปที่ ADD แล้วพิมพ์ประโยคเข้าไป โดยประโยคดังกล่าวต้องเป็นสาธารณะประโยชน์

ผมขอเชิญชวนชาว Blognone มาร่วมกันบริจาคเสียงพูดภาษาไทยให้กับทาง Mozilla Common Voice กันครับ

หากมีข้อสงสัย สามารถเข้าไปอ่านได้ที่ commonvoice.mozilla.org/th/faq และสามารถเข้าไปอ่านเอกสาร ? ? Mozilla Voice Community Playbook V1.1 สำหรับข้อมูลเพิ่มเติม

Blognone Jobs Premium