Google Translate เริ่มนำเทคนิค Neural Networks ช่วยแปล เริ่มจากภาษาจีนเป็นอังกฤษ

by mk
28 September 2016 - 02:14

Google Translate ประกาศนำอัลกอริทึมแบบ Neural Networks มาใช้แทนการแปลแบบ Phrase-Based เดิม โดยเริ่มจากการแปลจีนเป็นอังกฤษก่อน ช่วยให้การแปลแม่นยำและใกล้เคียงกับมนุษย์แปลมากขึ้น

ที่ผ่านมา ระบบการแปลของ Google Translate ใช้เทคนิคที่เรียกว่า Phrase-Based Machine Translation (PBMT) ซึ่งจะตัดประโยคต้นฉบับเป็นคำๆ หรือวลี แล้วแปลแต่ละส่วนแยกจากกัน คุณภาพของการแปลจึงอาจไม่เป็นธรรมชาติมากนัก ช่วงหลังกูเกิลเริ่มนำเทคนิค Neural Machine Translation (NMT) มาใช้แทน โมเดลนี้จะมองภาพรวมการแปลทั้งประโยค แทนการแปลแบบแยกส่วน

ภาพสาธิตการแปลแบบ NMT จากภาษาจีนเป็นอังกฤษ ที่มองคำในประโยคต้นฉบับต่อกันเป็นเวกเตอร์ (encoder) จากนั้นตอนแปล (decoder) จะถอดความมาทีละคำ แต่จะยังดูบริบทของคำโดยรอบด้วย

ในช่วงแรก เทคนิค NMT ยังมีความแม่นยำใกล้เคียงกับ PBT แต่ยังทำงานได้ไม่เร็วพอและคุณภาพการแปลยังไม่ดีพอ ซึ่งทีมวิจัยของกูเกิลก็ใช้เวลาอีกหลายปีกว่าจะพัฒนา NMT ให้ดีขึ้นกว่า PBMT (รวมถึงใช้ระบบ machine learning ทั้ง TensorFlow และชิป TPU เข้าช่วยเรื่องความเร็ว)

ตอนนี้เทคนิค NMT ก็ช่วยลดความผิดพลาดของการแปลลงได้ 55-85% จนอยู่ในระดับที่กูเกิลพร้อมนำมาใช้งานจริงกับ Google Translate แล้ว โดยจะใช้กับการแปลจีนเป็นอังกฤษก่อน ส่วนภาษาอื่นๆ จะตามมาในอนาคต

เปรียบเทียบคุณภาพการแปลระหว่าง PBMT, NMT, การแปลด้วยมนุษย์

ที่มา - Google Research Blog

Blognone Jobs Premium