กูเกิลพัฒนาปัญญาประดิษฐ์แปลภาษาในคู่ภาษาที่ไม่เคยฝึกได้สำเร็จ คอมพิวเตอร์สร้างภาษาสากลของมนุษย์ได้

by lew
24 November 2016 - 05:39

กูเกิลเปลี่ยนระบบแปลภาษาไปสู่เครือข่ายประสาทเทียมตั้งแต่เดือนกันยายนที่ผ่านมา และเพิ่มภาษาที่ใช้ระบบใหม่มากขึ้นเรื่อยๆ ตอนนี้ทีมงานวิจัยก็เสนอแนวทางการแปลภาษาโดยไม่ต้องฝึกการแปลคู่ภาษาโดยตรง เรียกว่าการแปลแบบ zero-shot

ระบบนี้แทนที่จะสร้างเครือข่ายประสาทเทียมสำหรับการแปลคู่ภาษาหนึ่งๆ เช่น อังกฤษเป็นเกาหลี ระบบจะฝึกโดยใส่อินพุตเป็นข้อความที่ระบุภาษาปลายทางไว้ด้วย เช่น "<2es> Hello, how are you? -> ¿Hola como estás?" เป็นตัวอย่างการฝึกการแปลจากภาษาอังกฤษไปเป็นภาษาสเปน โดยไม่ต้องบอกภาษาต้นทาง

เครือข่ายประสาทเทียมถูกฝึกด้วยตัวอย่างการแปลจำนวนมาก โดยทดลองฝึกการแปลโปรตุเกส <-> อังกฤษ และ อังกฤษ <-> สเปน เมื่อสำเร็จแล้วทีมงานทดลองแปลภาษาที่ไม่เคยใส่อินพุตตัวอย่างไปเลย คือ โปรตุเกส <-> สเปน พบว่าเครือข่ายประสาทเทียมยังสามารถแปลได้ผลที่ดีพอสมควร และเมื่อฝึกเครือข่ายประสาทเทียมเพิ่มเติมด้วยข้อมูลการแปล โปรตุเกส <-> สเปน เพียงเล็กน้อย คุณภาพการแปลก็เพิ่มขึ้นเป็นอย่างมาก

ทีมงานแสดงข้อมูลในเครือข่ายประสาทเทียม แล้วพบว่ามันสามารถเชื่อมโยงกลุ่มประโยคที่มีความหมายเหมือนกันไว้ด้วยกัน ทำให้สามารถแปลภาษาข้ามไปจากข้อมูลที่เคยฝึกไว้ก่อนหน้า ในแง่นี้เสมือนว่าคอมพิวเตอร์สามารถสร้างภาษาสากลของมนุษย์ขึ้นมาได้

ที่มา - Google Research

Blognone Jobs Premium