กูเกิลปล่อยโครงการ Tensor2Tensor (T2T) ชุดเครื่องมือสำหรับช่วยแยกปัญหาออกจากการออกแบบโมเดล deep learning ทำให้สามารถทดลองปัญหาเดิมกับโมเดลใหม่ๆ ได้มากขึ้น ช่วยให้นักวิจัยสามารถออกแบบโมเดลได้อย่างมีประสิทธิภาพ พร้อมกับสาธิตการใช้งานด้วยรายงานวิจัย MultiModel โมเดล deep learning ที่ทำงานหลายอย่างได้พร้อมกัน ได้แก่ บรรยายภาพ, จัดหมวดหมู่ภาพ, แปลภาษา, แปลงเสียงเป็นข้อความ, และวิเคราะห์โครงสร้างประโยค
MultiModel เป็นโมเดล deep learning ที่มีความซับซ้อนสูง มีกระบวนการเข้ารหัสข้อมูลและถอดรหัสเอาผลลัพธ์ได้หลายทางตามงานประเภทต่างๆ โดยยังสามารถทำงานประเภทต่างๆ ได้ความแม่นยำในระดับดีพอใช้ แถมการฝึกปัญหาหลายอย่างไปพร้อมกันกลับเพิ่มความแม่นยำในงานประเภทต่างๆ ได้
ก่อนหน้านี้กูเกิลเคยอาศัยการฝึกแปลภาษาเพื่อสร้างโมเดลที่สามารถแปลภาษาในคู่ภาษาที่ไม่มีข้อมูลฝึก ได้แล้ว แต่ครั้งนี้เป็นการฝึกงานคนละประเภทแต่กลับเพิ่มความแม่นยำของโมเดลได้
ตัวโครงการ T2T มีตัวสร้างข้อมูลที่ได้รับความนิยมสูงไว้ในตัวทั้งข้อมูลด้านภาษาและภาพ กูเกิลระบุว่าการใช้โครงการนี้ทำให้กูเกิลสามารถสร้างตัววิเคราะห์ภาษาบนชุดข้อมูลใหม่ได้ในไม่กี่วัน
ซอร์สโค้ดอยู่บน GitHub
ที่มา - Google Research