OpenAI สาธิตปัญญาประดิษฐ์ควบคุมหุ่นยนต์มือเดียว แก้ปัญหารูบิกกับหุ่นยนต์จริงโดยฝึกในซิมอย่างเดียว

by lew
15 October 2019 - 17:57

OpenAI บริษัทพัฒนาปัญญาประดิษฐ์ที่ก่อตั้งโดย Elon Musk สาธิตเทคนิคการฝึกปัญญาประดิษฐ์เพื่อควบคุมหุ่นยนต์ในโลกความเป็นจริง โดยสร้างโมเดลปัญญาประดิษฐ์ที่มีความซับซ้อนสูง ผ่านการสร้างโจทย์ให้หุ่นยนต์มือเดียวต้องแก้ปัญหารูบิก

โมเดลปัญญาประดิษฐ์จะถูกฝึกในซอฟต์แวร์จำลองหุ่นยนต์เท่านั้น เท่าให้สามารถบอกปัญญาประดิษฐ์ได้ว่าแก้ปัญหาลูกรูบิกสำเร็จหรือยัง แต่อาศัยการสร้างสภาพแวดล้อมที่เปลี่ยนไปแต่ละรอบ (domain randomization) เพื่อให้โมเดลปัญญาประดิษฐ์ทนทานต่อความไม่แน่นอนในโลกความเป็นจริง โดยการวิจัยครั้งนี้ทาง OpenAI สร้างสภาพแวดล้อมที่เปลี่ยนไปเรื่อยๆ โดยเรียกว่าเทคนิค Automatic Domain Randomization (ADR)

ADR สร้างสภาพแวดล้อมที่เปลี่ยนไปเรื่อยๆ เช่น ขนาดลูกรูบิกที่เปลี่ยนไปเรื่อยๆ เพื่อให้โจทย์ยากขึ้นเรื่อยๆ สำหรับโมเดลปัญญาประดิษฐ์ โดยไม่ต้องให้นักวิจัยมากำหนดพารามิเตอร์ล่วงหน้า

หลังจากนำโมเดลมารันบนหุ่นยนต์จริงแล้ว นักวิจัยทดสอบความทนทานของโมเดลด้วยการเปลี่ยนสภาพแวดล้อมแบบใหม่ๆ เช่นการมัดนิ้วของมือหุ่นยนต์, เอาตุ๊กตาไปขยับลูกรูบิก, หรือเอาผ้าไปคลุมมือหุ่นยนต์ และพบว่าโมเดลยังคงแก้ปัญหาได้ดีกว่าที่คาดไว้

อัตราการแก้ปัญหาสำเร็จของโมเดลปัญญาประดิษฐ์อยู่ที่ 20% หากลูกรูบิกเริ่มต้นหมุนไว้ให้ต้องหมุน 26 ครั้งจึงแก้ได้ ขณะที่อัตราการแก้สำเร็จจะเพิ่มขึ้นเป็น 60% เมื่อลูกรูบิกต้องหมุน 15 ครั้งจึงแก้ได้

ที่มา - OpenAI

Blognone Jobs Premium