AlphaGo Zero สอนตัวเองให้เล่นหมากรุก ใช้เวลา 4 ชั่วโมงก็ล้มโปรแกรมแชมป์เก่าได้

by mk
11 December 2017 - 23:54

เราเพิ่งเห็นข่าว DeepMind พัฒนา AlphaGo Zero ไม่ต้องใช้ข้อมูลการเล่นของมนุษย์ สามารถเทรนตัวเองได้จากการเล่นแข่งกับตัวเองเพียงอย่างเดียว

แนวคิดของ AlphaGo Zero ไม่ได้ใช้แค่การเล่นโกะเท่านั้น เพราะทาง DeepMind นำมันไปใช้กับหมากรุกด้วย

ชื่อของ AI เปลี่ยนมาเป็น AlphaZero (ตัดคำว่า Go ออกไป) และใช้เวลาหัดเล่นหมากรุกด้วยตัวเองเพียง 4 ชั่วโมง ก็สามารถเอาชนะโปรแกรมเล่นหมากรุกที่เก่งที่สุดคือ Stockfish ได้ ทางทีม DeepMind ยังเอามันไปฝึกเล่นหมากรุกญี่ปุ่น (โชงิ) และใช้เวลาฝึกเพียง 2 ชั่วโมงก็เอาชนะบ็อตโชงิได้

เป้าหมายของ DeepMind คือสร้าง AI ที่ทำงานทั่วไป (more generic) มากกว่างานเฉพาะทางอย่างการเล่นโกะเพียงอย่างเดียว

ที่มา - Ars Technica, ภาพจาก Pexels

Blognone Jobs Premium