เราเพิ่งเห็นข่าว DeepMind พัฒนา AlphaGo Zero ไม่ต้องใช้ข้อมูลการเล่นของมนุษย์ สามารถเทรนตัวเองได้จากการเล่นแข่งกับตัวเองเพียงอย่างเดียว
แนวคิดของ AlphaGo Zero ไม่ได้ใช้แค่การเล่นโกะเท่านั้น เพราะทาง DeepMind นำมันไปใช้กับหมากรุกด้วย
ชื่อของ AI เปลี่ยนมาเป็น AlphaZero (ตัดคำว่า Go ออกไป) และใช้เวลาหัดเล่นหมากรุกด้วยตัวเองเพียง 4 ชั่วโมง ก็สามารถเอาชนะโปรแกรมเล่นหมากรุกที่เก่งที่สุดคือ Stockfish ได้ ทางทีม DeepMind ยังเอามันไปฝึกเล่นหมากรุกญี่ปุ่น (โชงิ) และใช้เวลาฝึกเพียง 2 ชั่วโมงก็เอาชนะบ็อตโชงิได้
เป้าหมายของ DeepMind คือสร้าง AI ที่ทำงานทั่วไป (more generic) มากกว่างานเฉพาะทางอย่างการเล่นโกะเพียงอย่างเดียว
ที่มา - Ars Technica, ภาพจาก Pexels