OpenAI เปิดตัวโมเดลปัญญาประดิษฐ์รุ่นใหม่ตระกูล o1 เป็นโมเดลเน้นตอบคำถามด้านวิทยาศาสตร์, คณิตศาสตร์, และการเขียนโปรแกรม แนวทางการทำงานต่างจากโมเดลก่อนหน้านี้คือ o1 มีความสามารถ "ค่อยๆ คิด" ก่อนจะทำให้คำตอบ ทำให้สามารถตอบสนองต่อคำสั่งที่ซับซ้อน เช่น การสร้างเกมตามกำหนด
โมเดลมี 3 ตัว ได้แก่ o1, o1-preview, และ o1-mini การทดสอบชุดทดสอบแข่งขันคณิตศาสตร์ AIME o1 ได้ 74.4% ขณะที่ o1-mini ได้ 70% หากเทียบผู้เข้าแข่งจริงก็อยู่ระดับ 500 คนแรกของสหรัฐฯ ในระดับมัธยมแล้ว ส่วนการทดสอบแข่งเขียนโปรแกรม Codeforce นั้น o1 ได้ Elo 1673 ขณะที่ o1-mini ได้ 1650 เป็น percentile ที่ 86 ของผู้เข้าแข่งทั้งหมด
เนื่องจากโมเดลถูกฝึกมาเฉพาะทาง เมื่อต้องทดสอบความรู้รอบตัวอย่าง MMLU คะแนนของ o1-mini จะต่ำกว่า GPT-4o แต่โมเดลตัวอื่นในตระกูลยังทำคะแนนได้สูงกว่า
ระดับความช้าของ o1 นั้นหากคำถามที่ GPT-4o ใช้เวลา 3 วินาที o1-mini จะใช้เวลา 9 วินาที และ o1-preview จะใช้เวลาถึง 32 วินาที
ผู้ใช้ ChatGPT แบบเสียเงินจะสามารถเลือกใช้ o1-mini และ o1-preview ได้แล้ว แต่จำกัดข้อความต่อสัปดาห์ สำหรับการใช้งานผ่าน API นั้นยังจำกัดเฉพาะลูกค้าระดับ Tier 5 (จ่ายเงินมาแล้วเกิน 1,000 ดอลลาร์) เท่านั้น และจำกัดแค่ 20RPM เท่านั้น แต่ในอนาคตมีแผนจะเปิด o1-mini ให้ผู้ใช้ฟรีทุกคน
ที่มา - OpenAI