Mark Chen หัวหน้าทีมวิจัย OpenAI ชื่นชม DeepSeek R1 ค้นพบไอเดียสำคัญของ OpenAI o1 ได้ด้วยตัวเอง

by ShiRaTo

29 January 2025 - 12:58

Mark Chen (Chief Research Officer ของ OpenAI) แสดงความคิดเห็นผ่านทาง X (Twitter) ว่าขอแสดงความยินดีกับทีม DeepSeek ที่สามารถพัฒนาโมเดล LLM ให้มีความสามารถด้าน Reasoning เทียบเท่ากับ OpenAI o1 ได้

Chen กล่าวชื่นชมว่าทีมพัฒนา DeepSeek สามารถค้นพบแนวคิดหลักบางส่วนที่ทีม OpenAI ใช้ในการพัฒนา o1 ได้ด้วยตนเอง โดยระบุว่า "...they've independently found some of the core ideas that we did on our way to o1"

Chen แสดงความเห็นเพิ่มเติมว่า การวิพากษ์วิจารณ์จากภายนอกเกี่ยวกับเรื่องต้นทุน (cost) นั้นอาจเกินจริงไป โดยอธิบายว่าการพัฒนา LLM ที่สามารถสเกลได้ 2 แกนคือ Pre-training และ Reasoning นั้น แม้ว่าสามารถ optimize ร่วมกันทั้งสองแกนเพื่อลดต้นทุนได้ แต่ OpenAI ยังคงต้องการสเกล และผลักดันพลังประมวลผลให้สูงที่สุดในทั้งสองด้านอยู่ดี

Chen มองว่าด้วยความก้าวหน้าของการวิจัยด้าน Distillation ในปัจจุบัน การพยายามพัฒนาโมเดลด้าน "capability" และการ "ลดต้นทุน" จะแยกออกจากกันชัดเจนมากขึ้น (decoupled) ซึ่งหมายความว่า ความสามารถในการพัฒนาโมเดลที่มีต้นทุนต่ำลง (โดยเฉพาะการเพิ่ม latency อย่างในกรณีของ DeepSeek R1) ไม่ได้หมายความว่าจะสามารถพัฒนาโมเดลที่มีความสามารถดีขึ้นได้

Chen ปิดท้ายว่า OpenAI ยังคงมุ่งมั่นที่จะพัฒนา models ที่มีต้นทุนต่ำลง เขาเชื่อมั่นใน research roadmap ปัจจุบัน และเขายังตื่นเต้นที่จะเปิดตัวโมเดลที่มีประสิทธิภาพดีขึ้นอย่างต่อเนื่องภายในไตรมาสนี้ และในอนาคตแน่นอน

ที่มา: โพสต์ของ Mark Chen บน X

Read on Full Site

Blognone Jobs Premium