NVIDIA บอก DeepSeek R1 เป็นความก้าวหน้าของ Test-Time Scaling แต่งาน Pre และ Post ยังต้องการจีพียูมหาศาล

by arjin
28 January 2025 - 00:09

NVIDIA ชี้แจงกับสื่อหลังราคาหุ้นปรับลดลงแรง 17% จากความกังวลว่า DeepSeek ได้นำเสนอเทคโนโลยีการพัฒนาปัญญาประดิษฐ์ที่ไม่ต้องพึ่งพาฮาร์ดแวร์ประสิทธิภาพสูง จึงอาจเข้าสู่จุดพีคของความต้องการจีพียู

NVIDIA บอกว่าเทคโนโลยี DeepSeek ทำให้เห็นว่าเราสามารถสร้างโมเดลใหม่ขึ้นมาได้ โดยใช้เทคนิคหลายอย่าง รวมทั้งต่อยอดจากโมเดลโอเพนซอร์สที่มีอยู่ ร่วมกับการประมวลผลที่ถูกควบคุมไว้อย่างดี ซึ่งเป็นความก้าวหน้าในการทำส่วน Test-Time Scaling ตามกฎการ Scaling 3 อย่าง (Three Scaling Laws) ที่ซีอีโอ Jensen Huang เคยอธิบายไว้

NVIDIA บอกว่าความต้องการจีพียูยังคงมีอยู่ในส่วน Pre-Training Scaling และ Post-Training Scaling โดยเฉพาะงาน Inference ที่ต้องพึ่งพาการประมวลผลจำนวนมาก

ที่มา: CNBC

Blognone Jobs Premium