NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง
จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้
Nemotron-4 ประกอบด้วยโมเดล 3 ตัวทำงานร่วมกันคือ base, instruct, reward ปรับแต่งให้ทำงานกับเฟรมเวิร์ค NVIDIA NeMo และจะออกแพ็กเกจสำหรับ NVIDIA NIM ให้นำไปดีพลอยบนเครื่องต่างๆ ได้สะดวก โมเดลสามารถดาวน์โหลดได้แล้วจาก Hugging Face
ที่มา - NVIDIA