NVIDIA เปิดตัวโมเดล Nemotron-4 340B สร้างข้อมูลสังเคราะห์สำหรับเทรน LLM อีกที

by mk
17 June 2024 - 03:18

NVIDIA เปิดตัวโมเดล Nemotron-4 340B เป็นโมเดลสำหรับสร้างข้อมูลสังเคราะห์ (synthetic data) เพื่อใช้เทรนโมเดลภาษาขนาดใหญ่ LLM อีกทีหนึ่ง

จุดเด่นของ Nemotron-4 340B คือการสร้างข้อมูลคุณภาพสูงในราคาถูก ตัวสัญญาอนุญาตเป็น NVIDIA Open Model ใช้งานในเชิงพาณิชย์ได้ฟรี นำโมเดลไปดัดแปลงต่อได้

Nemotron-4 ประกอบด้วยโมเดล 3 ตัวทำงานร่วมกันคือ base, instruct, reward ปรับแต่งให้ทำงานกับเฟรมเวิร์ค NVIDIA NeMo และจะออกแพ็กเกจสำหรับ NVIDIA NIM ให้นำไปดีพลอยบนเครื่องต่างๆ ได้สะดวก โมเดลสามารถดาวน์โหลดได้แล้วจาก Hugging Face

ที่มา - NVIDIA

Blognone Jobs Premium