IBM เปิดตัวโมเดลโอเพนซอร์ส Granite 3.0 ประสิทธิภาพดีกว่า Llama 3.1 และ Mistral

by mk
23 October 2024 - 01:23

IBM เปิดตัวโมเดล Granite เวอร์ชัน 3.0 ซึ่งเป็นเวอร์ชันอัพเดตจาก Granite 1.0 ที่เปิดตัวเมื่อเดือนพฤษภาคม

Granite เป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่เปิดเป็นโอเพนซอร์สใต้สัญญาอนุญาตแบบเปิดกว้าง Apache 2.0 ชูจุดเด่นด้านประสิทธิภาพสูงกว่าหรือเทียบเท่าโมเดล LLM โอเพนซอร์สหรือเชิงพาณิชย์

Granite 3.0 มีให้เลือก 2 ขนาดพารามิเตอร์คือ 2B และ 8B โดย IBM โชว์เบนช์มาร์คคะแนน Hugging Face OpenLLM Leaderboard ว่าสามารถเอาชนะโมเดลโอเพนซอร์สขนาดใกล้เคียงกันอย่าง Llama 3.1 8B และ Mistral 7B

จุดเด่นอีกอย่างของ Granite 3.0 คือการออกแบบสถาปัตยกรรมแบบ Granite Mixture of Experts (MoE) ที่ตอบคำถามได้เร็ว (low latency) และลดต้นทุนการค่ารันโมเดลลงได้ ตัวโมเดลรุ่นเล็ก 2B สามารถรันในระบบที่มีแต่ซีพียูอย่างเดียวได้

ตอนนี้ Granite 3.0 เปิดให้ใช้งานแล้วบนคลาวด์ยี่ห้อต่างๆ เช่น IBM watsonx, Google Cloud Vertex AI, NVIDIA NIM และตัวโมเดลดาวน์โหลดได้จาก Hugging Face

ที่มา - IBM, IBM

Blognone Jobs Premium