IBM ประกาศโอเพนซอร์สโมเดลช่วยเขียนโค้ดของตัวเองชื่อ Granite โดยบอกว่ามีประสิทธิภาพเหนือกว่าโมเดลโอเพนซอร์สคู่แข่งในขนาดใกล้เคียงกัน (7B-8B) เช่น Google Gemma หรือ Meta CodeLlama
Granite เป็นโมเดลที่อยู่เบื้องหลังบริการ Watsonx Code Assistant (WCA) ที่เปิดตัวเมื่อปีที่แล้ว และนำไปใช้งานกับโค้ด COBOL ในเมนเฟรม Z หรือ Ansible Lightspeed ของฝั่ง Red Hat
โมเดล Granite ที่เปิดซอร์สออกมามีขนาดหลากหลาย ได้แก่ 3B, 8B, 20B, 30B แต่ละขนาดแยกเป็นสองเวอร์ชันย่อยคือ โมเดลพื้นฐาน (base) และโมเดลที่ปรับจูนด้วยข้อมูลจาก Git ผสมกับคำสั่งของมนุษย์ (instruct)
IBM บอกว่าเชื่อในการพัฒนาแบบเปิด และมองว่าการโอเพนซอร์สจะช่วยสร้างชุมชนนักพัฒนาได้กว้างกว่า บริษัทยังเปิดเผยวิธีการเทรนให้โปร่งใสที่สุดเท่าที่ทำได้ เพื่อให้การนำไปใช้งานต่อในเชิงพาณิชย์ไม่ต้องมีข้อกังวลว่าจะถูกฟ้องในภายหลัง
โค้ดอยู่บน GitHub และ Hugging Face ใช้สัญญาอนุญาตแบบเปิดกว้าง Apache License 2.0
ที่มา - IBM