Together.AI เปิดบริการ Serverless LoRA ไม่คิดค่าโฮสต์โมเดลที่ปรับแต่งแล้ว คิดแต่ค่ารันตามโทเค็น

by lew

24 December 2024 - 05:34

Together.AI ผู้ให้บริการคลาวด์ปัญญาประดิษฐ์เปิดบริการปรับแต่งโมเดล (finetune) แบบ LoRA เต็มรูปแบบ โดยทั้งการฝึกโมเดลและการรันโมเดลที่ปรับแต่งมาแล้ว

บริการ Severless LoRA สามารถใช้ adapter ที่ปรับแต่งมาแล้วจากที่อื่นได้ โดยคิดค่ารันตามโทเค็นเท่ากับโมเดลหลักเท่านั้น และสามารถใช้งานได้กับทุกโมเดลที่ทาง Together.AI ให้บริการแบบ serverless อยู่ เช่น Llama และ Qwen

ส่วนการทำ finetune บน Together.AI ก็สามารถอัพโหลดชุดข้อมูลขึ้นไปฝึกแบบ LoRA ได้ โดยคิดค่าบริการตามขนาดข้อมูลและจำนวนรอบการฝึก หลักฝึกฝึกเสร็จแล้ว โมเดลจะนำไปรันได้ทันทีหรือจะดาวน์โหลด adapter ไปใช้งานที่อื่นก็ได้เช่นกัน

โดยปกติแล้วบริการคลาวด์ปัญญาประดิษฐ์ที่รองรับการทำ finetune มักคิดค่าบริการโฮสต์โมเดลหากไม่ใช้งาน ทาง Together.AI ระบุว่าสามารถปรับแต่งจนรัน LoRA นับร้อยชุดได้พร้อมกัน ทำให้สามารถให้บริการลูกค้าโดยคิดราคาเท่าๆ กับโมเดลพื้นฐาน ประสิทธิภาพการรันอยู่ที่ 90% ของโมเดลหลัก

ที่มา - Together.AI

Read on Full Site

Blognone Jobs Premium