Together.AI ผู้ให้บริการคลาวด์ปัญญาประดิษฐ์เปิดบริการปรับแต่งโมเดล (finetune) แบบ LoRA เต็มรูปแบบ โดยทั้งการฝึกโมเดลและการรันโมเดลที่ปรับแต่งมาแล้ว
บริการ Severless LoRA สามารถใช้ adapter ที่ปรับแต่งมาแล้วจากที่อื่นได้ โดยคิดค่ารันตามโทเค็นเท่ากับโมเดลหลักเท่านั้น และสามารถใช้งานได้กับทุกโมเดลที่ทาง Together.AI ให้บริการแบบ serverless อยู่ เช่น Llama และ Qwen
ส่วนการทำ finetune บน Together.AI ก็สามารถอัพโหลดชุดข้อมูลขึ้นไปฝึกแบบ LoRA ได้ โดยคิดค่าบริการตามขนาดข้อมูลและจำนวนรอบการฝึก หลักฝึกฝึกเสร็จแล้ว โมเดลจะนำไปรันได้ทันทีหรือจะดาวน์โหลด adapter ไปใช้งานที่อื่นก็ได้เช่นกัน
โดยปกติแล้วบริการคลาวด์ปัญญาประดิษฐ์ที่รองรับการทำ finetune มักคิดค่าบริการโฮสต์โมเดลหากไม่ใช้งาน ทาง Together.AI ระบุว่าสามารถปรับแต่งจนรัน LoRA นับร้อยชุดได้พร้อมกัน ทำให้สามารถให้บริการลูกค้าโดยคิดราคาเท่าๆ กับโมเดลพื้นฐาน ประสิทธิภาพการรันอยู่ที่ 90% ของโมเดลหลัก
ที่มา - Together.AI