ทีม Qwen ของ Alibaba Cloud เปิดโมเดล QvQ-72B-Preview ที่พัฒนาต่อจาก Qwen-VL-72B แต่ฝึกให้คิดเป็นขั้นเป็นตอนเพื่อเพิ่มความแม่นยำมากขึ้น
ผลทดสอบที่ทีม Qwen ใช้ทดสอบมี 4 ชุด ได้แก่ MMMU, MathVista, MathVision, และ OlympiadBench คะแนนที่ได้ขึ้นไปถึงระดับ Claude 3.5 Sonnet เข้าใกล้ OpenAI o1 มากขึ้น โดยพฤติกรรมของโมเดลจะคิดไปเรื่อยๆ และตอบคำถามสุดท้าย
โมเดลเปิดให้ทดสอบผ่าน HuggingFace ไฟล์โมเดลเปิดให้ดาวน์โหลดในไลเซนส์แบบ Qwen License โดยตอนนี้ยังส่งคำสั่งได้รอบเดียว ไม่สามารถคุยต่อเนื่องได้
ที่มา - QwenLM