กูเกิลเปิดตัวโมเดล LLM ตัวใหม่ Gemini 2.5 Pro ที่พัฒนาความเก่งโดยอาศัยการฝึกจนกว่าจะทำแบบทดสอบถูก (reinforced learning) และฝึกให้คิดก่อนตอบ (chain of thought) โดยระบุว่าหลังจากนี้จะฝึกโมเดลต่อๆ ไปโดยฝังแนวทางคิดก่อนตอบไว้เสมอเพื่อให้โมเดลมีความสามารถสูง
ผลทดสอบ Gemini 2.5 Pro ด้านการเขียนโปรแกรมนั้นสูงขึ้นมาก ผลทดสอบ Aider สูงสุดในตอนนี้เหนือ DeepSeek-R1 แม้ว่าผลทดสอบ SWE-bench verified ที่เน้นปัญหาจริงจะยังแพ้ Claude 3.7 แต่ก็นับว่าใกล้เคียงขึ้นมาก ผลการทดสอบบน LM Arena นั้นตอนนี้ Gemini 2.5 Pro ขึ้นที่หนึ่งทั้งตาราง ใกล้เคียงกับ GPT-4.5 และ Grok-3 Preview
จุดแข็งมากๆ ของ Gemini 2.5 คือรองรับอินพุต 1 ล้านโทเค็นพร้อมมีแผนจะขยายเป็น 2 ล้านโทเค็น ตอนนี้มีให้ลองใช้งานใน Google AI Studio และแอป Gemini สำหรับลูกค้า Gemini Advanced ส่วนบริการผ่าน Vertex AI จะตามมาภายหลัง โดยตอนนี้ยังไม่บอกราคาค่าบริการ
ที่มา - Gemini