กูเกิลเปิดบริการ Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุด ราคาถูกลง 50% จาก Flash รุ่นปกติ

by mk
3 October 2024 - 23:52

กูเกิลเปิดให้ใช้งาน Gemini 1.5 Flash-8B โมเดลรุ่นเล็กสุดของ Gemini Flash ที่เปิดทดลองใช้ฟรีก่อนหน้านี้

Gemini 1.5 Flash-8B เป็นโมเดลที่ปรับขนาดให้เล็กลงเหลือ 8 พันล้านพารามิเตอร์ ในแง่ความฉลาดอาจลดลงบ้างเมื่อเทียบกับ Gemini 1.5 Flash รุ่นปกติ แลกกับข้อดีที่ได้มาคือ ราคาถูกลง 50%, ตอบสนองเร็วขึ้น, และมีอัตรา rate limit เพิ่มขึ้น 2 เท่า (สูงสุด 4,000 รีเควสต์ต่อนาที ของเดิม 2,000 รีเควสต์ต่อนาที)

ราคาของ Gemini 1.5 Flash-8B ถือว่าถูกที่สุดในการรันโมเดล Gemini ทุกตัว ได้แก่

  • $0.0375 per 1 million input tokens กรณี prompt เล็กกว่า 128K (ของเดิม $0.075)
  • $0.15 per 1 million output tokens (ของเดิม $0.30)
  • $0.01 per 1 million tokens on cached prompts

ที่มา - Google for Developers

Blognone Jobs Premium