เปิดตัว Amazon Nova ปัญญาประดิษฐ์ LLM รองรับ 200 ภาษา อ่านภาพ, ดูวิดีโอได้ ถูกกว่าคู่แข่ง 75%

by lew
4 December 2024 - 02:25

Amazon เปิดตัวชุดโมเดลปัญญาประดิษฐ์ Amazon Nova ในชุดมีโมเดลถึง 6 ตัวมีความสามารถต่างกันไป

  • Amazon Nova Micro: โมเดลขนาดเล็กอ่านข้อความได้อย่างเดียว เน้นตอบเร็ว ราคาถูก รองรับข้อความยาวสุด 128,000 token ราคาอินพุต 0.035 ดอลลาร์ต่อล้านโทเค็น และเอาท์พุต 0.14 ดอลลาร์ต่อล้านโทเค็น
  • Amazon Nova Lite: โมเดลขนาดเล็กรองรับข้อตวาม, ภาพ, วิดีโอ เน้นราคาถูกเช่นกัน รองรับอินพุต 300,000 token ราคาอินพุต 0.06 ดอลลาร์ต่อล้านโทเค็น และเอาท์พุต 0.24 ดอลลาร์ต่อล้านโทเค็น
  • Amazon Nova Pro: โมเดลประสิทธิภาพสูงแต่คำนึงถึงทั้งราคา, ความเร็ว, และความแม่นยำ รองรับอินพุต 300,000 token ราคาอินพุต 0.8 ดอลลาร์ต่อล้านโทเค็น และเอาท์พุต 3.2 ดอลลาร์ต่อล้านโทเค็น
  • Amazon Nova Premier: โมเดลประสิทธิภาพสูงสุด ใช้สอนโมเดลอื่นๆ
  • Amazon Nova Canvas: โมเดลสร้างภาพจากข้อความ ราคาขึ้นกับคุณภาพภาพ แบบมาตรฐาน 0.04 ดอลลาร์ต่อภาพ และสูงสุด 0.08 ดอลลาร์ต่อภาพ
  • Amazon Nova Reel: โมเดลสร้างวิดีโอ ความละเอียด 720p แบบ 24 เฟรมต่อวินาที ราคา 0.08 ดอลลาร์ต่อวินาที

ความพิเศษคือโมเดล LLM ในกลุ่มที่รองรับ Multimodal นั้นจะรองรับการทำ fine-tuning ทุกรูปแบบทั้งข้อความ, ภาพ, และวิดีโอเหมือนกัน

คะแนนทดสอบของ Nova Micro, Lite, และ Pro นั้นเกาะกลุ่มกับ GPT-4o, Gemimi 1.5 Pro, และ Claude 3.5 Sonnet เมื่อทดสอบงานหลักๆ เช่น ด้านการเขียนโปรแกรม, การเงิน, และการค้นข้อมูล แต่ที่น่าสนใจคือการทดสอบ GroundUI-1K ที่ทดสอบการสั่งหน้าจอต่างๆ นั้น Nova Pro และ Nova Lite ทำได้ดีกว่ามาก

ทาง Amazon ประกาศแผนว่าจะทำโมเดล speech-to-speech คุยเสียงได้โดยตรงภายในไตรมาสแรกของปี 2025 และเตรียมพัฒนาไปสู่โมเดล any-to-any สามารถใส่อินพุตแบบใดก็ได้ และขอเอาท์พุตแบบใดก็ได้ภายในกลางปี 2025

ที่มา - Press Release, About Amazon, Amazon.Science

Blognone Jobs Premium