Apple เผยแพร่งานวิจัย AI ที่สามารถแก้ไขรูปภาพได้ตามคำสั่ง Natural Language

by arjin
7 February 2024 - 15:48

แอปเปิลเผยแพร่งานวิจัยด้าน AI ต่อสาธารณะ โดยเป็นโมเดลโอเพนซอร์ส ที่สามารถแก้ไขรูปภาพได้ตามคำสั่งภาษาธรรมชาติ (Natural Language) ซึ่งพัฒนาและวิจัยโดยทีมวิจัยของแอปเปิล ร่วมกับทีมนักวิจัยจาก University of California, Santa Barbara

โมเดล AI ตัวนี้มีชื่อว่า "MGIE" ย่อมาจาก MLLM-Guided Image Editing โดยนำโมเดลข้อมูลผสมผสานภาษาขนาดใหญ่ มาต่อยอดให้รับคำสั่งเพื่อแก้ไขรูปภาพในหลายแบบ ทั้งระดับเล็กที่พิกเซล จนถึงการแก้ไขภาพรวม

ตัวอย่างที่นำเสนอในงานวิจัย แสดงให้เห็นความสามารถในการตีความคำสั่ง แล้วแก้ไขภาพให้ได้ใกล้เคียงความต้องการที่สุด เช่น รูปพิซซ่า เมื่อบอกให้ดูเป็นเมนูสุขภาพมากขึ้น ก็แก้ไขโดยเติมผักเข้าไป หรือสามารถสั่งแก้ไขรายละเอียดปลีกย่อย เช่น ลบคนด้านหลัง, แก้ไขหน้าจอคอมพิวเตอร์ในภาพ เป็นต้น

ความสามารถของ MGIE ที่อธิบายไว้ได้แก่ การแก้ไขบรรยากาศภาพรวม, การแก้ไขลักษณะตามคำสั่งแบบ Photoshop เช่น คร็อป ปรับขนาด หมุน, ปรับแสง ความคมชัด ความสว่าง, แก้ไขวัตถุที่ระบุในภาพ

MGIE เป็นโครงการโอเพนซอร์สสามารถดูเพิ่มเติมได้ที่ GitHub

ที่มา: VentureBeat

ตัวอย่างการแก้ไขของ MGIE ด้วยคำสั่งต่าง ๆ

Blognone Jobs Premium