Blognone

OpenAI เปิดตัวแชทบ็อต ChatGPT คุยโต้ตอบได้เหมือนมนุษย์ ยอมรับได้ว่าตอบผิดหรือไม่รู้

authorby mk
published on2 December 2022 - 08:06

OpenAI เปิดให้ทดลองคุยกับแชทบ็อต ChatGPT ที่ใช้เอนจิน GPT เวอร์ชัน 3.5 ที่ปรับปรุงเพิ่มขึ้นจาก GPT-3 ที่เปิดตัวในปี 2021

ความสามารถของ ChatGPT เน้นไปที่การสนทนาโต้ตอบ ตอบคำถาม และสามารถยอมรับความผิดพลาดในสิ่งที่ตัวเองสุนทนาได้ ตัวอย่างที่ OpenAI นำมาโชว์คือการใช้ ChatGPT ช่วยหาบั๊กในโค้ดโปรแกรมตัวอย่าง

Mira Murati ซีทีโอของ OpenAI บอกว่าจุดเด่นของ ChatGPT ที่ต่างจากโมเดลสนทนาโต้ตอบตัวอื่นๆ คือการยอมรับได้ว่าไม่รู้ ไม่เข้าใจ หรือตอบผิดพลาดไป ไม่ได้พยายามตอบทุกสิ่งทุกอย่างเหมือนกับโมเดลรุ่นก่อนหน้า

เบื้องหลังการทำงานของ ChatGPT เป็นการเทรนด้วยวิธี Reinforcement Learning from Human Feedback (RLHF) โดยในช่วงแรกให้มนุษย์ที่ผ่านการอบรมเป็นผู้สอน AI ให้สนทนา (supervised training) จากนั้นนำบทสนทนาที่ได้มาจัดลำดับคุณภาพแล้วให้รางวัล เพื่อสร้างเป็น rewarding model แยกอีกชุด แล้วนำ rewarding model ไปปรับแต่งโมเดลหลักด้วยเทคนิค Proximal Policy Optimization (PPO) อีกทีหนึ่ง

กระบวนการเทรนทั้งหมดทำอยู่บนซูเปอร์คอมพิวเตอร์ของ Microsoft Azure ที่ร่วมลงทุนใน OpenAI อยู่ก่อนแล้ว

No Description

ทีมงาน OpenAI ยังยอมรับว่า ChatGPT มีข้อจำกัดบางอย่าง เช่น อาจสร้างคำตอบที่ฟังดูน่าเชื่อถือ แต่จริงๆ แล้วไม่ถูกต้อง เพราะในกระบวนการเทรนก็มีข้อจำกัดว่าข้อมูลไหนบ้างที่ถูกต้อง, คำตอบมักยาวเกินควร เพราะมี bias ตอนเทรนว่ามนุษย์ที่เป็นฝ่ายเทรนมักชอบคำตอบยาวๆ มากกว่า เป็นต้น

บริษัทอื่นๆ ที่ทำด้าน AI ต่างมีโมเดลสนทนาแบบเดียวกันนี้หลายตัว เช่น Sparrow ของ DeepMind และ Galactica ของ Meta

OpenAI ยังอยู่ระหว่างการพัฒนาโมเดลตัวใหม่คือ GPT-4 ซึ่งยังไม่ระบุชัดเจนว่าจะเปิดตัวเมื่อไร

No Description

ตัวอย่างคำตอบของ ChatGPT กับ InstructGPT เวอร์ชันก่อนหน้านี้ ด้วยคำถามยากๆ อย่าง "เล่าเรื่องคริสโตเฟอร์ โคลัมบัส มาที่สหรัฐอเมริกาในปี 2015" จะเห็นว่า InstructGPT พยายามตอบ (ไปเรื่อย) แต่ ChatGPT รู้ว่าเรื่องนี้ไม่ใช่ของจริง แต่ยังแต่งเรื่องมาตอบให้ได้

ที่มา - OpenAI, MIT Technology Review

Blognone Jobs Premium