New York Times ระบุ OpenAI ดูดวิดีโอ YouTube กว่าล้านชั่วโมงไปแปลงเป็นข้อความฝึก AI

by lew
8 April 2024 - 02:57

New York Times อ้างแหล่งข่าวไม่เปิดเผยตัว 3 คน ระบุว่า OpenAI ดูดวิดีโอ YouTube มากกว่าล้านชั่วโมงเพื่อไปฝึก GPT-4 แม้ว่าทีมงานภายในจะมีความกังวลว่าการทำเช่นนี้จะเป็นการละเมิดข้อตกลงการใช้งานของ YouTube

ที่ผ่านมาผู้พัฒนาปัญญาประดิษฐ์ในกลุ่ม LLM ต้องการข้อความจำนวนมากเพื่อมาฝึกปัญญาประดิษฐ์ และที่สำคัญข้อความเหล่านั้นต้องเป็นคอนเทนต์คุณภาพสูงเชื่อถือได้ เพื่อฝึกปัญญาประดิษฐ์ให้ตอบเฉพาะข้อมูลที่ถูกต้อง ทาง OpenAI เองก็มีโครงการซื้อคอนเทนต์เหล่านี้อยู่ โดยมีข่าวหลุดออกมาว่าราคาประมาณ 1-5 ล้านดอลลาร์ต่อปี

ข้อมูลที่ใช้ฝึกปัญญาประดิษฐ์ที่ผ่านมามักใช้ชุดข้อมูลไม่ต่างกันมากนัก โดยอาศัยชุดข้อมูลที่ดูดมาจากเว็บจำนวนมาก บางกลุ่มวิจัยเน้นข้อมูลจาก Wikipedia ที่มีการแก้ไขมาแล้ว แต่การขยายข้อมูลที่มากขึ้นหลังจากนี้เริ่มทำได้ยาก การดูดจากเว็บมาเรื่อยๆ ก็อาจจะได้ข้อมูลคุณภาพต่ำ

บริษัทอื่นๆ นอกจาก OpenAI นั้นมีความได้เปรียบเพราะมีแพลตฟอร์มของตัวเอง กูเกิลเคยระบุว่าใช้คอนเทนต์จาก YouTube มาฝึกปัญญาประดิษฐ์หากได้รับคำยินยอมจากเจ้าของคอนเทนต์ ส่วน Meta ก็มีแพลตฟอร์มอย่าง Instagram และ Facebook ซึ่งหากขออนุญาตในข้อตกลงการใช้งานต่างๆ เอาไว้ก็น่าจะนำข้อมูลมาฝึกได้ ขณะที่ OpenAI ไม่มีแพลตฟอร์มที่มีคนสร้างคอนเทนต์ให้จำนวนมากๆ มีเพียง ChatGPT ที่มีผู้ใช้จำนวนมาก แต่ก็เป็นเนื้อหาที่สร้างจากปัญญาประดิษฐ์เอง

ที่มา - New York Times

Blognone Jobs Premium