นักเขียนนิยาย 2 คนคือ Mona Awad และ Paul Tremblay ยื่นฟ้อง OpenAI ในข้อหานำนิยายไปใช้เทรนโมเดลโดยไม่ได้รับคำอนุญาต
นักเขียนทั้งสองคนระบุในคำฟ้องว่า ChatGPT สามารถสรุปเนื้อหาในนิยายของพวกเขาออกมาได้อย่างแม่นยำ (ตัวอย่างจากในคำฟ้อง) จึงเชื่อว่านิยายถูกนำไปใช้เทรนโมเดล และกลายเป็น OpenAI ได้รับผลประโยชน์อย่างไม่เป็นธรรมต่อผู้สร้างเนื้อหา ซึ่งได้รับความคุ้มครองตามกฎหมายลิขสิทธิ์อยู่แล้ว
The Guardian ชี้ว่า การพิสูจน์ว่า OpenAI นำเนื้อหาไปใช้งานนั้นทำได้ยาก เพราะตัวโมเดลเองอาจมีความสามารถสรุปเนื้อหาได้โดยไม่จำเป็นต้องเทรนด้วยข้อความจากหนังสือมาก่อน เพราะโมเดลอาจเทรนด้วยเนื้อหาในอินเทอร์เน็ตที่สนทนาถึงหนังสือฉบับนั้นๆ แทนได้อยู่แล้ว
OpenAI เองยังปิดบังไม่บอกแหล่งที่มาของข้อมูลที่ใช้เทรน โดยบอกเพียงแค่ว่าใช้ฐานข้อมูลหนังสือชื่อ Books2 ที่น่าจะมีหนังสือราว 294,000 เล่ม และเป็นไปได้ว่าอาจนำมาจากแหล่งหนังสือละเมิดลิขสิทธิ์อย่างเช่นใน BitTorrent
ผู้สนใจคำฟ้องเรื่องลิขสิทธิ์กับ LLM (ซึ่งน่าจะเป็นเคสแรกในโลก) สามารถอ่านรายละเอียดได้ที่ LLM Litigation
ที่มา - The Guardian