กูเกิลโอเพนซอร์ส SynthID Text ซอฟต์แวร์ใส่ลายน้ำในข้อความเพื่อบอกว่าสร้างโดย AI

by mk
24 October 2024 - 09:31

Google DeepMind เปิดซอร์สโค้ด SynthID Text ตัวช่วยสร้างลายน้ำเพื่อบอกว่าข้อความสร้างด้วย AI เพื่อนำไปใช้ตรวจสอบได้ในอนาคต

Google DeepMind มี SynthID สำหรับทำลายน้ำลงในภาพ AI อยู่ก่อนแล้ว กรณีของภาพ ทุกคนคงนึกออกว่าการแทรกลายน้ำที่แยกด้วยสายตามนุษย์ไม่เห็นคงทำได้ไม่ยากนัก เพราะในหนึ่งภาพมีปริมาณข้อมูลอยู่มาก การแทรกลายน้ำเพิ่มไปอีกหน่อยคงไม่ใช่เรื่องยาก แต่เมื่อต้องใส่ลายน้ำลงในข้อความ text ล้วนๆ จะทำอย่างไร

SynthID Text ใช้หลักการว่า โมเดลภาษา LLM คือ "เครื่องพ่นคำ" คาดเดาคำถัดไปจากความน่าจะเป็น โดยคำหรือ token ที่มีค่าความน่าจะเป็นสูงสุดจะถูกคัดเลือกออกมาเป็นผลลัพธ์ให้ผู้ใช้เห็น

สิ่งที่ SynthID Text ทำคือเข้าไปเปลี่ยนค่า "ความน่าจะเป็น" ในขั้นตอนสุดท้ายก่อนโมเดล LLM พ่นคำออกมา (ไม่จำเป็นต้องไปยุ่งกับตัวโมเดล ไม่ต้องเทรนใหม่) ซึ่งจะได้ผลลัพธ์ที่แตกต่างออกไปบ้าง แต่ SynthID จะพยายามรักษาคุณภาพของผลลัพธ์ให้ใกล้เคียงกับต้นฉบับจาก LLM เอาไว้

ผลลัพธ์ที่ผ่าน SynthID จะมีบางคำในข้อความที่ถูกปรับน้ำหนักความน่าจะเป็นโดย SynthID โดยน้ำหนักเหล่านี้สามารถปรับค่าได้จากตัวซอฟต์แวร์ SynthID โดยตรง ทำให้ผู้สร้างโมเดล LLM ที่ปรับน้ำหนักแล้วทราบว่าตัวเองปรับน้ำหนักคำไว้อย่างไร และสามารถตั้งคอนฟิกให้ตัวตรวจจับข้อความ AI รู้จักแพทเทิร์นของน้ำหนักที่ตั้งค่าไว้ได้ จึงพยากรณ์ได้แม่นยำว่าข้อความนี้สร้างด้วย AI หรือไม่

DeepMind บอกว่าเทคนิค SynthID Text ใช้ได้กับข้อความที่สั้นเพียง 3 ประโยคขึ้นไป และถ้าข้อความยิ่งยาวเท่าไร การตรวจจับก็ยิ่งมีความแม่นยำสูงขึ้นด้วย แต่ถ้าข้อความถูกนำไปดัดแปลงต่อในภายหลัง (เช่น มนุษย์ไปปรับแก้) โอกาสตรวจจับได้ย่อมลดลง

เทคนิค SynthID ถูกนำมาใช้งานแล้วกับข้อความที่สร้างโดย Gemini แล้ว และทางทีมวิจัยของ Google DeepMind ได้ลองนำข้อความจาก Gemini เกือบ 20 ล้านข้อความ ทั้งที่ใส่ลายน้ำและไม่ใส่มาตรวจสอบคุณภาพของผลลัพธ์ จากการให้ thumb up/down โดยผู้ใช้งาน พบว่าแทบไม่แตกต่าง (คะแนนห่างกัน 0.01%-0.02%)

ไลบรารี SynthID Text เปิดเป็นโอเพนซอร์สแล้วบน GitHub ใช้ไลเซนส์เปิดกว้าง Apache 2.0 และตอนนี้มี Hugging Face นำไปใช้งานแล้วในโมเดลตระกูล Transformers บนแพลตฟอร์มของตัวเอง

ที่มา - Google, Google AI, SynthID

Blognone Jobs Premium