MariaDB 10.1.16 เรียงลำดับข้อความภาษาไทยในตาราง UTF-8 ถูกต้องแล้ว

by lew
22 July 2016 - 11:52

เมื่อต้นสัปดาห์ MariaDB ออกรุ่นอัพเดตย่อย 10.1.16 แต่สำหรับคนไทยรุ่นนี้มีความสำคัญเพราะระบบการเรียงข้อความภาษาไทยเป็นไปตามหลักภาษาไทยแล้ว

ปัญหาการเรียงลำดับภาษาไทยเป็นข้อจำกัดของระบบฐานข้อมูลหลายตัว เพราะภาษาไทยไม่ได้เรียงตามลำดับตัวอักษรโดยตรงแต่เรียงตามพยัญชนะ เช่น "กา", "ขา", "เก" ควรเรียงเป็น "กา", "เก", "ขา" ตามลำดับ

ที่ผ่านมา MariaDB รองรับการเรียงลำดับภาษาไทยอย่างถูกต้องก็ต่อเมื่อเลือกใช้ตารางเข้ารหัสตัวอักษรเป็น TIS-620 เท่านั้น แต่แพตช์ fb35b9ad ที่เพิ่งรับเข้าไปเมื่อปลายเดือนพฤษภาคมที่ผ่านมาแก้ปัญหานี้ในตารางที่เป็น UTF-8 แล้ว แพตช์นี้เข้าไปใน MariaDB ตั้งแต่รุ่น 10.1.15 แต่รุ่นนี้ไม่ได้ปล่อยออกมาให้คนทั่วไปใช้งาน

รุ่นทดลองของ MariaDB คือรุ่น 10.2.1 ก็ได้รับแพตช์นี้ด้วยเช่นกัน

ที่มา - Medium: @pruet

Blognone Jobs Premium