ParadeDB ผู้พัฒนา PostgreSQL เวอร์ชั่นสำหรับงานวิเคราะห์ข้อมูล เปิดตัว pg_lakehouse ที่เพิ่มฟีเจอร์ทำให้สามารถใช้งาน PostgreSQL แทนที่ฐานข้อมูลเฉพาะทางอย่าง DuckDB
ฟีเจอร์สำคัญของ pg_lakehouse คือการดึงข้อมูลภายนอกออกมาเป็นเหมือนตารางใน PostgreSQL โดยข้อมูลที่ดึงเข้ามาใส่ไปยัง Apache DataFusion ที่เป็นเอนจินการคิวรีแบบ analytics ประสิทธิภาพใกล้เคียงกับ DuckDB โดยก่อนหน้านี้ก็มีส่วนขยายอื่นคล้ายกัน แต่ pg_lakehouse ใช้ Apache OpenDAL สำหรับแปลงข้อมูลทำให้รองรับชนิดไฟล์จำนวนมาก หากการคิวรีใดไม่สามารถใช้ DataFusion ได้ก็จะถอยไปใช้เอนจิน PostgreSQL แทน
ตอนนี้ pg_lakehouse ยังรองรับการคิวรีแบบอ่านเท่านั้น ต่อจากนี้ทีมงาน ParadeDB มีแผนจะรองรับตารางแบบ Apache Iceberg และจะเพิ่มฟอร์แมตไฟล์เพิ่มเติม
pg_lakehouse เป็นไลเซนส์แบบ AGPL ต่างจาก PostgreSQL ที่ใช้ไลเซนส์แบบ PostgreSQL License ที่เปิดกว้างกว่า สามารถดัดแปลงแก้ไขได้อิสระ แต่ AGPL นั้นบังคับให้โค้ดที่ดัดแปลงต้องเผยแพร่แบบ AGPL ด้วยเช่นกัน
ที่มา - ParadeDB