ParadeDB เปิดตัว pg_lakehouse เสริมให้ PostgreSQL คิวรีไฟล์ตรงแบบ DuckDB

by lew
14 June 2024 - 15:14

ParadeDB ผู้พัฒนา PostgreSQL เวอร์ชั่นสำหรับงานวิเคราะห์ข้อมูล เปิดตัว pg_lakehouse ที่เพิ่มฟีเจอร์ทำให้สามารถใช้งาน PostgreSQL แทนที่ฐานข้อมูลเฉพาะทางอย่าง DuckDB

ฟีเจอร์สำคัญของ pg_lakehouse คือการดึงข้อมูลภายนอกออกมาเป็นเหมือนตารางใน PostgreSQL โดยข้อมูลที่ดึงเข้ามาใส่ไปยัง Apache DataFusion ที่เป็นเอนจินการคิวรีแบบ analytics ประสิทธิภาพใกล้เคียงกับ DuckDB โดยก่อนหน้านี้ก็มีส่วนขยายอื่นคล้ายกัน แต่ pg_lakehouse ใช้ Apache OpenDAL สำหรับแปลงข้อมูลทำให้รองรับชนิดไฟล์จำนวนมาก หากการคิวรีใดไม่สามารถใช้ DataFusion ได้ก็จะถอยไปใช้เอนจิน PostgreSQL แทน

ตอนนี้ pg_lakehouse ยังรองรับการคิวรีแบบอ่านเท่านั้น ต่อจากนี้ทีมงาน ParadeDB มีแผนจะรองรับตารางแบบ Apache Iceberg และจะเพิ่มฟอร์แมตไฟล์เพิ่มเติม

pg_lakehouse เป็นไลเซนส์แบบ AGPL ต่างจาก PostgreSQL ที่ใช้ไลเซนส์แบบ PostgreSQL License ที่เปิดกว้างกว่า สามารถดัดแปลงแก้ไขได้อิสระ แต่ AGPL นั้นบังคับให้โค้ดที่ดัดแปลงต้องเผยแพร่แบบ AGPL ด้วยเช่นกัน

ที่มา - ParadeDB

Blognone Jobs Premium