DuckDB เปิดตัว pg_duckdb เปิดทาง PostgreSQL คิวรีตรงจากไฟล์

by lew
20 August 2024 - 16:28

Hydra สตาร์ตอัพด้าน data processing พัฒนาส่วนขยาย pg_duckdb ที่ฝัง DuckDB เข้าไปอยู่ใน PostgreSQL ในตัว ทำให้สามารถคิวรีข้อมูลในไฟล์ parquet หรือ CSV จากสตอเรจเช่น S3, R2, หรือ Google Cloud Storage ได้โดยตรง

โดยปกติ DuckDB ก็สามารถคิวรีด้วย SQL ได้อยู่แล้ว แต่ก็มีความต่างจาก PostgreSQL อยู่ส่วนหนึ่ง การนำข้อมูลเข้ามาคิวรีใน PostgreSQL จะทำให้นักพัฒนาสามารถใช้คิวรีเดิมๆ ได้ ส่วนขยายจะพยายามใช้ DuckDB คิวรีก่อน และหากใช้งานไม่ได้จะหันไปใช้ PostgreSQL คิวรีแทน แผนการพัฒนาส่วนขยายนี้จะพยายามรองรับชนิดข้อมูลทุกชนิดที่ PostgreSQL รองรับ

ก่อนหน้านี้ ParadeDB ก็เคยออกมาเปิดตัวส่วนขยาย pg_lakehouse ที่ทำงานคล้ายกัน แต่ pg_lakehouse นั้นใช้ไลเซนส์ AGPL ที่จำกัดกว่า และฝั่ง pg_duckdb มีแนวร่วม ตั้งแต่ DuckDB Labs เอง, MotherDuck ผู้ให้บริการ DuckDB แบบคลาวด์, Neon ผู้ให้บริการคลาวด์ PostgreSQL, และไมโครซอฟท์ที่มีนักพัฒนา PostgreSQL เป็นพนักงานประจำอยู่ และตัวโครงการจะอยู่ภายใต้ DuckDB โดยตรง

ที่มา - MotherDuck

Blognone Jobs Premium