เดือนที่แล้วไมโครซอฟท์เปิดตัว Azure Databricks บริการใหม่ในเครือ Azure สำหรับการวิเคราะห์ข้อมูลขนาดใหญ่
Azure Databricks เป็นการนำ Apache Spark มารันบนคลาวด์ ความน่าสนใจคือบริการตัวนี้เป็นความร่วมมือระหว่างไมโครซอฟท์กับบริษัท Databricks ซึ่งก่อตั้งโดยหนึ่งในผู้สร้าง Apache Spark ด้วย
จุดเด่นของ Azure Databricks คือการขยายตัวแบบไม่จำกัดบนโครงสร้างพื้นฐานของไมโครซอฟท์ และการเชื่อมต่อกับบริการข้อมูลตัวอื่นในตระกูล Azure เช่น Azure Cosmos DB, Azure Data Lake Store, Azure IoT Hub เพื่อรวมข้อมูลหลายประเภทหลายแหล่ง มารันวิเคราะห์ใน Azure Databricks อีกทีหนึ่ง
ไมโครซอฟท์ยังสร้างเครื่องมือให้นักวิทยาศาสตร์ข้อมูล สามารถนำเทคนิคจากหลายภาษาโปรแกรม เช่น R, Scala, Python, SQL มาสร้างโมเดล machine learning วิเคราะห์ข้อมูลร่วมกันเป็นทีมได้
ที่มา - Microsoft
แผนผังความเชื่อมโยงของ Azure Databricks กับบริการอื่นๆ ของ Azure