IBM Storage Ceph โซลูชันจัดการแพลตฟอร์มข้อมูลโอเพ่นซอร์ส ที่เกิดมาเพื่อจัดการข้อมูลระดับองค์กร

by KkonhinN
11 November 2024 - 04:00

โจทย์ของการจัดการข้อมูลสำหรับองค์กรในปัจจุบันไม่ได้เป็นเพียงการวางแผนระยะสั้นอีกต่อไป เนื่องจากข้อมูลมีอัตราการเติบโตเพิ่มขึ้นอย่างไม่หยุดยั้ง ด้วยเหตุนี้เองการวางกลยุทธ์เพื่อจัดการแพลตฟอร์มด้านข้อมูลจึงกลายเป็นแผนระยะยาวที่ต้องรองรับการขยายตัวได้แทบไร้ขีดจำกัด นอกจากนี้แพลตฟอร์มยังต้องเปิดกว้างรองรับโซลูชันได้หลายประเภททั้ง Block Storage, File Storage หรือแม้กระทั่งการใช้งาน Object ที่ได้รับความนิยมในแอปพลิเคชันสมัยใหม่ รวมไปถึงต้องไม่ปิดกั้นเฉพาะโซลูชัน Storage เจ้าใดเจ้าหนึ่งเท่านั้น

ในบทความนี้เราจะพาทุกท่านไปรู้จักกับโซลูชัน IBM Storage Ceph หรือโซลูชัน Software-defined Storage ถึงจุดเด่นและกรณีศึกษาสำหรับการใช้งานในองค์กร

จุดเริ่มต้นของ IBM Storage Ceph

ย้อนไปราวปี 2004 นักศึกษาปริญญาเอกรายหนึ่งที่ชื่อว่า Sage Weil จากมหาวิทยาลัยแคลิฟอเนียได้มุ่งพัฒนาซอฟต์แวร์สำหรับการบริหารจัดการข้อมูลปริมาณมหาศาลผ่าน Distribute Storage ซึ่งซอฟต์แวร์นี้เริ่มได้รับการแนะนำสู่โลกภายใต้ชื่อ Ceph เมื่อปี 2006 และเพียงปีเดียวให้หลังด้วยความโดดเด่นเรื่องการรับมือกับข้อผิดพลาดต่างๆและมีเสถียรภาพสูง (Fault Tolerant & High Availability) ทำให้ Ceph เหมาะกับระบบคลาวด์หรือดาต้าเซนเตอร์ขนาดใหญ่ ถึงขนาดว่าปี 2010 Linus Torvalds ได้บรรจุ Ceph Client ไว้ใน Linux Kernel และในปี 2012 ผู้คิดค้นอย่าง Weil ก็ได้สร้าง Inktank Storage เพื่อให้บริการดูแล Ceph แบบเชิงพาณิชย์ และในปีเดียวกันนั้นเอง Openstack ก็รองรับเรื่องของ Ceph เช่นกัน

เพียง 2 ปีให้หลัง(2014) ทาง Red Hat ก็ได้เล็งเห็นโอกาสและเข้าซื้อ Inktank และปัจจุบันกลายมาเป็นส่วนหนึ่งของโซลูชั่น IBM Storage for Data & AI ทั้งนี้แน่นอนว่าเมื่ออยู่ในมือของผู้เล่นระดับองค์กร Ceph ก็ได้ถูกพัฒนาให้มีการดูแลช่วยเหลือในการใช้งาน เพิ่มประสิทธิภาพ และฟีเจอร์ต่างๆเพื่อตอบโจทย์ระดับองค์กร รวมถึงด้วยความเป็นโอเพ่นซอร์สทำให้ Ceph มี Community ที่กว้างขวางและรองรับโซลูชันด้านการจัดการข้อมูลได้มากมาย

ประโยชน์ของ IBM Storage Ceph กับการใช้งานในภาคองค์กร

IBM Storage Ceph เป็นโซลูชัน Software-defined storage สำหรับแพลตฟอร์ม x86 ที่รองรับการจัดการข้อมูลทั้งในรูปแบบของ Block, file และ Object โดยโซลูชันนี้ได้ช่วยทลายขีดจำกัดของการบริการจัดการโซลูชัน Storage ในกลายเป็นผืนเดียวกัน ทั้งระบบ Block และ File ที่สืบเนื่องมาตั้งแต่อดีต และที่สำคัญคือการขยายตัวจัดการ Storage จำนวนมากขึ้นได้โดยไม่ต้องเพิ่มความยุ่งยากในการบริหารจัดการทำให้องค์กรไม่ต้องเพิ่มคนมาดูแลตามการขยายตัว ทั้งนี้ IBM Storage Ceph ชูจุดเด่นใน 3 มุมมองคือ

1.) Scalability
แผนของการจัดการข้อมูลในปัจจุบันมักต้องรองรับเรื่องการขยายตัว ซึ่ง IBM Storage Ceph สามารถรองรับการเริ่มต้นได้แต่น้อยเพียงแค่ 3 โหนดไปจนถึงนับพันโหนดร่วมกัน หรือคิดเป็นข้อมูลราว 1 พันล้าน Object นอกจากนี้ยังมีฟีเจอร์ Rebalance ที่ช่วยเพิ่มประสิทธิภาพและการรักษาการกระจายอย่างมีคุณภาพ ซึ่งเป็นกระบวนการที่เกิดขึ้นอย่างอัตโนมัติ และถ้าหากแอดมินต้องการขยายคลัสเตอร์หรืออัปเดตฮาร์ดแวร์ โซลูชัน IBM Storage Ceph คือคำตอบที่จะช่วยให้กระบวนการเหล่านั้นไม่พบกับ downtime

2.) Simplicity
ความง่ายคือหัวใจในการปฏิบัติงานอย่างแท้จริง เพราะงานการจัดการข้อมูลนั้นก็มีความซับซ้อนมากพออยู่แล้ว ซึ่ง IBM Storage Ceph สามารถทำการกำหนดสิทธิ์ตามหน้าที่มอบหมายงานต่อได้ รวมไปถึงมีข้อมูล Insight และ Dashboard ให้ท่านสามารถตรวจตราการทำงานภาพรวมของคลัสเตอร์หรือจะเจาะลึกดูการทำงานของโหนดที่สนใจ นอกจากนี้การเริ่มต้นขั้นพื้นฐานก็ทำได้รวดเร็วแค่ภายในไม่กี่ขั้นตอน รองรับการทำงานผ่าน Ansible ตลอดจนหากท่านเป็นลูกค้าเดิมที่ใช้ Red Hat Ceph มาก่อนย่อมทำงานร่วมกับ IBM Storage Ceph ได้

3.) Security
อีกหนึ่งสิ่งที่พลาดไม่ได้เลยของการมองหาโซลูชันระดับองค์กรก็คือเรื่องความมั่นคงปลอดภัย โดย IBM Storage Ceph มีจุดเด่นเรื่องของการป้องกันข้อผิดพลาดจากน้ำมือมนุษย์ การโจมตีทางไซเบอร์ หรือภัยต่างๆ ได้ ด้วยความสามารถด้านการทำ Replication, Erasure Coding หรือ write-once-read-many (WORM) ทั้งนี้ในกรณีของการปกป้องที่ตัวข้อมูลก็สามารถเลือกใช้การเข้ารหัสที่ได้รับการยอมรับจากสถาบันระดับโลกอย่าง NIST ได้

กรณีการนำ IBM Storage Ceph ไปใช้งานในองค์กร

อย่างที่ทราบไปแล้วว่า IBM Storage Ceph มีความโดดเด่นเรื่องการรองรับปริมาณข้อมูลอย่างมหาศาล เช่น การทำงานในระดับคลาวด์ หรือดาต้าเซนเตอร์ขนาดใหญ่ แต่ถ้าจะตีความเป็นโจทย์ในภาคองค์กรให้ชัดขึ้น IBM Storage Ceph สามารถถูกนำไปใช้ในโจทย์ของภาคองค์กร ดังนี้

  • AI/ML - โมเดลด้าน AI และ Machine Learning ที่ดีย่อมมาจากปริมาณข้อมูลมหาศาลที่เรียนรู้ได้ ซึ่งนี่คือความท้าทายสำคัญที่มักถูกกล่าวถึงว่าเป็นความท้าทายของความสำเร็จในโครงการ AI/ML และด้วยโจทย์ในการเก็บรักษาข้อมูลจำนวนมากระดับ Data Lake หรือ Big Data รวมถึงเทคโนโลยีล่าสุดอย่าง Lakehouse จึงเป็นโอกาสอันดีของการนำ IBM Storage Ceph มาใช้
  • Cloud Native Application - แอปพลิเคชันสมัยใหม่ที่ถูกออกแบบขึ้น มักมองหาโครงสร้างการจัดการข้อมูลแบบ Object Storage ซึ่งข้อดีก็คือการเรียกใช้งานได้ง่ายผ่าน API ทั้งนี้ในองค์กรเองก็ยังจำเป็นต้องใช้งานข้อมูล Block & File Storage แบบเดิม และต้องผสานข้อมูลเก่าและใหม่ให้เป็นระบบเดียวกันเพื่อประโยชน์ในการทำงานสูงสุด ตรงนี้เองก็เป็นอีกมุมมองหนึ่งที่จะนำ IBM Storage Ceph เข้ามาได้
  • DR และ Backup - Object Storage มีต้นทุนในการจัดเก็บต่ำกว่าการใช้งานประเภทอื่น ดังนั้นนโยบายเรื่อง Archive Data หรือ Backup Data ที่เป็นการเก็บข้อมูลสำรองหรือเก็บระยะยาวจึงเหมาะกับ Object Storage มากกว่า เช่นเกียวกัน IBM Storage Ceph ก็ยังคงบริหารจัดการส่วนนี้ได้ ที่สำคัญคือในปัจจุบันมี Vendor มากมายที่ Certified กับโซลูชัน IBM Storage Ceph เพิ่มขึ้นเรื่อยๆ

บทสรุป

จะเห็นได้ว่า IBM Storage Ceph คือโซลูชัน Open Source Software-defined Storage ที่ได้การยอมรับและมีกลุ่มผู้ใช้อย่างกว้างขวาง ซึ่ง Ceph ภายใต้การดูแลของ IBM ได้ถูกปรับแต่งให้มีฟีเจอร์ที่เหมาะกับการทำงานระดับองค์กรและได้รับการดูแลเบื้องหลังโดยทีมงานมืออาชีพอย่าง IBM โดยเฉพาะหากเกิดปัญหา ผู้ใช้งานก็สามารถขอรับบริการจาก IBM Support ได้โดยตรง

นอกจากนี้หากท่านต้องการประสิทธิภาพในงานข้อมูลระดับ Data Lakehouse ในโปรเจ็กต์ AI ที่ต้องการกรอบธรรมาภิบาลในการกำกับดูแลการใช้งาน (AI Governance) เป็นพิเศษก็สามารถจับคู่เข้ากับโซลูชัน watsonx.data ได้ด้วย ไม่เพียงเท่านั้น IBM เองยังสามารถนำเสนอ AI Infrastructure ได้ด้วย เรียกได้ว่ามีทางเลือกต่อยอดไปจนสุดทางที่องค์กรต้องการทุกกรณี

หากมีความสนใจโซลูชัน IBM Storage Ceph หรือโซลูชันอื่นๆ ของ IBM สามารถติดต่อทีมงานจาก Computer Union ได้ที่ email : cu_mkt@cu.co.th หรือโทร. 02 3116881 #7151, 7156

Blognone Jobs Premium