Dell EMC พลิกโฉม Storage มารองรับข้อมูลมหาศาลของ Big Data อย่างไร

by advertorial
3 August 2017 - 04:00

ผลิตภัณฑ์สตอเรจในปัจจุบันที่เป็นยุคของคลาวด์ จำเป็นต้องตอบสนองรูปแบบการใช้งานใหม่ๆ โดยเฉพาะการเก็บข้อมูลแบบ unstructured data ที่มีความสำคัญมากขึ้นเรื่อยๆ อีกทั้งการที่ข้อมูลมีปริมาณเติบโตอย่างรวดเร็ว การขยายขีดความสามารถของสตอเรจให้รองรับข้อมูลได้อย่างเพียงพอ ก็ถือเป็นความท้าทายอีกประการหนึ่ง

ยักษ์ใหญ่ของวงการสตอเรจองค์กร Dell EMC มีผลิตภัณฑ์ออกแบบมาเพื่อจับลูกค้ากลุ่มนี้ นั่นคือ Isilon

รู้จัก Isilon

Isilon เป็นสตอเรจแบบ NAS (network attached storage) ที่ออกแบบมาให้ขยายตัวแบบ scale out คือเพิ่มขีดความสามารถตามปริมาณฮาร์ดแวร์ที่ใส่เข้าไปในระบบเพื่อต่อเป็นคลัสเตอร์ โดยมีซอฟต์แวร์ช่วยให้ผู้ใช้งานมองเห็นสตอเรจทั้งหมดเป็นผืน (pool) เดียวกัน

ตัวผลิตภัณฑ์ Isilon มีรากเหง้ามาจากบริษัท Isilon Systems ที่ EMC ซื้อกิจการมาในปี 2010 หลังจากนั้น Isilon ถูกพัฒนาต่อมาอีกหลายสมัย ปัจจุบัน Dell EMC ได้รับการจัดอันดับจาก Gartner ให้เป็นอันดับหนึ่งใน Magic Quadrent (เดือนตุลาคม 2016) สำหรับกลุ่มสินค้าประเภท Scale-Out NAS storage

สายผลิตภัณฑ์ของ Isilon สามารถแบ่งออกเป็น 3 กลุ่มย่อยคือ

  • All-Flash (รหัส F) เป็นสตอเรจแบบที่ใช้แฟลชล้วน ไม่ใช้ฮาร์ดดิสก์แบบจานหมุนเลย เพื่อประสิทธิภาพที่ดีที่สุด (สูงสุด 250,000 IOPS, 15GBps)
  • Hybrid (รหัส H) ผสมผสานสตอเรจแบบฮาร์ดดิสก์ที่ต้นทุนถูกกว่า และมี SSD สำหรับการทำ Cache เพื่อให้ได้ประสิทธิภาพในการ transfer data สูงสุด
  • Archive (รหัส A) สำหรับตลาดเก็บข้อมูลระยะยาวที่ไม่ค่อยถูกเรียกใช้บ่อยนัก จะเน้นเรื่องความจุที่มากกว่า และราคาที่ถูกกว่า

ไม่ว่าจะเป็นสตอเรจแบบไหน แต่ผลิตภัณฑ์ Isilon ทุกรุ่นในปัจจุบันใช้หน่วยประมวลผลเป็น Intel Xeon

ระบบปฏิบัติการ OneFS

จุดเด่นของ Isilon คือซอฟต์แวร์ที่ช่วยอำนวยความสะดวกเรื่องการจัดการสตอเรจทั้งหมด ระบบปฏิบัติการตัวนี้มีชื่อว่า OneFS มันทำหน้าที่ 3 อย่างคือ จัดการระบบไฟล์ (File System) โวลูม (Volume Manager) และป้องกันข้อมูลสูญหาย (Data Protection)

OneFS ออกแบบมาสำหรับงาน big data จึงรองรับข้อมูลขนาดใหญ่ระบบเพตะไบต์ (PB) ได้สบาย (รองรับได้สูงสุดที่ 96PB) แต่ก็ยังคงประสิทธิภาพและการขยายตัวไม่ว่าข้อมูลจะใหญ่แค่ไหน นอกจากนี้ Isilon ยังรองรับการเก็บข้อมูลหลากหลายประเภท ตามแนวคิดที่เรียกว่า data lake และรองรับ เชื่อมต่อกับโพรโทคอลที่หลากหลาย เช่น NFS, SMB, FTP, Hadoop HDFS ช่วยให้สามารถเข้าถึงข้อมูลชุดเดียวกันผ่านช่องทางที่หลากหลาย

และเนื่องจากลูกค้าของ Isilon เป็นลูกค้าองค์กรขนาดใหญ่ที่ "ข้อมูล" มีความสำคัญสูงมาก ส่งผลให้ Isilon มีฟีเจอร์ด้านการจัดการข้อมูลมากมาย เช่น deduplication (ช่วยบีบอัดข้อมูลจากข้อมูลชุดที่ซ้ำกัน), การจัดการโควต้าพื้นที่ข้อมูล, การจัดการระดับความสำคัญของข้อมูล (tiering) เป็นต้น

ฟีเจอร์สำคัญของ Isilon อีกชุดหนึ่งที่ควรค่าแก่การพูดถึง คือการป้องกันข้อมูล (data protection) เช่น การแบ็คอัพข้ามไซต์, การสร้างสแนปช็อต และความปลอดภัย (security) เช่น การตรวจสอบระบบไฟล์ (file system auditing) และการใช้แนวคิด WORM (write once, read many) เพื่อป้องกันการเขียนหรือลบข้อมูลผิดพลาด

Isilon Data Lake

  • เป็นการรวมศูนย์โครงสร้างพื้นฐานในการจัดเก็บข้อมูลที่เป็น Unstructured Data ทำให้ง่ายในการบริหารจัดการ และการนำข้อมูลไปใช้งานหรือนำไปวิเคราะห์
  • สถาปัตยกรรมแบบ Scale-out เพื่อรองรับกับข้อมูลที่เพิ่มสูงขึ้นอย่างรวดเร็ว
  • รองรับ Workload และ Application ที่หลากหลาย
  • สามารถกำหนด Policy ในการทำ auto-tiering เพื่อช่วยลดต้นทุนในการจัดเก็บข้อมูล
  • ขยายขอบเขตของการจัดเก็บข้อมูลจาก Core ไปสู่ Edge (สาขาหรือศูนย์ข้อมูลที่อยู่ระยะไกล) และ Cloud
  • ช่วยทำให้การทำ In-Place Data Analytics นั้นเกิดขึ้นได้ในองค์กร ช่วยลดเวลาและความซับซ้อนในการวิเคราะห์ข้อมูลลงได้

ตัวอย่างการใช้งาน Isilon ในประเทศไทย

ตัวอย่างการใช้งาน Isilon มักเป็นองค์กรใหญ่ที่มีข้อมูลจำนวนมากๆ เช่น องค์กรที่ต้องแชร์ไฟล์ระหว่างพนักงาน, งานประมวลผล DNA/RNA, งานวิเคราะห์ข้อมูล big data, งานด้านวิดีโอสตรีมมิ่ง รวมไปถึงงานด้านการแบ็คอัพระยะยาว (archive) และสำรองข้อมูลข้ามไซต์ (disaster recovery) ที่เป็นกลุ่มเป้าหมายของ Isilon Archive

ที่ผ่านมา MFEC พัฒนาและติดตั้ง Isilon ให้กับธนาคารรายใหญ่ไปแล้วสองราย โดยไปประกอบเป็นโซลูชั่น big data ของธนาคาร

โจทย์ของธนาคารขนาดใหญ่คือมีระบบไอทีภายในที่หลากหลาย อีกทั้งธนาคารยังมีบริษัทลูกที่แยกไปทำธุรกิจด้านอื่นๆ ที่ใกล้เคียงกัน เช่น สินเชื่อ บัตรเครดิต ฯลฯ และมีระบบการเก็บข้อมูลแยกเฉพาะของตัวเอง จึงเป็นความท้าทายของธนาคารที่จะมองเห็นภาพรวมว่าลูกค้ามีความต้องการที่แท้จริงอย่างไร ซึ่งการมองเห็นภาพรวมนี้จะช่วยในการวิเคราะห์พฤติกรรมลูกค้าเป็นรายบุคคล จึงนำมาซึ่งการพัฒนาบริการหรือนำเสนอโปรโมชั่นที่ตอบโจทย์ผู้บริโภคอย่างถูกจุด ดังนั้นจึงเกิดประโยชน์กลับมายังลูกค้าธนาคาร

ในอีกทาง ข้อมูลปัจจุบันก็มีความหลากหลายมากขึ้น จากในอดีตที่มีเฉพาะฐานข้อมูลแบบดั้งเดิม กลายมาเป็นข้อมูลแบบ unstructured data ที่ดึงมาจากโซเชียลหรือระบบ CRM ร่วมด้วย ทำให้โซลูชันการวิเคราะห์ข้อมูลเดิมๆ ในยุค data warehouse ไม่ตอบโจทย์ การสร้างระบบ big data ที่อยู่บนเทคโนโลยี Hadoop ที่เป็นมาตรฐานของวงการ จึงเป็นสิ่งที่ธนาคารต้องก้าวตามให้ทัน

ลูกค้ากลุ่มธนาคารเลือกใช้ฮาร์ดแวร์เป็น Isilon ด้วยเหตุผลหลักคือมองว่าข้อมูลจะมีขนาดใหญ่ขึ้นเรื่อยๆ การขยายฮาร์ดแวร์แบบ scale-out (เพิ่มโหนด) จึงเป็นทางออกที่ยืดหยุ่น นอกจากนี้จุดเด่นของ Isilon ที่รองรับโพรโทคอลข้อมูลหลากหลาย ก็ช่วยให้ระบบ big data สามารถเชื่อมต่อข้อมูลจากแหล่งต่างๆ ภายในธนาคารได้ทันที โดยไม่ต้องเสียเวลาไปดัดแปลงแก้ไขอะไรเพิ่มเติม

การเลือกใช้ระบบสตอเรจแบบ Isilon ยังมีข้อดีอีกอย่างคือแยกส่วนของการเก็บข้อมูล (สตอเรจ) ออกจากระบบการประมวลผล ทำให้มั่นใจได้ว่าข้อมูลที่เก็บไว้ใน Isilon จะปลอดภัย และไม่ต้องเป็นห่วงเรื่องการย้ายหรือแบ็คอัพข้อมูลหากต้องการอัพเกรดเวอร์ชันของซอฟต์แวร์ Hadoop เพราะ Isilon จะช่วยจัดการเรื่องข้อมูลให้อยู่แล้ว+

MFEC ระบุว่าลูกค้ากลุ่มธนาคาร มีขนาดข้อมูลประมาณ 100TB โดยใช้ Isilon 3 โหนดทำหน้าทีสตอเรจ และมีระบบประมวลผลอีก 11 โหนด ผลของการติดตั้งระบบนี้คือ ธนาคารสามารถวิเคราะห์ข้อมูลได้อย่างมีประสิทธิภาพ และสามารถทำงานได้แบบเรียลไทม์ ดูข้อมูลได้ทันทีโดยไม่ต้องรอการเรียกข้อมูลช่วงสิ้นวันมาประมวลผลตอนกลางคืน เหมือนที่ต้องทำในอดีต

หากท่านสนใจเรื่อง Big Data สามารถติดต่อขอคำปรึกษาจาก MFEC ได้โดยกรอกข้อมูลในแบบฟอร์มนี้

Blognone Jobs Premium