Blognone รายงานข่าวเรื่อง Big Data มาพอสมควร พอดีเมื่อวันก่อน Dell ประเทศไทยมีแถลงข่าวเรื่อง Storage + Big Data (ซึ่งเป็นเรื่องที่เกี่ยวข้องกัน) ผมเลยไปฟังหน่อยเผื่อว่าจะได้ภาพรวมของตลาด Big Data ในประเทศไทยนะครับ
การนำเสนอของ Dell เริ่มจากโชว์คำพยากรณ์ของ Gartner ที่ประเมินว่าอัตราการเติบโตของข้อมูลในองค์กรจะเติบโตสูงมากในอนาคต ตัวเลขปีล่าสุดคือ 47 เท่าในปี 2011 (ข้อมูลที่สร้างในปี 2011 คิดเป็น 1.8 ล้านล้าน GB)
ในแง่การเก็บข้อมูลระดับคอนซูเมอร์ก็เรื่องนึง แต่ในระดับองค์กร ต่อไปความสามารถในการนำข้อมูลมาใช้งานจะเป็นตัวชี้วัดความสามารถในการแข่งขันขององค์กรได้ องค์กรไหนที่นำข้อมูล (ที่มีอยู่แล้ว) มาสกัดออกเป็นยุทธศาสตร์ได้ก็จะประสบความสำเร็จ
การจัดเก็บข้อมูลจะยากและซับซ้อนขึ้นเรื่อยๆ เพราะก่อนหน้านี้เราไม่เคยออกแบบระบบเก็บข้อมูลที่มันใหญ่ขนาดนี้ (ไม่มีใครเคยคิดถึงสเกลระดับนี้มาก่อน) ในระบบ enterprise storage แบบเก่าต้องการบำรุงรักษาเยอะ เช่น
Dell แบ่งระดับของ storage องค์กรออกเป็น 5 ระดับ ตามภาพ
เส้นแบ่งอยู่ที่ระดับ 3 และ 4 ครับ โดยช่วง 1-3 คือเทคโนโลยีด้าน storage (กรอบบน) ส่วนช่วง 4-5 คือระดับของ Big Data (กรอบล่าง)
ผลิตภัณฑ์ storage ของ Dell จับตลาดนี้เป็นหลัก มีเทคโนโลยีด้าน storage ใหม่ๆ หลายอย่าง เช่น virtualization, disaster recovery, data retention, data governance (การเก็บข้อมูลตามมาตรฐานที่ระบุ)
ผลิตภัณฑ์กลุ่มนี้ออกแบบโดยใช้แนวคิด Fluid Data Architecture (FDA) มีแนวคิดสำคัญ 3 ข้อย่อยคือ
ส่วนสายผลิตภัณฑ์ก็ดูกันเองตามภาพครับ (อันนี้เป็นข่าวไม่ใช่ advertorial :D)
Dell บอกว่าในอนาคตระบบ storage ควรจะฉลาดกว่านี้ เช่น ปัจจุบันเราเก็บรูปภาพและไฟล์เอกสารที่มีรูปภาพฝังอยู่ภายในแยกกัน แต่ในอนาคตมันควรแยกแยะได้ว่าไฟล์รูปเป็นไฟล์เดียวกัน แล้วเก็บแค่ก็อปปี้เดียวเพื่อประหยัดเนื้อที่
ในส่วนของการนำข้อมูลจำนวนมหาศาลมาวิเคราะห์ Dell (และจริงๆ ก็บริษัทอื่นด้วย) เลือกใช้เทคโนโลยี Hadoop ตามสมัยนิยม โดยจับมือกับบริษัท Cloudera ซึ่งเป็นผู้เชี่ยวชาญ Hadoop ที่กำลังมาแรง ขายเป็นโซลูชันร่วมกัน ซึ่งทาง Dell จะพัฒนาผลิตภัณฑ์ที่อยู่บนระบบ storage ของตัวเองชื่อ Crowbar เอาไว้เชื่อมกับซอฟต์แวร์ของ Cloudera อีกทีหนึ่ง
Dell ยังไม่มีผลิตภัณฑ์ด้านการวิเคราะห์ข้อมูลระดับสูง (business analytics) มากนัก ในเบื้องต้นจึงเน้นเป็นตัวกลางระหว่างการเก็บข้อมูลไปสู่การวิเคราะห์ข้อมูลมากกว่า
Dell ประเมินว่าในบ้านเรากำลังเริ่มสนใจ Big Data และอีกประมาณ 2 ปีเทรนด์น่าจะชัดเจนขึ้น (เหมือนกับ virtualization ที่ตอนแรกๆ คนยังงงๆ ว่ามันเอาไว้ทำอะไร) โดยอุตสาหกรรมของบ้านเราที่น่าจะใช้ก่อนคือ ธนาคารและการเงิน โทรคมนาคม และสุขภาพ ส่วนภาคการผลิตยังไม่ค่อยสนใจเท่าที่ควร
สำหรับนิยามของ Big Data ของ Dell คือขนาดข้อมูลองค์กรควรมากกว่า 8-10 TB ขึ้นไป และรูปแบบข้อมูลต้องหลากหลาย ถ้ามีแต่ relational database อย่างเดียวก็ยังไม่ต้องถึงขั้นใช้เทคโนโลยี Big Data ครับ
รูปสุดท้ายนี่ผมชอบเพราะมันให้ภาพรวมของการเก็บ storage ในระดับต่างๆ ได้ดี เลยขอสไลด์เขามาลงให้ดูด้วย