ข่าวน่าสนใจของวงการไอทีในวันนี้คือ การควบรวมกันระหว่าง Cloudera และ Hortonworks สองบริษัทที่ทำธุรกิจซอฟต์แวร์ Hadoop ส่งผลให้บริษัทใหม่ (ซึ่งจะใช้ชื่อว่า Cloudera) กลายเป็นบริษัท Hadoop รายใหญ่ของโลก
ถ้าดูเผินๆ การควบกิจการครั้งนี้อาจเป็นเรื่องปกติทั่วไปในโลกธุรกิจ แต่แท้จริงแล้ว Cloudera และ Hortonworks เรียกได้ว่าเป็น "แฝดท้องเดียวกัน" ที่พรากจากกันมานาน และกลับมารวมกันอีกครั้ง
ทุกวันนี้ Hadoop กลายเป็นซอฟต์แวร์มาตรฐานสำหรับการประมวลผลข้อมูลขนาดใหญ่ หรือที่เราเรียกกันว่า big data ไปแล้ว แต่จุดกำเนิดของ Hadoop ก็มีความน่าสนใจไม่แพ้กัน
เทคนิคการประมวลผลข้อมูลขนาดใหญ่ที่ Hadoop ใช้งาน เริ่มมาจาก Google File System และ MapReduce ที่คิดค้นโดยกูเกิล แต่กูเกิลกลับไม่เปิดซอร์สโค้ดของซอฟต์แวร์ที่ใช้ในบริษัท (อาจเป็นเพราะความลับทางธุรกิจในยุคนั้น ที่ทำให้กูเกิลได้เปรียบคู่แข่ง เพราะสามารถประมวลผลข้อมูลจำนวนมากๆ ได้ดีกว่า) สิ่งที่กูเกิลทำจึงมีเพียงแค่การเปิดเอกสารวิจัย (เปเปอร์) ของ Google File System และ MapReduce ออกสู่สาธารณะในปี 2003
แต่ความต้องการประมวลผลข้อมูลจำนวนมหาศาลเป็นเรื่องที่หลีกเลี่ยงไม่ได้ ทำให้นักพัฒนากลุ่มหนึ่งตัดสินใจสร้างซอฟต์แวร์แบบเดียวกันขึ้นมาใหม่ โดยใช้เปเปอร์ของกูเกิลเป็นแนวทาง
โครงการนี้เริ่มต้นในปี 2006 โดยทีมพัฒนาของโครงการ Apache Nutch ซึ่งมีแกนหลักคือ Doug Cutting ที่ขณะนั้นเป็นพนักงานของ Yahoo!
Doug Cutting มีชื่อเสียงจากการสร้างซอฟต์แวร์โอเพนซอร์สดังๆ อย่าง Lucene และ Nutch อยู่ก่อนแล้ว เมื่อเขาสร้างโครงการใหม่ จึงตั้งชื่อมันว่า Hadoop ตามชื่อตุ๊กตาช้างของลูกชาย (และเป็นเหตุว่าทำไม Hadoop ถึงต้องเป็นช้าง)
Hadoop เริ่มสั่งสมชื่อเสียงมาเรื่อยๆ โดยมี Yahoo! เป็นผู้ใช้งานรายสำคัญ และให้ทรัพยากรพัฒนาโครงการมากกว่าใคร แต่ภายหลัง Yahoo! ก็เปิดซอร์สโค้ด Hadoop ของตัวเอง และร่วมพัฒนา Hadoop ภายใต้การดูแลของ Apache Software Foundation
เนื่องจาก Hadoop มีองค์ประกอบที่ค่อนข้างซับซ้อน และใช้การพัฒนาแบบโอเพนซอร์สที่มาจากนักพัฒนาหลากหลายกลุ่ม มีโครงการย่อยมากมาย การใช้งาน Hadoop เวอร์ชัน Apache จึงต้องใช้ความชำนาญสูง จึงมีแนวคิดการสร้าง "ดิสโทร" ของ Hadoop ที่รวบรวมแพกเกจทุกอย่างที่จำเป็นมาให้ ลักษณะเดียวกับดิสโทรของลินุกซ์
บริษัทแรกที่เริ่มทำดิสโทร Hadoop เชิงพาณิชย์คือ Cloudera ที่ก่อตั้งในปี 2008 โดยอดีตพนักงานของ Google/Yahoo!/Facebook/Oracle จำนวน 4 คนที่มองเห็นโอกาสนี้ และตัวของ Doug Cutting ก็ลาออกจาก Yahoo! ในปี 2009 เพื่อมาร่วมงานกับ Cloudera ในฐานะ Chief Architect
หลังจากนั้น 2 ปี ทีมงาน Hadoop ในบริษัท Yahoo! จำนวน 24 คนก็แยกตัวออกเป็นบริษัทใหม่ชื่อว่า HortonWorks ในปี 2011 (รายชื่อทีมงานทั้งหมด) เพื่อทำธุรกิจแบบเดียวกัน
หลังจากนั้น Cloudera กับ HortonWorks จึงกลายเป็นคู่แข่งทางธุรกิจกันมานาน 7 ปี ทั้งที่มีจุดกำเนิดมาจากทีมงานตั้งต้นของ Hadoop เหมือนกัน ทั้งสองบริษัทเติบใหญ่จนกลายเป็นบริษัทขายหุ้น IPO ที่อยู่ในตลาดหลักทรัพย์ด้วยกันทั้งคู่
เมื่อข่าวการควบกิจการถูกประกาศออกไป Doug Cutting ในฐานะผู้สร้าง Hadoop จึงโพสต์ข้อความในทวิตเตอร์ว่า พวกเรากลับมารวมกันอีกครั้ง
นอกจากจุดกำเนิดที่มีประวัติศาสตร์แล้ว ถ้าดูข้อมูลทางธุรกิจอย่างละเอียด Cloudera กับ HortonWorks ก็มีความคล้ายคลึงกันมากอย่างไม่น่าเชื่อ
รายได้ของ Cloudera มากกว่า HortonWorks อยู่บ้าง โดยมีรายได้ในรอบ 12 เดือนล่าสุดที่ 411 ล้านดอลลาร์ ส่วน HortonWorks อยู่ที่ 309 ล้านดอลลาร์ แต่มาจากลูกค้าจำนวนใกล้เคียงกันคือ 1,300-1,400 บริษัท สิ่งที่น่าตกใจคือบริษัทมีอัตรากำไรขั้นต้น (gross margin) เท่ากันที่ 74%! และมีอัตรากำไร/ขาดทุนสุทธิ (operating margin) ใกล้เคียงกันคือขาดทุน 19% และ 18% ตามลำดับ!!
เรียกได้ว่านอกจากธุรกิจคล้ายคลึงกันมากแล้ว ตัวเลขผลประกอบการยังใกล้เคียงกันมาก (การควบรวมครั้งนี้ Cloudera จะถือหุ้น 60% ส่วน HortonWorks ถือหุ้น 40%)
อย่างไรก็ตาม คงไม่มีบริษัทไหนเหมือนกันทั้งหมด 100% ความแตกต่างระหว่างสองบริษัท และเป็นปัจจัยที่ส่งเสริมการควบรวมกัน คือทั้งสองบริษัทมีความเชี่ยวชาญต่างกัน โดย Cloudera เน้นไปที่สายวิเคราะห์ข้อมูลและ data warehouse ในแบบดั้งเดิม ส่วน HortonWorks ถนัดด้านข้อมูลแบบสตรีมมิ่งที่ไหลมาจากอุปกรณ์ชนิดใหม่ๆ เช่น IoT ทำให้การควบรวมครั้งนี้กลายเป็นผสมจุดเด่นของทั้งสองฝ่ายเข้าด้วยกัน เพื่อครองทั้งสองตลาด
อีกเรื่องที่น่าสนใจคือ พาร์ทเนอร์ธุรกิจของทั้งสองรายไม่ค่อยซ้ำกันมากนัก เช่น Cloudera สนิทกับ AWS และ Azure ในขณะที่ HortonWorks ใกล้ชิดกับ Google และ IBM ทำให้ควบรวมกันแล้ว สามารถเชื่อมต่อกับพาร์ทเนอร์หลากหลายและครอบคลุม
บริษัทที่ทำธุรกิจ Hadoop เชิงพาณิชย์มีด้วยกัน 3 รายใหญ่คือ Cloudera, HortonWorks และ MapR แน่นอนว่าการควบรวมครั้งนี้ ผู้ที่เสียประโยชน์มากที่สุดคือ MapR เพราะคู่แข่งรายใหญ่ 2 รายจะกลายเป็นยักษ์ใหญ่รายเดียว
น่าเสียดายว่าเราไม่มีตัวเลขส่วนแบ่งตลาด Hadoop เชิงพาณิชย์ว่ารายไหนมีส่วนแบ่งเท่าไร และ MapR เป็นบริษัทที่อยู่นอกตลาดหลักทรัพย์ จึงไม่มีข้อมูลรายได้เปิดเผยมาเปรียบเทียบกัน
ส่วนคู่แข่งรายอื่นๆ ที่ทำดิสโทร Hadoop จะมีแต่กลุ่มผู้ให้บริการคลาวด์รายใหญ่ เช่น AWS หรือ Microsoft ที่มี Hadoop เวอร์ชันของตัวเองด้วย (HDInsight หรือ Elastic MapReduce) แต่กลุ่มเป้าหมายคงเน้นไปที่การอำนวยความสะดวกให้ลูกค้าคลาวด์ของตัวเองเท่านั้น มากกว่าจะเป็นการขายลูกค้าทั่วไป แถมบริษัทคลาวด์เหล่านี้ก็มีความสัมพันธ์อันดีกับ Cloudera/Hadoop/MapR ในการรัน Hadoop เชิงพาณิชย์บนคลาวด์ด้วย
การควบรวมครั้งนี้ย่อมทำให้เกิดบริษัทยักษ์ใหญ่ในโลก Hadoop ขึ้นมาหนึ่งราย และจะมีบทบาทอย่างสูงในการกำหนดทิศทางของ Hadoop จากนี้ไป ทั้งสองบริษัทสัญญาว่าจะซัพพอร์ตซอฟต์แวร์เดิมไปอย่างน้อย 3 ปี แต่ก็มีแผนจะออก Hadoop เวอร์ชันเดียวที่รวมทั้งสองดิสโทรเข้าด้วยกัน
อย่างไรก็ตาม ถึงแม้จะกลายเป็นบริษัทใหญ่ แต่ในแง่ผลกำไรขาดทุนเป็นเรื่องที่ต้องจับตา เพราะ Cloudera เองก็มีผลประกอบการออกมาไม่ดีอย่างที่คาดในรอบ 6 เดือนหลัง ส่วน HortonWorks ก็มีข่าวว่าสนใจอยากขายกิจการมานานแล้ว การควบรวมกันเพื่อลดค่าใช้จ่ายซ้ำซ้อน และเพิ่มส่วนแบ่งตลาดเพื่อเร่งอัตรากำไร ดูเป็นหนทางที่สมเหตุสมผลและหลีกเลี่ยงไม่ได้
เราคงต้องดูกันต่อไปว่าหลังควบรวมกันแล้ว เป้าหมายจะเป็นจริงตามที่ฝันไว้หรือไม่