บทสรุปจาก Google I/O 2017 หรือว่ากูเกิลจะเป็นผู้ชนะในยุคสมัยแห่ง AI First

by mk
22 May 2017 - 05:02

ในคีย์โน้ตงาน Google I/O 2017 เมื่อสัปดาห์ที่ผ่านมา ธีมหลักของงานนั้นชัดเจนมากว่าเป็นเรื่องของ AI ที่มีความสำคัญเหนือทุกสิ่งอย่าง (Android และ VR ถูกนำไปพูดช่วงท้ายๆ และแทบไม่พูดถึงบริการตัวเก่าๆ อย่าง Google Maps หรือ Chrome เลย)

ซีอีโอ Sundar Pichai ขึ้นเวทีพร้อมกับย้ำว่าโลกกำลังเปลี่ยนผ่านจากยุค Mobile First มาเป็น AI First (เขาพูดเรื่องนี้มาตั้งแต่ปีที่แล้ว) พร้อมกับอธิบายผลงานด้าน AI ของกูเกิลในปัจจุบันว่ามีอะไรบ้าง

บทความนี้จะสรุปประเด็นและวิเคราะห์ผลงานด้าน AI ของกูเกิลว่าไปไกลแค่ไหน และเปรียบเทียบกับคู่แข่งแล้ว กูเกิลยืนอยู่ตรงไหนในโลกของ AI

1. TensorFlow หัวใจสำคัญของแผนการ AI กูเกิล

ความก้าวหน้าของโลก AI ในปัจจุบัน มีโฟกัสอยู่ที่สาขา deep learning โดยมีไลบรารีสำหรับการฝึกสอน (เทรน) AI อยู่หลายตัว ส่วนใหญ่แล้วไลบรารีเหล่านี้กำเนิดมาจากโลกการศึกษา-วิจัยเป็นหลัก เช่น Caffe

แต่เมื่อกูเกิลเปิดตัว TensorFlow ในปี 2015 เวลายังผ่านไปไม่ถึงสองปีดี ความนิยมก็เทมายัง TensorFlow อย่างชัดเจน ปัจจุบันงานด้าน deep learning แทบจะเริ่มต้นที่ TensorFlow กันเป็นดีฟอลต์ และทีม AI ที่เคยใช้ไลบรารีตัวอื่นอย่าง DeepMind ของกูเกิลเอง ก็ย้ายมาใช้ TensorFlow กันเรียบร้อยแล้ว

แต่เท่านั้นยังไม่พอครับ ระดับกูเกิลแล้วไม่เคยทำอะไรอันเดียว ไลบรารียอดนิยมอันดับสองหรือสามในโลก deep learning ตอนนี้คือ Keras (ที่เน้นงานระดับ high level กว่า TensorFlow) ก็พัฒนาโดย François Chollet ที่ตอนนี้เป็นพนักงานของกูเกิล

ตัว Chollet เองเคยสำรวจความนิยมของไลบรารีด้าน deep learning ในเดือนกันยายน 2016 และพบว่า Top 3 คือ TensorFlow, Caffe, Keras แปลว่ากูเกิลเป็นเจ้าของไลบรารียอดนิยม 2 ตัว (ส่วน Caffe ตัวต้นฉบับเป็นของมหาวิทยาลัย Berkeley) อำนาจของการกำหนดทิศทางโลก deep learning จึงอยู่ในมือกูเกิลไม่มากก็น้อย

การพิชิตวงการ deep learning ยังไม่จบเพียงแค่นั้น ในงาน I/O ปีนี้ กูเกิลก็ประกาศออก TensorFlow Lite ที่จะสามารถประมวลผล deep learning บนมือถือได้ ช่วยแก้ปัญหาว่าเราเก็บข้อมูลจากสมาร์ทโฟน แล้วไม่ต้องการ/ไม่สามารถส่งไปเทรนบนคลาวด์ของกูเกิลได้ ก็เทรนกันในมือถือนี่ล่ะ (และแน่นอนว่าเอนจิน deep learning ใน Android หลักพันล้านเครื่อง ก็คงไม่ใช่ตัวอื่น)

ความน่าสนใจคือคู่แข่งในตลาดไลบรารี deep learning ส่วนใหญ่มาจากวงการวิจัย ขณะที่คู่แข่งจากภาคธุรกิจกลับมีไม่เยอะนัก ที่เพิ่งเริ่มต้นคือ Microsoft CNTK และ Facebook ที่เพิ่งประกาศทำ Caffe2 โดยทีมวิจัยที่สร้าง Caffe เวอร์ชันแรก แต่ก็ต้องยอมรับว่าตอนนี้ TensorFlow ล้ำหน้าไปไกล และครอบครองจิตใจของนักวิจัยสายนี้ไปได้เยอะแล้ว

คู่แข่งจากภาคธุรกิจ: Facebook Caffe2, Microsoft CNTK, Amazon DSSTNE

2. เทรนโมเดล AI ผ่านคลาวด์: ล้ำหน้ากว่าใครด้วย TPU

วงการนักวิจัยที่มีคอมพิวเตอร์สมรรถนะสูง อาจใช้วิธีดาวน์โหลดไลบรารีอย่าง TensorFlow หรือ Caffe ไปรันบนเครื่องของตัวเองได้ไม่ยากนัก แต่นั่นแปลว่านักวิจัยต้องทำเองทุกอย่างตั้งแต่การเตรียมเครื่อง ติดตั้งซอฟต์แวร์ จนไปถึงการเทรนและรันทดสอบโมเดล

สำหรับภาคธุรกิจที่ต้องการงานด้าน AI แต่ไม่ต้องการเสียเวลาเรียนรู้เท่า กูเกิลก็มีบริการ Cloud Machine Learning ซึ่งอยู่ภายใต้ร่ม Google Cloud Platform ให้ลูกค้าสามารถเช่าใช้เครื่องของกูเกิลเพื่อเทรนโมเดลได้ (แน่นอนว่าซอฟต์แวร์ที่ใช้คือ TensorFlow) ช่วยอำนวยความสะดวกเรื่องการบริหารจัดการเครื่อง และการขยาย (scale) เครื่องถ้าจำเป็นต้องใช้งาน

แต่การนำไลบรารีโอเพนซอร์สมารันบนคลาวด์ให้คนอื่นเช่าใช้งาน เป็นเรื่องที่ใครๆ ก็ทำได้ กูเกิลจึงสร้างจุดต่างของตัวเองด้วยการออกแบบหน่วยประมวลผลพิเศษสำหรับงาน AI โดยเฉพาะ โดยใช้ชื่อว่า Tensor Processing Unit (TPU) และเปิดตัว TPU รุ่นที่สอง ในงาน I/O ครั้งที่ผ่านมา

กูเกิลคุยว่าการประมวลผล AI ผ่าน TPU มีประสิทธิภาพดีกว่าการประมวลผลปกติหลายเท่า ตอนนี้ยังไม่มีคนนอกบริษัทได้ทดลองกันมากนักว่าจริงแค่ไหน แต่กูเกิลก็เริ่มเปิดบริการ Cloud TPU รุ่นทดสอบ และ TensorFlow Research Cloud (TFRC) ให้ลองใช้งานแล้ว

ถ้า TPU ทำงานได้ดีจริงตามที่คุย (ซึ่งก็น่าจะทำได้จากผลงานการรัน AlphaGo) และกูเกิลทำราคาได้ดึงดูดพอ ในอนาคตเมื่อทุกคนคิดถึงการเทรน AI บนคลาวด์ ก็คงคิดถึงกูเกิลเป็นอันดับแรก

ความน่าสนใจคือกูเกิลยังไม่มีคู่แข่งในตลาด TPU เท่าไรนัก ที่ใกล้เคียงที่สุดคือ Project Catapult ของไมโครซอฟท์ ที่ยังมีสถานะเป็นโครงการวิจัย ในขณะที่ฝั่งกูเกิลทำเสร็จออกมาเปิดให้บริการกับคนทั่วไปแล้ว

คู่แข่ง:

3. ขอแบบที่เทรนเสร็จแล้ว บริการ AI สำเร็จรูป เรียกใช้ได้ผ่าน API

ยกระดับความขี้เกียจไปอีกขั้น ภาคธุรกิจส่วนใหญ่อาจไม่ต้องการโมเดล AI ที่พิสดารอะไรมาก ขอแค่ AI ที่สามารถแยกแยะเสียงพูดได้ แยกแยะข้อความในภาพ แยกแยะวัตถุในรูปภาพ-วิดีโอ แปลภาษาในข้อความ ฯลฯ

บริการ AI สำเร็จรูปเหล่านี้ กูเกิลเทรนเสร็จเรียบร้อยและเปิดให้เช่าใช้งานผ่าน API มาสักระยะแล้ว เรียกว่ามาตัวเปล่า ไม่ต้องมีความรู้ด้านการวิจัย ไม่ต้องมีเครื่อง ไม่ต้องเทรนโมเดล กำแต่เงินใส่บัตรเครดิตมาเขียนโปรแกรมเรียกใช้ผ่าน API ของกูเกิลได้เลย

หลายคนน่าจะจำน้องคนนี้กันได้

คู่แข่ง: Microsoft Cognitive Services, Amazon AI Services (Amazon Lex)

4. AI กับการปรับปรุงบริการของกูเกิลให้ดียิ่งขึ้น

3 หัวข้อข้างต้นคือบริการด้านการฝึกสอนและการใช้งาน AI ส่วนในหัวข้อนี้คือการนำประโยชน์จาก AI มาปรับปรุงบริการเดิมๆ ของกูเกิลให้ดีกว่าเดิม (และล้ำหน้าคู่แข่ง)

Sundar Pichai พูดในคีย์โน้ตว่าเดิมทีในยุคของพีซี เราป้อนข้อมูลด้วยเมาส์และคีย์บอร์ด พอมาถึงยุคของสมาร์ทโฟน ก็เปลี่ยนมาเป็นการสัมผัสด้วยนิ้ว

แต่พอมาถึงยุคของ AI เราก็มีอินพุทใหม่พร้อมกัน 2 ทางคือ เสียงพูด (speech) และภาพ (vision)

4.1 เสียงพูด: โฟกัสที่ Google Assistant

Sundar โชว์ความแข็งแกร่งของกูเกิลที่ทำผลงาน speech recognition ภาษาอังกฤษได้ดีกว่ามนุษย์แล้ว มีอัตราการแยกแยะคำผิดพลาดต่ำมาก

ผลิตภัณฑ์หลักที่เรียกใช้ระบบแยกแยะเสียงพูดของกูเกิล ย่อมหนีไม่พ้น Google Assistant ผู้ช่วยส่วนตัวที่กำลังขยายพื้นที่มากขึ้นเรื่อยๆ จากเดิมที่มีเฉพาะบน Google Pixel และลำโพง Google Home ก็จะขยายไปยังอุปกรณ์ Android รุ่นอื่น, ออกแอพบน iOS และเปิด SDK ให้นำไปใช้บนอุปกรณ์ประเภทอื่น

ที่ผ่านมา Google Home/Assistant อาจยังตามหลังคู่แข่ง Amazon Echo/Alexa อยู่พอสมควร แต่ในงาน I/O รอบนี้ เราก็เห็นกูเกิลไล่กวด Amazon อย่างรวดเร็ว ฟีเจอร์ที่ Alexa ทำได้มาก่อนอย่างการจ่ายเงิน-การโทรคุย ตอนนี้ Google Assistant แทบจะตามทันหมดแล้ว

คู่แข่งที่สมน้ำสมเนื้อในตลาดนี้ เหมือนจะมีเพียงแค่ Amazon เท่านั้น แต่กูเกิลก็ได้เปรียบกว่าตรงฐานผู้ใช้ Android จำนวน 2 พันล้านเครื่อง ที่สามารถอัพเกรดมาใช้ Google Assistant ได้ง่ายกว่ามาก

คู่แข่ง:

  • ผู้ช่วยส่วนตัว: Amazon Alexa, Microsoft Cortana, Apple Siri, Samsung Bixby
  • ลำโพงอัจฉริยะ: Amazon Echo, Harman Invoke

4.2 ภาพ: รอดูพลังของ Google Lens

การเกิดขึ้นของกล้องสมาร์ทโฟน ส่งผลให้วิธีการมองโลกของคนเปลี่ยนไป คนหันมาใช้การสื่อสารด้วยกล้องถ่ายภาพกันมากขึ้น (ตัวอย่างที่ประสบความสำเร็จคือ Snapchat) และในงาน Facebook F8 เมื่อเดือนที่แล้ว Facebook ก็พูดเรื่องเดียวกันว่า Camera คือแพลตฟอร์มหลักของโลก AR

กูเกิลก็มองเห็นภาพนี้ และเปิดตัว Google Lens ฟีเจอร์ด้านการใช้กล้องเพื่อแยกแยะวัตถุต่างๆ ในโลก ด้วยพลังของข้อมูลที่กูเกิลมีเก็บไว้ เราสามารถใช้ Google Lens ชี้ที่วัตถุแล้วดูได้ทันทีว่าเป็นวัตถุอะไร เป็นสถานที่ไหน ถ้าเป็นร้านอาหาร ร้านนั้นได้รีวิวกี่คะแนน

Google Lens จะกลายเป็นตัวเชื่อมใหม่ระหว่างโลกออนไลน์กับออฟไลน์ เพียงแค่เรายกกล้องขึ้นมาเท่านั้น ตอนนี้ต้องรอ Google Lens ออกแล้วถึงจะรู้ว่าทำได้สมราคาคุยแค่ไหน (Samsung Bixby ก็มีฟีเจอร์นี้ แต่ใช้วิธีร่วมมือกับพาร์ทเนอร์รายอื่นอย่าง Pinterest)

นอกจากการใช้ Google Lens ดูข้อมูลวัตถุแบบเรียลไทม์ เรายังสามารถใช้ความฉลาดของมันกับภาพที่ถ่ายไว้แล้วได้ด้วย ตอนนี้คนที่ใช้ Google Photos ก็คงทราบดีว่ามันสามารถแยกแยะวัตถุในภาพตามที่เราค้นหาได้ แต่กูเกิลกำลังจะก้าวไปอีกขั้นด้วยการใช้ AI ตกแต่งภาพให้ออกมาตามที่เราต้องการ

เดโมในงาน I/O ถ่ายภาพลูกสาวกำลังตีเบสบอลผ่านรั้วลวดตาข่าย และพลังของ AI สามารถลบรูปรั้วนั้นออกไปให้เราได้เลย (ต่อไปกล้องมือถือคงแข่งกันด้วยฟีเจอร์นี้)

คู่แข่ง: Facebook Camera Platform, Samsung Bixby

5. บทสรุป

ทั้งหมดนี้คือภาพรวมของงานด้าน AI ของกูเกิลในปัจจุบัน ที่ยังไม่นับรวมงานสายงานวิจัย (เช่น DeepMind/AlphaGo) และงานที่อยู่ในส่วนของบริษัทแม่ Alphabet (เช่น รถยนต์ไร้คนขับ Waymo) ส่วนอื่นอีกมาก มากถึงขนาดกูเกิลต้องเปิดเว็บ Google.ai ขึ้นมารวมผลงานของตัวเองเผยแพร่ต่อสาธารณะ

จากผลงานด้าน AI ของกูเกิล จะเห็นว่ากูเกิลมีคู่แข่งมากมายในแต่ละระดับชั้น แต่คู่แข่งที่มีผลิตภัณฑ์ครบทุกระดับแบบเดียวกับกูเกิลนั้นยังไม่มี

สิ่งที่น่าจับตาต่อไปคือ กูเกิลจะสามารถใช้ประโยชน์จากผลิตภัณฑ์ เทคโนโลยี และทีมงานด้าน AI จำนวนมากในปัจจุบัน เพื่อสร้างความได้เปรียบในการแข่งขันได้มากแค่ไหน อีกไม่เกิน 1-2 ปี เราน่าจะเริ่มเห็นผลลัพธ์ของการแข่งขันในสายงานด้านนี้

Blognone Jobs Premium