มารู้จักกับ Bing Platform เทคโนโลยีเบื้องหลัง Cortana

by nismod
9 April 2014 - 16:21

การอัพเดตใหญ่ของไมโครซอฟท์ในงาน Build 2014 ที่ผ่านมาคงหนีไม่พ้นเรื่องของ Cortana ที่เป็น Voice Assistant ของทางฝั่ง Window Phone ส่วนตัวผมว่าสามารถสู้กับ Siri ของ iOS ได้อย่างไม่เคอะเขินเลยทีเดียว และแน่นอนว่าภายใต้เบื้องหน้าอันชาญฉลาดของ Cortana ย่อมมีแพลตฟอร์มที่ทำงานสนับสนุนอยู่เบื้องหลัง ไมโครซอฟท์เรียกแพลตฟอร์มการทำงานนี้ว่า แพลตฟอร์ม Bing แพลตฟอร์มนี้ประกอบไปด้วย ระบบรับคำสั่งเสียง (Speech Recognition), ระบบค้นหา (ไมโครซอฟท์มีโค้ดเนมในเทคโนโลยีการค้นหาว่า Satori อ่านเพิ่มเติมที่นี่ [1], [2]) และระบบประมวลผลแบบ real-time (stream processing system) ผมขออธิบายแยกไปทีละระบบละกันนะครับ

ระบบรับคำสั่งเสียง

ภายใต้ระบบคำสั่งเสียง เทคโนโลยีที่เรียกว่า โครงข่ายประสาทเทียมแบบลึก (deep neural networks (DNNs)) ซึ่งเลียนแบบการทำงานของระบบประสาทในสมองมนุษย์ มีส่วนสำคัญในการประมวลผลสิ่งที่เราพูด (การประมวลผลนี้ไมโครซอฟท์เรียกว่า การประมวลภาษาธรรมชาติ (natural language processing)) เพื่อทำความเข้าใจว่าสิ่งที่เราพูดนั้นเป็นคำสั่งหรือคำถาม สั่งอะไร ถามอะไร เป็นต้น เสียงที่เราพูดกับ Cortana จะถูกส่งขึ้น cloud แปลงเป็น bits และส่งให้ engine ที่ทำงานโดย DNNs ตีความสิ่งที่เราพูด เพื่อทำงานตามที่เราสั่ง/ถามต่อไป

ระบบค้นหา

เป็นต้นว่าผมถาม Cortana ว่า พรุ่งนี้กรุงเทพจะร้อนไหม? ระบบคำสั่งเสียงจะตีความก่อนว่าคำว่า "ร้อน" ในที่นี้หมายถึง "อากาศ" แล้วระบบเข้าไปค้นหาในคลังข้อมูลของ Bing (Bing's knowledge repository) ซึ่งติดตามข้อมูลทั้งคน,สิ่งของและสถานที่ (entities) แบบ real-time ระบบในคลังนี้จะรู้ว่ากรุงเทพอยู่ในประเทศไทย ระบบจึงเข้าไปหาข้อมูล data feeds เรื่องสภาพอากาศในประเทศไทย และส่งข้อมูลของสภาพอากาศในกรุงเทพมาให้ผม

ระบบประมวลผลแบบ real-time (stream processing system)

หากผมมีอีเมลคอนเฟิร์มเที่ยวบินและแผนการเดินทาง ระบบจะถือว่าข้อมูลทั้งเที่ยวบิน เมืองที่เครื่องออกและจุดหมายปลายทางเป็นสิ่งที่อาจจะเกิดขึ้นได้ (potential actions) ระบบจะจดจำทั้งเที่ยวบิน วันและเวลาและกลับมาถามผมว่าจะให้เตือนเรื่องการเดินทางนี้หรือไม่ แน่นอนผมให้ Cortana ช่วยเตือน เมื่อเวลาผ่านไปใกล้วันเครื่องออก ระบบ stream processing จะติดตามสถานะของเที่ยวบินอย่างใกล้ชิด และจะส่ง notification มาเตือนผม สิ่งที่ส่งมาด้วยไม่ใช่แต่การเตือน แต่มีทั้งสถานะเที่ยวบิน (ว่าไม่เลื่อน), สภาพการจราจรจากบ้านผมไปสนามบิน รวมไปถึงแผนผังสนามบิน

อย่างไรก็ดี Cortana เองก็คงมีข้อจำกัดในแง่ของข้อมูลที่ไม่แตกต่างกับ Siri เท่าใดนัก โดยเฉพาะข้อมูลด้านสถานที่และแผนที่ที่เมืองใหญ่ๆ สำคัญๆ มักจะมีข้อมูลละเอียดเพียงพอจะให้ Cornata ช่วยเหลือดังที่กล่าวไปได้ก่อน ถึงตอนนี้ก็คงต้องแค่รอให้ Window Phone 8.1 อัพเดตออกมาให้ผู้ใช้ได้ใช้จริงและทดสอบความสามารถของ Cortana ให้ชัดแจ้งไปเลยว่าสมราคาคุยของไมโครซอฟท์ และสามารถทาบนวมกับ Siri ได้แค่ไหน

หมายเหตุ: ที่ผมเปรียบเทียบ Cortana กับ Siri โดยไม่พูดถึง Google Now เพราะผมเห็นว่าฟีเจอร์การทำงานของ Google Now นั้นตอบสนองต่อคำสั่งในการค้นหาเพียงอย่างเดียว ขณะที่ Cortana และ Siri สามารถมีปฏิสัมพันธ์กับมนุษย์ได้มากกว่า

The Bing Platform: More Helpful, Personal and Intelligent from Bing on Vimeo.

ที่มา - Bing Official Blog

Blognone Jobs Premium