อดีต ปัจจุบันและอนาคตของ Siri

by 0rmsin
6 October 2011 - 07:23

จากงานแถลง Let's talk iPhone บริษัทแอปเปิลเปิดตัวผลิตภัณฑ์และบริการใหม่หลายต่อหลายตัว ซึ่งหนึ่งในนั้นคือ Siri บางคนอาจสงสัยว่า คืออะไร? ทำอะไรได้? มาจากไหน? หรือแม้แต่ชื่อนี้มาจากภาษาไทยรีเปล่า? วันนี้เราจะมาทำความรู้จักกันครับ

  • แนะนำให้รู้จัก

    Siri แจ้งเกิดอย่างเต็มตัวภายหลังงาน Let's talk iPhone โดยถูกนำเสนออย่างคร่าวๆ ภายในงาน แต่เพียงแค่นั้นก็ทำให้เข้าใจได้ว่า มันคือแอพพลิเคชันที่จะมาเป็น “ผู้ช่วย” ไม่ว่าจะเป็นด้านการค้นหา หรือใช้ความสามารถอื่นๆ ที่มีอยู่ภายในเครื่อง เช่น ใช้งานปฏิทิน หรือส่งข้อความ

    ความโดดเด่นอยู่ที่การใช้งาน กล่าวคือ แอพพลิเคชันทำงานผ่านการ “คุย” ระหว่างผู้ใช้และอุปกรณ์ (iPhone) ซึ่งความพิเศษไม่ใช่แค่การสั่งการด้วยเสียง แต่เป็นความฉลาดของระบบ ที่สามารถรู้และโต้ตอบในสิ่งที่เราต้องการได้ ตามคำโปรยของแอปเปิลที่ว่า

    Ask Siri to do things just by talking the way you talk. Siri understands what you say, knows what you mean, and even talks back. Siri is so easy to use and does so much, you’ll keep finding more and more ways to use it.

  • ประวัติและที่มา

    เดิมที Siri มาจากงานวิจัยในชื่อ CALO project (Cognitive Assistant that Learns and Organizes) โดยเป็นความร่วมมือระหว่าง SRI International (หน่วยงานวิจัยโดยไม่หวังผลกำไร เกิดจากความร่วมมือจากหลายๆ มหาวิทยาลัย อาทิเช่น stanford) และ DARPA ซึ่งมีงบประมาณวิจัย 150 ล้านเหรียญสหรัฐฯ เริ่มโครงการในปี 2003

    โดยมีจุดประสงค์หลักเพื่อประยุกต์ระบบปัญญาประดิษฐ์ (artificial intelligence) และเทคโนโลยีการรู้จำมาใช้ในงานด้านการจัดการในหน่วยงานทางทหารสหรัฐฯ เช่น จัดวาระและนัดหมายการประชุม, เรียงลำดับความสำคัญอีเมล์, จัดลำดับความสำคัญของสารสนเทศ รวมถึงงานด้านการตัดสินใจ และการประสานงานภายในหน่วยงาน (อ่านเพิ่มเติมใน Wikipedia)

    ต่อมาในปี 2007 จึงมีการจัดตั้งบริษัท Siri ซึ่งเป็นบริษัทร่วมทุนระหว่าง Morgenthaler Ventures, Menlo Ventures, SRI International และ Li Ka-shing เป็นเงินทั้งสิ้น 24 ล้านเหรียญสหรัฐฯ ซึ่งใช้ทีมเดิมที่ทำ CALO project มาเป็นผู้บริหารของบริษัท มีผลิตภัณฑ์หลักคือ Siri นั่นเอง

    และตอนนี้ผมขอเฉลยว่า คำว่า Siri นั้นมาจากภาษาสแกนดิเนเวียน ซึ่งแปลว่า "ชัยชนะอันงดงาม"

    คลิปทำความรู้จัก CALO project ตามลิงค์ครับ

    ฟีเจอร์ดั้งเดิม

    Siri นั้นถูกวางตัวมาเพื่อเป็นแอปพลิเคชันที่ทำหน้าที่เป็น "ผู้ช่วยส่วนตัว" กล่าวคือเป็นตัวกลางที่ทำหน้าที่เชื่อมบริการของผู้ให้บริการรายอื่นๆ ที่มีอยู่แล้วเข้าด้วยกัน เช่น จองตั๋วผ่าน StubHub, จองโต๊ะร้านอาหารผ่าน OpenTable โดยทั้งหมดจะถูกสั่งการด้วยเสียง ในส่วนการวิเคราะห์เสียงจะใช้บริการของ Nuance และจากอดีตถึงปัจจุบัน Siri มีเฉพาะบนแพลตฟอร์ม iOS เท่านั้น

    ทำให้วิเคราะห์ได้ว่า Siri เองมีหน้าที่เชื่อมต่อบริการต่างๆ และประมวลผลผ่าน engine ของตัวเองเท่านั้น โดยบริษัทในความร่วมมือได้แก่ WeatherBug, Citisearch, OpenTable, Taxi Magic, Rotten Tomatoes, Yahoo Local, Yelp และ Nuance (ชื่อนี้ขอให้จำดีๆ)

    และเพื่อให้เห็นถึงพัฒนาการ ขอสรุปฟีเจอร์ดั้งเดิมไว้ดังนี้ครับ

    • จองตั๋วภาพยนตร์, กีฬา, คอนเสิร์ต
    • จองโต๊ะอาหาร
    • ถามพยากรณ์อากาศ (แน่นอนว่าตอบเป็นเสียง)
    • สร้างบันทึกเตือนความจำ
    • ค้นหาสถานที่ พร้อมแนะนำเส้นทางและการเดินทาง
    • ถามเรื่องทั่วๆ ไป เช่น อยากรู้ชื่อตึกที่สูงที่สุดในโลก, รอบภาพยนตร์ หรือรอบการแสดงในแถบที่อยู่ของเรา
    • เรียกแท็กซี
    • อื่นๆ

    ที่ต้องรวมอื่นๆ มาด้วยเพราะแอพพลิเคชันมีความสามารถหลากหลายมาก เหตุผลคือ Siri เป็นระบบปัญญาประดิษฐ์ที่บูรณาการตัวเองเข้ากับบริการอื่นๆ รวมทั้งบริการค้นหาด้วย ทำให้มีความยืดหยุ่นต่อการใช้งานสูง

    คลิปแสดงความสามารถเดิมของ Siri

  • สู่อ้อมกอดแอปเปิล

    แอปเปิลเองได้ให้ความสำคัญกับเทคโนโลยีสั่งการด้วยเสียงมาเป็นเวลาอย่างน้อยสองถึงสามปี จะเห็นได้จากผลิตภัณฑ์ใหม่ๆ หลายตัวภายหลังงาน WWDC 2011 ที่ได้มีการแถลงข่าวของ OSX Lion และ iOS 5 ไปหมาดๆ โดยมีผู้ตั้งข้อสังเกตว่าทั้งสองแพลตฟอร์มมีการรองรับการสั่งการด้วยเสียงเข้ามา โดยเป็นความร่วมมือระหว่างแอปเปิลและ Nuance (จำได้รึเปล่าเอ่ย) อ้างอิง 1, 2 และอันที่จริงฟีเจอร์รับคำสั่งจากเสียงมีให้เห็นตั้งแต่ iOS 4 แล้ว

    แอพพลิเคชันแห่งอนาคตอย่าง Siri ย่อมไม่รอดสายตาของบริษัทไอทียักษ์ใหญ่เช่นแอปเปิลไปได้ ทางเลือกของแอปเปิลจึงมีเพียงสองทางคือ จะสร้างขึ้นเองหรือซื้อกิจการเข้ามา จากการคาดการณ์ของหลายแหล่งข่าวก็ได้คาดว่า Siri จะต้องโดนซื้ออย่างแน่นอน

    ในที่สุด ช่วงเดือนเมษายน ปี 2010 แอปเปิลตัดสินใจเข้าซื้อ Siri อย่างเงียบๆ โดยไม่ได้ประกาศราคาเข้าซื้อ แต่มีรายงานออกมาว่าเป็นเงินประมาณ 150 ถึง 250 ล้านเหรียญสหรัฐฯ ซึ่งในช่วงนั้นยังไม่ค่อยเป็นที่เข้าใจว่าแอปเปิลตัดสินใจซื้อด้วยเหตุใด เพราะโดยวิสัยของแอปเปิลเองก็ไม่ค่อยเข้าซื้อกิจการของบริษัทใดอยู่แล้ว (ไม่เหมือนอีกราย :D) แต่ถ้าสังเกตจากแนวโน้มของแอปเปิลเองก็ไม่น่าแปลกใจที่ตัดสินใจเช่นนี้ เพราะด้วยราคาเท่านี้ กับผลิตภัณฑ์ที่ต้นทุนสูงแบบนี้ มองมุมไหนก็คุ้มค่า

    คลิปแสดงเบื้องลึกเบื้องหลังการลงทุนครั้งนี้

    Part 1

    Part 2

  • ฟีเจอร์คาดการณ์

    ในวันนี้ความสามารถของ Siri ยังคลุมเครืออยู่มาก เพราะแอปเปิลเองก็ไม่ได้พูดถึงมากนัก อีกทั้งยังอยู่ในสถานะทดสอบ (Beta) ซึ่งหมายความว่าจะมีความสามารถอื่นๆ เพิ่มเติมในภายหลัง

    ตรงนี้ผมจะขอสรุปฟีเจอร์เท่าที่ทราบครับ (ทั้งหมดสั่งการด้วยเสียง)

    • รองรับ 3 ภาษา คือ อังกฤษ, เยอรมัน, ฝรั่งเศส
    • พิมพ์ข้อความ
    • สร้างบันทึกข้อความ
    • เขียนอีเมล์
    • ค้นหาเส้นทาง
    • ถามเกี่ยวกับความรู้ทั่วไป (รองรับ Yelp และ WolframAlpha)
    • ให้ข้อมูลเกี่ยวกับตำแหน่งที่ใกล้เคียง
    • สอบถามสภาพอากาศ
    • จัดวาระการประชุม
    • ถามหมายเลขโทรศัพท์ของรายชื่อในเครื่อง
    • ตั้งเวลาปลุก
    • ติดตามสถานการณ์หุ้น
    • ตั้งเวลาแจ้งเตือน

    ซึ่งความสามารถหลักๆ ก็คล้ายๆ กับช่วงก่อนถูกซื้อเข้ามา อย่างไรก็ตามเมื่อเข้ามาอยู่ใต้เงาแอปเปิล สิ่งที่เปลี่ยนอย่างเห็นได้ชัดคือ "ดีไซน์" ที่เหล่าสาวกคงเรียกได้ว่า "เป็นแอปเปิล" มากขึ้น แต่ก็ต้องยอมรับจริงๆ ว่าโดยรวมนั้นช่วยเพิ่มประสบการณ์ผู้ใช้ได้จริง ไม่ว่าจะเป็นความง่ายในการใช้งาน อนิเมชันที่สวยงาม หรือแม้แต่เสียงเย็นๆ ของแม่สาวที่คอยโต้ตอบกับเรา ราวกับอยู่บนยานอวกาศ

    คลิปแถลงเกี่ยวกับ Siri จากงาน Let's talk iPhone

  • วันนี้และอนาคต

    สำหรับผม การเปิดตัวเล็กๆ ของ Siri กลับเป็นอีกเรื่องใหญ่ของวงการไอที เพราะนี่หมายถึงการเปิดแนวรบที่ “มองไม่เห็น” ให้ทุกคนได้มองเห็น กล่าวคือ แอปเปิลได้รุกคืบเข้ามาในตลาดของการค้นหามากขึ้น ซึ่งผู้ครองส่วนแบ่งใหญ่ก็คงเป็นใครไปไม่ได้นอกจากกูเกิล ที่มีบริการทำนองนี้มาก่อน เช่น voice search

    แม้ขณะนี้แอปเปิลยังไม่ได้ลงเล่นในตลาดการค้นหาเต็มตัว แต่การเปิดตัวครั้งนี้ และผลิตภัณฑ์ที่ผ่านๆ มา ก็แสดงนัยยะบางอย่างไม่น้อยทีเดียว คำถามต่อไปคือกูเกิลจะมีแผนรับมืออย่างไร? แพลตฟอร์ม Windows Phone จากก๊กไมโครซอฟท์จะตอบรับต่อเทคโนโลยีนี้หรือไม่? การสั่งการด้วยเสียงจะเป็นอนาคตจริงหรือ? ซึ่งแน่นอนว่าสามก๊กไอทีจะต้องเข้มข้นมากขึ้น

  • แหล่งอ้างอิง

    USAtoday,PCmag, CNN, SEOchat,
    Gigaom,
    Techcrunch 1/ 2,
    informationweek
    programmableweb,
    newyorktimes
    WSJ,
    businessinsider ,
    scobleizer,
    ecommercetimes,
    apple 1/ 2/ 3,
    thenextweb,
    geek,
    fiercemobilecontent,
    imaicafe,
    Wikipedia 1/ 2,
    9to5mac,
    SRI 1/ 2/ 3,
    crunchbase,
    engadget,
    Stanford University,
    Dailytech,
    xconomy,
    macrumors

    Blognone Jobs Premium