รู้จัก Accurately.ai เพราะ AI เริ่มต้นที่ข้อมูลคุณภาพ

by sponsored
9 November 2020 - 07:10

AI หรือ Artificial Intelligence เทคโนโลยีที่คนทั่วโลกต่างรู้จัก และกำลังมาแรงในโลกธุรกิจ ทำให้องค์กรจำนวนมากมีความพยายามนำ AI มาประยุกต์ใช้เพื่อเพิ่มขีดความสามารถในการแข่ง จะเห็นได้จาก Gartner’s Hype Cycle for Emerging Technology ประจำปี 2020 นั้น มี AI เป็นส่วนประกอบ 1 ใน 3 ของเทรนเทคโนโลยีที่กำลังมาแรงที่สุด


2020 Gartner’s Hype Cycle for Emerging Technology

หนึ่งในสาขาของ AI ที่มีการนำมาประยุกต์ใช้ในธุรกิจมากในระยะหลังคือ machine learning หรือการเรียนรู้ของเครื่องจักร เป็นการพัฒนา AI ด้วยการสร้างแบบจำลองสมองหรือ neural network เพื่อเรียนรู้การทำงานจากตัวอย่างข้อมูลที่ถูกป้อนเข้าไป ซึ่งสามารถแก้ปัญหาที่มีความซับซ้อนมากกว่าการพัฒนา AI ในรูปแบบดั้งเดิม

ตัวอย่างกรณีศึกษา ที่เป็นที่รู้จักกันอย่างกว้างขวาง ได้แก่ ระบบรถไร้คนขับของ Tesla, การตรวจจับ defect บนสินค้าในโรงงาน, การตรวจหาความผิดปกติของฟิล์มเอกซเรย์, การตรวจจับความผิดปกติของพืชในอุตสาหกรรมการเกษตร


(1) การตรวจจับวัตถุในระบบรถไร้คนขับ

(2) การตรวจจับความผิดปกติของพืชในฟาร์มการเกษตร

(3) การตรวจจับ defect บนสินค้าจากโรงงานอุตสาหกรรม

จะเห็นได้ว่าจากตัวอย่างกรณีศึกษาข้างต้น AI สามารถเป็นเครื่องมือที่ช่วยลดความผิดพลาด ลดต้นทุนการใช้แรงงาน ทั้งยังสร้างโอกาสทางธุรกิจใหม่ๆ มากขึ้นอีกด้วย ดังนั้น AI จึงกลายเป็นปัจจัยที่จะช่วยขับเคลื่อนองค์กรให้มีประสิทธิภาพ และมีศักยภาพในการแข่งขันมากยิ่งขึ้น

มีขั้นตอนอะไรบ้างในการสร้าง Machine Learning AI?


ที่มา: medium.com/@devendra

ในการพัฒนา AI ข้อมูล เป็นสิ่งที่สำคัญที่สุดที่ช่วยทำให้ AI เรียนรู้และทำงานได้อย่างมีประสิทธิภาพ สิ่งแรกที่ควรคำนึงถึงคือปริมาณข้อมูลที่ใช้ว่ามีจำนวนมากเพียงพอ แม้งานหลายอย่างมีความต้องการปริมาณข้อมูลที่ไม่เท่ากัน แต่สิ่งที่เหมือนกันคือ ยิ่งมีปริมาณข้อมูลมากเท่าไรก็ยิ่งดีกับการพัฒนาและคุณภาพของ AI มากเท่านั้น

นอกจากปริมาณข้อมูลแล้ว อีกสิ่งหนึ่งที่มีความสำคัญไม่แพ้กันคือ คุณภาพข้อมูล โดยขั้นตอนนี้ถือว่ามีความสำคัญที่สุดในการสร้าง AI เนื่องจากคุณภาพของข้อมูลจะส่งผลต่อความแม่นยำของ AI อย่างมาก เพราะข้อมูลที่ผิดจะส่งผลให้ AI เรียนรู้แบบผิดๆ และทำให้ AI นั้นมีความผิดพลาดสูงเมื่อนำไปใช้งาน อย่างที่กล่าวกันว่า “garbage in, garbage out” ดังนั้น ขั้นตอนการตรวจสอบและปรับปรุงคุณภาพของข้อมูลจึงมีความสำคัญอย่างยิ่ง

ขั้นตอนการเตรียมข้อมูลควรเป็นอย่างไร

การเตรียมข้อมูลจัดเป็นสิ่งสำคัญลำดับต้นๆ สำหรับการสร้าง AI ในการเตรียมข้อมูลสำหรับการพัฒนา AI ในองค์กรนั้น จำเป็นต้องมีกระบวนการจัดทำข้อมูลหรือ Data Labelling Workflow

โดยเริ่มจากการกำหนดรูปแบบและประเภทของข้อมูลที่ต้องการ จากนั้นทำการหาข้อมูลเหล่านั้นโดยอาจจะเป็นได้ทั้งข้อมูลที่มีในองค์กรอยู่แล้ว ข้อมูลดิบ หรือข้อมูลที่สามารถหาได้ทั่วไปบนโลกอินเตอร์เน็ตก็เป็นได้

เมื่อเราได้ข้อมูลที่ต้องการมาแล้วขั้นตอนต่อไปคือการจำแนกข้อมูลหรือ Data Labelling ซึ่งสามารถทำได้หลากหลายวิธีขึ้นอยู่กับรูปแบบของข้อมูลที่ต้องการใช้ ทั้งการ Label แบบพื้นฐานอย่างข้อมูลทั่วไปที่สามารถจัดการได้ด้วยวิธีการที่ไม่ซับซ้อน หรือ การ Label ข้อมูลที่มีความซับซ้อน เช่น การจำแนกรูปภาพที่ต้องมีกระบวนการจัดการซับซ้อนมากกว่าการ Label ข้อมูลปกติ

แต่สิ่งสำคัญที่ต้องคำนึงถึงคือการวางแผนการเก็บรักษาข้อมูลและการจัดการข้อมูลต้องปลอดภัย สอดคล้องกับข้อกำหนดต่างๆ เช่น กฎหมายคุ้มครองข้อมูลส่วนบุคคลหรือมาตรฐานต่างๆ ที่เกี่ยวข้อง (ISO27001)

อุปสรรค ในการจำแนกข้อมูลเพื่อเทรน AI

การจำแนกข้อมูลจำเป็นต้องใช้ผู้ที่มีความรู้และความเชี่ยวชาญ ในการกำหนดทิศทาง และการบริหารงาน เพื่อความมีประสิทธิภาพ เพราะหากขาดความรู้ความเชี่ยวชาญก็อาจจะก่อให้เกิดอุปสรรคต่างๆ ได้ดังนี้

ด้านต้นทุน

  • ต้นทุนด้านเครื่องมือการทำงานสูง เช่น กรณีที่ต้องสร้างระบบเพื่อจำแนกข้อมูลเอง
  • ต้นทุนการบริหารบุคลากร ไม่ว่าจะเป็นทั้งการจัดการทีมงานภายในองค์กร หรือการจัดจ้างทีมงานภายนอก

ด้านระบบ

  • หาเครื่องมือที่ใช้คัดแยกให้เหมาะสมกับข้อมูลขององค์กรได้ยาก
  • การสร้างเครื่องมือใช้งานเองโดยทีม development อาจตอบโจทย์ความต้องการขององค์กรได้ แต่ต้องใช้ระยะเวลานาน เป็นผลทำให้ต้นทุนในการพัฒนาและดูแลรักษาสูงตามไปด้วย
  • การวัดผลการทำงานเพื่อนำมาปรับปรุงและพัฒนาคุณภาพ สามารถทำได้ยากหากไม่มีเครื่องมือที่ใช้วัดผลที่ดีพอ

ด้านทรัพยากรมนุษย์

  • หาผู้มีความรู้และมีความเข้าใจที่จะทำระบบจำแนกข้อมูลให้ตอบโจทย์และเหมาะสมกับการนำข้อมูลไปใช้พัฒนา AI ได้ยาก
  • การวางแผนการทำงาน ลำดับขั้นตอน และการรวบรวมข้อมูล มีความซับซ้อนยากต่อการบริหารจัดการ
  • อาจต้องใช้พนักงานเป็นจำนวนมากเพื่อจำแนกข้อมูล
  • ต้องใช้ระยะเวลาในการหาพนักงานและการฝึกฝน พัฒนาศักยภาพพนักงาน เพื่อให้เข้าใจวิธีการทำงาน จนสามารถคัดแยกข้อมูลให้ถูกต้องและมีประสิทธิภาพสูงสุด

ให้ Accurately.ai ช่วยคุณ

หากคุณกำลังมองหาตัวช่วยที่จะทำให้ Data Labelling Workflow ของคุณทำได้ง่ายและมีประสิทธิภาพมากขึ้น Accurately.ai สามารถช่วยให้คุณทำงานได้อย่างสะดวกสบายบน Feature ที่หลากหลาย พร้อมการจัดเก็บข้อมูลบนเซิร์ฟเวอร์ที่มีความปลอดภัยสูงอย่าง Amazon AWS ทำให้ผู้ใช้งานเกิดความมั่นใจเรื่องความปลอดภัยของข้อมูล ทั้งยังสามารถจัดการระบบ ติดตามผล รวมถึงดาวน์โหลดข้อมูลของคุณได้ทุกที่ที่ต้องการ

Labelling Tools

ในปัจจุบัน Accurately.ai มีเครื่องมือรองรับการทำ Data labelling หลากหลายรูปแบบ ได้แก่ image classification, object detection, และ image segmentation

  • Image Classification หรือ การจำแนกประเภทรูปภาพให้อยู่ในหมวดหมู่ที่กำหนดไว้
  • Object Detection หรือ การจำแนกองค์ประกอบในรูปภาพพร้อมกรอบแสดงผล
  • Image Segmentation หรือ การระบายสีทับเพื่อจำแนกองค์ประกอบต่างๆในรูปภาพ

นอกจากเครื่องมือที่กล่าวไปแล้ว Accurately.ai ยังมีเครื่องมือพิเศษที่ช่วยอำนวยความสะดวกและประหยัดเวลาทำงานให้แก่ผู้ใช้บริการด้วย คือ การ pre-label objects หรือการให้ AI ของ Accurately ช่วย label รูปภาพ ซึ่งมีให้เลือกมากกว่า 90 ประเภท

Project Management


หน้า Dashboard แสดงภาพรวมของโปรเจกต์ต่างๆ

Accurately.ai ยังช่วยอำนวยความสะดวกในการจัดการข้อมูลหลังบ้าน ตั้งแต่การอัพโหลดข้อมูลรูปภาพสูงสุด 1 TB เข้าระบบที่รองรับข้อมูลปริมาณมาก สร้างและจัดการโปรเจกต์ได้หลากหลาย รองรับการควบคุมสิทธิ์ในการเข้าถึงข้อมูล พร้อมหน้า dashboard ที่จะช่วยแสดงภาพรวมและความคืบหน้าในการทำงานของแต่ละโปรเจกต์ ช่วยให้ผู้ใช้งานสามารถจัดการปัญหาต่างๆได้อย่างทันท่วงที

Accuracy

เพราะความถูกต้องของข้อมูลคือสิ่งสำคัญ Accurately.ai จึงมีเครื่องมือที่ใช้เพื่อตรวจสอบความถูกต้องของข้อมูลหลังจากการ label ให้ QA/QC ทำการตรวจสอบ เพื่อให้ผู้ใช้บริการมั่นใจว่าจะได้ชุดข้อมูลที่มีคุณภาพในการนำไปใช้งาน ซึ่งสามารถแสดงผลได้ทั้งในรูปแบบความถูกต้องของชุดข้องมูล (Data Set) และความถูกต้องของ Labeller เป็นรายบุคคล เพื่อให้ผู้จัดการทีมสามารถประเมินประสิทธิ์ภาพและปรับปรุงการทำงานของ Labeller ได้


หน้าแสดงผลภาพรวม

ตัวอย่าง​ : หน้าตรวจสอบความถูกต้องของข้อมูล

Performance Tracking

นอกจากเรื่องความถูกต้องแล้วระบบของ Accurately.ai ยังสามารถเก็บข้อมูลระยะเวลาที่พนักงานแต่ละคนใช้ทำงาน โดยสามารถแสดงผลได้ทั้งจำนวนข้อมูลที่พนักงานทำได้ ระยะเวลาที่ใช้ เพื่อใช้ในการวางแผนบริหารจัดการงบประมาณในการจ้างพนักงาน

Security

สำหรับองค์กรที่เป็นห่วงในเรื่องความปลอดภัยของข้อมูลหรือ Privacy สามารถหายห่วงได้ เพราะผู้ให้บริการใส่ใจเกี่ยวกับความปลอดภัยในข้อมูลของผู้ใช้บริการเป็นลำดับแรก บริษัท เดต้า ว้าว จำกัด ได้รับการรับรองมาตรฐานความปลอดภัย ISO 27001 สามารถช่วยให้ผู้ใช้บริการมั่นใจในกระบวนการและมาตรการควบคุมต่อภัยคุกคามทางไซเบอร์ได้อย่างแน่นอน

อีกหนึ่งบริการดีๆจาก Accurately.ai หากผู้ใช้บริการไม่สะดวกในการจัดหาพนักงานเพื่อจำแนกข้อมูล ทางบริษัทมีบริการจำแนกข้อมูลโดยพนักงานที่มีความเชี่ยวชาญในการจำแนกข้อมูลรูปภาพ และยังมี Data Science Team คอยให้คำปรึกษาสำหรับการพัฒนา Model สามารถทำให้ผู้ใช้บริการมั่นใจในคุณภาพและความถูกต้องของข้อมูลได้

นอกจากความสามารถที่กล่าวไปแล้วบริษัทยังไม่หยุดพัฒนา features อื่นๆเพิ่มเติม เช่น automatic trainning ซึ่งจะช่วยให้ผู้ใช้บริการสามารถพัฒนา machine learning model จากชุดข้อมูลของตนเองให้ตอบโจทย์ความต้องการในอนาคตได้อีกด้วย

สามารถทดลองใช้งานได้แล้วที่ accurately.ai

Blognone Jobs Premium