แอปเปิลรายงานวิธีการรวบรวมข้อมูลจากผู้ใช้โดยไม่เปิดเผยข้อมูลส่วนตัวใครคนหนึ่ง

by lew
7 December 2017 - 01:33

แอปเปิลออกรายงานระบบรวบรวมข้อมูลจากผู้ใช้เพื่อเรียนรู้พฤติกรรมของผู้ใช้ในกลุ่มใหญ่ โดยไม่ต้องเปิดเผยข้อมูลผู้ใช้คนใดคนหนึ่ง แต่ยังทำให้ระบบสามารถเรียนรู้ข้อมูลเป็นกลุ่มได้ เช่น ข้อมูลอิโมจิยอดนิยม, คำใหม่ๆ ที่เพิ่งเกิดขึ้น, หรือรายงานเว็บมีพฤติกรรมผิดปกติ

ระบบเช่นนี้จะทำงานต่อเมื่อผู้ใช้เปิดตัวเลือกรายงานข้อมูลไปยังแอปเปิล หากปิดตัวเลือกการส่งข้อมูลไว้ก็จะไม่มีข้อมูลใดๆ ส่งกลับไปเลย

ระบบรายงานข้อมูลการใช้งานถูกแบ่งออกเป็นสองฝั่ง คือ ฝั่งอุปกรณ์และฝั่งเซิร์ฟเวอร์ ที่ฝั่งอุปกรณ์จะมีระบบ Privatization รับประกันว่าข้อมูลจะไม่มีข้อมูลส่วนตัวติดไปในระดับหนึ่ง ระบบนี้จะกักข้อมูลไว้ไม่ส่งไปยังเซิร์ฟเวอร์ทันที แต่จะแฮชข้อมูลเป็นชุดๆ (differentially private record) จากนั้นจึงสุ่มเลือกส่งข้อมูลบางชุดไปยังเซิร์ฟเวอร์

หลังจากนั้นจะส่งไปยังเซิร์ฟเวอร์ ที่ระบบ Ingestor โดยจะลบข้อมูลไอพีระหว่างการเก็บออกไป แล้วรวบรวมข้อมูลเพื่อวิเคราะห์

กระบวนการส่งข้อมูลจริงอาศัยอัลอริทึม Private Count Mean Sketch (CMS) สุ่มเลือกกระบวนการแฮชของข้อมูลที่ต้องการส่ง เช่น โดเมนเว็บ แล้วส่งข้อมูลค่าแฮชออกไปยังเซิร์ฟเวอร์ ฝั่งเซิร์ฟเวอร์ต้องรวบรวมข้อมูลแล้วคำนวณค่าแฮชของโดเมนเว็บหนึ่งๆ จากกระบวนการแฮชทุกแบบที่ไคลเอนต์เลือกได้ ข้อมูลที่ได้จะสามารถประมาณการปริมาณการเข้าใช้เว็บโดเมนหนึ่งๆ ได้ดีพอสมควร โดยไม่สามารถนับได้อย่างแม่นยำได้เลย เพราะค่าแฮชจากไคลเอนต์สามารถชนกันได้เสมอ

ที่มา - Apple

Blognone Jobs Premium