Google Feedfetcher ดึงข้อมูลด้วยปริมาณมากผิดปกติ

by frameonthai
29 April 2012 - 17:35

เหตุการณ์ครั้งนี้ได้เกิดขึ้นกับนาย Panos Ipeirotis อาจารย์คณะวิทยาการคอมพิวเตอร์ มหาวิทยาลัยนิวยอร์คถูก Amazon Web Services เรียกเก็บค่าบริการเช่าโฮสต์ถึง 1,177.67 ดอลลาร์สหรัฐหรือประมาณ 37,000 บาท โดยมีการใช้งานข้อมูลขาออกจำนวน 8.8 TB ภายในเดือนเดียว

จากการตรวจข้อมูลพบว่า Google Feedfetcher ซึ่งเป็นโปรแกรมที่กูเกิลเรียกข้อมูล Atom Feed หรือ RSS เพื่อไปใช้กับ Google Reader และหน้าของกูเกิลเอง ได้ทำการเรียกข้อมูลเดิมซ้ำๆ ทำให้เกิดการใช้งานข้อมูลเกินความจำเป็น เนื่องจาก Feedfetcher ของกูเกิลได้ทำการค้นหาแล้วใช้ข้อมูลดังกล่าวโดยที่ไม่ได้เก็บไว้บนเซิร์ฟเวอร์ของกูเกิลเอง จนมีการเรียกใช้ข้อมูลถึงประมาณ 250GB ต่อชั่วโมง

หลังจากนั้นนาย Panos Ipeirotis ได้ทดลองโดยใช้ URL ภาพที่มีอยู่บน Amazon S3 storage ไปวางไว้บน Google Spreadsheets โดยทำให้ภาพโชว์บนตัว Spreadsheet หรือ Thumbnail และได้ส่งให้คนอื่นๆดู พบว่าได้มีการเรียกข้อมูลเดียวกันซ้ำไปซ้ำมาเป็นจำนวนมากเช่นกัน

ที่มา - Behind The Enemy Lines ผ่าน The Hacker News

Blognone Jobs Premium