ต่อจาก กูเกิลปรับอัลกอริทึมใหม่ ลดอันดับ content farm ทางเว็บไซต์ Wired.com มีโอกาสคุยกับวิศวกรด้านการค้นหาของกูเกิลสองคนคือ Amit Singhal และ Matt Cutts ทำให้เราได้ข้อมูลเบื้องลึกของการปรับอัลกอริทึมครั้งนี้
Amit Singhal อธิบายว่าการปรับระบบดัชนีเว็บตัวใหม่ Caffeine เมื่อกลางปี 2010 ทำให้กูเกิลทำดัชนีเว็บได้เร็วและเยอะขึ้นมาก และได้เว็บพวก content farm ที่เนื้อหาคุณภาพต่ำเยอะตามมาด้วย
ส่วนมาตรการการจัดการกับ content farm กูเกิลพยายามสร้างอัลกอริทึมที่เป็นอัตโนมัติและเป็นวิทยาศาสตร์ แทนการใช้คนเข้าแทรกแซง ขั้นตอนสร้างอัลกอริทึมของกูเกิลคือให้ผู้ใช้ตอบแบบสอบถามจำนวนมาก เต็มไปด้วยคำถามหลายรูปแบบ เช่น คิดว่าเว็บนี้มีโฆษณาเยอะเกินไปหรือไม่, เว็บนี้เป็นของแท้หรือลอกเนื้อหาจากที่อื่นมา ฯลฯ แล้วจึงสร้างกฎทางคณิตศาสตร์ที่ใช้แยกแยะเว็บไซต์เหล่านี้
กูเกิลทดสอบอัลกอริทึมนี้เป็นการภายใน โดยมีรายการของเว็บไซต์ที่ "รู้สึกแน่" ว่าเป็น content farm และไม่เป็น content farm (เช่น Wikipedia หรือ The New York Times) มาทดสอบ นอกจากนี้ยังทดสอบกับคนนอกผ่าน Chrome Extension โดยรายการเว็บจากอัลกอริทึมของกูเกิลเอง ตรงกับการแจ้งของคนนอก 84% ซึ่งทำให้กูเกิลมั่นใจว่าอัลกอริทึมของตัวเองใช้งานได้
อัลกอริทึมต่อต้าน content farm รอบนี้มีรหัสเรียกกันภายในว่า "Panda" ตามชื่อของวิศวกรคนหนึ่งในทีมค้นหา
Wired.com ยังถามประเด็นว่าอัลกอริทึมสำหรับผลการค้นหาของกูเกิล ควรเปิดเผยต่อสาธารณะเพื่อความโปร่งใสหรือไม่ เพราะกูเกิลก็โดนโจมตีว่ารับเงินค่าโฆษณาจากเว็บต่างๆ และอาจทำให้เว็บที่จ่ายค่าโฆษณามีอันดับสูง
กูเกิลยืนยันว่าเงินไม่มีผลต่ออันดับการค้นหา แต่ก็ไม่มีหลักฐานมาพิสูจน์เช่นกัน ส่วนประเด็นเรื่องการเปิดอัลกอริทึม กูเกิลอธิบายว่าในอัลกอริทึมมีปัจจัย (signal) บางอย่างที่เปิดเผยออกไปแล้ว จะมีคนใช้ประโยชน์และโกงอันดับในผลการค้นหาได้ และถ้าในอนาคตเกิดมีอัลกอริทึมที่เปิดเผยออกไป แต่ป้องกันการโกงอันดับได้ กูเกิลก็ยินดีเปิดเผย
Wired.com ถามประเด็น ห้าง JCPenny ทำ Blackhat SEO ว่าทำไมกูเกิลจัดการปัญหาช้า
คำตอบของกูเกิลคือดัชนีเว็บมีขนาดใหญ่มาก ดูแลได้ไม่ทั่วถึง และกูเกิลไม่กล้าลงโทษแรงเพราะเคยโดนเว็บไซต์ในยุโรปไปฟ้องคณะกรรมการของ EU ว่ากูเกิลกีดกันการแข่งขัน เลยถูกโจมตีจากทั้งสองฝั่ง คือฝั่งที่บอกว่ากูเกิลลงโทษแรงเกินไป และฝั่งที่บอกว่ากูเกิลไม่ยอมทำอะไรเลย
ที่มา - Wired