กูเกิลเริ่มทำ OCR กับไฟล์ PDF

by lew
31 October 2008 - 03:13

กูเกิลประกาศเริ่มแปลงข้อมูลภาพในไฟล์ PDF ทั้งหมดให้เป็นตัวอักษรเพื่อให้สามารถค้นหาได้ โดยใช้เทคโนโลยี Optical Character Recognition (OCR) แบบเดียวกับที่กูเกิลเคยใช้ใน Google Book Search มาก่อนหน้านี้แล้ว

ความพยายามของกูเกิลในช่วงๆ หลังๆ มานี้คงเป็นเรื่องของความพยายามในการค้นหาข้อมูลที่แต่ก่อนเคยค้นกันไม่ได้เช่นหน้าเว็บที่ต้องคลิกฟอร์มก่อน หรือจะเป็นไฟล์ PDF ที่เก็บเอกสารเป็นภาพแทนที่จะเป็นข้อความ

อนาคตคงไม่แปลกอะไรหากเราจะได้เห็นรูปแบบการค้นหาแบบใหม่ๆ เช่นการค้นหาคำพูดจากไฟล์ mp3 หรือวีดีโอใน Youtube ก็เป็นได้

ที่มา - Google Blog

Blognone Jobs Premium