Google indexa PDF’s escaneados
Escrito por: MatÃas
![]()
SÃ, Google ya hace bastante ofrece en sus resultados de búsqueda PDF’s. Pero basaba los mismos en metadatos y no en el contenido del documento.
Ahora el buscador ha comenzado a utilizar la tecnologÃa de Reconocimiento óptico de carácteres (OCR) que reconoce las palabras presentes en imágenes y las convierte en texto. Entonces ahora a cualquier PDF podremos verlo tambien como HTML.
Queda ver que puede hacer con PDF’s escaneados de baja calidad o que provienen de textos antiguos o dañados. Por mis tareas universitarias siempre ando descargando archivos PDF y la verdad es que hay muchos que no creo que puedan ser reconocidos de la mejor manera. Si llega a poder reconocer todos se merecen aplausos de por vida. No me extrañarÃa viniendo de Google…
Fuente e imagen desde BaluART
Esto es un ejemplo de cómo con el tiempo las tendencias cambian. Según
Si estas impaciente a la inminente salida del SO para celulares de Google el G1, y vivis por estas tierras y/o ni soñas con alcanzar uno de esos smarthphone podes probar el Google Androide de forma online gracias a un emulador que nos puso la gente de T-mobile.
Ayer confirmaron desde 
