Hace unos días un cliente nos pidió poder sacar un texto de una imagen escaneada para poder luego modificarlo. Lo primero que hay que pensar es que, en principio, son dos formatos opuestos, ya que tanto la imagen como el PDF son formatos de “resultado final”, no pensados para retocar (en un principio) y menos texto.
Sin embargo, los OCR, han ido desarrollándose mucho (antes eran malísimos jejejeeje) y ya podemos hacerlo bastante bien. Os damos algunas alternativas de las muchas que hay.
FreeOCR es un software gratuito, fácil de instalar que permite obtener el texto tanto de una imagen en un escaner como de un fichero imagen (de varios tipos).
No tiene mucho más que explicar, la interfaz es muy intuitiva. Sirve para Windows de 2000 a 7 (casi todos en 32 y 64 bits) pero las imágenes deben estar en 200dpi o más.
Con Office One Note. Si tenemos una versión de Office que tenga este programa, podemos usar su OCR incorporado. Para ello tenemos que abrir One note, crear un nuevo documento, arrastrar la imagen y darle botón derecho y copiar texto de la imagen. Muy sencillo.
Con soluciones online. Hay muchos OCR en la web en los que sólo tienes que subir el documento y te devuelven el texto en un formato editable. Os dejamos uno que hemos probado pero usando Google podréis encontrar más.
Os recomendamos los siguientes productos relacionados con la informática:
GT Text tambíen es bastante bueno.
A mí me va bastante bien.
https://code.google.com/p/gttext/wiki/GTTextES
Gracias!