Un programa OCR (Reconocimiento Óptico de Caracteres) sirve para hacer editable un texto desde un fichero de imagen de puntos (bitmap). En este artículo podemos ver cómo se comportan algunos de estos programas, entre ellos tenemos al famoso Tesseract
meneame.net/story/google-hace-open-source-soft-ocr