OCR

(EN) Análisis de los principales OCR para GNU/Linux

Un programa OCR (Reconocimiento Óptico de Caracteres) sirve para hacer editable un texto desde un fichero de imagen de puntos (bitmap). En este artículo podemos ver cómo se comportan algunos de estos programas, entre ellos tenemos al famoso Tesseract meneame.net/story/google-hace-open-source-soft-ocr

Google hace open source un soft OCR

Tesseract OCR, un soft de OCR desarrollado por los laboratorios de HP entre 1985 y 1995, ha sido retomado por Google que ha corregido algunos bugs importantes, y lo ha publicado en sourceforge bajo una licencia libre. No es apto para documentos demasiado complejos, y sólo funciona en inglés, pero en Google afirman que es el OCR open source más preciso existente en la actualidad. Como dato adicional, la entrada dice que en Google buscan buenos ingenieros OCR (para contratarlos).

Valid XHTML 1.0 Strict