informatica:ocr
¡Esta es una revisión vieja del documento!
OCR
Reconocimiento óptico de caracteres (Optical Character Recognition). Es un proceso dirigido a la digitalización de textos, los cuales identifican automáticamente a partir de una imagen símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos.
Tesseract
Tesseract es el motor OCR libre más potente, el que mejores resultados da.
Funciona en línea de comandos:
tesseract imagen_escaneada.png texto
Frontends para tesseract:
- gImageReader
informatica/ocr.1607246351.txt.gz · Última modificación: por tempwin
