Herramientas de usuario

Herramientas del sitio


informatica:ocr

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
informatica:ocr [2020/12/06 10:16] – [OCR] tempwininformatica:ocr [2025/04/18 14:10] (actual) – [Docker] tempwin
Línea 5: Línea 5:
  
 Tesseract es el motor OCR libre más potente, el que mejores resultados da. Tesseract es el motor OCR libre más potente, el que mejores resultados da.
 +
 +  * [[https://github.com/tesseract-ocr/tesseract|Respositorio oficial]]
 +  * [[https://tesseract-ocr.github.io/|Documentación oficial]]
  
 Funciona en línea de comandos: Funciona en línea de comandos:
Línea 12: Línea 15:
 </code> </code>
  
-Frontends para tesseract: 
  
-  * gImageReader+==== Mejorando resultados ==== 
 + 
 +Para que el reconocimiento sea más acertado es importante que la imagen que va a procesar Tesseract sea lo más clara posible en términos de contraste, resolución, etc. 
 + 
 +El script [[http://www.fmwconcepts.com/imagemagick/textcleaner/index.php|Textcleaner]] basado en [[https://imagemagick.org/index.php|ImageMagick]] realiza varias de estas operaciones de forma automática. 
 + 
 +  https://tesseract-ocr.github.io/tessdoc/ImproveQuality.html 
 + 
 +  * https://tesseract-ocr.github.io/ 
 + 
 +==== Docker ==== 
 + 
 +https://hub.docker.com/r/jitesoft/tesseract-ocr 
 + 
 +==== Frontends para Tesseract ==== 
 + 
 +Aplicaciones para usar Tesseract con interfaz gráfica. 
 + 
 +  * [[https://github.com/manisandro/gImageReader|gImageReader]] 
 + 
 +===== Recursos =====
  
 +  * [[https://tech.trivago.com/2015/10/06/python_receipt_parser/|Writing a Fuzzy Receipt Parser in Python]] ([[https://github.com/ReceiptManager/receipt-parser|Repositorio]])
informatica/ocr.1607246169.txt.gz · Última modificación: por tempwin