Herramientas de usuario

Herramientas del sitio


informatica:software:aplicaciones_web:stirling_pdf

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
informatica:software:aplicaciones_web:stirling_pdf [2024/08/05 15:18] – [Instalación] tempwininformatica:software:aplicaciones_web:stirling_pdf [2024/08/05 15:32] (actual) – [OCR] tempwin
Línea 1: Línea 1:
 ====== Stirling-PDF ====== ====== Stirling-PDF ======
  
-Aplicación web para realizar operaciones con ficheros PDF.+Aplicación web desplegada con [[informatica:sistemas_operativos:virtualizacion:docker|Docker]] para realizar operaciones con ficheros PDF.
  
   * [[https://github.com/Stirling-Tools/Stirling-PDF|Repositorio de código]]   * [[https://github.com/Stirling-Tools/Stirling-PDF|Repositorio de código]]
Línea 40: Línea 40:
  
 Tras instalarlo, lo tendríamos disponible desde ''http://miservidor.ext:8003/'' Tras instalarlo, lo tendríamos disponible desde ''http://miservidor.ext:8003/''
 +
 +===== Configuración =====
 +
 +==== OCR ====
 +
 +Para instalar más idiomas, debemos descargarlos de:
 +
 +  * https://github.com/tesseract-ocr/tessdata_fast: paquetes de idiomas más pequeños y menos precisos, pero tardan menos en cargar (es el que usa por defecto Stirling-PDF).
 +  * https://github.com/tesseract-ocr/tessdata: paquetes de idiomas más grandes y precisos, pero tardan más en cargar.
 +
 +Ejemplo instalando el paquete de español desde ''tessdata_fast'':
 +
 +<code bash>
 +# En la carpeta del host de Docker ''/home/usuario/docker/stirling-pdf/trainingData''
 +# descargamos el paquete de idioma Español:
 +wget https://github.com/tesseract-ocr/tessdata_fast/raw/main/spa.traineddata
 +</code>
informatica/software/aplicaciones_web/stirling_pdf.1722863895.txt.gz · Última modificación: por tempwin