Herramientas de usuario

Herramientas del sitio


informatica:software:aplicaciones_web:stirling_pdf

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
informatica:software:aplicaciones_web:stirling_pdf [2024/08/05 15:12] tempwininformatica:software:aplicaciones_web:stirling_pdf [2024/08/05 15:32] (actual) – [OCR] tempwin
Línea 1: Línea 1:
 ====== Stirling-PDF ====== ====== Stirling-PDF ======
  
-Aplicación web para realizar operaciones con ficheros PDF.+Aplicación web desplegada con [[informatica:sistemas_operativos:virtualizacion:docker|Docker]] para realizar operaciones con ficheros PDF.
  
   * [[https://github.com/Stirling-Tools/Stirling-PDF|Repositorio de código]]   * [[https://github.com/Stirling-Tools/Stirling-PDF|Repositorio de código]]
Línea 16: Línea 16:
   * Avanzado (renombrar, reparar, ajustar color/contraste, dividir páginas...)   * Avanzado (renombrar, reparar, ajustar color/contraste, dividir páginas...)
 ===== Instalación ===== ===== Instalación =====
 +
 +==== Docker ====
 +
 +Ejemplo de Docker Compose:
 +
 +<code yaml>
 +services:
 +  stirling-pdf:
 +    image: frooodle/s-pdf:latest
 +    ports:
 +      - '8003:8080'
 +    volumes:
 +      - ./trainingData:/usr/share/tessdata #Required for extra OCR languages
 +      - ./extraConfigs:/configs
 +#      - ./customFiles:/customFiles/
 +#      - ./logs:/logs/
 +    environment:
 +      - DOCKER_ENABLE_SECURITY=false
 +      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
 +      - LANGS=es_ES
 +    restart: unless-stopped
 +</code>
 +
 +Tras instalarlo, lo tendríamos disponible desde ''http://miservidor.ext:8003/''
 +
 +===== Configuración =====
 +
 +==== OCR ====
 +
 +Para instalar más idiomas, debemos descargarlos de:
 +
 +  * https://github.com/tesseract-ocr/tessdata_fast: paquetes de idiomas más pequeños y menos precisos, pero tardan menos en cargar (es el que usa por defecto Stirling-PDF).
 +  * https://github.com/tesseract-ocr/tessdata: paquetes de idiomas más grandes y precisos, pero tardan más en cargar.
 +
 +Ejemplo instalando el paquete de español desde ''tessdata_fast'':
 +
 +<code bash>
 +# En la carpeta del host de Docker ''/home/usuario/docker/stirling-pdf/trainingData''
 +# descargamos el paquete de idioma Español:
 +wget https://github.com/tesseract-ocr/tessdata_fast/raw/main/spa.traineddata
 +</code>
informatica/software/aplicaciones_web/stirling_pdf.1722863545.txt.gz · Última modificación: por tempwin