Tabla de Contenidos

Stirling-PDF

Aplicación web desplegada con Docker para realizar operaciones con ficheros PDF.

Características

Instalación

Docker

Ejemplo de Docker Compose:

services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - '8003:8080'
    volumes:
      - ./trainingData:/usr/share/tessdata #Required for extra OCR languages
      - ./extraConfigs:/configs
#      - ./customFiles:/customFiles/
#      - ./logs:/logs/
    environment:
      - DOCKER_ENABLE_SECURITY=false
      - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
      - LANGS=es_ES
    restart: unless-stopped

Tras instalarlo, lo tendríamos disponible desde http://miservidor.ext:8003/

Configuración

OCR

Para instalar más idiomas, debemos descargarlos de:

Ejemplo instalando el paquete de español desde tessdata_fast:

# En la carpeta del host de Docker ''/home/usuario/docker/stirling-pdf/trainingData''
# descargamos el paquete de idioma Español:
wget https://github.com/tesseract-ocr/tessdata_fast/raw/main/spa.traineddata