Aplicación web desplegada con Docker para realizar operaciones con ficheros PDF.
Ejemplo de Docker Compose:
services: stirling-pdf: image: frooodle/s-pdf:latest ports: - '8003:8080' volumes: - ./trainingData:/usr/share/tessdata #Required for extra OCR languages - ./extraConfigs:/configs # - ./customFiles:/customFiles/ # - ./logs:/logs/ environment: - DOCKER_ENABLE_SECURITY=false - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false - LANGS=es_ES restart: unless-stopped
Tras instalarlo, lo tendríamos disponible desde http://miservidor.ext:8003/
Para instalar más idiomas, debemos descargarlos de:
Ejemplo instalando el paquete de español desde tessdata_fast:
# En la carpeta del host de Docker ''/home/usuario/docker/stirling-pdf/trainingData'' # descargamos el paquete de idioma Español: wget https://github.com/tesseract-ocr/tessdata_fast/raw/main/spa.traineddata