====== Stirling-PDF ======
Aplicación web desplegada con [[informatica:sistemas_operativos:virtualizacion:docker|Docker]] para realizar operaciones con ficheros PDF.
* [[https://github.com/Stirling-Tools/Stirling-PDF|Repositorio de código]]
{{ https://raw.githubusercontent.com/Stirling-Tools/Stirling-PDF/main/images/stirling-home.jpg |}}
===== Características =====
* Organizar (comprimir, unir, dividir, rotar, eliminar...)
* Convertir a PDF (imágenes, URL / página web, fichero HTML, markdown...)
* Convertir desde PDF (a imagen, Word, presentación, a TXT, a HTML...)
* Seguridad (firmar, añadir contraseña, eliminar contraseña, cambiar permisos, añadir marca de agua...)
* Ver y editar (ver PDF, ejecutar OCR, añadir números de página, extraer imágenes, eliminar páginas en blanco, cambiar metadatos, obtener información del PDF...)
* Avanzado (renombrar, reparar, ajustar color/contraste, dividir páginas...)
===== Instalación =====
==== Docker ====
Ejemplo de Docker Compose:
services:
stirling-pdf:
image: frooodle/s-pdf:latest
ports:
- '8003:8080'
volumes:
- ./trainingData:/usr/share/tessdata #Required for extra OCR languages
- ./extraConfigs:/configs
# - ./customFiles:/customFiles/
# - ./logs:/logs/
environment:
- DOCKER_ENABLE_SECURITY=false
- INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false
- LANGS=es_ES
restart: unless-stopped
Tras instalarlo, lo tendríamos disponible desde ''http://miservidor.ext:8003/''
===== Configuración =====
==== OCR ====
Para instalar más idiomas, debemos descargarlos de:
* https://github.com/tesseract-ocr/tessdata_fast: paquetes de idiomas más pequeños y menos precisos, pero tardan menos en cargar (es el que usa por defecto Stirling-PDF).
* https://github.com/tesseract-ocr/tessdata: paquetes de idiomas más grandes y precisos, pero tardan más en cargar.
Ejemplo instalando el paquete de español desde ''tessdata_fast'':
# En la carpeta del host de Docker ''/home/usuario/docker/stirling-pdf/trainingData''
# descargamos el paquete de idioma Español:
wget https://github.com/tesseract-ocr/tessdata_fast/raw/main/spa.traineddata