informatica:software:aplicaciones_web:stirling_pdf
¡Esta es una revisión vieja del documento!
Tabla de Contenidos
Stirling-PDF
Aplicación web desplegada con Docker para realizar operaciones con ficheros PDF.
Características
- Organizar (comprimir, unir, dividir, rotar, eliminar…)
- Convertir a PDF (imágenes, URL / página web, fichero HTML, markdown…)
- Convertir desde PDF (a imagen, Word, presentación, a TXT, a HTML…)
- Seguridad (firmar, añadir contraseña, eliminar contraseña, cambiar permisos, añadir marca de agua…)
- Ver y editar (ver PDF, ejecutar OCR, añadir números de página, extraer imágenes, eliminar páginas en blanco, cambiar metadatos, obtener información del PDF…)
- Avanzado (renombrar, reparar, ajustar color/contraste, dividir páginas…)
Instalación
Docker
Ejemplo de Docker Compose:
services: stirling-pdf: image: frooodle/s-pdf:latest ports: - '8003:8080' volumes: - ./trainingData:/usr/share/tessdata #Required for extra OCR languages - ./extraConfigs:/configs # - ./customFiles:/customFiles/ # - ./logs:/logs/ environment: - DOCKER_ENABLE_SECURITY=false - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false - LANGS=es_ES restart: unless-stopped
Tras instalarlo, lo tendríamos disponible desde http://miservidor.ext:8003/
Configuración
OCR
Para instalar más idiomas, debemos descargarlos de:
- https://github.com/tesseract-ocr/tessdata_fast: paquetes de idiomas más pequeños y menos precisos, pero tardan menos en cargar (es el que usa por defecto Stirling-PDF).
- https://github.com/tesseract-ocr/tessdata: paquetes de idiomas más grandes y precisos, pero tardan más en cargar.
Ejemplo instalando el paquete de español desde tessdata_fast:
# En la carpeta del host de Docker ''/home/usuario/docker/stirling-pdf/trainingData'' # descargamos el paquete de idioma Español: wget https://github.com/tesseract-ocr/tessdata_fast/raw/main/spa.traineddata
informatica/software/aplicaciones_web/stirling_pdf.1722864759.txt.gz · Última modificación: por tempwin

