====== Stirling-PDF ====== Aplicación web desplegada con [[informatica:sistemas_operativos:virtualizacion:docker|Docker]] para realizar operaciones con ficheros PDF. * [[https://github.com/Stirling-Tools/Stirling-PDF|Repositorio de código]] {{ https://raw.githubusercontent.com/Stirling-Tools/Stirling-PDF/main/images/stirling-home.jpg |}} ===== Características ===== * Organizar (comprimir, unir, dividir, rotar, eliminar...) * Convertir a PDF (imágenes, URL / página web, fichero HTML, markdown...) * Convertir desde PDF (a imagen, Word, presentación, a TXT, a HTML...) * Seguridad (firmar, añadir contraseña, eliminar contraseña, cambiar permisos, añadir marca de agua...) * Ver y editar (ver PDF, ejecutar OCR, añadir números de página, extraer imágenes, eliminar páginas en blanco, cambiar metadatos, obtener información del PDF...) * Avanzado (renombrar, reparar, ajustar color/contraste, dividir páginas...) ===== Instalación ===== ==== Docker ==== Ejemplo de Docker Compose: services: stirling-pdf: image: frooodle/s-pdf:latest ports: - '8003:8080' volumes: - ./trainingData:/usr/share/tessdata #Required for extra OCR languages - ./extraConfigs:/configs # - ./customFiles:/customFiles/ # - ./logs:/logs/ environment: - DOCKER_ENABLE_SECURITY=false - INSTALL_BOOK_AND_ADVANCED_HTML_OPS=false - LANGS=es_ES restart: unless-stopped Tras instalarlo, lo tendríamos disponible desde ''http://miservidor.ext:8003/'' ===== Configuración ===== ==== OCR ==== Para instalar más idiomas, debemos descargarlos de: * https://github.com/tesseract-ocr/tessdata_fast: paquetes de idiomas más pequeños y menos precisos, pero tardan menos en cargar (es el que usa por defecto Stirling-PDF). * https://github.com/tesseract-ocr/tessdata: paquetes de idiomas más grandes y precisos, pero tardan más en cargar. Ejemplo instalando el paquete de español desde ''tessdata_fast'': # En la carpeta del host de Docker ''/home/usuario/docker/stirling-pdf/trainingData'' # descargamos el paquete de idioma Español: wget https://github.com/tesseract-ocr/tessdata_fast/raw/main/spa.traineddata