Cómo convertir ficheros pdf a imagen en Linux con pdftoppm

Volvemos a la carga en este nuevo año 2021, hablando de cómo convertir ficheros pdf a imagen, en sistemas GNU/Linux, utilizando la herramienta pdftoppm

Esta herramienta convierte páginas de documentos PDF a formatos de imagen como JPG, PNG u otros. Es una herramienta de línea de comandos, que permite convertir un documento PDF completo a archivos de imagen separados. Con pdftoppm, podemos especificar la resolución de imagen preferida, escalar y recortar sus imágenes.

Convertir ficheros pdf a imagenes con pdftoppm

Para utilizar la herramienta de línea de comandos pdftoppm, primero debemos instalarla. Esta es parte del conjunto de herramientas poppler. Debemos instalar este paquete de la siguiente manera dependiendo de su distribución:

#En sistemas Debian, Ubuntu, Linux Mint y similares
sudo apt install poppler-utils 
#En sistemas RHEL, Centos o Fedora
sudo dnf install poppler-utils 
#En SUSE y OpenSuse
sudo zypper install poppler-tools 
#En Arch y similares
sudo pacman -S poppler

Una vez realizado este paso ya podemos empezar a utilizarla.

Convertir documentos PDF a imagen

La sintaxis de uso es la siguiente:

pdftoppm -(formato_imagen) (fichero_pdf) (nombre_imagen)

En el siguiente ejemplo, el nombre del documento es Fichero_Ejemplo.pdf y lo convertiremos a formato JPG y nombraremos las imágenes como Imagenes_ejemplo.

pdftoppm -jpg Fichero_Ejemplo.pdf Imagenes_ejemplo

Al lanzarlo cada página se convertira en una imagen en formato JPG.

Convertir rango de páginas PDF en imágenes.

La sintaxis para especificar el rango es la siguiente:

pdftoppm -(formato_imagen) -f N -l N (nombre_pdf) (nombre_imagen)

Donde N especifica el número de la primera página para convertir y -l N para la última página para convertir.

En el siguiente ejemplo, convertimos las páginas 5 a 10 de Fichero_Ejemplo.pdf a JPG.

pdftoppm -jpg -f 5 -l 10 Fichero_ejemplo.pdf Imagenes_ejemplo

Ajustar la calidad de la conversión

Pdftoppm convierte páginas PDF en imágenes con un DPI de 150 por defecto. Para ajustar, debemos utilizar el número «rx» que especifica la resolución X, y «-ry» el número que especifica la resolución Y, en DPI.

Veamos un ejemplo:

pdftoppm -jpg -rx 300 -ry 300 Fichero_ejemplo.pdf Imagenes_ejemplo

De esta manera indicamos que la imagen será de 300×300 y en formato JPG

Esta entrada está basada en una publicada originalmente en el portal anglosajón Tecmint

How to Convert PDF to Image in Linux Command Line

Fuentes consultadas

Página de man de pdftoppdm