web-dev-qa-db-fra.com

Comment convertir un fichier .pdf dans un dossier d'images?

J'ai quelques fichiers .pdf que je voudrais convertir dans mon format de lecture préféré: .cbr ou .cbz ou, si cela n’est pas directement possible, j’ai besoin d’extraire toutes les pages du fichier .pdf sous forme d’images, puis de les compresser. mon format de choix. Je n'ai pu enregistrer des pages qu'une à la fois avec Document Viewer. Évidemment, je voudrais faire un peu plus vite. J'ai essayé pdfsam, pdf shuffler et pdfmod sans aucune chance. J'utilise Ubuntu 11.10.

15
Shawn

OK, j’ai fait quelques recherches supplémentaires et bien que la méthode de tohuwawohu fonctionne, j’ai trouvé qu’il était plus facile d’utiliser un programme appelé pdftoppm pour réaliser ce que je voulais faire. Étant donné que je suis un profane en matière d’utilisation d’applications en ligne de commande, je ferai de mon mieux pour expliquer comment j’ai obtenu ce résultat pour moi.

  1. Naviguez jusqu'au dossier contenant le fichier .pdf que vous souhaitez modifier et ouvrez un terminal à cet endroit. Je l'ai fait en utilisant la commande exemple:

    cd ~/Documents/PDF
    
  2. Supposons que le fichier que je veux modifier s'appelle Sample.pdf. Ce que je veux faire, c'est utiliser pdftoppm pour créer des fichiers image de chaque page du fichier .pdf. Plusieurs formats peuvent être choisis (voir le lien des pages de manuel ci-dessus) mais je préfère utiliser .png. La commande de base ressemble à ceci:

    pdftoppm -FORMAT FILENAME.pdf PREFIX
    

    ou dans l'exemple ci-dessus:

    pdftoppm -png Sample.pdf Sample
    

    Cette commande crée un fichier image de chaque page dans le même dossier que le fichier .pdf d'origine portant des noms tels que Sample-01.png, Sample-02.png, etc. Je l'ai essayé avec les extensions .png et .jpeg avec succès. .jpg n'est apparemment pas supporté.

  3. Ensuite, je viens d'utiliser Archive Manager en sélectionnant tous les fichiers image nouvellement créés, en cliquant avec le bouton droit de la souris et en choisissant "Compresser" dans le menu contextuel. Je choisis ensuite le format d'archive que je préfère (dans ce cas, .cbz ou Comic Book Zip) et crée la nouvelle archive.

  4. Maintenant, j'ai un nouveau fichier .cbz brillant appelé Sample.cbz que je peux ensuite visualiser avec mon lecteur Comix !

Espérons que ce que j'ai posté ci-dessus a suffisamment de sens pour que quelqu'un d'autre puisse en tirer des leçons. Si j'ai besoin de le changer de quelque manière que ce soit, veuillez me le faire savoir.

13
Shawn

J'ai écrit un script bash simple à cette fin, vous aurez besoin d'installer poppler, donc:

Sudo apt-get install poppler-utils #ubuntu
brew install poppler # mac

Voici le script bash (enregistrez-le sous convert_to_cbz.sh):

filename="${1%.*}"
echo "Converting $filename to cbz"
mkdir "./$filename"
pdftoppm -jpeg "$1" "./$filename/000"
Zip -r9 "${filename}.cbz" "./$filename" 
rm -rf "./$filename"

Pour utiliser le script bash:

chmod +x convert_to_cbz.sh
./convert_to_cbz.sh "Nintendo Official Magazine 066 (OldGameMags).pdf"

Espérons que cela sera utile pour quelqu'un!

4

Je ne connais pas très bien * .cbr/* .cbz, mais il semble que vous deviez combiner deux étapes:

  1. Convertir PDF en images
  2. Compressez-les dans une archive Zip/RAR.

Concernant l’étape 1, vous pouvez utiliser la commande convert de ImageMagick . Vous pouvez alimenter convert avec un fichier PDf comprenant plusieurs pages. convert renverra chaque page sous forme de fichier graphique unique. Je l'ai testé avec un texte numérisé à 400 dpi et la commande suivante a abouti à de simples fichiers JPGE agréables:

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpeg

(crédits concernant l'option -quality: cette entrée de forum )

En conséquence, vous obtenez 000.jpeg, 001.jpeg et ainsi de suite. Il suffit de les compresser dans un fichier .cbz et vous avez terminé.

Vous pouvez même combiner les deux étapes en les "concaténant":

$ convert -verbose -colorspace RGB -interlace none -density 400 -quality 100 yourPdfFile.pdf 00%d.jpg && Zip -vm comic.cbz *.jpg

(assurez-vous qu'il n'y a pas d'autres fichiers JPEG dans votre répertoire de travail actuel, car en utilisant le code ci-dessus, Zip déplacera tous les fichiers JPEG dans le fichier cbz )

4
tohuwawohu

Essayez d’utiliser calibre pour convertir directement le .pdf en .cbr ou .cbz.

3
bntser

Il semble que le moyen le plus simple consiste à utiliser Acrobat Pro.

  1. Ouvrez le fichier PDf dans Acrobat Pro.
  2. Une fois le fichier ouvert, accédez à FileExportImageJPEG, chaque page étant exportée sous forme d'un fichier JPG unique.
  3. Placez tous les fichiers JPG dans un dossier
  4. Zip le dossier.
  5. Modifiez manuellement l’extension située à la fin du fichier compressé de . Zip en . Cbz

Si vous préférez un fichier CBR, rarnez le dossier au lieu de le compresser, puis remplacez l'extension par . Rar par . Cbr.

1
Eric Vincent