web-dev-qa-db-fra.com

Comment extraire une image d'un fichier PDF

J'utilise actuellement le lecteur PDF de Foxit et j'ai récemment téléchargé une image d'Internet, mais elle se trouve dans un fichier PDF. Comment extraire cette image?

Le système d'exploitation est Windows 7.

48
studiohack

Si vous n’avez pas besoin de la résolution originale en pixels de l’image, il suffit d’appuyer sur les boutons ALT et Imprimer l’écran. Ensuite, choisissez coller où vous voulez l'image.

L'autre façon de préserver la résolution consiste à ouvrir le fichier PDF dans un programme de traitement d'images tel qu'Adobe Photoshop et à l'utiliser avec ce programme.

4
UserSuUserDo

Si vous téléchargez XPDF pour Windows ( ici ), vous trouverez quelques fichiers .exe à l'intérieur. Vous pouvez les exécuter sans "installation". Utilisez pdfimages.exe comme ceci:

pdfimages.exe -help

Cela affiche l'écran d'aide.

pdfimages.exe ^
    -j ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

Cela extrait tous les JPEG sous le préfixe-00N.jpg, et toutes les autres images sous le préfixe-00N.ppm (Portable PixMap).

[ Modifier par ComFreek:Veuillez noter la barre oblique finale dans le chemin de destination, ce qui est important si vous ne souhaitez pas extraire toutes les images dans son répertoire parent.] -
{ Edit de KurtPfeifle:Je ne suis pas d'accord avec le commentaire de ComFreek, mais laissez le soin aux lecteurs de tester et de découvrir les différences de résultats eux-mêmes. . Mon paramètre d'origine, n'utilisant pas de barre oblique finale, car ..\prefix préfixera l'image nomsutilisé pour les fichiers extraits.}

pdfimages.exe ^
    -j ^
    -f 11 ^
    -l 13 ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

Comme auparavant, mais l'extraction des images est limitée aux pages 11 ('f' = premier) à 13 ('l' = dernier).


Mettre à jour:

En attendant, je préfère la version de Poppler de pdfimages - d’autant plus qu’elle a acquis cette nouvelle fonctionnalité: ajoutez -list à la ligne de commande afin de simplement lister (pas extraire ) les images contenues dans le PDF, ainsi que certaines de leurs propriétés. Exemple:

 pdfimages -list -f 7 -l 8 ct-magazin-14-2012.pdf 
 
 page num type largeur hauteur couleur comp bpc enc interp ID d'objet 
 -------------------------------------------------- ------------------- 
 7 0 image 581 838 RGB 3 8 Jpeg n ° 39 0 
 7 1 image 4 4 ​​RGB 3 8 image no 40 0 ​​
 7 2 image 314 332 rgb 3 8 jpx no 44 0 
 7 3 image 358 430 rgb 3 8 jpx no 45 0 
 7 4 image 4 4 ​​rgb 3 8 image no 46 0 
 7 5 image 4 4 ​​rgb 3 8 image no 47 0 
 7 6 image 4 6 rgb 3 8 image n ° 48 0 
 7 7 image 596 462 rgb 3 8 jpx no 49 0 
 7 8 image 4 6 rgb 3 8 image n ° 50 0 
 7 9 image 4 4 ​​rgb 3 8 image non 51 0 
 7 10 image 8 10 rgb 3 8 image n ° 41 0 
 7 11 image 6 6 rgb 3 8 image n ° 42 0 
 7 12 image 113 27 rgb 3 8 jpx no 43 0 
 8 13 image 582 839 gris 1 8 jpeg no 2080 0 
 8 14 image 344 364 gris 1 8 jpx no 2079 0 

Remarque encore: cette version de pdfimages est celle de Poppler (celle de XPDF ne supporte pas(encore?) Cette nouvelle fonctionnalité), et la version doit être v0.20.2 ou plus récente.

70
Kurt Pfeifle

Vous pouvez essayer d'importer le PDF dans Inkscape et de travailler à partir de là. Inkscape n'ouvrira qu'une page à la fois, mais vous donnera un contrôle total sur le contenu de la page. Vous pourrez extraire et manipuler des graphiques vectoriels à partir du PDF assez facilement.

Cependant, si vous souhaitez extraire des images raster du PDF, je suis presque certain que pdfimages de XPDF est plus facile (mais vous pouvez toujours essayer d'utiliser Inkscape après avoir appris comment extraire des images incorporées à partir de fichiers SVG ).

7
Denilson Sá Maia

Sans installer de logiciel, vous pouvez passer à PDF-XChange Viewer (sélectionnez version portable ) qui a cette capacité déjà intégrée

  • exporte toutes les pages ou toutes les pages sélectionnées en image
  • format de sortie: PNG, JPG, TIFF, BMP
  • choisissez DPI, niveau de compression, échelle de gris
  • peut enregistrer plusieurs pages au format TIFF multipage

    enter image description here

    enter image description here
    cliquez pour agrandir


Veuillez noter que, même si cette méthode convertit les PDF pages entières en images, la méthode décrite à partir de @Laurenz à l'aide de Sumatra PDF est supérieure si vous voulez extraire des images d'une page PDF avec un contenu mixte (image + texte) pour obtenir uniquement l'image.

5
nixda

Sumatra PDF est un lecteur open source rapide et léger PDF pouvant copier des images directement dans le Presse-papiers, sans aucune re-pixellisation.

4
Laurenz

MuPDF est une nouvelle multiplatforme (créée en 2006) (ordinateur de bureau et mobile) PDF spectateur publié sous licence AGPL. Il est maintenu par les mêmes personnes que Ghostscript .

Il contient un outil de ligne de commande permettant d’extraire des images d’un fichier PDF:

mutool extract [options] file.pdf [object numbers]

La commande extraire peut être utilisée pour extraire des images et des fichiers de polices d’un fichier PDF. Si aucun numéro d'objet n'est donné sur la ligne de commande, toutes les images et les polices seront extraites.

-p password
       Use the specified password if the file is encrypted.

-r     Convert images to RGB when extracting them.
3
Denilson Sá Maia

utilisez pdftocairo à partir de poppler toolkit. Il peut extraire et convertir des images de pdf au format souhaité. Il génère toujours des images et ne génère jamais de ppm ou de craps comme celui-là. La commande suivante convertit les pages pdf en images jpg:

pdftocairo.exe -jpeg "my.pdf" "my"

Vous pouvez l'obtenir ici pour Windows: http://blog.alivate.com.au/poppler-windows/

Il est également disponible sur Linux.

2
MSS

http://www.sumnotes.net/ est un outil en ligne permettant d'extraire des notes, des points forts et des images. Je l'ai beaucoup utilisé à l'université pour ma thèse et j'étais vraiment satisfait.

1
Timothy