web-dev-qa-db-fra.com

Extraire les images incorporées d’un PDF

Avant de commencer à utiliser Ubuntu, j'utilisais Nitro PDF reader pour extraire automatiquement les images des fichiers PDF. Existe-t-il un lecteur PDF pour Linux qui le fasse?

J'aimerais pouvoir extraire des images plus rapidement/plus facilement que lors d'une prise de vue instantanée.

157
1kb

Utilisez pdfimages

pdfimages est un outil d'extraction d'images PDF qui enregistre les images dans un fichier PDF au format de fichier PPM, PBM, JPEG ou JPEG 2000.

Cela fait partie du paquetage poppler-utils, que vous devrez installer.

Utilisation: pdfimages [options] <PDF-file> <image-root>

Exemple: Ce qui suit extrait toutes les images d'un fichier PDF, en les enregistrant au format JPEG.

pdfimages -j in.pdf /tmp/out

Sauvegardera les images du PDF fichier in.pdf dans les fichiers /tmp/out-000.jpg (ou /tmp/out-000.pbm; voir ci-dessous), /tmp/out-001.jpg, etc.


Pdfimages page de manuel explique:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.
190
pl1nk

J'utilise souvent Inkscape pour cela. Chargez la page et supprimez tous les autres éléments. L'avantage est que vous pouvez obtenir des images vectorielles au format SVG et les modifier à votre guise.

22
Gremlin

J'ai un fichier PDF à double colonne avec des images incorporées créées avec LaTeX, où les images d'origine ont été fournies au format EPS. J'ai essayé la solution proposée basée sur pdfimages, mais malheureusement, elle n'a renvoyé aucune image. J'ai alors essayé d'utiliser Inkscape, mais les images SVG générées étaient déformées et je n'ai pas eu la chance de les exporter au format EPS.

Le logiciel qui a fonctionné pour nous était le MasterPdfEditor .

Voici la procédure

  • Ouvrez votre fichier avec Master PDF Editor
  • Utilisez l'outil d'édition (Alt + 1) pour sélectionner l'image à extraire.
  • Copier la figure (Ctrl + C)
  • Cliquez sur le cadre en pointillé autour de l'image, vérifiez la barre latérale droite (Inspecteur d'objets) et cliquez sur "Geomerty". Là vous pouvez voir la taille de votre sélection
  • Créez un nouveau fichier (Ctrl + N). Vous serez invité à indiquer la taille de la page. Fournissez la taille exacte de votre image et créez le nouveau fichier
  • Maintenant c'est un peu délicat: collez l'image (Ctrl + V). L'image peut ne pas apparaître dans le nouveau fichier. Utilisez les flèches pour le déplacer jusqu'à ce que vous puissiez le tracer.
  • Utilisez les flèches pour centrer l'image dans la nouvelle page
  • Enregistrer en PDF

Le résultat est de très haute qualité, mais le logiciel n’est pas gratuit. Il existe une version de démonstration qui "vous permet d'essayer toutes les fonctionnalités", mais vient avec "l'ajout d'un filigrane sur le fichier de sortie". Pour être franc, je n'ai pas remarqué de filigrane dans le fichier PDF produit.

5
Pantelis Sopasakis

Vous pouvez également essayer pdfmod. C'est une interface graphique qui permet d'extraire des images et d'effectuer d'autres manipulations de base en pdf.

4
To Do

Si vous avez besoin d’une image recadrée au format pdf/eps, extrayez une page avec l’image en utilisant pdfmod (comme suggéré par Tâches).

Ensuite, en utilisant pdfcrop, vous pouvez le rogner correctement en définissant les marges par essais et erreurs:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf
2
macieksk

Si vous souhaitez recadrer une image à partir d'un pdf avec un pdfviewer, vous pouvez essayer okular. Il peut rogner n'importe quoi (textes ou images) au format png ou jpeg. Si vous souhaitez extraire des images au format png à partir d'un fichier PDF, vous pouvez le faire avec une commande minimale avec pdftohtml. Il convertit le pdf en html plus des images. Ici vous pouvez trouver un exemple - https://www.youtube.com/watch?v=CG1rf7k3xo8 . Si vous souhaitez extraire de nombreuses images d'un fichier PDF, je vous suggère d'essayer.

1
user203413

J'utilise pdfimages, un outil de ligne de commande qui fonctionne très bien pour moi. Il est très facile à utiliser et vous pouvez utiliser l'option --help pour en savoir plus sur son utilisation. J'utilise Ubuntu et il est pré-installé. Si vos fichiers pdf sont cryptés ou protégés par un mot de passe, il existe des options pour cela, donc cet outil fonctionne très bien. Vous pouvez lire plus sur pdfimages ici

1
jetbird13

Avec pdfimages, l'image extraite peut être en deux parties ou plus. Un moyen simple de les réassembler sans vous soucier des formats extraits consiste à importer les pièces dans LibreOffice Draw, à les rogner à l'aide du dialogue de rognage d'image, à les positionner, à ajuster la taille de la page et à l'exportation dans le format de votre choix.

1
DafyddG

Logiciels utilisés: OS Xreader: Antergos

Pas:

  1. Ouvrir le PDF
  2. Clic droit sur l'image
  3. Sélectionnez Enregistrer l'image sous ..
  4. Nom du fichier d'entrée et extension.
  5. Sauvegarder.
0