web-dev-qa-db-fra.com

Comment ouvrir PDF raw?

Je voulais voir l'intérieur d'un PDF pendant un certain temps, comme le code source brut de celui-ci pour que je puisse le regarder. Une façon de le faire?

25
user775171

Utilisez un éditeur hexadécimal . Bien sûr, à moins que vous ne connaissiez la spécification PDF (PDF, 8,6 Mo), vous ne reconnaîtrez pas grand-chose.

4
Oswald

Regarder le code brut des PDF ne vous sera pas très utile à moins d'avoir une idée de sa structure interne. Vous devriez vous procurer une copie du officiel PDF (télécharger le PDF) , et vous devriez avoir lu un article d'introduction tel comme ceci [disparu] ou this pour commencer.

Même après une telle préparation, vous ne découvrirez pas beaucoup d'utilité en regardant le code brut. Parce que les PDF contiennent généralement des parties qui sont "filtrées" (cela signifie: compressées).

Comment regarder la vraie PDF source derrière les parties binaires "brutes")

Jay Birkenbilt's ( qpdf est un outil de ligne de commande très utile (disponible pour Linux, Mac OSX et comme code source, sous l'open source Licence Artistique), qui peut décompresser la plupart des contenus filtrés et réorganiser la structure interne d'une manière qui vous donne beaucoup plus d'informations (tous les objets sont ordonnés numériquement, etc.). La ligne de commande pour y parvenir est:

 qpdf  --qdf  original.pdf  unpacked.pdf

PDFEdit est un autre outil utile et gratuit (sous licence GPL, mais AFAIK uniquement pour Linux) pour consulter les PDF. Celui-ci vient même avec une interface graphique (si vous préférez cela), tout en vous permettant toujours d'accéder à la structure interne et au "raw" PDF code.

46
Kurt Pfeifle

Il est très facile d'enquêter sur une source de fichier PDF en utilisant l'utilitaire CosEdit . La version gratuite permet de regarder les sources mais pas de les éditer).

2
zavolokas

En plus de la conversion de l'outil qpdf en postscript peut être utile. PDF est un sous-ensemble de PS. Habituellement, c'est assez facile à comprendre, par exemple où se trouvent les étiquettes d'un graphique. Vous pouvez utiliser pdf2ps ou invoquer ghostscript

gs -sDEVICE=pswrite some.pdf -sOutputFile=some.ps -dNOPAUSE -c quit

Lorsque vous générez vos PDF à l'aide de pdflatex, vous pouvez désactiver la compression avec une option. Cela rend le PDF plus lisible.

0
whoplisp