web-dev-qa-db-fra.com

Pourquoi les PDF générés à partir de MS Word sont-ils si volumineux?

J'ai créé un simple document MS Word contenant uniquement cette phrase:

Ceci est un petit document.

Rien d'autre. Ensuite, j'ai enregistré ce document au format DOCX et PDF. Voici les tailles de fichiers:

DOCX: 12 ko
PDF: 89 kB

Cette différence est énorme, techniquement, et cela commence vraiment à me gêner lorsque la plupart des documents textuels représentant des dizaines de kB dans DOCX commencent à générer des PDF qui sont des centaines de kB de grande taille. En quoi le format PDF est-il si inefficace? Ou est-ce que Word utilise un algorithme de sortie terrible?

BTW, les PDF paramètres de sortie ont été définis pour créer le plus petit fichier possible:

PDF output options

70
Borek Bernard

Si vous ouvrez le PDF dans le bloc-notes ++, vous trouverez:

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

et cet objet est référencé ici à la fin dans l'instruction/FontFile2:

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Les polices utilisées par le document Word sont intégrées au PDF, de sorte que le fichier PDF est autonome.

J'ai utilisé cette diapositive pour déchiffrer les instructions PDF.

Si vous souhaitez empêcher les polices d'être incorporées dans le fichier PDF, assurez-vous que votre document Word utilise l'une des 14 polices de caractères standard disponibles dans les visualiseurs PDF (source Wikipedia )

  • Times New Roman> Times (v3) (en italique normal, gras et italique gras)
  • Courrier New> Courier (en oblique régulière, oblique et audacieuse)
  • Arial> Helvetica (v3) (en oblique régulière, audacieuse et oblique audacieuse)
  • Symbole> Symbole
  • Wingdings> Zapf Dingbats
103
rene

Cela m'est souvent arrivé dans Microsoft Word lorsque j'essayais d'exporter un manuscrit simple au format PDF. Un document Word de 5 à 8 pages, d’une taille d’environ 50 Ko, constitue un fichier de plus de 10 Mo PDF, beaucoup trop volumineux pour recevoir un courrier électronique raisonnable.

La réponse de René est sur la bonne voie - le problème est que les polices sont incorporées dans le document - mais l'utilisation de l'une des polices de caractères standard ne résoudra pas nécessairement le problème.

Tous mes documents étaient au format Times New Roman et n’utilisaient rien de plus sophistiqué que le gras et l’italique. Ou alors j'ai pensé. Il se trouve que le crénage automatique est activé dans mon modèle par défaut (pour des raisons évidentes ). Lors de l'exportation au format PDF, Word intégrait chacune de ces ligatures en tant qu'objet de police distinct dans le document, le gonflant au-delà de toute croyance.

Le correctif est simple, vous devez juste vous rappeler de le faire à chaque fois:

  1. Sélectionnez tout le texte du document.
  2. Format → Police → Avancé
  3. Décocher "Crénage pour les polices"

Fait intéressant, vous pouvez laisser les ligatures, les alternatives contextuelles et d’autres fonctionnalités de typographie avancées activées; ils n'ont aucun effet perceptible sur la taille du fichier PDF résultant.

Ré-exportez le document au format PDF et ne disposez plus que d'une centaine de Ko. Malheureusement, le crénage est insuffisant, je ne recommanderais donc pas l'impression de cette façon, mais cela fonctionne bien pour l'envoi d'un document par courrier électronique.

2
Cody Gray