web-dev-qa-db-fra.com

Pandoc convertit docx en démarque avec des images incorporées

Lors de la conversion du fichier .docx en markdown, l'image incorporée n'est pas extraite de l'archive docx, mais le résultat contient ![](media/image1.png){width="6.291666666666667in" height="3.1083333333333334in"}

Faut-il définir un paramètre pour extraire les images incorporées?

17
JC-
pandoc --extract-media ./myMediaFolder input.docx -o output.md

De la manuel :

--extract-media=DIR Extrayez les images et autres supports contenus dans un conteneur docx ou epub dans le chemin d'accès DIR, en le créant si nécessaire, puis ajustez les références aux images du document afin qu'elles pointent vers les fichiers extraits. Cette option n'affecte que les lecteurs docx et epub.

41
mb21

En vous référant au commentaire de gridtrak et au problème d'une structure de répertoire inutilement profonde (exemple: media/media/image2.jpeg), utilisez le répertoire actuel comme chemin DIR, puis un dossier media est créé dans le répertoire actuel (par exemple, media/image2.jpeg):

pandoc --extract-media=. input.docx -o output.md
2
sgrubsmyon