web-dev-qa-db-fra.com

Utilisez PDF.js pour convertir statiquement un PDF en HTML

PDF.js est la dernière bibliothèque de Mozilla. Il s'agit d'un moteur de rendu basé sur des normes PDF qui est entièrement écrit en Javascript. Actuellement, vous ne pouvez pas accéder au code HTML généré et la bibliothèque ne peut être utilisée que comme visualiseur. Est-il possible d'utiliser PDF.js pour convertir de manière statique un PDF en son équivalent HTML? Compte tenu du rendu dans un navigateur, il doit s'agir de HTML + CSS, et le JS serait utilisé uniquement pour la navigation. 

Après l'avoir convertie en HTML, je prévois d'utiliser notre flux de travail HTML existant pour importer/indexer/consommer la page comme s'il s'agissait d'une page Web HTML ordinaire.

17
Robinicks

Remarque: ceci concerne la question initiale, ainsi que les autres personnes qui visitent cette page pour obtenir de l'aide, comme ce fut le cas avec moi. ;)

Réponse:
Vous pouvez essayer: Poppler ou pdf2htmlEX basé sur Poppler.

Je vous conseillerais de consulter la documentation pdf2htmlEX elle contient également un très bon tableau comparatif

15
Asad Malik

pdf.js rend à Canvas afin qu'il ne puisse pas être utilisé pour convertir statiquement un PDF en HTML

7
Ika

DocPub est alimenté par PDFNet , un SDK PDF avec prise en charge de C #, qui prend en charge la conversion de PDF en HTML hors connexion.

WebViewer de la même société est un visualiseur PDF basé sur HTML5 qui restitue les documents à la volée dans le navigateur.

WebViewer fonctionne avec toutes les principales plates-formes Web; le visualiseur peut être directement intégré et personnalisé dans n’importe quelle application HTML5, Silverlight ou Flash. Vous pouvez accéder instantanément au contenu à partir de n’importe quel système ou appareil, y compris iPad/iPhone (iOS), Android, Windows (ordinateurs de bureau et tablettes), WP8, Linux, Mac, etc. - démo

1
Robinicks