web-dev-qa-db-fra.com

Comment convertir par programme HTML en epub?

Puis-je effectuer cette conversion avec n'importe quel langage de programmation ou bibliothèque?

39
Juanjo Conti

La réponse courte est oui, cela peut être fait dans n'importe quel langage de programmation.

Étapes de base:

  1. Convertissez votre HTML en XHTML (+ CSS). Cela peut être fait dans votre programme ou via un fichier XSLT.
  2. Copiez vos fichiers (XHTML, CSS, toutes les images et polices) dans une structure de répertoires qui suit le format.
  3. Compressez la structure du répertoire et nommez l'archive avec une extension ".epub".

Quelques sites Web pour vous aider à démarrer:

Juin 2015 Remarque: Le validateur epubcheck est passé du code google à GitHub; notez la nouvelle URL.

55
eb1

Calibre prend en charge une grande variété de formats d'entrée, y compris HTML, et une grande variété de formats de sortie, y compris EPUB, mais ce n'est pas "un langage de programmation ou une bibliothèque". Y a-t-il des raisons spécifiques pour lesquelles vous désirez une approche basée sur la programmation plutôt qu'un outil autonome? Si tel est le cas, peut-être que Python et ebookmaker.py , par exemple, pourrait vous aider.

15
Alex Martelli

Une réponse tardive, mais j'ai trouvé que la valeur Python 3-based ebookmaker était utile, au moins après avoir envoyé une demande d'extraction pour supprimer une nomenclature UTF-8. Un problème avec cela semble être qu'il utilise expressions régulières fragiles pour analyser HTML , mais je suppose que je devrai le signaler là-bas.

3
Shlomi Fish

J'utilise la bibliothèque suivante d'Aspose - http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx

En seulement deux lignes de code, je suis capable de faire des conversions html en epub. Utilisant ceci actuellement dans un système de production.

Document doc = nouveau document (_sourceFilePath);

doc.Save (_destinationFilePath, SaveFormat.Epub);

1
Brian Singh

Je viens de commencer à implémenter un tel outil dans Java (compatible OpenJDK): html2epub . Afin de me débarrasser de l'édition manuelle du fichier de configuration, je vais probablement commencer un outil distinct pour générer le fichier de configuration à partir de n'importe quel répertoire donné (cependant, il serait toujours nécessaire de déterminer l'ordre des XHTML dans l'EPUB - pour une utilisation non programmatique, le développement d'un outil d'aide GUI pourrait être envisagé, pour une flexibilité totale Je n'ai pas encore trouvé d'idée.) Avant cela, j'ai implémenté des convertisseurs basés sur des scripts Shell pour une entrée XML personnalisée ( outils hag2epub ) - au cas où vous seriez intéressé, je le ferais probablement les porter sur l'entrée XHTML (avec un fichier de configuration pour les métadonnées EPUB ou obtenir des métadonnées à partir du plus haut index.html d'un répertoire, s'il existe).

1
skreutzer

Voici pdf to epub , je sais que ce n'est pas ce que vous recherchez, mais c'est un début.

Le package calibre peut avoir ce que vous voulez

1
cofiem

J'ai déjà rencontré le même problème, car je souhaite lire du contenu de page Web hors ligne sur mon iPad. Je n'en ai aucune idée et je ne suis pas un connaisseur en informatique. Il y a du calibre ou de la strophe blabla ....

Mais pour moi, ce ne sont que des convertisseurs de formats et j'ai besoin d'un créateur de livre ePub qui me permettra de combiner de nombreux documents souhaités à lire. Ensuite, j'ai trouvé un bookish convertisseur html en ePub , j'enregistre la page html du Web puis la convertis avec. C'est un très bon outil pour moi maintenant.

0
user81718