web-dev-qa-db-fra.com

Convertir des documents Microsoft Word (.doc / x) en fichiers HTML

Est-ce que quelqu'un connaît une bonne application pour le faire rapidement et efficacement?

J'ai acheté Word Cleaner mais les résultats sont simplement suffisants et j'ai besoin de passer en revue tous les fichiers HTML générés pour nettoyer des tonnes de tags injectés inutiles comme

<strong>H</strong><strong>ell</strong><strong>o </strong><em>Wor</em><em>ld</em>

La plupart des articles affichés sur un site Web que je gère sont basés sur des documents écrits sur MS Word par des personnes qui n’ont aucune idée des marges des listes, des notes ordonnées/non ordonnées, des notes de bas de page/fin, etc.

Quelqu'un a-t-il un conseil pour m'aider à gérer ces pages plus efficacement que pour les corriger et les appliquer à mon style CSS?

NB: Pour mémoire, l'utilisation de "Enregistrer au format HTML DOC" dans Word est pire que le nettoyeur de Word

7
danie7LT

Voici ce que mon équipe et moi-même au travail utilisons pour convertir du contenu MS Word en HTML:

http://Word2cleanhtml.com/

Nous vérifions toutes les cases, collons le code, puis convertissons.

J'espère que ça aide.

4
KruegerDesigns

Je pense que la meilleure solution serait d'utiliser un éditeur WYSIWYG. TinyMCE, par exemple, est un bon - bien que je suppose que vous pourriez avoir besoin d'un autonome. L'utilisation serait semblable à n'importe quel programme semblable à Word, mais le résultat serait du code HTML simple. Aussi, avez-vous essayé d'autres programmes similaires à Word, comme OpenOffice ou LibreOffice? Le code HTML n'est pas génial, car il a beaucoup de style en ligne, mais d'après un test rapide, il semble ne pas avoir le problème de beaucoup de balises inutiles.

3
milo5b