web-dev-qa-db-fra.com

Comment exporter du texte de Google Doc en HTML?

J'ai un corps de texte dans un Google Doc contenant un grand nombre de liens. Je dois obtenir le texte - et tous les liens - dans le système de gestion de mon client.

Malheureusement, il semble que Google Docs n'autorise plus les utilisateurs à exporter du code HTML. J'ai essayé "Télécharger en tant que"> "Page Web (.html, zippée)" et en téléchargeant ce fichier dans Text Wrangler pour le nettoyer, mais les liens sont tous brouillés - par exemple, quelque chose que Twitter.com/sree devient:

<a href="https://www.google.com/url?q=https://Twitter.com/sree&amp;sa=D&amp;ust=1465095908840000&amp;usg=AFQjCNHpFpNdY6Hsr5xrZZlF5vCGTGIt6w">Sree Sreenivasan</a>

Plutôt que d'entrer et de refaire tous les liens manuellement, existe-t-il un moyen d'obtenir le code html dont j'ai besoin de Google Doc?

2
Abigail Edge

Vous pouvez utiliser une expression régulière comme celle-ci dans Text Wrangler:

<a href="https://www.google.com/url\?q=(.*)\&amp;sa(.*)">(.*)</a>

et remplacer par:

<a href="$1">$3</a>
2
Mantisse

Si vous souhaitez convertir des liens dans Google Documents en HTML, donnez un essai au module complémentaire Gd2md-html (divulgation complète: j'ai développé cela): https://github.com/evbacher/Gd2md-html/wiki

Vous pouvez sélectionner une section de texte dans un document Google qui comprend des liens et la convertir en HTML. Par exemple cette section d'un document Google:

enter image description here

convertit en ce HTML relativement propre:

<h2>Markdown syntax, standards information</h2>
<ul>
<li>Basic Markdown syntax from John Gruber, the inventor of Markdown: 
<a href="https://daringfireball.net/projects/markdown/syntax">https://daringfireball.net/projects/markdown/syntax</a>
<li>CommonMark standard: <a href="http://commonmark.org/">http://commonmark.org/</a>
1
evb