web-dev-qa-db-fra.com

Meilleure approche pour que le contenu d'index de Google soit principalement généré par Javascript

Je développe une application où les clients peuvent insérer une balise Javascript sur leur site Web et générer du contenu. Quelle est la meilleure approche pour que Google indexe ce contenu et l'associe à l'URL du site.

Je sais que Google n'exécute pas JS, alors je pense à des angles différents. Je pourrais demander à Google d’indexer le contenu du site à partir duquel le contenu est compilé (et non sur le site du client), mais il sera évidemment indexé avec la mauvaise URL. Pourrais-je obtenir en quelque sorte que Google affiche une URL différente? Existe-t-il une autre approche permettant à Google d’indexer le contenu d’un autre site mais de l’associer à

Les contraintes sont:

  • Le site Web du client ne peut insérer qu'une seule section de code (idéalement une balise JS).
  • J'ai le plein contrôle du contenu original, bien que sur un site différent.
  • Le site Web du client ne peut effectuer aucun traitement côté serveur pour résoudre ce problème.

Dans l'idéal, les visiteurs Web verraient le contenu généré par JS lors de la consultation du site, mais les robots Google seraient alimentés par du contenu provenant d'une autre page Web (le même contenu, mais la source brute). Je ne sais tout simplement pas comment faire cela sans JS.

5
Sean Coleman

D'après ce que j'ai compris, vous transmettez du contenu de votre site à des sites clients et vous souhaitez que les sites clients obtiennent le représentant pour le contenu?

Google analyse maintenant certains scripts JavaScript, mais pas tous et pas systématiquement. Votre meilleur atout serait de suivre le lien fourni par @Shaz http://code.google.com/web/ajaxcrawling et de travailler avec vos clients pour la mettre en œuvre.

Malheureusement, cela impose certaines restrictions sur les structures d'URL de vos clients, mais je ne connais aucun autre moyen de le faire.

1
Dan Blows

Votre "balise" peut être une combinaison d'un élément A et d'un extrait de code javascript. La href de l'élément A pointe vers une page explorable avec votre contenu, destinée à être vue par les moteurs de recherche et ceux sans javascript. Pour les utilisateurs dotés de javascript, l'élément A est remplacé par le contenu dynamique (il peut analyser le href pour déterminer le contenu à servir, pour simplifier les choses pour ceux qui souhaitent l'insérer dans leur site). Les utilisateurs sans javascript (et donc les moteurs de recherche) verront un lien vers le contenu.

En outre, sur la page de contenu, vous pouvez utiliser javascript pour renvoyer les utilisateurs à la page dynamique. De cette façon, si quelqu'un arrive via un moteur de recherche, il se rendra à la page qui le relie au site.

Il est difficile de l'installer, de sorte qu'il ne soit pas compliqué pour les internautes de déposer votre contenu dynamique sur leur site, mais cela ne devrait pas être si difficile.

0
rob

À compter de 2015, Googlebot rend les pages, y compris l'exécution de JavaScript. Il indexe ensuite tout le contenu qu'il voit: statique et généré. Pour vous assurer que Googlebot voit le contenu généré par JavaScript:

  • Assurez-vous que vos fichiers CSS et JS ne sont pas bloqués par le fichier robots.txt
  • Utilisez la fonctionnalité "Fetch and Render" de Fetch as Google dans les outils pour les webmasters de Google.  Assurez-vous que Googlebot peut voir le contenu généré par JavaScript de vos pages.

Googlebot a tellement appris à voir le contenu généré par JavaScript que j'ai dû demander comment l'empêcher .

0