web-dev-qa-db-fra.com

Générer des instantanés du contenu Ajax pour BingBot vs GoogleBot

Nous avons un site Web dont le contenu est généré dynamiquement via JavaScript. Aux fins de l'indexation des moteurs de recherche, nous fournissons également des instantanés des pages.

Voici quelques exemples:

Si vous affichez la source HTML de l'un de ces liens, vous remarquerez qu'il y a du contenu spécifié dans les balises noscript. Il s'agit d'un miroir du contenu dynamique généré par JavaScript que les utilisateurs verront. Il a été mis en place pour le traitement des robots d'exploration.

Désormais, GoogleBot a correctement traité le contenu noscript et l'affiche dans les résultats de recherche, mais BingBot n'indexe pas les pages.

Résultats Google

Résultats Bing

Je me suis assuré que le plan du site a été soumis et attendu environ quatre jours.

Comment pouvons-nous résoudre le problème? Idéalement, j'aimerais le faire à la manière noscript car c'est simple et élégant. Alternativement, je pourrais ajouter le contenu dans le balisage standard et utiliser CSS pour le masquer, mais je voudrais éviter de le faire si possible, car il s’agit là d’un travail supplémentaire inutile pour le navigateur.

Est-ce que certains ont un aperçu de ce problème? Plus précisément, existe-t-il des preuves que BingBot ne traitera pas le contenu dans les balises noscript?

2
Noel Abrahams

Dans mes cas, je conçois du contenu entièrement Ajaxified et trouve qu'il est difficile d'explorer correctement les robots. Alors je le redessine. Lorsque les pages sont ouvertes pour la première fois, le contenu visible est identique à celui créé à l'aide d'événements javascript. En bref, chaque élément de contenu a reçu sa propre URL et a répertorié toutes les URL d'un sitemap. Enfin, j'ai trouvé que la plupart des URL étaient explorées et indexées.

Vous pouvez voir mon site par exemple: learn.servloci.com

de plus, vous pouvez vérifier en utilisant le site: [URL donnée] comme cache.

1
Vikas Avnish

Je suis un peu surpris que les balises noscript fonctionnent pour Google. Google a publié une norme pour crawlable AJAX , dans laquelle votre page comporte une balise méta qui permet au robot d’extraire l’instantané de l’URL avec un paramètre supplémentaire.

Bing prend désormais également en charge cette norme , donc son implémentation permettra d’indexer votre contenu dans Google et Bing.

0
Stephen Ostermiller