web-dev-qa-db-fra.com

Site Web créé à l'aide d'une application JS non indexée selon les spécifications AJAX Crawling de Google. Quel est le problème?

J'ai deux sites qui devraient être conformes à Google AJAX Spéc. D'analyse (https://developers.google.com/webmasters/ajax-crawling/docs/getting-started).

Un domaine (http://auroraliveaboard.com) était précédemment indexé et perd maintenant tous les résultats de la recherche. Un autre domaine (http://acs-germany.de) n'a jamais été indexé et, après s'être conformé aux spécifications pendant un mois et demi, rien n'a changé et aucun résultat n'apparaît.

Mon application contient des liens en utilisant le #! format, qui sont réalisés dans le format suivant:

http://tld.com/#!locale/page

une règle de réécriture est en place pour traiter les demandes de ciblage d'instantanés HTML correctes pour:

http://tld.com/?_escaped_fragment_=locale/page

Cet instantané est généré en vidant simplement le DOM sur une instance de nodeJS et en encapsulant le code HTML généré dans de nouvelles balises.

Il devient évident à ce stade qu’il n’ya pas de masquage, car je suis simplement en train de vider le DOM pour chaque page, mot pour mot comme un navigateur avec JS activé.

Le raisonnement pour utiliser une application JS au lieu de pages statiques ne fait pas partie de cette discussion.

Je suis préoccupé par la raison, et une solution possible, pour laquelle Google n'indexe plus les pages. Je suis à peu près sûr que je suis en pleine conformité avec les spécifications. J'ai également envoyé un plan du site contenant tous les liens. Rien n'a changé. Le sitemap est présent en tant que "sitemap.txt" pour les deux domaines.

Si quelqu'un pouvait aider à éclaircir un peu la question, je vous en serais très reconnaissant! Merci!

2
DLeonardi

Autant que je sache, les sites auroraliveaboard.com et acs-germany.de n’implémentent pas correctement le programme de balayage AJAX de Google que vous avez décrit.

En ce qui concerne auroraliveaboard.com, il semble que les URL de fragments échappés renvoient toujours le même contenu. Par exemple, http://auroraliveaboard.com/?_escaped_fragment_=en_routes ne renvoie pas d'instantané de http://auroraliveaboard.com/#!en_routes .

Concernant acs-germany.de, la règle de réécriture ne fonctionne pas parfois. Par exemple, http://acs-germany.de/?_escaped_fragment_=en/news redirige vers http://acs-germany.de/snapshots/en/news.html qui n'existe pas. Il semble également que vous ayez renommé le chemin "fragments" en "instantanés". Comme vous pouvez le constater Google a indexé certaines de ces anciennes pages présumées, mais a également tenté d'obtenir des instantanés à l'aide de l'URL redirigée (par exemple, http://acs-germany.de/fragments/de/ news.html #! fr/news au lieu de http://acs-germany.de/#!en/news ). Cela peut expliquer pourquoi cela n'a pas fonctionné.

1
check_ca