web-dev-qa-db-fra.com

Signification des erreurs d'exploration

Ma question concerne la définition de erreurs d'analyse dans Google Webmaster Tools. Les erreurs d’exploration sont divisées en quelques sections.

Considérons d’abord la section HTTP.

Je suppose que tous les liens brisés dans cette section ont été trouvés par le robot, ce ne sont pas les liens du plan du site. Si tous ces liens ont été trouvés en recherchant des liens dans les pages du plan Sitemap, pourquoi ne pas préciser quelle était la page source, comme dans la section Plan du site avec la colonne Linked From. S'il vous plait corrigez moi si je me trompe.

Plan du site section.

On dirait que tous ces liens proviennent de mon sitemap. Mais il existe une colonne Linked From, je sais déjà que tous les liens rompus proviennent de sitemap. Par conséquent, afin de corriger l'erreur, je devrais réviser mon sitemap. Ai-je tort?

Non suivi section.

Je ne sais pas ce que ça veut dire. On dirait que cela accumule tous les liens qui ont causé la redirection, mais pour une raison quelconque, Google considère toutes ces redirection comme une redirection incorrecte. Savez-vous s’il existe un ensemble de règles permettant de déterminer une redirection erronée? En fait, j’ai constaté que c’était mon erreur, j’ai essayé de normaliser l’URL et de le rediriger vers la bonne URL, mais j’ai normalisé de manière erronée.

Introuvable section.

Cette section ressemble à la section HTTP mais avec 404 erreurs. Cette section a la colonne lié à. Mais très souvent lié à a indisponible. Qu'est-ce que cela signifie, Google ne peut pas me dire comment il a trouvé cette page non existante. Comment cette section est liée à la section Plan du site. Est-ce que cette section contient tous les 404 liens du plan du site aussi. Mais il y a trop de liens 404, beaucoup plus que dans le plan du site. J'ai essayé de regarder ce que nous avons dans Linked From, et j'ai vu que ce lien venait d'un sitemap il y a deux mois. Mais pourquoi Google le maintient indexé, le lien est déjà mort, le nouveau sitemap ne l’a pas. S'il y a une date d'expiration pour les anciens liens?

inaccessible section.

On dirait que cette section contient 500 erreurs. Cette section ne contient pas la colonne lié à. Il y a trop de liens complètement dépourvus de sens, je ne sais vraiment pas d'où vient ce contenu, et sans Linked From je ne suis pas en mesure de comprendre comment le gérer.

Désolé pour un sujet aussi important, mais je tiens simplement à préciser ce que représente chaque section, car il est extrêmement important de pouvoir traiter de tous ces problèmes. J'espère que ce sera utile, pas seulement pour moi.

Merci!

7
com

Je pense que vous êtes principalement correct avec vos hypothèses.

La première section HTTP montre toutes les erreurs 4xx sauf les erreurs 404 (qui sont beaucoup plus courantes, donc obtenez leur propre page). J'ai 400 erreurs (mauvaise requête) de CodeIgniter qui interdit certains caractères dans les URL. 403 (interdit) sont ici aussi.

La section plan du site vous indique simplement toute URL d'un plan Sitemap introuvable. La section "lié à" est utile afin que, si une page n'existe plus, vous pouvez supprimer les liens.

Je n'ai jamais vu la section non suivie, mais cela ressemble à une liste d'adresses URL liées à rel = ofollow.

Introuvable est chaque erreur 404. Il listera probablement les pages de votre sitemap car elles doivent évidemment être liées à votre site (en d'autres termes, une page uniquement dans le sitemap et non liée à un emplacement donné n'apparaîtrait pas ici).

Injoignable sont des erreurs 5xx comme vous l'avez dit, qui sont des erreurs de serveur. "Lié de" n'apparaît pas ici car cela n'a pas d'importance, aucune page ne devrait jamais renvoyer d'erreur 5xx.

3
DisgruntledGoat