web-dev-qa-db-fra.com

Pourquoi le nombre de pages de mon site Web indexées par Googlebot diminue-t-il?

Je surveille le nombre de pages indexées par Googlebot pour l'un de mes sites Web.

J'ai remarqué que depuis la semaine dernière, le nombre de pages a diminué d'environ 60%. Pour être juste, je n'ai pas ajouté grand chose au cours de la semaine dernière. (En fait, je ne pense pas avoir ajouté de nouveau contenu.) Mais au moins, j’aurais pensé que le nombre de pages indexées serait statique (si je n’ajoutais rien de nouveau.) Je ne comprends pas pourquoi les chiffres ont chuté.

Quelqu'un at-il une explication officielle pour cela?. J'ai vérifié les outils Google pour les webmasters et je n'ai rien trouvé qui réponde directement à ce problème.

5
morpheous

On dirait que très récemment, Google a eu un "petit problème" avec son indexation, il semble que beaucoup de sites voyaient des pages tomber de l'index de Google, lisez ce lien pour plus de détails:

http://searchengineland.com/is-google-broken-sites-big-small-seeing-indexing-problems-53701

Il existe toujours la possibilité que d'autres problèmes aient une incidence sur la capacité de votre site d'indexation, mais comme il s'agit d'un problème très répandu, Google semble avoir confirmé que je commencerais par là.

2
Joshak

Tout d'abord, Google Bot peut détecter si les pages n'ont pas été mises à jour et ne pas les analyser en premier lieu (cela ne devrait pas réduire le nombre de pages indexées). Il peut détecter cela de plusieurs façons, par exemple en utilisant des horodatages ou des étiquettes.

Après l'exploration, il n'y a aucune promesse qu'il soit indexé - il peut, ou non. De nombreux facteurs déterminent si Google indexera les pages explorées par le bot.

De temps en temps, Google purge également son index et supprime les pages dont il pense qu’elles ne devraient pas figurer. Des éléments tels que la duplication de contenu, le contenu indésirable/spam et d'autres facteurs sont utilisés pour décider de cela. Personne (à l'exception de Google) ne sait réellement à l'avance quand ce type de purge se produit ou quels facteurs sont utilisés. Mais ils se produisent de temps en temps.

Lisez également le contenu sous le titre "Indexing Stuff" sur le lien pour plus d'informations, http://www.google.com/support/forum/p/Webmasters/thread?tid=2ad71287c04eb28

1
Evgeny

Cela ressemble à Googlebot n'est plus capable de trouver vos pages. Si une page se trouve toujours sur votre site, Google ne la supprimera pas de l'index, mais si de nombreuses pages renvoient des erreurs 404, elles seront généralement supprimées. Dans Outils pour les webmasters, cochez l’outil "Récupérer en tant que Googlebot" sur certaines de vos pages.

Le contenu dupliqué sur le même site (par exemple, les URL page.html et page.html?x=nothing) peut être ignoré/supprimé, mais le contenu dupliqué sur plusieurs sites (par exemple, si vous avez copié du contenu à partir de Wikipedia) ne sera jamais supprimé à partir de l'index en soi, il ne se classera tout simplement pas n'importe où.

1
DisgruntledGoat