web-dev-qa-db-fra.com

Que fait Google avec les pages indexées qui renvoient 403?

Je suppose que Google supprime les pages déjà indexées qui renvoient maintenant l'erreur HTTP 403.

Malheureusement, je ne trouve aucune déclaration définitive à ce sujet. Savez-vous la réponse?

3
user15155

Ils sont supprimés de l'index. Il n'y a pas de documentation officielle de Google à ce sujet, mais vous pouvez trouver de nombreux cas où des sites Web ont renvoyé 403 par erreur et se sont désindexés.

Exemple: http://wordpress.org/support/topic/403-crawl-error-on-google-all-pages-have-been-removed-from-google-index

2
ilanco

Comme vous le savez, Google supprimera éventuellement les pages qui renverront les codes de serveur 404 Introuvable et 410 Gone. Toutefois, un 403 est une réponse interdite du serveur et non une erreur.

Google continuera probablement à vérifier la page et à la conserver dans son index au cas où elle deviendrait accessible. Si vous ne souhaitez pas l'indexer, définissez la balise d'en-tête meta noindex

2
Anagio