web-dev-qa-db-fra.com

Googlebot demande une URL non valide

J'ai une application Web qui m'envoie automatiquement des exceptions par courrier électronique. Ce matin, il y avait une erreur liée à une URL:/Catalogue/LiveCatalog? Id = ylwpfqzts

id est invalide (devrait être un guide) et a provoqué une erreur d'analyse. Tout a été traité correctement et une page d'erreur est renvoyée. Mais ce qui était étrange, c’est que l’agent utilisateur se soit signalé lui-même comme étant Googlebot et que l’IP soit enregistrée auprès de Google.

L'URL n'aurait jamais été générée par mon application Web, mais ne semble pas particulièrement malicieuse.

2
Rob Walker

Si votre application ressemble à beaucoup de CMS, elle peut renvoyer la page d'index même si la page en cours d'accès n'existe pas. Vous devez créer une page 404 personnalisée à laquelle Google devrait adhérer.

Quelques informations supplémentaires: http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=93641

2
Richard Testani

C'est peut-être un simple bug dans GoogleBot (ça arrive). Ou bien il pourrait s'agir d'une URL que vous avez précédemment utilisée et qui n'a tout simplement pas été supprimée du plan Sitemap de Google pour votre site. Si vous dites que cela n'a jamais été une URL valide, cela est douteux.

Il y a aussi une mince chance que quelqu'un teste des exploits sur votre site en bidouillant des URL. Je dis mince parce que ce n'est pas difficile à simuler puisque GoogleBot est légèrement plus difficile à simuler que Google IP.

Pour le moment, j'écrirais cela comme un problème GoogleBot, mais gardez un œil attentif à ce que cela se reproduise.

1
jskrwyk