web-dev-qa-db-fra.com

Le site renvoyant l'en-tête 404 à Google, ne sachant pas pourquoi

Un site Drupal qui fonctionne bien pour les utilisateurs normaux renvoie une erreur 404 non trouvée lorsque j'essaie d'utiliser le validateur W3C; Il n’est pas du tout indexé par Google (ce qui est le problème principal, mais je soupçonne qu’il existe une connexion). Il s’agit d’un site https:// avec la règle .htaccess pour rediriger toute demande http:// vers https://.

Je l'avais fait tourner dans les outils Google pour les webmasters et je pensais que tout allait bien, mais il s'avère que je n'ai pas ajouté le domaine HTTPS. Après avoir ajouté le domaine HTTPS, l’en-tête est également renvoyé.

HTTP/1.1 404 Not Found
Date: Mon, 15 Oct 2012 19:37:43 GMT
Server: Apache
Expires: Sun, 19 Nov 1978 05:00:00 GMT
Cache-Control: no-cache, must-revalidate, post-check=0, pre-check=0

robots.txt vient de

User-agent: *
Crawl-delay: 10
# Files
Disallow: /cron.php

Comment puis-je vérifier quel est le problème ici?

1
Damon

Un site Drupal qui fonctionne bien pour les utilisateurs normaux renvoie une erreur 404 non trouvée lorsque j'essaie d'utiliser le validateur W3C.

On dirait que vous envoyez à tort un en-tête de réponse HTTP "404 Introuvables" pour toutes les demandes, au lieu d'un "200 OK". Les utilisateurs normaux "verront" la page de travail, mais le validateur W3C et les robots des moteurs de recherche signaleront une erreur.

Cependant, sans plus d'informations sur votre site spécifique, il est impossible de répondre plus avant.

1
MrWhite