web-dev-qa-db-fra.com

Webmaster Bing indiquant des erreurs d'analyse sur une redirection http vers https 301

J'ai déplacé mon formulaire de site http vers https, à présent le sitemap contient des URL https, mais le webmaster Bing indique une augmentation des "erreurs d'analyse" et mes pages indexées ont été réduites à 0.

La liste des erreurs indique que les pages http redirigent (comme j'ai utilisé la redirection 301 HTTP> HTTPS), ma question est de savoir pourquoi recherche-t-il les pages http lorsque j'ai des pages https dans le plan Sitemap et pourquoi ne pas indexer les pages https sous la forme sitemap et internal liens.

Tous les liens internes sont déplacés vers HTTPS, Google n'appelle pas cette erreur. C'est juste Bing et le plus troublant est que; ça ne part pas avec le temps, j'ai attendu 45 jours. Il s’agit uniquement de Bing. Les pages http ont été marquées comme ayant été corrigées (simplement parce qu’elles redirigent vers https) et n’indexent pas les pages https, même s’il n’ya pas un seul lien interne http dans le site ou le plan du site.

2
XIMRX

... Ma question est la suivante: pourquoi cherche-t-il les pages http lorsque j'ai des pages https dans le plan du site ...

Ceci est la clé.

La réponse est simple Les sitemaps ne sont pas l'autorité par laquelle les moteurs de recherche soumettent des pages à la file d'attente d'extraction. Leur index est! Vos pages sont indexées en tant que HTTP et c’est donc exactement ce qui sera soumis à la file d’extraction. Jusqu'à ce que chaque page soit demandée, redirigée et que l'URL soit mise à jour dans l'index, le moteur de recherche non demandera alors les URL HTTP. L'exception consiste bien entendu à suivre les liens existants vers vos pages créés avec HTTP. Le moteur de recherche tentera toujours de récupérer les pages en fonction des URL de lien, même si la même page existe dans son index en tant que HTTPS et non HTTP. Ce serait la bonne chose à faire et responsable.

Le plan du site n'a rien à voir avec ce processus. Ne parlant pas pour Bing, je suppose qu'ils ressemblent exactement à Google à cet égard. Google utilisera uniquement le plan du site pour vérifier qu'il peut analyser correctement votre site. Rien de plus. Généralement, les sitemaps dirigent les entrées dans la file d'attente d'extraction uniquement lorsque le site est si vaste que les liens vers toutes les pages ne sont pas possibles ou lorsque des pages existent derrière un login ou un paywall. Et alors seulement pour ces pages. C'est ça. En ce qui concerne Google, les sitemaps ne sont pas utilisés pour alimenter la file d'attente de récupération lorsqu'un site peut être correctement analysé.

2
closetnoc

Il semble que tout ce que vous avez fait a été de soumettre un nouveau plan de site et non d'implémenter une redirection 301 valide.

Si vous êtes sur un serveur Apache, ajoutez ceci à votre fichier htaccess dans le dossier racine de votre site.

Une approche simple serait;

# Force www:

RewriteEngine on
RewriteCond %{HTTPS_Host} ^example.com [NC]
RewriteRule ^(.*)$ https://www.example.com/$1 [L,R=301,NC]

# Force non-www:

RewriteEngine on
RewriteCond %{HTTPS_Host} ^www\.example\.com [NC]
RewriteRule ^(.*)$ https://example.com/$1 [L,R=301]

Je choisirais celui pour lequel vous êtes actuellement le plus indexé dans les recherches.

ma question est la suivante: pourquoi cherche-t-il les pages http lorsque j'ai des pages https dans le plan du site?

Parce que vous n'avez pas spécifié lesquels utiliser dans leurs outils de webmaster et/ou aucune redirection pour indiquer le contraire.

Très probablement, vous avez au moins 4 versions ou partiellement indexées.

http://example.com
https://example.com
http://www.example.com
https://www.example.com

avec une possibilité de

http://example.com/
https://example.com/
http://www.example.com/
https://www.example.com/
0
norcal johnny