web-dev-qa-db-fra.com

Une seule page n'apparaissant pas dans la recherche Google

La description

J'ai un site Web de franchise statique qui comporte différentes sous-pages, chacune étant dédiée à un franchisé individuel.

Pour chaque franchisé de la page, la seule chose qui soit légèrement similaire entre tous les titres sont les titres de page, ils suivent cette structure:

<title>
  Welcome to THE_COMPANY - PRODUCT_DESCRIPTION Services, THE_LOCATION
</title>

THE_COMPANY et PRODUCT_DESCRIPTION sont les mêmes pour tous les franchisés, cependant THE_LOCATION change en fonction de son emplacement au Royaume-Uni.

Chaque page de franchisé comporte les balises <meta /> suivantes:

<meta name="DC.creator" content="user"/>
<meta name="DC.format" content="text/html"/>
<meta name="DC.language" content="en"/>
<meta name="DC.date.modified" content="2014-01-23T11:22:31+00:00"/>
<meta name="DC.date.created" content="2014-01-23T11:22:09+00:00"/>
<meta name="DC.type" content="Page"/>
<meta name="DC.distribution" content="Global"/>
<meta name="robots" content="ALL"/>
<meta name="distribution" content="Global"/>

Le contenu principal de chaque page de franchisé est complètement différent.

Le problème

Il existe une page de franchise particulière, située dans , zone A .. Laquelle ne s'affiche pas dans la recherche Google résultats du tout. Cependant, chaque autre franchisé (si vous effectuez une recherche Google pour " THE_COMPANY , THE_LOCATION "est le numéro 1). Et si je fais la même recherche sur Bing, Yahoo ou DuckDuckGo, le franchisé Area A est le premier résultat sur chacun d'entre eux.

Google a-t-il, pour une raison quelconque, inscrit une page noire sur le site?

Ce que j'ai essayé

  • S'assurer que la page est référencée dans mon sitemap.xml fichier
  • "Récupérer en tant que Google Bot" le lien www.the_company.co.uk/areaa
    • Quand cela est revenu comme OK je soumettrais à l'index
  • Nouvelle soumission du fichier sitemap.xml dans les outils pour les webmasters
  • Lien vers la zone A à partir du contenu d'une autre page
    • Pour cela, j'ai également attendu environ 3 semaines avant de vérifier à nouveau pour donner à Google le temps de se réindexer.
  • Modifier le contenu de la page et attendre encore 2/3 semaines
  • Supprimer complètement la page et la recréer avec une URL alternative

La chose la plus proche que j'ai trouvée à ce problème est cette question de StackOverflow mais ce franchisé particulier existe depuis presque un an, il apparaissait auparavant dans les recherches Google, mais n'existe plus. J'imagine que le mise à jour de Panda n'était pas très heureux avec quelque chose sur la page, mais cela n'a aucun effet sur le site et je ne sais pas quoi essayer.

J'apprécierais beaucoup toute information ou pensée quant à ce qui aurait pu causer cette

Merci.

Mettre à jour

Conformément à la réponse de Daniel Fukudas ci-dessous, j’ai suivi certaines de ses démarches, mais tout semble aller pour le mieux:

En-têtes HTTP

HTTP/1.1 200 OK =>
Date => Tue, 25 Feb 2014 16:31:29 GMT
Server => Zope/(2.12.16, python 2.6.6, linux2) ZServer/1.1
Content-Length => 40078
Expires => Sat, 01 Jan 2000 00:00:00 GMT
Content-Type => text/html;charset=utf-8
Content-Language => en
Vary => Accept-Encoding
Connection => close

Robots <meta /> tag :

<meta name="robots" content="ALL"/>

J'ai mis à jour cette balise <meta /> pour lire content="INDEX" à la place.

robots.txt :

User-agent: *
Disallow:

User-Agent: Googlebot
Disallow: /*sendto_form$
Disallow: /*folder_factories$

Utilisation du site: THE_COMPANY.co.uk :

La recherche de 'AREA A site: THE_COMPANY.co.uk' ne renvoie pas la page, mais peu importe la recherche, il suffit de chercher le site: THE_COMPANY.co.uk ne renverra pas nécessairement toutes les pages indexées, ou alors je comprends ...

Mettre à jour

Il semble que Google aime lâcher de temps en temps des pages de l'index, malgré les étapes précédentes, j'ai quitté le site tout seul et la page est réapparue dans les SERP.

3
Dan

Assure-toi:

  • cette page renvoie le code 200 @ en-têtes HTTP. Vérifiez X-Robots-Tag. Vous pouvez vérifier les en-têtes ici: http://www.webconfs.com/http-header-check.php

  • que meta name="robots" sur ce particulier a content="all" ou content="index"

  • vérifier le fichier robots.txt

  • inspectez votre site Web @ Google en utilisant site:example.com

1
SubZeroFX