web-dev-qa-db-fra.com

Masquer un sous-domaine de Google / Résultat de moteur de recherche SEO?

J'ai un sous-domaine que je ne veux pas être répertorié dans aucun résultat de moteur de recherche. Disons que j'ai:

  • http://www.example.com
  • http://child.example.com

Comment puis-je masquer tous les URL du domaine child.example.com qui apparaissent actuellement dans les résultats du moteur de recherche?

11
夏期劇場

Dans la racine du répertoire du site Web du sous-domaine, ajoutez un fichier appelé robots.txt contenant:

User-agent: *
Disallow: /

Cela indiquera aux crawlers web de ne pas indexer le site du tout. Ils n'ont pas à obéir, mais les principaux le feront.

14
Paul

L'utilisation d'un fichier robots.txt dans votre sous-domaine vous aidera (et Google y obéira), mais vous pouvez également spécifier avec un compte Google Webmasters que vous ne souhaitez pas que ce sous-domaine soit indexé. Vous pouvez également utiliser une balise META sur toutes les pages du sous-domaine:

    <meta name="robots" content="noindex">

S'il s'agit d'un site que vous utilisez uniquement à des fins de test interne, limiter la visibilité à un ensemble d'adresses IP spécifié dans votre fichier d'hôtes virtuels masquerait davantage le site.

6
Kenzo

Les solutions de Kenzo et Paul sont bonnes, vous pouvez mettre des balises méta noindex sur vos pages Web et ajouter le fichier robots.txt pour interdire les robots.

Mais à mon avis, la meilleure solution consiste à utiliser l’authentification par mot de passe sur votre sous-domaine. C’est la seule solution pour laquelle vous êtes certain que les robots peuvent accéder à votre site Web et l’indexer. Si vous utilisez Apache, vous pouvez implémenter htpasswd .

2
Zistoloen

... actuellement dans les résultats de référencement?

Les autres réponses concernent davantage de manière proactive d'empêcher l'indexation d'un (sous) domaine (qui correspond principalement à ce que vous demandez dans la question) plutôt que de supprimer activement vos pages des résultats de la recherche. , qui pourrait être plus ce que vous recherchez, à en juger par votre autre question .

Vous devez toujours bloquer votre site dans robots.txt et servir un noindex meta balise (ou X-Robots-Tag en-tête de réponse HTTP), comme indiqué dans les autres réponses, mais vous devez également bloquer l'accès à vos pages, en renvoyant un code d'état 404 ou 410.

Pour plus d'informations à ce sujet, consultez la page d'aide de Google Webmaster Tools:
Conditions requises pour la suppression de conten

Une fois que vous avez tout cela en place, vous pouvez utiliser l'outil Supprimer les URL dans les outils pour les webmasters de Google. Cependant, cela ne s'applique qu'à des URL individuelles, pas à un site entier, mais c'est un début. (Google indique que l'utilisation de robots.txt, noindex et la signification d'un 404 constituent les conditions requises pour utiliser l'outil de suppression de GWT.)

Toutefois, si vous souhaitez toujours que les utilisateurs réguliers puissent accéder au site en tapant l'URL, c'est un problème, car votre contenu n'est plus disponible. Vous pouvez y entrer un mot de passe, comme le suggère Zistoloen. Toutefois, cela retournera un 403 (interdit) par défaut que vous devrez remplacer pour retourner un 404/410. Vous pouvez masquer votre contenu, en renvoyant un 410 à Googlebot et en permettant à tous les autres d'entrer - mais qu'en est-il des personnes qui cliquent sur les résultats dans les SERP?

Mais si vous souhaitez que Google supprime votre contenu le plus rapidement possible, vous devez le supprimer de l'internet "Google".

2
MrWhite