web-dev-qa-db-fra.com

Comment empêcher Google d'afficher une page de sous-domaine erronée et périmée dans des liens annexes

Pour notre domaine, exemple.com, nous avons 2 sous-domaines: a0.example.com et a1.example.com. Ces 2 sont uniquement destinées aux images de produits. Les images stockées ici sont accessibles comme par exemple a0.example.com/var1/var2/prod_id_img_1.jpg, et sont liées à des produits répertoriés sous www.example.com. Il n'y a pas d'autre utilisation de ces sous-domaines.

Avant la sortie, nous avions une page à (a0 | a1) .example.com disant "Coming Soon", que nous avons oublié de supprimer plus tard (car elle n’est pas accessible depuis notre site principal).

Maintenant, nous constatons que lorsque nous recherchons notre domaine, "exemple", le premier lien annexe est "À venir bientôt" et des liens vers a0.example.com (les 5 autres liens annexes indiqués sont valides).

Les questions sont:

  1. Comment puis-je supprimer correctement cette page afin qu'elle n'apparaisse pas sur les liens de site Google (et sur toute autre recherche, le cas échéant)? Devrais-je simplement l'enlever pour obtenir le statut 404 ou dois-je l'exécuter à travers 410 ou dois-je faire autre chose pour obtenir une suppression correcte (pour toujours)?

  2. En parcourant les journaux nginx, je remarque que Google Bot recherche périodiquement des sitemaps sous (a0 | a1) .example.com. Me manque-t-il une configuration explicite à cause de laquelle Google Bot cherche des sitemaps ici, ou est-ce que ce comportement est standard et je n'ai pas à m'inquiéter?

  3. Sur le webmaster, nous avons les propriétés exemple.com et www.exemple.com. example.com n'est pas configuré, mais www.example.com fonctionne et fonctionne bien. Dois-je faire quelque chose avec la propriété exemple.com qui puisse aider à notre utilisation (s0 | s1) .example.com?

Merci d'avance pour votre aide.

1
Ethan Collins

Vous avez quelques options.

  1. Supprimez et autorisez toutes les demandes à émettre une erreur 404; toutefois, s'il s'agit d'un fichier index.html situé à la racine de chaque sous-domaine, il est vivement recommandé de ne pas le faire et de conserver le fichier pour des raisons de sécurité.

  2. Excluez la page dans un fichier robots.txt dans chaque espace Web de sous-domaine. Voici un exemple de code permettant d'exclure le fichier index.html dans chaque racine Web de sous-domaine.

    User-agent: *
    Disallow: /index.html
    
  3. Utilisez noindex dans l'en-tête HTML. Voici un exemple de code à placer dans la balise HTML <head>.

    <meta name="robots" content="noindex">
    
  4. Rediriger toute demande de la page vers la page d'accueil du site. Voici un exemple de code pour le faire. Vous pouvez l'insérer dans votre fichier .htaccess dans la racine Web de chaque sous-domaine. (En supposant Apache)

    Redirect permanent /index.html http://www.example.com/
    
1
closetnoc