web-dev-qa-db-fra.com

Supprimer discrètement la page de l'index Google sans modifier la page HTML

Disons simplement qu'un "ami" veut faire un blog invité sur votre site avec un lien vers son site, mais vous n'en êtes pas très heureux. Vous ne pouvez pas dire non, mais vous ne voulez pas jouer au jeu "link juice".

Comment puis-je demander à Google d'ignorer complètement cette URL et ses liens, sans laisser de marqueur sur la page?

Pour autant que la personne en question sache, la page est en direct avec un backlink dofollow, mais secrètement, Google a-t-il reçu l'instruction d'ignorer complètement cette page?

Une des idées que j'avais était d'ajouter un code pour détecter les moteurs de recherche et de renvoyer un 404 lors de leur visite. J'avais peur que Google remarque la différence et me punisse pour avoir essayé de donner à l'araignée une page différente.

1
Dan Hastings

Outre l'aspect éthique: oui, c'est possible. Laissez le lien être dofollow dans le code source de la page, mais envoyez nofollow avec X-Robots-Tag, comme ceci:

<FilesMatch "page.html$">
Header set X-Robots-Tag "nofollow"
</FilesMatch>

Googlebot lit le X-Robots-Tag plus tôt que le code source et, malgré des signaux contradictoires concernant ce lien, il suivrait (espérons-le et selon sa logique comportementale) le signal qu'il avait reçu plus tôt.

1
Evgeniy

l'outil de suppression des URL de Google vous permet de masquer votre page des résultats de recherche Google pendant 90 jours. Cette méthode ne laisserait aucune trace visible sur votre site. La seule façon pour votre ami de savoir, c'est s'il tente de rechercher la page dans Google et ne parvient pas à la trouver.

Après 90 jours, vous devrez effectuer une autre demande de suppression. Google ne transmet pas le PageRank aux pages non indexées. Cette méthode peut donc également empêcher le comptage du lien. Cependant, il n'est pas clair que la page ne soit pas vraiment indexée, par opposition à indexée mais cachée des résultats de la recherche.

Une deuxième méthode consisterait à utiliser robots.txt . Si vous mettez Disallow: /the-page-to-be-removed.html dans votre fichier robots.txt , Google ne pourrait ni l'explorer, ni transmettre le contenu de son lien. Il peut indexer la page s'il contient des liens externes, mais n'inclut aucun des mots-clés de la page dans l'index. Votre ami pourrait vérifier votre fichier robots.txt s’il le souhaite. Si vous voulez le rendre plus discret, vous pouvez déguiser le Disallow avec des jokers: Disallow: /*-to-be-*

0
Stephen Ostermiller