web-dev-qa-db-fra.com

Devrais-je utiliser nofollow sur des liens internes qui n'ont pas besoin d'être explorés?

Nous disposons d'un moteur de navigation qui permet à nos clients de filtrer les produits en fonction d'attributs (taille, couleur, etc.). Nous mettons en œuvre une mise à niveau qui leur permet d’utiliser les raffinements "multi-sélections". En gros, ils peuvent dire "montre-moi tous les produits rouges, bleus et verts". Nous voulons que les moteurs de recherche explorent uniquement la première page sans aucune amélioration. Nous avons défini le canonique de la page avec les raffinements sur celui sans raffinement.

Du point de vue des ressources système, je ne suis pas sûr de vouloir explorer tous ces liens de raffinement avec Google. Les liens générés par ces raffinements peuvent être différents de manière exponentielle en fonction de l'ordre des raffinements, du nombre de ceux qui ont été sélectionnés, etc. Cela semble un gaspillage pour Google d'essayer d'indexer ces pages.

Devrais-je mettre une balise "no-follow" sur ces URL de raffinement afin que Google ne les explore même pas?

5
Paul Lemke

Nofollow n'empêche pas Google d'explorer les pages, il empêche tout "lien" d'être transmis à ces pages.

Robots.txt est ce que vous souhaitez empêcher Google de parcourir les pages.

http://www.robotstxt.org/robotstxt.html

4
Anonymous

Si vous êtes certain que Google atteint l'ensemble de vos produits et qu'il semble que vous l'utilisiez depuis des URL canoniques, il est judicieux d'empêcher Google d'explorer ces pages car son seul objectif est de réduire votre bande passante. et ressources du serveur.

Utiliser nofollow sur n’importe quel lien interne est un bon début. Je voudrais aussi envisager d'utiliser le balise méta des robots ou tête HTTP x-robots-tag r pour leur dire de ne pas l'indexer également. De cette façon, vous êtes sûr, même s'ils trouvent ces URL via des liens externes ou autrement, qu'ils ne les indexeront certainement pas. Les bloquer via robots.txt est également une bonne chose car vous pouvez tiliser des caractères génériques pour intercepter les pages contenant des chaînes de requête , etc.

1
John Conde

Étant donné que vous avez mentionné que les pages peuvent être "différentes de manière exponentielle", vous pouvez envisager d'utiliser la méta-balise "follow, noindex". Les différents classificateurs peuvent fournir à Google des informations supplémentaires sur le produit. Il est donc potentiellement avantageux de les en informer. contenu même si vous ne voulez pas l'indexer (ceci peut aider pour les requêtes longues).

1
Joshak