web-dev-qa-db-fra.com

Comment faire en sorte que Google préfère une branche / répertoire de mon site à un autre?

J'écris une bibliothèque de logiciels qui maintient les branches "dernières" et "bêta":

gojs.net/latest

gojs.net/beta

Idéalement, tout ce contenu serait disponible via la recherche Google. Par conséquent, je suis réticent à interdire l'indexation de la branche beta. Cependant, beaucoup de pages sont identiques ou très similaires, telles que les pages API

Toutefois, la recherche dans Google d'une requête telle que "site: organigramme de gojs.net" renvoie les résultats du répertoire /beta pour plusieurs pages et peu/aucun pour /latest.

Existe-t-il un moyen de faire en sorte que Google et les autres robots d'exploration de sites Web préfèrent/reconnaissent /latest comme répertoire canonique, mais indexent toujours /beta?

Ou si je ne peux pas raisonnablement le faire , puis-je interdire l'indexation de /beta pour que les utilisateurs de la recherche organique Google atterrissent à endroit plus approprié?

5
Simon Sarris

Vous ne pouvez pas contrôler grand-chose aux moteurs de recherche, mais voici quelques idées.

En ce qui concerne les liens canoniques, c’est une façon de dire à Google que c’est comme ça . Certains affirment qu'il s'agit de pages identiques, tandis que d'autres recommandent également d'utiliser cette option pour des pages similaires. Quoi qu'il en soit, vous dites à Google de prendre connaissance d’une page et non de l’autre, car il s’agit bien d’une page dupliquée, identique ou identique, cela n’a aucune importance. Je ne sais pas si cela fonctionne pour vous. Seulement vous pouvez décider.

En dehors de la suppression de la liste en bloquant à l'aide de robots.txt ou de nofollow, il semble que vous recherchiez une option nuancée sans perdre un ensemble complet de pages dans le moteur de recherche. Voici quelques idées. Ensemble, je pense que vous obtiendrez ce que vous voulez.

Contexte: Certaines de ces techniques sont utilisées dans des situations similaires où des versions de logiciel plus anciennes et plus anciennes sont proposées. Il s’agit de désaccorder un ensemble de pages de manière à ce qu’elles soient faciles à trouver par l’utilisateur et restent valables, tout en ayant une importance moindre pour les moteurs de recherche. Ironiquement, cela se fait facilement.

Voici une pensée pour commencer. Si/beta a été découvert en premier par les moteurs de recherche, ces pages peuvent avoir une priorité de facto sur/dernières si les pages sont similaires. Vous voudrez probablement modifier la structure de la page pour vous assurer que les pages similaires d'un ensemble/du plus récent à l'autre/bêta ne sont en réalité pas similaires. Vous pouvez ajuster le contenu des pages/beta sans décevoir vos utilisateurs. Je parle de la façon dont le contenu est formaté. Rendez les/dernières pages plus riches en contenu et les pages/bêta moins riches en contenu sans décevoir vos utilisateurs. Cette astuce est souvent utilisée lorsque la page préférée est nettement plus robuste que la page non préférée.

Les balises title et h1 sont deux des indices de référencement les plus importants pour les moteurs de recherche. Ceci avec des liens internes et des backlinks entrants dont je parlerai plus tard dans cette réponse.

Voici des exemples de balises title et h1.

motos husqvarna motos neuves husqvarna usagées motos neuves husqvarna usagées motos husqvarna motos neuves usagées husqvarna motos usagées husqvarna

Tous les trois vont bien performer pour husqvarna et/ou motos. Les mots-clés nouveaux et utilisés auront peu d'effet car ils ne sont pas considérés comme des mots-clés importants par rapport à husqvarna et aux motos. Rappelez-vous ce concept. Dans ce cas, les deux premiers exemples sont optimisés au mieux. Cependant, les deux derniers sont désoptimisés pour husqvarna. Mais cela peut ne pas suffire à vos besoins.

Je ne sais pas quels sont les mots-clés de votre site. Vous pouvez le découvrir à l'aide d'un analyseur de fichier journal. Je vais donc donner un exemple, mais vous devrez remplir les blancs.

Un peu de fond. Les moteurs de recherche ordonnent les termes de recherche et les termes trouvés dans les balises par ordre d'importance de gauche à droite, simplement parce que la plupart de nos cerveaux ont été formés pour penser ainsi. Ceci est le résultat d'apprendre à lire de gauche à droite. Ainsi, lorsque les personnes effectuent une recherche, elles ont tendance à utiliser les termes avant-gardistes en premier étant les plus importants, à moins qu'ils ne soient dyslexiques ou chinois. Pour vos dernières pages, vous souhaitez optimiser vos efforts de référencement en utilisant cette théorie, en classant les mots-clés les plus importants de gauche à droite. Pour/beta, il se peut que cela ne soit pas suffisant pour ajuster vos efforts de référencement en inversant la commande. Après tout, les pages ne fonctionneraient que différemment pour les mêmes mots clés. Au lieu de cela, vous allez rechercher un nouvel ensemble de mots-clés qui s’appliquent spécifiquement à vos pages/beta. Bien sûr, vous aurez un certain chevauchement, il vous suffit de désaccorder les termes importants pour/beta. Vous trouverez ci-dessous un exemple, mais pas excellent!

Bibliothèque JavaScript Bibliothèque de logiciels d'évaluation bêta JS

J'ai remplacé JavaScript par JS et ajouté des mots clés spécifiques/battus.

Bien entendu, vous pouvez rediriger toutes les références de Google pour/beta vers/latest. Je n'ai pas testé l'exemple de code ci-dessous, mais il devrait être proche. Cela signifierait que si un utilisateur clique sur un lien de Google pour/beta, il sera redirigé vers/latest.

RewriteCond %{HTTP_REFERER} google [NC]
RewriteCond %{REQUEST_URI} /beta(.*) [NC, OR]
RewriteRule (.*) http://www.gojs.net/latest%1 [R=301,L]

Maintenant, voici une idée, bien que je ne pense pas que cela affectera les SERP, il y a quelques éléments de vérité dans certains de cela et devrait être considéré. Je vais en discuter immédiatement après la section Plan du site.

Si vous n'avez pas créé de plan Sitemap, peut-être, et je veux dire peut-être, pouvez-vous modifier la façon dont Google considère les pages à l'aide des valeurs last modification et priority. Bien sûr, vous pouvez augmenter la priorité pour les dernières pages. Je ne pense pas que cet effet recherche, cependant, il ne ferait pas de mal et serait toujours proche de la vérité. Pour les dernières dates de modification, vos dernières pages, je suppose, seraient moins récentes que/beta, ce qui semble contradictoire. Vous pouvez en quelque sorte falsifier la vérité et faire en sorte que/latest semble plus frais que/beta. Voici un exemple de sitemap.

  <url>
    <loc>http://www.gojs.net/latest</loc>
    <lastmod>2014-04-22</lastmod>
    <priority>1</priority>
  </url>
  <url>
    <loc>http://www.gojs.net/latest/something</loc>
    <lastmod>2014-04-22</lastmod>
    <priority>1</priority>
  </url>
  <url>
    <loc>http://www.gojs.net/beta</loc>
    <lastmod>2012-03-11</lastmod>
    <priority>0.5</priority>
  </url>
  <url>
    <loc>http://www.gojs.net/beta/something</loc>
    <lastmod>2011-02-09</lastmod>
    <priority>0.5</priority>
  </url>

Cela peut ne pas suffire. Qui sait à coup sûr. Mais ça vaut le coup d'essayer.

Mais voici une idée qui fonctionnera. Je ne sais pas quelle configuration vous avez. Si c'est Linux/Apache, alors cela peut être vraiment facile. Pour Windows/IIS, cela reste simple, mais un peu plus compliqué.

Vous pouvez toujours manipuler les dernières dates de modification de vos fichiers. Je ne serais pas un bon participant SE si je n'incluais pas de lien. Ceci décrit comment changer la date de modification d’un fichier Linux.

https://askubuntu.com/questions/62492/how-can-i-change-the-date-modified-created-of-a-file

Windows protège certaines propriétés de fichier, je ne sais pas pourquoi. Mais les dates de fichier peuvent être modifiées par programme. Ce lien répertorie certains outils vers le bas pour modifier la date de modification.

http://www.techrepublic.com/article/build-your-skills-learn-to-manipulate-file-time-stamps-in-windows/

Les liens sont l’un des indices les plus importants pour les moteurs de recherche. Il existe des liens internes et des liens entrants, mais la plupart des gens ne se rendent pas compte qu'ils sont traités presque exactement de la même façon. Donc, vous voulez utiliser ce fait en votre faveur.

Premier lien interne.

Tout lien dans une barre de navigation est très important et tout lien plus haut dans le contenu est plus important qu'un lien plus bas dans le contenu. Vous voudrez ajuster vos liens pour que/latest soit plus important que/beta.

Pour ce faire, vous pouvez vous assurer que/latest est dans la barre de navigation et que/beta ne l’est pas. Une autre méthode consiste à créer un lien/beta vers le bas de la page et de répéter un lien vers/au plus tard en haut de la page. Cela peut ne pas suffire cependant. Vous pouvez ignorer le lien vers/beta, à l'exception des/dernières pages faites vers le bas de la page. C'est un truc vraiment commun.

La manière dont un lien est créé est tout aussi importante que là où le lien existe. Vous vous souvenez des exemples de mots-clés ci-dessus pour les balises title et h1? Vous souhaitez ajuster vos liens vers/latest,/latest/quelque chose et/beta, beta/quelque chose de la même manière. Puisque votre structure de répertoire existe déjà, la seule partie du lien qui vous reste est le texte du lien. Ajustez les liens vers/latest et modifiez les liens vers la version bêta sans affecter l'utilisateur ou le CTR sur la page, ce qui n'est évidemment pas la même chose que SERP CTR.

Pour vos backlinks entrants, assurez-vous de créer un lien vers/la dernière période. Vous ne pouvez pas aider les internautes à accéder à votre contenu, mais vous pouvez également associer des liens à/beta avec des liens vers/latest. Je ne peux pas vous dire quel devrait être le rapport, le moins 2: 1 semble fonctionner, mais 3: 1 est peut-être meilleur et 4: 1 est incroyablement incroyablement fantastique ainsi mieux.

C'est ça. Ces tactiques devraient permettre à vos dernières pages de prendre une priorité dans les SERP par rapport à la bêta en utilisant principalement le référencement standard, mais en sachant comment rendre un ensemble de pages plus performant qu’un autre. La redirection n'est qu'un bonus!

Bien sûr, les moteurs de recherche sont notoirement lents, donc cela prendra un certain temps, bien que je soupçonne que la réorganisation peut commencer 30 à 60 jours après les modifications.

3
closetnoc

Tout d'abord, je m'assurerais que les pages sont explorables. Google choisira une URL comme canonique si elle considère les deux comme identique, mais les indexera généralement s'il y a des différences (en insérant une non-canonique dans les listes).

Vous pouvez le tester en exécutant un robot (par exemple, un générateur de sitemap XML) et en vous assurant que toutes les pages peuvent être trouvées sans sitemap.

Notez que Google indique que la balise canonique est destinée à "dupliquer ou contenu similaire", et pas simplement au contenu dupliqué. La balise canonique est à améliorer signaux dont est le droit plutôt que toujours utilisé. Tout ce que vous pouvez faire, c'est simplement améliorer ces signaux. Je suis à peu près sûr que si deux URL au contenu complètement différent disent qu'elles sont canoniques, les deux seront indexées et la balise sera ignorée.

Personnellement, je voudrais simplement utiliser la balise canonique.

Cependant, si vous souhaitez simplement améliorer la pertinence de l'un par rapport à l'autre, alors link sculpting peut être la solution.

Pour ce faire, je m'assurerais que chaque page/bêta est liée à la dernière page, mais pas l'inverse. S'il doit être lié dans l'autre sens, utilisez rel="nofollow" sur le lien.

Vous pouvez également créer des sitemaps XML et HTML mentionnant les dernières pages, mais laissez Google rechercher celles de/beta en effectuant une exploration.

Enfin, vous voudrez peut-être essayer rel=”next” et rel=”prev” afin de dire à Google que la version/bêta est la page 2 de la/dernière version. Bien que non sémantique, il convient de relier les pages dans leur index et d'indiquer que la dernière version est la page 1.

1
Richard B
Is there a way to get Google and other web crawlers to prefer/recognize
/latest as the canonical directory, but still index /beta?

Non, mais vous pouvez définir un lien canonique dans certaines pages /beta vers la page /latests correspondante. Et Google peut décider ou non de suivre votre recommandation et d’afficher la page /latest par-dessus la page /beta.

Vous pouvez également définir certaines de vos pages dans /beta comme noindex, ce qui laisserait à Google la possibilité d'indexer la page correspondante dans /latest. Malheureusement, cela ne peut pas être défini au niveau du répertoire.

Si certaines pages /beta sont laissées sans lien canonique, Google peut les traiter comme des pages distinctes.

Or If I can't reasonably do that, then should I disallow indexing of /beta
to ensure that users from organic google search land at a more appropriate
place?

Si la version bêta signifie que le contenu n'est pas vraiment prêt ou que le travail est en cours, ce serait le meilleur choix. Google veut de la qualité et n'aime pas les doublons ou les quasi-doublons.

Du point de vue du référencement, il est préférable d’être patient et de n’exposer que des travaux de qualité. Beaucoup de contenu presque dupliqué est un mauvais signal.

1

Pourquoi ne pas définir des URL canoniques pour suggérer à Google le contenu que vous souhaitez indexer.

https://support.google.com/webmasters/answer/139066?hl=fr

0
Anagio

Vous avez quelques options ici.

  1. Ajoutez une URL canonique aux pages de la version "bêta" du site dont le contenu n'a pas changé et l'URL canonique étant la page correspondante dans la "dernière" version du site. Cela indiquerait à Google lequel préférer lors de la liste.

  2. Dans votre sitemap XML, accordez une priorité plus élevée à ceux de la "dernière" version du site.

  3. Indiquez la balise méta source d'origine sous forme d'URL pour toutes les pages de la version "bêta" du site, la source d'origine étant la version "la plus récente". Cela peut être une URL absolue ou juste une partie du nom de domaine. Vous pouvez donc simplement ajouter "gojs.net/latest" à toutes les pages de "gojs.net/beta" en tant que balise méta source originale.

  4. Et bien sûr, votre lien interne devrait préférer la version "la plus récente" du site. Tous les backlinks que vous construirez dans le futur doivent également pointer vers la "dernière" version.

Tout ce qui précède donnera à Google un signal fort quant à l'URL à répertorier. Ne donnez pas un en-tête 'noindex' aux pages. Cela empêcherait les pages d'être indexées et elles finiraient par disparaître des résultats de la recherche. Cela peut donner des résultats indésirables lorsque les termes de recherche sont compétitifs. Si les pages correspondantes de la "dernière" version ne se classent pas aussi bien que celles de la version stable (pour une raison quelconque), alors en ajoutant un "noindex", vous gaspillez du trafic dans les moteurs de recherche.

Bien que Google indexe un site Web, il regroupe toutes les pages au contenu similaire et choisit une URL à ajouter à l'index. L'URL à choisir dépend des signaux forts fournis par le site. J'ai énuméré certains d'entre eux ci-dessus.

http://googlewebmastercentral.blogspot.in/2008/09/demystifying-duplicate-content-penalty.html

Même après cela, certains utilisateurs pourraient se retrouver dans la version bêta. Vous pouvez les diriger vers la dernière version du site en leur montrant un lien attirant avec une demande d'accès à cette page. J'espère que cela répond à certaines questions.

0
Rana Prathap