web-dev-qa-db-fra.com

Pourquoi Google indexe-t-il les pages avec? Utm_campaign query string

Récemment, j'ai remarqué que Google indexait des URL contenant des arguments de chaîne de requête utm_campaign, utm_source et utm_medium. Dans les résultats, Google affiche les URL contenant ces chaînes de requête plutôt que l'URL canonique:

utm_campaign added to URL

Je comprends que cela pourrait être un problème de "duplicate content", mais j’utilise la balise link rel=canonical sur mon site Web. À titre d'exemple:

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

Screenshot of canonical tag

Mon attente est que Google utilise l’URL canonique pour l’indexation. Qu'est-ce que je fais mal?

9
Brendon

En examinant votre site Web dans l’état actuel, je ne suis pas certain qu’il s’agisse d’un problème persistant ou actuel.

Le problème n’est pas le lien interne sur votre site Web avec l’inclusion des paramètres UTM (comme le suggère une autre question).

Il semble plus qu'un processus de partage du contenu de votre site Web sur les médias sociaux laisse les paramètres UTM dans les URL et partage ces URL, ce qui a, à un moment donné, conduit à leur indexation.

Il est rare que cela se produise, mais cela est déjà arrivé à de nombreux autres sites. Le fait qu'il ne s'agisse que de trois pages indexées avec ces paramètres indique qu'il ne s'agit ni d'un problème grave ni d'un problème global.

Voici les étapes à suivre pour aider à éliminer ce problème: -

1. Spécifiez une URL canonique sur vos pages

Vous le faites déjà et la mise en œuvre est correcte. Cela garantira que seul l'URL canonique spécifié aura un poids dans les moteurs de recherche. Cela a probablement toujours été en place, mais sinon, cela pourrait expliquer pourquoi certaines anciennes instances de pages sont encore indexées avec des paramètres UTM.

Correct implementation of canonical URLs

2. Indiquez à Google de ne pas indexer les paramètres UTM dans la console de recherche.

Dans le cas où certaines URL sont indexées avec les paramètres UTM (comme votre cas), le paramètre d'URL doit apparaître comme étant détecté dans la section "Explorer> les paramètres d'URL" de la console de recherche Google pour votre domaine (voir ci-dessous).

Google Search Console UTM URL Parameters

Même si les paramètres UTM n'apparaissent pas, vous pouvez "Ajouter un paramètre" pour les créer.

Il vous suffit de sélectionner No: Doesn't affect page content (ex: tracks usage) (connu sous le nom de "Paramètres passifs") et Google procédera alors généralement, une seule URL à explorer avec une valeur de paramètre spécifique .

3 Interdit les paramètres d'URL dans votre fichier robots.txt

Cela empêchera Google d’indexer le contenu de ces URL, mais pas les URL réelles elles-mêmes (elles pourraient toujours s'afficher dans les résultats de la recherche mais omettront simplement la description comme ci-dessous).

Indexed page disallowed in robots.txt

Ajouter simplement quelque chose comme ceci résoudrait ceci de robots.txt: -

Disallow: /*?utm=*

Conclusion

Les étapes n ° 1 et n ° 2 doivent être exécutées par mesure de précaution et "meilleures pratiques" de toute façon, et l'étape n ° 3 en plus des étapes n ° 1 et n ° 2 peut-être (car elle ne sera pas efficace en soi).

Dans Google Search Console, il est également possible de supprimer (temporairement) des URL. Ceci est particulièrement utile si des pages persistantes sont encore indexées mais que vous savez que la source du problème a été résolue et que cette installation devrait suffire à les supprimer définitivement des résultats de la recherche.

Je n'ai pas inclus cela dans l'étape ci-dessus car, malgré les recherches qui ont été effectuées auparavant, je ne me souviens pas s'il prend en charge les URL avec des paramètres [citation nécessaire]. Je connaissais la réponse une fois, mais ma mémoire me manque à cette occasion particulière.

Plus de lecture sur le suppression des URL de Google .

3
zigojacko

Il semble que vous utilisiez ces liens dans le contenu de votre site Web pour relier des pages entre elles.

Pour vous assurer que Google n'indexera pas, vous pouvez ajouter rel="nofollow" à ces liens dans votre site Web et bloquer ces paramètres à partir du fichier robots.txt:

Disallow : /*utm_campaign
2
Nadeem Haddadeen

Avez-vous vérifié si votre URL canonique a été indexée ou non? Si l'URL canonique a été indexée, vous n'avez rien à craindre.

Vous pouvez essayer les outils pour les webmasters de Google et changer la manière dont Google traite les paramètres d'URL here .

1
muhammad usman