web-dev-qa-db-fra.com

Dupliquer le contenu des sites Web internationaux

J'aide au référencement d'un groupe international. Entre autres, il existe un site Web company.com et un site Web company.com.sa (Arabie saoudite). Ils ont une nouvelle section FAQ sur le site Web .com, en anglais.

Ils aimeraient utiliser ce contenu sur le site Web .com.sa, en anglais également. Même contenu sur différents domaines ... Ce serait du mauvais contenu dupliqué, n'est-ce pas? Donc, j'ai suggéré qu'ils utilisent un canonique interdomaine de .com.sa à .com pour ces pages.

Mes questions:

  • Avec cette balise canonique interdomaine, le contenu des deux apparaît-il dans les résultats de recherche de Google?

  • Google pourra-t-il reconnaître que les sites sont liés l'un à l'autre? et par conséquent comprendre que le contenu n'est pas en double?

  • Pourrais-je simplement utiliser hreflang pour montrer que le contenu de .com.sa est destiné à des utilisateurs spécifiques (personnes en Arabie Saoudite), par exemple: <link rel="alternate" hreflang="EN-sa" href="company.com.sa" />

2
whatwouldyoudo

Le contenu dupliqué n'est plus déterminé de manière linéaire. Aujourd'hui, le contenu dupliqué est déterminé à l'aide d'une méthode d'évaluation sémantique, de sorte que le contenu quasi dupliqué sera toujours considéré comme dupliqué. En effet, les spammeurs réorganiseraient simplement le contenu pour éviter que celui-ci ne soit signalé comme un doublon.

De plus, la reconnaissance de phrases n-gramme est utilisée pour déterminer la langue indépendamment de tout autre indicateur de langue. Il n'y a pas de distinction entre anglais américain et anglais australien par exemple. Cette méthode est utilisée de différentes manières, notamment en sachant indexer le contenu. Compte tenu de cela, l'anglais, quel que soit l'anglais, sera indexé de la même manière.

Je réalise que ce n'est pas ce que vous faites mais je vous le dis pour une raison.

Le contenu dupliqué est un contenu dupliqué, indépendamment de ce que vous faites ou du scénario. Vous ne pouvez pas échapper à un contenu en double. L'exception est la langue, cependant, elle s'applique aux langues intégralement distinctes telles que l'anglais, le chinois et le russe.

Votre idée d'utiliser une balise canonique est correcte. Vous devez choisir quel ensemble de contenu doit être l'original. Cela devrait être le premier ensemble de contenu publié et trouvé par un moteur de recherche. Si les deux ensembles de contenu sont publiés en même temps, vous pouvez choisir quel ensemble de contenu doit être l'original. Étant donné que le contenu d'origine a une valeur supérieure à la copie, vous devez indiquer le contenu d'origine à l'endroit où il aurait le plus de valeur. Généralement, il s’agit du site principal. Seul le contenu d'origine apparaît dans les SERP.

2
closetnoc

Lorsque vous utilisez un site Web multirégional, il est très difficile d'éviter les contenus dupliqués. Par conséquent, le meilleur moyen consiste à utiliser des balises canoniques et, comme indiqué dans les autres commentaires, Google considère le contenu manipulé comme une duplication.

0
Alex Walker
  1. Quelle que soit la page référencée en tant que canonique, celle qui sera affichée dans les SERP. L'autre ne sera probablement pas.

  2. Si le contenu de la page est très similaire ou identique, oui, il s'agit d'un contenu en double. Le domaine hébergeant le contenu n'est pas pertinent.

  3. Non, hreflang est utilisé pour spécifier les pages dont le contenu est identique, mais dans d'autres langues. Dans votre cas, les deux pages sont en anglais, ce qui serait inapproprié.

Ma recommandation serait en réalité de ne rien faire. Comme le contenu est hébergé sur un domaine .com.sa, Google/Bing/etc. devrait être assez intelligent pour savoir montrer la page saoudienne aux utilisateurs en Arabie saoudite, et la page .com aux utilisateurs ailleurs. La probabilité que cela se produise augmente si vous avez configuré le ciblage international dans Google Webmaster Tools.

Donc, au final, il s'agira toujours d'un contenu en double, il est donc peu probable qu'un utilisateur obtienne les deux pages apparaissant dans un SERP. Mais le bon devrait être mis au jour pour les pays appropriés.

0
nathangiesbrecht

Régler le hreflang dans le .com comme vous le suggérez - <link rel="alternate" hreflang="en-SA" href="company.com.sa/FAQ-page" /> est une solution.

Hreflang est défini page par page. Par conséquent, si la FAQ est la seule page du domaine .sa en anglais, vous devez la définir en-SA uniquement pour cette page. Le moyen le plus propre est de définir hreflang pour l’ensemble du site Web, car c’est la même société. Assurez-vous simplement d’utiliser la bonne langue (définissez toutes les pages anglais sur anglais, toutes les pages arabes sur arabe).

Le fait de définir ces balises sur l'ensemble du site aidera en fait Google à savoir que les deux sites Web sont connectés et que le domaine .sa est destiné aux utilisateurs de SA, tandis que le domaine .com en est la version mondiale.

Une implémentation correcte affichera la version .sa dans le SERP pour les utilisateurs dans SA et la version .com dans le SERP pour tous les autres pays.

Canonical ne devrait pas être ajouté à ces pages, il pourrait en résulter un conflit.

0
ePetkov