Comment traiter le contenu en onglets qui réécrit l'URL en termes de référencement?

Question

scénario

Nous avons plusieurs pages qui utilisent des onglets contrôlés par JavaScript. Tout le contenu de la page entière est chargé dans le document HTML, mais certaines parties sont masquées et affichées en fonction de l'onglet actuellement actif. Ces onglets représentent des zones géographiques.

Lorsque vous cliquez sur un onglet, l'URL est modifiée pour correspondre à l'onglet actif. En plus de l'URL mise à jour, les balises <title> et <meta> sont mises à jour correctement. Lorsque vous entrez directement dans une URL, l'onglet approprié est automatiquement sélectionné.

Par exemple:

www.example.com/florida/ - Page principale, aucun onglet actif
www.example.com/florida/jacksonville/ - Contenu spécifique à Jacksonville
www.example.com/florida/miami/ - Contenu spécifique à Miami
etc.

Problème

Google et plusieurs tiers nous avertissent du contenu en double. Nous voulons que chaque URL soit indexée afin que, si quelqu'un recherche "Jacksonville", il trouve cette instance de la page et accède au site avec l'onglet présélectionné. Il est important de noter que ce comportement fonctionne .

Nous craignons maintenant de subir un coup dur pour le référencement en raison du nombre important d'avertissements de contenu "en double" que nous recevons. Ces pages sont dupliquées en termes de HTML brut, mais ne le sont pas les doublons en termes de présentation.

Nous ne voulons pas non plus diviser chaque "onglet" en documents HTML individuels; la commodité et la vitesse des onglets constituent une amélioration mesurable par rapport à notre système précédent qui utilisait un document HTML séparé.

Il semble également que rel="canonical" ne nous aide pas dans notre situation.

Comment pouvons-nous atténuer les problèmes de contenu en double sans interrompre le flux d'organisation/de présentation de nos données afin d'accroître la valeur du référencement?

DisgruntledGoat · Answer

Il est difficile de savoir à quel point c'est préjudiciable. Github fait exactement ce que vous décrivez sur les demandes d'extraction: changer d'onglet modifie l'URL, mais un code HTML presque identique est renvoyé sur chacune des URL. Toutefois, cela n’importe presque pas pour eux, ils n’ont pas besoin que ces deux onglets soient classés séparément dans les résultats de recherche.

Dans votre cas, il me semble que la meilleure solution serait la suivante:

Lorsqu'une URL est demandée, votre serveur répond avec le code HTML uniquement pour l'onglet en cours. Cela garantit que /jacksonville et /miami n'ont pas un contenu dupliqué.
Conservez tous les onglets de la page, mais commencez par les associer à l’URL appropriée (c’est-à-dire que la page jacksonville a <a href="/miami">Miami</a> comme onglet).
Une fois la page chargée, utilisez JavaScript pour "pré-charger" le contenu des autres onglets. Ici, vous pouvez maintenant ajouter des événements de clic aux onglets de manière à ce que leur contenu affiche instantanément le contenu de l'onglet au lieu de devoir charger une page. Vous souhaitez également modifier l'URL dans la barre d'adresse.

L'avantage de ceci est que le site est maintenant plus accessible pour les utilisateurs sans JavaScript.

Max · Answer

Je ne peux pas penser à un moyen d'éviter la duplication de contenu implémentant de la sorte sans perdre également l'avantage du contenu.

Quand je dis perdre le bénéfice du contenu, ce que j'essaie de dire, c'est que vous pouvez charger le contenu via un Iframe (je ne sais pas si vous pouvez le faire ET le charger via JS, mes connaissances ne fonctionnent pas.) aussi loin!). Vous pouvez "masquer" le contenu des moteurs de recherche en le chargeant via une iframe afin qu'il extrait le contenu d'une page différente, puis vous empêchez cette page d'être indexée, via les balises NOINDEX et/ou dans le fichier robots.txt.

Cependant, si vous pouviez le faire, vous perdriez l'avantage de tout ce contenu. Cela dépend donc du point de savoir s'il est important que ce contenu soit indexé et consultable dans les moteurs de recherche? De plus, si ce contenu constitue tout le contenu de la page et qu'il est masqué, la page peut également être affectée par des problèmes de contenu insignifiants si les moteurs de recherche le sont, sauf s'il existe un autre contenu.

Une autre façon de penser est d'utiliser la technologie AJAX. Je suis allé sur certains sites en utilisant AJAX qui permettent de charger le contenu de la même manière que vous le décrivez. Ce ne serait peut-être pas une option envisageable, mais tant que vous suivez Les instructions de Google sur la possibilité de Rendre AJAX Crawlable , cela facilitera le référencement.

Intéressé d'entendre s'il y a d'autres options.

J'ajouterai également que récemment John Mueller de Google réitéré que Votre contenu dans les onglets et le clic à développer peuvent ne pas être indexés ni classés dans Google . Cependant, je ne prendrais pas cela comme un signe pour dire que votre configuration proposée serait exempte de problèmes de contenu en double et ne garantissait pas non plus qu'elle ne serait ni indexée ni classée. Je vois le contenu dans le classement des onglets et le classement n'est pas constant.