web-dev-qa-db-fra.com

Comment traiter les doublons de contenu / URL dans Joomla?

Je viens de découvrir un problème majeur de référencement et bien que je l'ait résolu pour le moment; J'essaie de comprendre pourquoi cela a pu se produire et s'il y a eu une erreur ou est-ce que cela a quelque chose à voir avec Joomla lui-même. D'abord le problème:

Lorsque j'ai exploré un site avec Moz, il a montré quatre contenus en double pour la page d'accueil, ce qui était inattendu. Ainsi, par exemple, pour la page d'accueil http://www.foo.com , les URL de contenu en double étaient affichées, comme suit:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

Et tous ces liens chargeaient simplement le contenu de la page d'accueil, mais les méta-détails étaient tirés de l'article. Cela indiquait évidemment que Joomla créait automatiquement les liens et j'ai trouvé la même chose pour les 4 liens. Le lien dans l'article était comme ceci:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

Le Itemid = 1 correspond à l'élément de menu de la page d'accueil, qui explique le chargement de la page d'accueil. J'ai essayé de recréer le problème mais je n'ai pas pu. Selon les personnes qui ont ajouté le contenu, voici les étapes à suivre pour créer ces articles et leurs liens:

  1. Créer des articles
  2. Ajoutez un lien vers d'autres articles en utilisant l'onglet "Article" dans l'éditeur de contenu.
  3. Créer un élément de menu pour les articles

Je me demandais donc si quelque chose n'allait manifestement pas être faux. Je suis confus parce qu'il y a plus de 100 articles, mais cela ne s'est produit que dans environ 5 articles. Merci.

11
sifu

TOC de cette réponse:

  1. Contenu sous le même ID d'article
  2. Comment le contenu dupliqué est-il créé/Pages dynamiques/URL
  3. Perspective de référencement
  4. Traitement du contenu en double dans Joomla
  5. Références et liens

1. Pourquoi les articles sont affichés sous le même itemid

Tout d'abord, ce n'est pas le problème qui explique pourquoi vous obtenez des URL en double. Les articles utilisent l'identifiant d'élément de la page d'accueil, car aucun autre identifiant d'élément ne leur a été attribué.

En savoir plus sur ceci:

Et celui-ci pourrait aussi être perspicace:



2. Comment le "contenu dupliqué" est-il créé/Pages dynamiques/URL

Il s’agit en fait d’un comportement standard pour les sites Web dynamiques qui génèrent leurs pages en utilisant des paramètres d’URL pour construire des chaînes de requête sous la forme de paires Champ-Valeur . Le serveur/l'application recevra la requête, la traitera et renverra le contenu associatif au navigateur.

Pour mieux comprendre cela, vous pouvez désactiver les URL SEF sur un site Web Joomla et étudier un peu l’URL non SEF d’une page:

Exemple:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

En scindant la requête ci-dessus en paires champs-valeurs, nous voyons:

  • option = com_content
  • voir = article
  • id = 3
  • catid = 9
  • Itemid = 101

Ce sont des champs-valeurs que Joomla comprend et qui essaieront de renvoyer le contenu suivant:

Il interrogera le composant com_content et utilisera une vue d'article pour afficher l'élément de contenu (article) avec l'ID 3, de la catégorie 9, à l'aide de l'élément de menu avec l'ID 101.


Nombreuses variations d'URL pour 1 page

Cependant, le même article peut être affiché avec encore plus de combinaisons champs-valeurs:

Certaines combinaisons possibles pourraient être:

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = en
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = fr & print = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = fr & tmpl = composant

Comme vous pouvez le constater, toutes les personnes citées ci-dessus demandent les mêmes données au système, à savoir l'article avec id = 3. Cela conduit au fait que le même contenu/la même page peuvent être consultés via différentes URL et dans certains cas affiché dans différentes mises en page.

* Avec URL SEF activées dans Joomla, les informations ci-dessus pourraient potentiellement être converties en plusieurs URL SEF pour le même article/contenu.



3. La perspective du référencement

Les moteurs de recherche modernes et Google sont particulièrement conscients de ce problème. Habituellement, ils feront de leur mieux pour indexer et conserver dans leurs résultats de recherche l'URL la plus appropriée pour une page. En outre, Google a révélé qu’il n’existait pas de " pénalité " réelle pour les contenus dupliqués.

Cependant, le problème principal dans le cas où le même contenu/page a été indexé plus d'une fois est que vous perdez probablement le classement de la page et le meilleur possible performances SEO , car le classement des pages sera divisé en plus d'une page au lieu de 1.

Dans cet esprit, il est sage de régler ce problème au lieu de laisser les moteurs de recherche indexer les URL tout en essayant de deviner si différentes URL affichent le même contenu ou un contenu différent.
En outre, le contrôle de vos URL et de ce que SE doit indexer peut vous aider à offrir une meilleure expérience utilisateur dans son ensemble, car les utilisateurs du site trouveront la même page sous 1 seule URL standard et produiront une structure plus solide pour un site web et sa gestion.



4. Comment gérer le contenu dupliqué

  • Utilisation d'URL canoniques pour vos pages.
    Canonical Urls indiquera au moteur de recherche quelle est supposée la bonne URL d'une page à explorer et à conserver dans son index.

  • Utilisation de métadonnées INDEX/NOINDEX, FOLLOW/NOFOLLOW. L’utilisation de telles métadonnées dans vos pages indique aux moteurs de recherche si vous souhaitez qu’ils indexent ou non le contenu de une page et de suivre ou non les liens qui s'y trouvent.

  • Utilisation de 301 redirections/htaccess.
    Vous pouvez rediriger toutes les autres URL vers celle de votre choix dans la fenêtre principale. Ceci peut être réalisé avec extensions SEF ou htaccess . Les deux fournissent une grande puissance, cependant, htaccess a une grande flexibilité compte tenu de la possibilité d’utiliser des expressions régulières pour tous types de redirections/ou de réécritures à l’aide de mod_rewrite. En ce qui concerne les extensions J, quand le besoin s’en fait sentir, j’utilise habituellement sh404SEF .

    Mise à jour: Comme l'a souligné @Neil Robertson dans les commentaires: une redirection importante concerne la version non-www du site Web vers la version www du site Web ou vice versa. vice versa. Ajoutez-le au fichier .htaccess pour la redirection non www à www.

        ### Redirect non-www to www
        RewriteCond %{HTTP_Host} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_Host}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Utilisation des outils Google Webmasters
    Les outils Google Webmasters proposent des options permettant de définir le comportement du robot d'exploration avec votre paramètres d'URL .

  • Utilisation des sitemaps
    Soumettez aux moteurs de recherche la structure d'URL de votre site.

  • Utilisation du fichier Robots.txt
    Google et d’autres grandes entreprises respectent votre Robots.txt. Vous pouvez leur demander de ne pas analyser des répertoires/chemins d’URL spécifiques.

Toutes les options ci-dessus peuvent être combinées afin de produire le résultat souhaité.

* Comme partout dans Joomla, une bonne planification et une bonne organisation du contenu aident toujours à atteindre de meilleurs résultats. Surtout avec Joomla, cela implique également une catégorisation de contenu propre et une structure d'éléments de menu.



5. Références et liens

Extensions Joomla SEO

Généralement, dans Joomla, si vous souhaitez gérer cela efficacement, vous devez installer une extension SEO-SEF tierce.



Plus de lecture:

15
FFrewin

Si plusieurs éléments de menu sont associés au même contenu, j'utilise l'alias Liens système/Alias ​​d'élément de menu situé dans le Gestionnaire de menus. Voici un vieil article à ce sujet. mais la méthode existe toujours aujourd'hui: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias =

@Neil, je suis tout à fait d'accord sur le fait que le contenu non-www vs www soit lu en double. Voici le code qui oblige www à être non-www. Placez-le dans votre fichier htaccess. En outre, il ajoute également le protocole de sécurité https. Ce code n'est pas la seule méthode, mais c'est ce que j'utilise avec succès sur de nombreux sites.

RewriteCond %{HTTP_Host} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
0
yaya