web-dev-qa-db-fra.com

Comment ajouter correctement une page d'index à un sitemap xml - ai-je besoin d'une expression canonique?

Lorsque je crée un plan Sitemap XML à l'aide d'un créateur de plan Sitemap en ligne, les éléments suivants sont ajoutés:

<url>
   <loc>http://www.mysite.co.uk/</loc>
   <lastmod>2017-09-26T18:03:59+00:00</lastmod>
   <changefreq>monthly</changefreq>
   <priority>1.0000</priority>
</url>
<url>
   <loc>http://www.mysite.co.uk/index.html</loc>
   <lastmod>2017-09-26T18:03:59+00:00</lastmod>
   <changefreq>monthly</changefreq>
   <priority>0.8000</priority>
</url>

Cela semble ajouter deux fois la même page, car index.html est la même page que le nom de domaine.

Je ne veux pas que Google classe cela en tant que contenu en double

Dois-je ajouter une expression canonique à ma page index.html - comme ceci?

<link rel="canonical" href="http://www.mysite.co.uk/ >

Si je le fais, est-ce que je supprime cette ligne du sitemap?

 <url>
       <loc>http://www.mysite.co.uk/index.html</loc>
       <lastmod>2017-09-26T18:03:59+00:00</lastmod>
       <changefreq>monthly</changefreq>
       <priority>0.8000</priority>
    </url>

Les liens vers ma page d'accueil sur toutes mes autres pages ressemblent à ceci

<a href="/index.html">Home</a>

Dois-je changer ces liens pour qu'ils lisent

<a href="http://www.mysite.co.uk">Home</a>

Toute aide serait appréciée

Merci d'avance

2
Joel

Vous devez résoudre ce problème en "homogénéisant" la manière dont les liens internes sont définis sur l'ensemble du site. Lorsque vous créez des liens internes, vous avez essentiellement deux options: 1) utiliser des chemins relatifs ou 2) des chemins absolus.

Par exemple, le même lien interne peut être défini dans les deux sens, comme suit:

href=“/index.html“ (1)

href=“http://www.example.com/“ (2)

Vous devez décider si vous allez utiliser des chemins relatifs ou absolus. Choisissez un moyen et respectez-le. Assurez-vous d'être cohérent sur tout le site.

Votre sitemap devrait cependant toujours contenir les URL du site Web utilisant des chemins absolus. Dans votre cas, je créerais certainement une et une seule référence à la page d'accueil, même si vous avez créé des liens en utilisant des chemins relatifs vers le fichier (/index.html), vous devez utiliser des chemins absolus ici. .

Pour éviter ce problème, procédez comme suit:

  • décidez entre les chemins relatifs et absolus.

  • si vous choisissez relative, assurez-vous que tous vos liens internes pointant vers la page d'accueil via un menu de navigation, des logos ou tout autre lien interne utilisent href = “/“ au lieu de href = “/ index.html”.

  • corrigez ce problème canonique en créant des redirections 301 à partir de example.com/index.html vers example.com. Une façon de procéder consiste à utiliser le fichier .htaccess si vous utilisez Apache en tant que serveur Web.

Remarque: le créateur de sitemap en ligne que vous avez utilisé est un outil automatisé ou un robot d'indexation Web qui récupérera les URL détectées en fonction de la configuration du serveur Web. .com. Ma recommandation ici est toujours de vérifier les outils de sortie en ligne et dans ce cas, n'hésitez pas à modifier le plan du site en fonction de ce que j'ai dit ci-dessus.

0
Raul Reyes