web-dev-qa-db-fra.com

Tags de titre en double et méta-descriptions après suppression de l'extension .html des fichiers

Google Outils pour les webmasters/Console de recherche me donne des erreurs concernant les balises de titre en double et les méta descriptions.

Le site Web en question est un site Web HTML statique. Tous les documents ont une extension .html. Afin de supprimer le .html de tous les documents, j'utilise le code ci-dessous dans mon fichier .htaccess:

RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^([^\.]+)$ $1.html [NC,L]

Ainsi, par exemple, http://example.com/about.html devient http://example.com/about Maintenant, Google pense qu'il existe deux pages distinctes, même si ce n'est qu'une. Quelqu'un peut-il m'expliquer comment résoudre ce problème?

4
Alex

Si vos URL .html _ étaient déjà indexées au moment où vous les avez modifiées (et que l'extension .html a été supprimée), le seul moyen de préserver votre référencement et d'éviter le contenu dupliqué dès le début est d'implémenter des redirections 301. de l'URL .html à l'URL de votre choix.

(Cela suppose que vous avez remplacé toutes les URL de votre application par les URL "sans extension" de votre choix.)

Quelque chose comme ce qui suit en haut de votre fichier .htaccess:

RewriteCond %{ENV:REDIRECT_STATUS} ^$
RewriteRule (.+)\.html$ /$1 [R=301,L]

La vérification sur REDIRECT_STATUS consiste à éviter une boucle de redirection en s'assurant que la demande réécrite (vers .html) n'est pas redirigée (lorsque la réécriture interne est déclenchée, REDIRECT_STATUS est défini sur 200).


Afin de supprimer le .html de tous les documents, j'utilise le code ci-dessous dans mon fichier . Htaccess

De côté: Je suppose que c'est probablement comme cela que vous le décrivez, mais ce n'est pas ce que fait cet extrait de code. Vous "supprimez le .html" de l'URL en modifiant physiquement les URL dans votre application (pas avec .htaccess). Vous utilisez ensuite .htaccess pour réécrire en interne l'URL dans le chemin d'accès actuel du système de fichiers (avec l'extension .html) - et c'est ce que l'extrait de code contient. Il rajoute l'extension .html, il ne la supprime pas.

2
MrWhite

Attribuons www.example.com/about - est votre URL principale et celle que vous souhaitez indexer dans Google.

Et www.example.com/about.html - est votre URL en double et que vous ne souhaitez pas l'indexer sur Google.

Donc, il y a deux solution parfaite. Vous pouvez utiliser l'un ou les deux.

1) tilisez la redirection 301 de example.com/about.html à example.com/about. Google n'indexera donc que la version finale ou redirigée de l'URL.

2) tilisez l'étiquette de lien canonique sur la section de tête.

Vos pages sont dupliquées, donc votre balise de lien canonique sera la même sur toutes ces pages.

www.example.com/about/
www.example.com/about
www.example.com/about.html
www.example.com/about/index.html

Ainsi, lorsque vous placez la balise de lien canonique ci-dessous, toutes les pages ci-dessus portent la même balise de lien canonique, tout comme le titre/la description de la page Web est identique pour toutes les URL.

<link rel="canonical" href="https://www.example.com/about" />

Donc, ici, Google indexera uniquement cette balise de lien canonique, d’autres pages considéreront qu’il est en double et Google évite de l’indexer.

4
Goyllo