J'ai configuré Blogger avec le panneau Archive de blog indiqué sur chaque page pour que les utilisateurs puissent accéder facilement aux anciens messages. Le problème est qu’il répertorie le titre de chaque page de ce panneau, ce qui signifie que la page en cours reçoit des mots clés qui ne le concernent pas directement, mais bien sur une page différente.
Par exemple, j'écris peut-être sur les oranges, mais il y a une semaine, je parlais des pommes. Les moteurs de recherche considèrent maintenant que la page sur les oranges parle également de pommes, car le panneau Archives contient un lien menant à mon message de la semaine dernière sur les pommes. L'inverse est également vrai lorsque la page pommes indexe également les mots-clés orange.
Existe-t-il un moyen d’exclure une certaine section d’une page de son index? (Par exemple, comme si vous aviez un <div>
entier portant la mention noindex
ou quelque chose de similaire.)
Je sais que Blogger a la possibilité de supprimer le titre des pages du panneau d’archivage, mais je préférerais qu’elles y restent afin que les utilisateurs sachent quels messages sont disponibles.
Soi-disant, vous pouvez ajouter la classe robots-nocontent
aux éléments de votre page, comme ceci:
<div class="robots-nocontent">
<p>Ignore this stuff.</p>
</div>
Yahoo respecte cela , bien que je ne sache pas si les autres moteurs de recherche le respectent. Il semble que Google ne le supporte pas pour le moment. Je suppose que si vous chargez votre contenu via ajax, vous obtiendrez le même effet s'il n'est pas présent sur la page.
Il n'y a pas de moyen général de le faire et personnellement, je ne m'en soucierais pas. Les moteurs de recherche savent assez bien reconnaître le contenu pertinent sur une page. Même si ce contenu peut figurer dans les mots-clés trouvés par les moteurs de recherche, cela ne signifie pas que la page serait pertinente pour ces mots-clés.
Si vous avez une page sur "Poisson" et une page sur "Chiens" (qui contient le lien vers la page sur "Poisson" quelque part dans la barre latérale), les moteurs de recherche seront généralement en mesure de reconnaître que la page "Poisson" est beaucoup plus pertinent pour "Poisson" que la page sur "Chiens" qui mentionne "Poisson" dans la barre latérale. Il est possible que les deux pages aient été trouvées à un moment donné, mais généralement, étant donné que la plupart des pages du site sont affichées dans les résultats de la recherche, il n’ya pas lieu de s’inquiéter.
Nul besoin de vous en occuper, et les moteurs de recherche risquent de devenir plus confus si vous essayez (par exemple, si vous utilisez JavaScript pour masquer le contenu, vous ne saurez jamais quand les moteurs de recherche commenceront à le trouver malgré tout). De même, l'utilisation d'iframes avec robots.txt interdit ou AJAX dégrade souvent la qualité de vos pages pour les utilisateurs (ralentissez-la ou rendez-la moins utilisable sur divers périphériques). Par conséquent, sauf en cas de problème grave, raison très forte et éprouvée que vous devez faire cela, je vous recommande fortement de ne pas vous embêter avec.
Je pense que vous pouvez utiliser un iFrame et le code qu'il contient ne sera indexé que si vous laissez Google indexer cette page. Donc, si vous mettez un nofollow dans votre fichier robots.txt pour le fichier chargé à partir de l'iFrame, tout devrait bien se passer.
Le texte du mot clé dans un lien est généralement appliqué à la page vers laquelle pointe le lien, pas à la page sur laquelle se trouve le lien. Personnellement, je ne m'en inquiéterais pas trop. Vous seriez probablement moins bien lotis en enlevant/en masquant les titres qu'en les laissant faire.
Google propose sa propre méthode pour exclure les textes non désirés de l'index .
Dans votre exemple, vous avez parlé de l'ancre dans laquelle Google propose cet exemple:
<!--googleoff: anchor-->
<A href=sharks_rugby.html>shark</A>
<!--googleon: anchor-->
Et il y a quelques autres modes.