web-dev-qa-db-fra.com

Prévenir les moteurs de recherche Indexer les pages 2, 3 et plus?

Savez-vous comment empêcher l'indexation des pages au-delà de la page d'accueil dans WP? Je veux dire que je ne veux pas que mysite.com/page/2, mysite.com/page/3 soit indexé.

C'est parce que j'utilise home.php pour mon thème, de sorte que page/2, page/3 sont tous identiques.

Donnez-moi s'il vous plaît un indice ou un extrait de code s'il vous plaît, je ne veux pas ajouter un autre plugin (robots méta).

1
RichZenMaster

Comment configurez-vous exactement votre page d'accueil? Je pense que le problème vient du fait qu’il ya une pagination non désirée en premier lieu et non cette pagination étant indexée.

En général, le fichier robots.txt est un bon moyen d’empêcher l’indexation en masse. Je pense que cela suivrait la directive dans votre cas (testez-la pour éviter que la pagination ne se produise ailleurs):

User-agent: *
Disallow: /page/
4
Rarst

Si c'est à cause du référencement et des avertissements dans la console de recherche Google, ceux-ci peuvent être ignorés. wp/page2 et ainsi de suite devraient toujours être indexés. La cette réponse et l'article avec la réponse de Google:

Pendant un certain temps, les SEO ont pensé qu'il pourrait être judicieux d'ajouter une méta-balise noindex robots à la page 2, puis à une archive paginée. Cela empêcherait les gens de trouver la page 2 et plus loin dans les résultats de la recherche. L'idée était que le moteur de recherche suivrait toujours tous ces liens, de sorte que toutes les pages liées seraient toujours correctement indexées.

Le problème, c’est qu’à la fin de l’année dernière, Google avait déclaré quelque chose qui avait retenu notre attention: à long terme, le non-index sur une page les mènerait à ne pas suivre les liens figurant sur cette page. Cela fait de l'ajout de noindex à la page 2 et plus loin des archives paginées une mauvaise idée, car vos articles pourraient ne plus obtenir les liens internes dont ils ont besoin.

En raison de ce que Google a dit sur le noindex à long terme, dans Yoast SEO v6.3, nous avons supprimé l'option permettant d'ajouter noindex aux sous-pages d'archives. Les pages 2 et suivantes d'une archive doivent-elles avoir un lien canonique vers la page 1 ou vers lui-même? L'idée était que vous souhaitiez surtout que les visiteurs se retrouvent à la page 1 d'une archive. Cette page est généralement la plus pertinente pour la majorité des utilisateurs.

Google est maintenant très clair: chaque page d’une série paginée doit se canoniser elle-même. Par conséquent,/page/2/pointe de manière canonique sur/page/2 /. C'est pourquoi vous voyez vos archives paginées en cours d'indexation.

Pour en savoir plus, vous pouvez vous référer à cet article - https://yoast.com/pagination-seo-best-practices/

1
Axel Metayer

Si vous essayez d'éviter le contenu en double, vous devez vous pencher sur le problème à la racine. Vous indiquez que votre page d'accueil utilise un modèle home.php. Cela inclut-il du texte statique que vous transmettez à toutes les autres pages à l'aide du modèle d'accueil? Si tel est le cas, supprimez-le ou créez un modèle d'accueil unique qui, honnêtement, devrait être home.php.

si, pour une raison quelconque, vous souhaitez conserver les pages qui affichent le même contenu que votre page d’accueil, mais en utilisant une URL différente, vous pouvez toujours recourir à des textes canoniques.

Si vous remplacez le contenu de votre header.php par ce qui suit, vous pouvez spécifier différents en-têtes, notamment ceux qui incluront un canonique et ceux qui ne le seront pas.

<?php
if (is_page('1')){
    <?php include(TEMPLATEPATH.'/header1.php'); ?>
}
elseif (is_page('2')){
    <?php include(TEMPLATEPATH.'/header2.php'); ?>
}
else {
    <?php include(TEMPLATEPATH.'/headerdefault.php'); ?>
}
?>

Et puis, assurez-vous d’inclure le texte canonique qui fait référence à votre page d’accueil.

<link rel="canonical" href="http://www.yourdomain.com/" />

Cela indiquera à Google quelle est l'URL appropriée du contenu affiché sans avoir recours à un plugin.

Quoi qu'il en soit, tout cela semble un peu bizarre et je crains que je ne comprenne simplement votre demande, car cela ne semble pas avoir de sens. Savez-vous comment le contenu en double fonctionne? Ou est-ce moi qui devrait retourner au lit.

Je ne vois pas le but de créer volontairement de nouvelles pages contenant le même contenu et de chercher une solution pour éviter le contenu en double.

0
Roswell Balentien

Je pense que les méta tags des robots sont ce qu’il faut ajuster. Vous voulez que les araignées aillent à la page 2 et suivent les liens vers vos articles, mais vous ne voulez pas qu’elle indexe réellement cette page (car elle changera). Donc, dans votre header.php, trouvez la méta-balise "robots" et remplacez-la par la suivante:

<meta name="robots" content="follow, <?php echo (get_query_var('paged')==1)?'index':'noindex'?>" />

L'utilisation d'une couverture robots.txt empêchera malheureusement l'araignée de suivre les liens et de ne pas trouver les articles qui se trouvent sur les autres pages.

0
user2810