web-dev-qa-db-fra.com

Puis-je "masquer" les robots d'exploration sans utiliser les paramètres d'identifiant de session et les redirections pour rechercher des cookies?

Je surveille mes utilisateurs à l'aide de paramètres GET pour pouvoir le faire même s'ils n'autorisent pas l'utilisation de cookies. Et pour ce faire, je dois effectuer 2 redirections la première fois que l'utilisateur clique sur ma page.

J'ai quelques problèmes (Googlebot nécessite 19 redirections) et j'ai trouvé que vous ne pouvez pas utiliser l'ID de session pour les robots d'exploration dans les paramètres GET, il est donc recommandé de détecter si l'utilisateur est un robot et, dans ce cas, ne redirigez pas et n'utilisez aucun identifiant de session.

Je peux le faire parfaitement mais ... Google ne détecterait-il pas que la redirection est faite pour les humains et non pour Googlebot? Et si tel est le cas, cela ne serait-il pas considéré comme du cloaking?

Que devrais-je faire?

3
Kenny Lajara

"Cloaking" dans cette situation serait bien. Lorsque l'agent utilisateur contient bot|crawl|Slurp|spider, vous ne devez ni utiliser les paramètres d'identification de session ni rechercher des cookies. Vous fournissez le même contenu aux utilisateurs et aux robots. Google n'aura pas de problème avec ce manteau particulier.

J'utilise une technique similaire pour décider d'utiliser ou non l'URI de données pour les images de mon site. Je traite tous les robots de la même manière que IE 7 et versions antérieures, qui ne peuvent pas gérer les URI de données. Techniquement, c'est un cloaking, mais tous les bots obtiennent les mêmes données et afficheraient les mêmes pixels sur l'écran que les utilisateurs. Ils obtiennent simplement ces données par différents moyens techniques.

Il pourrait également être intéressant d’explorer différentes manières de traiter le problème. Si c’était mon site, je pourrais créer des cookies, puis utiliser JavaScript comme suit sur les liens: onclick="if(!document.cookie.indexOf('session')this.href+='?session=abcdef1234';" Googlebot n’exécute pas le clic en cliquant sur les liens suivants. Il serait donc toujours en mesure d’analyser votre site sans paramètres.

Lorsque vous utilisez des paramètres de session, vous devez vous connecter à Google Search Console et indiquer à Google de les ignorer. Ouvre l'outil de paramètres d'URL ou affiche la documentation des paramètres d'analyse . Vous voudrez ajouter votre paramètre de session et le régler sur "N'affecte pas le contenu de la page (par exemple, l'utilisation de la piste)".

1