Quelle méta "robots" tag a la préférence?

Question

Ma femme travaille dans un lycée en Allemagne. J'ai récemment remarqué qu'il était extrêmement difficile de trouver la page d'accueil de cette école utilisant Google. J'ai regardé le code source de la page et je pense avoir trouvé la raison: il existe deux balises <meta name="robots">; l'un est

<meta name="robots" content="all">

et le second, plus bas dans la page, est

<meta name="robots" content="noindex, follow">

Mon hypothèse est que le second l'emporte sur le premier et empêche Google d'indexer le site. Ai-je raison? Je ne voudrais pas dire au webmaster que j'ai trouvé le problème et que je me fais idiot (parce que je ne sais pas vraiment comment créer une page Web adéquate, encore moins faire du référencement).

À propos, si vous trouvez d'autres gaffes sur le site, je serais heureux si vous pouviez les signaler. Mon prochain candidat serait le manque total de balises meta pertinentes qui transmettent des informations sur le contenu de la page.

Svartepjotr · Accepted Answer

Alors que Wikipédia en allemand prétend que all est une valeur valide, je ne sais pas d’où provient cette information et Wikipédia en allemand ne cite aucune source. C’est faux, et à mon humble avis, c’est un bon exemple de la raison pour laquelle on ne devrait pas s’appuyer sur Wikipedia pour ce type d’information.

Si vous souhaitez utiliser la balise Meta du robot pour diriger googlebot , la meilleure information à propos des valeurs valides est Google webmasters central . Il répertorie les six valeurs suivantes comme valides: noindex, nofollow, noarchive, nosnippet, noodp, none.

En d'autres termes, pour googlebot :

meta name="robots" content="all">

est une erreur de syntaxe et sera ignoré, alors que:

<meta name="robots" content="noindex, follow">

est une syntaxe valide et sera obéi (ceci explique donc pourquoi il est extrêmement difficile de trouver la page d'accueil de cette école à l'aide de Google).

Pour répondre à votre deuxième question, que se passe-t-il si deux conflits de méta-balises valides , Google indique (même page que celle qui est liée ci-dessus):

Si les valeurs de contenu sont en conflit, nous utiliserons le plus restrictif.

En ce qui concerne les balises méta, voici un aperçu de balises méta reconnues par Google .

DisgruntledGoat · Answer

Le comportement de deux balises méta en conflit n'est pas défini, pour autant que je sache, mais il est fort probable que la règle la plus restrictive l'emporte.

Cela se produit dans le cas similaire du fichier robots.txt et de la balise meta robots. Si robots.txt empêche l'indexation d'une page et que les méta-robots ne le font pas, la page ne sera pas indexée. Et si robots.txt autorise une page mais que les méta-robots la bloquent, elle ne sera toujours pas indexée.

La logique voudrait donc que s’il existe deux balises méta en conflit, si l’une bloque l’indexation, elle remplacera l’autre (indépendamment de leur emplacement respectif sur la page).

Vous devriez demander au webmaster s'il bloque les moteurs de recherche pour une raison particulière. Si ce n'est pas le cas, supprimez les balises méta les deux (la valeur par défaut est d'autoriser les moteurs de recherche, donc aucune raison d'avoir la balise du tout).

En ce qui concerne l’autre partie de votre question, les analyses de site ne relèvent pas de Pro Webmasters. Mais j'ajouterai que la balise meta description est probablement la seule que vous trouverez utile. La balise meta keywords n'est utilisée par aucun moteur de recherche.