web-dev-qa-db-fra.com

Empêcher l'indexation d'une image ou d'un fichier

Je comprends que vous pouvez faire ce qui suit pour empêcher généralement les images ou les pages d’être indexées.

Ajouter à la méta-section de la page:

<meta name="robots" content="noindex" />

Editez le fichier robots.txt:

User-agent: *
Disallow: /images/

User-agent: *
Disallow: /$folder/whatever.jpg

User-agent: *
Disallow: /$folder/*.gif$

User-agent: Googlebot-Image
Disallow: /$folder/*.gif$

Supposons que vous ayez une page indexée et une image référencée dans une feuille de style (image d'arrière-plan, etc.) ou une image dans une balise img ordinaire,

<img src="/$folder/img.gif" alt="whatever title="yadda" />

Ainsi, selon le fichier robots.txt, le dossier ou l'image spécifique ne doit pas être indexé. Cependant, la page est indexée (pas d'index).

Les moteurs de recherche, dans Googlebot-Image en particulier, honoreront-ils la requête? Indexer la page à l'exclusion de l'image dans une balise img?

Répondra-t-il également à la demande concernant les images d'arrière-plan stylisées?

4
Bob M

Les moteurs de recherche, dans Googlebot-Image en particulier, honoreront-ils la requête? Indexer la page à l'exclusion de l'image dans une balise img?

Oui. Quelle que soit la manière dont l’image est référencée sur votre site (élément img, image d’arrière-plan CSS, etc.), si elle est bloquée par robots.txt, Googlebot-Image ne pourra pas analyser cette image. empêchera très probablement que cette image soit indexée et renvoyée dans la recherche d'images Google.

Si l'exploration des pages est bloquée dans robots.txt, elles peuvent toujours être indexées (et éventuellement renvoyées dans les SERPs) si d'autres pages externes les lient (bien qu'il s'agisse d'un résultat d'URL unique - aucun titre ou description n'apparaît dans la liste). Les SERPs comme les pages elles-mêmes n’ont pas été explorées). Cependant, je n'ai pas vu un résultat similaire en ce qui concerne les images. Si l'image est bloquée par robots.txt, alors elle n'est pas indexée.

Vous pouvez également appliquer la même "balise méta" robots (en particulier l'en-tête de réponse X-Robots-Tag HTTP dans le cas de ressources non HTML) à des images, de la même manière que vous le feriez pour des pages. sera généralement inconditionnel - s’applique à tous les robots et à tous les agents utilisateurs.

2
MrWhite

Je crois que X-Robots-Tag "noindex" est idéal pour ce cas.

Jeu d'en-têtes X-Robots-Tag "noindex"

vous pouvez voir des exemples sur la façon de créer des fichiers noindex png, jp (e) g et gif. C'est spécifiquement pour un fichier Apache .htaccess. L'implémentation serait légèrement différente sur d'autres serveurs - mais vous voyez l'idée.

Si les éléments ne sont pas encore indexés, vous pouvez également résoudre le problème avec un bloc robots.txt. Toutefois, une fois qu’ils sont indexés, vous devrez utiliser un noindex pour les supprimer.

0
Brandon Holtzman