web-dev-qa-db-fra.com

Empêcher Google de voir "svg" comme mot clé de contenu sans utiliser .htaccess

Existe-t-il un moyen simple de faire cela sans utiliser "X-Robots-Tag: noarchive" et le fichier robots.txt? Parce que dans certains forfaits d'hébergement partagé, il n'est pas possible de modifier ce type de valeurs.

J'ai trouvé une solution alternative:

<meta name="robots" content="noindex">

Celui-ci semble également ne pas être valide pour les fichiers svg.

Problème:

enter image description here

2
mirza

Votre problème est pas que les images SVG soient indexées. Les éléments de votre capture d'écran sont des répertoires d'images . Si vous visitez ces URL, vous verrez probablement une liste de fichiers qui se trouvent dans les répertoires. S'agissant de répertoires d'images, la page d'index générée utilise le mot "svg".

C'est une fonctionnalité des serveurs Web appelée "index de répertoire". Si vous avez . Htaccess , vous pouvez le désactiver:

Options -Indexes 

Sinon, vous pouvez télécharger un fichier index.html dans chacun de ces répertoires. Le fichier index.html remplacera la liste de répertoires générée automatiquement. Vous pouvez créer une méta-actualisation du fichier index.html sur la page d'accueil et y insérer une directive noindex:

<!DOCTYPE html>
<html><head>
    <meta http-equiv="refresh" content="0; url=/">
    <meta name="robots" content="noindex">
</head></html>

Je tiens également à souligner que svg en tant que mot clé de contenu n'est pas un problème qui doit être corrigé . Google affiche le rapport sur les mots clés de contenu afin que vous puissiez rechercher le spam. Si vous voyiez "viagra" ou "escortes" sur cette liste, vous sauriez que votre site a été piraté avec du contenu peu recommandable qui y a été injecté.

Tant que les mots-clés contenus dans le rapport de mot-clé de contenu ne sont pas du courrier indésirable, vous ne devez rien faire à cause de cela.

5
Stephen Ostermiller

Si vous n'avez pas accès à noindex htaccess , noindex robots.txt ou PHP X-Robots-Tag , alors malheureusement, vous n'avez pas de beaucoup d'options. Seul Google Search Appliance prend en charge l'utilisation de googleoff et de googleon.

La méthode ci-dessous ne fonctionnera pas, à moins que votre intérêt pour GSA ne fonctionne, votre seule option est de abandonner l’hébergement actuel et de choisir une option fournisseur d'hébergement décent qui vous fournira les fonctionnalités et fonctions nécessaires, auxquelles Google et Bing s'attendent à ce que les webmasters aient accès.

excluant le texte indésirable de l'index

Il est possible que certaines pages Web que vous souhaitez supprimer des résultats de la recherche lorsque les utilisateurs effectuent des recherches sur certains mots ou certaines phrases. Par exemple, si une page Web est composée du texte "la page de conférence utilisateur sera complétée dès que Jim reviendra de congé médical", vous voudrez peut-être que cette page n'apparaisse pas dans les résultats d'une recherche sur les termes "conférence utilisateur". ”

Vous pouvez empêcher l'indexation de ce contenu à l'aide de balises googleoff/googleon. En intégrant les balises googleon/googleoff avec leurs indicateurs dans les documents HTML, vous pouvez désactiver:

  • L'indexation d'un mot ou d'une partie d'une page Web
  • L'indexation du texte d'ancrage
  • Utilisation de texte pour créer un extrait de code dans les résultats de recherche

Exemple de googleoff

<!--googleoff: index-->

<h2>Inline SVG No Index</h2>
<svg xmlns="http://www.w3.org/2000/svg" viewBox="-52 -53 100 100" stroke-width="2">
 <g fill="none">
  <ellipse stroke="#66899a" rx="6" ry="44"/>
  <ellipse stroke="#e1d85d" rx="6" ry="44" transform="rotate(-66)"/>
  <ellipse stroke="#80a3cf" rx="6" ry="44" transform="rotate(66)"/>
  <circle  stroke="#4b541f" r="44"/>
 </g>
 <g fill="#66899a" stroke="white">
  <circle fill="#80a3cf" r="13"/>
  <circle cy="-44" r="9"/>
  <circle cx="-40" cy="18" r="9"/>
  <circle cx="40" cy="18" r="9"/>
 </g>
</svg>
<h2>External SVG No Index</h2>
<img src="example.svg" alt="example">

<!--googleon: index>
1
Simon Hayter