web-dev-qa-db-fra.com

Google suit la chaîne JavaScript en tant que chemin relatif - génère une erreur 404

C'est ma première question ici donc j'espère ne pas enfreindre les règles, mais j'ai un problème:

J'ai un site qui utilise Adobe Site Catalyst pour ses analyses en ligne. La suite prend en charge le balisage via JavaScript. Une fois implémenté, il ressemble à ceci: il est placé sur http://www.mydomain.com:

<script language="JavaScript" type="text/javascript">
s.channel="/my-tracking-tag/"
</script>`

Le problème est que Google lit ce code JavaScript et interprète la chaîne s.channel comme un emplacement relatif sur mon site Web et l'explore. Je reçois alors une erreur 404 dans Google Webmaster Tools indiquant que l'URL http://www.mydomain.com/my-tracking-tag/ n'existe pas et qu'elle était liée à l'URL à laquelle le code de balise JavaScript était associé.

Y at-il quelqu'un pour éviter ce comportement? J'ai pensé à ajouter une URL avec une erreur 404 à mon fichier robots.txt, mais les campagnes de suivi sont constamment mises à jour et il serait fastidieux de mettre à jour le fichier texte avec les balises constamment à jour. Je pensais aussi à la structuration de la chaîne dans s.channel comme quelque chose comme 's.channel= "/" + "my-tracking-tag" + "/", mais je ne suis pas sûr que cela résoudrait l'astuce et nécessiterait également l'élaboration de directives de mise en œuvre pour l'avenir.

5
user2587704

J'ai rencontré cela aussi. Il est agaçant que Google rapporte 404 erreurs sur quelque chose que vous ne liez jamais, mais uniquement sur la base de leur heuristique qui trouve des liens dans du code JavaScript.

Ces erreurs signalées ne semblent pas indiquer de problèmes réels qu'il convient de résoudre. John Mueller de Google a posté ceci sur Google + :

  1. Les erreurs 404 sur des URL non valides ne nuisent en aucune façon à l'indexation ou au classement de votre site. Peu importe qu'il y ait 100 ou 10 millions, ils ont gagné ne pas nuire au classement de votre site. http://googlewebmastercentral.blogspot.ch/2011/05/do-404s-hurt-my-site.html
  2. Dans certains cas, les erreurs d'analyse peuvent provenir d'un problème structurel légitime sur votre site Web ou votre CMS. Comment vous dites Vérifiez l’origine de l’erreur d’analyse. S'il existe un lien brisé sur votre site, dans le code HTML statique de votre page, cela vaut toujours la peine de le corriger. (merci Martino Mosna )
  3. Qu'en est-il des URL funky qui sont "clairement cassées?" Lorsque nos algorithmes aiment votre site, ils peuvent essayer de trouver du contenu de qualité supérieure, par exemple en essayant de découvrir de nouvelles URL en JavaScript. Si nous essayons ces "URL" et trouvons un 404, c’est génial et attendu. Nous ne voulons simplement rien rater d’important (insérez ici le mot Googlebot trop lié). http://support.google.com/webmasters/bin/answer.py?answer=1154698
  4. Vous n'avez pas besoin de corriger les erreurs d'analyse dans les Outils pour les webmasters. La fonctionnalité "marquer comme fixe" est uniquement destinée à vous aider si vous souhaitez suivre vos progrès là-bas; cela ne change rien à notre pipeline de recherche Web, alors n'hésitez pas à l'ignorer si vous n'en avez pas besoin. http://support.google.com/webmasters/bin/answer.py?answer=24674
  5. Nous répertorions les erreurs d'analyse dans les outils pour les webmasters par priorité, en fonction de plusieurs facteurs. Si la première page d’erreurs d’analyse n’est manifestement pas pertinente, vous ne trouverez probablement pas d’erreurs d’analyse importantes dans les pages suivantes. http://googlewebmastercentral.blogspot.ch/2012/03/crawl-errors-next-generation.html
  6. Il n’est pas nécessaire de "réparer" les erreurs d’analyse sur votre site Web. Trouver 404 est normal et attendu d’un site Web sain et bien configuré. Si vous avez une nouvelle URL équivalente, il est recommandé d’y rediriger. Sinon, vous ne devriez pas créer de faux contenu, vous ne devriez pas rediriger vers votre page d'accueil, vous ne devriez pas non plus robots.txt interdire ces URL - toutes ces choses rendent plus difficile pour nous de reconnaître la structure de votre site et de la traiter correctement. Nous appelons ces erreurs "soft 404". http://support.google.com/webmasters/bin/answer.py?answer=181708
  7. Évidemment, si ces erreurs d’exploration apparaissent pour les URL qui vous intéressent, par exemple les URL de votre fichier Sitemap, vous devez agir immédiatement. Si Googlebot ne parvient pas à analyser vos URL importantes, elles risquent alors d’être supprimées de nos résultats de recherche et les utilisateurs risquent de ne pas pouvoir y accéder.
7
Stephen Ostermiller

La seule chose qui est impactée par ceci est votre budget d'exploration, donc à moins que ce ne soit des millions d'URL, je ne m'en inquiéterais pas

2
Susan Geraeds Meyer