web-dev-qa-db-fra.com

Comment trouver le chemin sitemap.xml sur des sites Web?

Comment trouver le fichier sitemap.xml des sites Web?

par exemple. Aller à stackoverflow/sitemap.xml me procure un 404. 

Dans stackoverflow/robots.txt est écrit ce qui suit:

"techniquement, cela n’est pas valable car, pour une raison bien foutue les chemins d'accès aux sitemap doivent être ABSOLUS et non relatifs. Sitemap: /sitemap.xml"

37
jacktrades

Je ne pense pas qu'il existe une norme quant à l'emplacement du plan du site. C'est pourquoi vous devez spécifier une URL arbitraire dans votre sitemap lorsque vous en ajoutez une à l'aide des outils pour les webmasters de Google.

15
maksimov

Il n'y a pas de standard, donc il n'y a pas de garantie. Cela dit, il est courant que le sitemap soit auto-étiqueté et à la racine, comme ceci:

example.com/sitemap.xml

La casse est sensible sur certains serveurs, alors gardez cela à l'esprit. Si ce n'est pas là, regardez dans le fichier robots à la racine:

example.com/robots.txt

Si vous ne le voyez pas dans le fichier de robots, dirigez-vous vers Google et recherchez ceci:

site:example.com filetype:xml

Cela limitera les résultats aux fichiers XML de votre domaine cible. À ce stade, ses essais et erreurs et basés sur les spécificités du site Web avec lequel vous travaillez. Si vous obtenez plusieurs pages de résultats à partir de la phrase de recherche Google ci-dessus, essayez de limiter davantage les résultats:

filetype:xml site:example.com inurl:sitemap

ou

filetype:xml site:example.com inurl:products

Si vous ne parvenez toujours pas à le trouver, vous pouvez right-click > "View Source" et faire une recherche (ou "control find" ou Ctrl + F) pour .xml afin de voir si le code contient une référence.

89
Kirkland

L'emplacement du plan Sitemap affecte les URL qu'il peut inclure, mais sinon, il n'y a pas de standard. Voici un bon lien avec plus d'explications: http://www.sitemaps.org/protocol.html#location

3
Johan Falk

Selon la documentation du protocole , il existe au moins trois options que les concepteurs de sites Web peuvent utiliser pour indiquer l'emplacement de sitemap.xml aux moteurs de recherche:

  • Informer chaque moteur de recherche de l'emplacement par le biais de l'interface fournie
  • Ajout de l'URL au fichier robots.txt
  • Envoi d'URL aux moteurs de recherche via http

Ainsi, à moins d'avoir choisi de publier l'emplacement du sitemap sur leur fichier robots.txt, vous ne pouvez pas savoir vraiment où ils ont placé leurs fichiers sitemap.xml.

2
Jens

Utilisez les opérateurs de recherche Google pour le trouver pour vous

recherche google avec le code ci-dessous ..

inurl: domain.com type de fichier: xml

remplacez domain.com par le domaine dans lequel vous souhaitez trouver le plan du site. Cela devrait lister tous les fichiers XML listés pour le domaine donné .. y compris tous les sitemaps :)

0
Rejneesh Raghunath