web-dev-qa-db-fra.com

Sitemap multiple: entrées dans robots.txt?

J'ai cherché dans Google mais je ne trouve pas de réponse à cette question.

Un fichier robots.txt peut contenir la ligne suivante:

Sitemap: http://www.mysite.com/sitemapindex.xml

mais est-il possible de spécifier plusieurs fichiers d'index de sitemaps dans le fichier robots.txt et de demander aux moteurs de recherche de reconnaître cela et d'explorer TOUS les sitemaps référencés dans chaque fichier d'index de sitemaps? Par exemple, cela fonctionnera-t-il:

Sitemap: http://www.mysite.com/sitemapindex1.xml

Sitemap: http://www.mysite.com/sitemapindex2.xml

Sitemap: http://www.mysite.com/sitemapindex3.xml
37
user306942

Oui, il est possible d'avoir plusieurs fichiers sitemap-index-file :

Vous pouvez avoir plus d'un Fichier d'index Sitemap.

Mettez en surbrillance par moi.

Oui, il est possible de répertorier plusieurs fichiers sitemap dans robots.txt, voir aussi sur le site sitemap.org :

Vous pouvez spécifier plus d'un Fichier Sitemap par fichier robots.txt.

Sitemap: http://www.example.com/sitemap-Host1.xml

Sitemap: http://www.example.com/sitemap-Host2.xml

Mettez en surbrillance par moi, cela ne peut pas être mal lu, je dirais, donc simplement parlé, cela peut être fait.

Cela est également nécessaire pour les soumissions croisées, pour lesquelles btw. les robots.txt a été choisi.

Btw Google, Yahoo et Bing, tous sont membres de sitemaps.org :

Le plan du site 0.90 est proposé sous les termes de la licence Creative Commons Attribution-ShareAlike et a une large adoption, y compris le support de Google, Yahoo !, et Microsoft.

Ainsi, vous pouvez être assuré que vos entrées de plan de site seront correctement lues par les robots des moteurs de recherche.

Les soumettre via les outils pour les webmasters ne peut pas faire de mal non plus - comme John Muellercommenté .

82
Miltan Chaudhury

Si votre plan de site fait plus de 10 Mo (non compressé) ou contient plus de 50 000 entrées, Google exige que vous utilisiez plusieurs plans de site groupés avec un fichier d'index de plan de site .

Dans votre fichier robots.txt, pointez sur un index de plan de site qui devrait ressembler à ceci:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.example.com/sitemap1.xml.gz</loc>
      <lastmod>2012-10-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap2.xml.gz</loc>
      <lastmod>2012-01-01</lastmod>
   </sitemap>
</sitemapindex>
8
scott

Il est recommandé de créer un fichier d'index de sitemap, plutôt des URL XML distinctes à insérer dans votre fichier robots.txt.

Ensuite, placez l'URL du plan du site indexé comme ci-dessous dans votre fichier robots.txt.

Sitemap: http://www.yoursite.com/sitemap_index.xml

Si vous souhaitez apprendre à créer une URL de sitemap indexée, suivez ces instructions guide de sitemap.org

Meilleures pratiques:

  • Créez un plan de site d'image, un plan de site vidéo séparément si votre site Web contient un grand nombre de ces contenus.
  • Vérifiez l'orthographe du fichier robots, il devrait être robots.txt , n'utilisez pas robot.txt ou toute faute d'orthographe. Mettez le fichier robots.txt en racine directement uniquement.
  • Pour plus d'informations, vous pouvez visiter site officiel de robots.txt .
0
Deepak Mathur