web-dev-qa-db-fra.com

Création d'un sitemap pour Googlebot - comment marquer un contenu dynamique / des sous-pages dynamiques?

J'ai un site Web qui est un forum Internet. Ce forum comporte de nombreuses catégories et une page de catégorie unique contenant de nombreux sous-pages avec les discussions répertoriées.

Ce forum Internet est tout nouveau et, il y a environ une semaine, je l'ai rempli de quelques centaines de milliers de sujets. J'ai ensuite consulté la page Outils de Google Webmasters pour voir les modifications d'indexation, mais l'index est passé de 300 à environ 1 200, ce qui signifie qu'il n'a pas indexé les fils ajoutés (bien qu'il ait ajouté quelque chose).

Ce qui suit est ce que contient mon sitemap.xml, que j'ai téléchargé sur leur site Web. Bien sûr, il y a beaucoup plus de code, il ne s'agit que d'un extrait de code pour une seule catégorie. Dans mon vrai fichier sitemap, j'ai toutes les catégories énumérées ci-dessous:

<url>
  <loc>http://mysite.com/Forums/Physics</loc>
  <changefreq>hourly</changefreq>
</url>

À présent, je m'attendrais à ce que Googlebot accède à mysite.com/Forums/Physics, explore toutes les sous-pages avec des liens de fil, puis explore l'intérieur de chaque fil et indexe son contenu.

Comment puis-je atteindre cet objectif? De plus, si cela n'est pas clair, je vais ajouter un vrai lien vers mon site web.

1
ojek

Ajoutez simplement ces pages au plan du site. Sinon, vous devrez simplement compter sur Google pour suivre les liens trouvés sur chaque sous-page dans /Forums/Physics. Pour un nombre aussi important de pages, vous souhaiterez qu'il s'agisse d'un processus automatisé. Cela inclut lorsque de nouvelles pages sont ajoutées. StackOverflow et d’autres sites importants le font, car il serait impossible de le faire autrement.

En outre, le fait que vous ajoutiez beaucoup de pages ne signifie pas que Google explore et/ou indexe ces pages. De nombreux facteurs déterminent si du contenu sera ajouté à l'index de Google. Parfois, les pages sont ajoutées lentement, parfois, elles sont ignorées car considérées comme de mauvaise qualité.

Tant que ces pages sont disponibles pour l'exploration et qu'elles ne sont pas de qualité médiocre, elles devraient éventuellement être ajoutées à l'index de Google. Vous ne pouvez pas faire grand chose pour accélérer le processus, mais il sera certainement utile d’obtenir des liens de qualité vers ces pages.

2
John Conde