web-dev-qa-db-fra.com

Google a cessé d'indexer mon site. Existe-t-il un substitut pour un sitemap XML?

Sur mon site se trouve une page qui héberge toutes mes entrées d'annonce. Chaque URL et son contenu sont différents. Google indexait toutes les URL différentes jusqu'à l'entrée 4570. Comme je peux le constater dans Google Index GWT, ils ont également arrêté d'analyser les nouvelles entrées (70 000) à ce moment.

J'aimerais comprendre pourquoi Google s'est arrêté. J'ai ajouté un sitemap à peu près à ce moment-là. Le générateur de sitemap ne produit pas les URL d'annonce simples.

Je devais changer un nom de page et mettre une redirection dans mon fichier . Htaccess:

Redirect permanent /aerzte/ http://www.example.de/arzt/

Google s'est arrêté environ une semaine plus tard pour ajouter de nouvelles URL. Une des raisons ci-dessus peut-elle être la raison?

Existe-t-il une solution différente - sans sitemap - pour que Google indexe ces URL?

P.S .: Je peux ajouter des URL avec Google Fetch et ces URL sont immédiatement indexées.

2
user1838185

Si vous ne voyez pas votre site, il semble que vous soyez frappé par une pénalité de contenu de qualité médiocre. C'est pourquoi Google ne vous indexe plus. L'ajout d'URL avec Fetch fonctionnera à court terme, mais si la pénalité en est la cause, je m'attendrais à ce que vous voyiez ces URL disparaître au fil du temps.

La taille de votre fichier sitemap (70 000 entrées) peut indiquer d’autres problèmes. Les fichiers XML individuels doivent être limités à 50 000 entrées. Si votre fichier en contient plus, il se peut que Google refuse catégoriquement d'indexer. Pour vous en assurer, vous pouvez notamment vérifier dans le journal des accès du serveur les demandes relatives à la carte du site et voir si Googlebot le fait toujours.

2
JCL1178

Créez un compte sur Google Webmaster Tools . Dans environ une semaine, ils devraient pouvoir vous dire exactement où se trouvent les pages de problèmes du site sous le statut du domaine en question.

Ils diront des choses telles que "Googlebot n'a pas pu accéder à votre site". ou "Trop de redirections." et ils vont également lister les 404 erreurs qu'ils reçoivent.

Si vous avez apporté des modifications majeures à votre site, ils le mettront en file d'attente pour une nouvelle analyse et recommenceront à zéro (mais cela prend quelques semaines pour que les modifications soient reflétées). Ils indiqueront également leur taux de crawl (que vous devriez pouvoir changer).

Mettre à jour

La plupart des gens ne savent pas que Google indexera toujours votre site en fonction de vos liens internes (et des liens hors site), même si vous ne fournissez pas de plan du site. Un de mes sites est à la première page pour une recherche sur des liens de 1,8 m et je n’ai pas de sitemap à ce sujet.

1
AbsoluteƵERØ