web-dev-qa-db-fra.com

Les mauvais backlinks sont-ils à l'origine de milliers d'erreurs 404 et 410 dans les outils pour les webmasters?

Notre compte outils pour les webmasters montre 250 000 erreurs liées à des liens de sites insolites.

Ces URL proviennent pour la plupart de sites inexistants ou sont générées directement par notre site Web.

Voici quelques exemples de ces URL:

oursite.com/&q=videos+caseros+sexo+pornos+gratis&sa=X&ei=R638T8eTO8WphAfF2vG8Bg&ved=0CCAQFjAC%2F%2Fpage%2F2%2Fpage%2F3%2Fpage%2F4%2Fpage%2F3%2Fpage%2F4%2Fpage%2F3%2Fpage%2F4%2Fpage%2F5%2Fpage%2F4/page/3

Notre site est un site espagnol populaire, mais nous ne disposons pas des mots-clés mentionnés dans cette URL. Apparemment, ce lien provient de notre site.

Quelques exemples supplémentaires:

oursite.com/&q=losmejoresvideosporno&sa=X&ei=U__8T-BnqK7RBdjmhYsH&ved=0CBUQFjAA%2F%2Fpage%2F2%2Fpage%2F3%2Fpage%2F2%2Fpage%2F3%2Fpage%2F2%2Fpage%2F3%2Fpage%2F4%2Fpage%2F3%2Fpage%2F2%2Fpage%2F3/page/4

Encore une fois: pas nos requêtes, pas nos URL.

oursite/tag/tetonas

Nous pensons qu'il pourrait s'agir d'un autre site, qui applique une politique de référencement extrêmement mauvais basée sur l'utilisation de la marque et des mots clés d'autres sites:

thirdsite/buscador/tetonas-oursite

La question est: si d'autres sites génèrent ces URL, comment pouvons-nous empêcher cela?

Pourquoi la balise est générée si aucun lien n'a été ajouté à l'autre site?

Que devrions-nous faire avec ces erreurs? 301? 410 sont partis?

J'ai lu tous les Q & R similaires ici, mais aucun ne semble résoudre notre problème. Il est peu probable que ce soit une mauvaise annonce (ils ont tous été inspectés). Peut-être que certains contenus que google a décidé de redéfinir soudainement? Peut-être que les tiers ont une mauvaise politique de référencement? Peut-être tous?

1
Natália

Ces erreurs ne causeront probablement aucun problème pour votre site. John Mueller de Google dit :

Les erreurs 404 sur des URL non valides ne nuisent en aucune façon à l’indexation ou au classement de votre site. Peu importe qu’il y en ait 100 ou 10 millions, ils ne nuisent pas au classement de votre site. http://googlewebmastercentral.blogspot.ch/2011/05/do-404s-hurt-my-site.html

Dans cet esprit, 404 est une réponse très appropriée pour ces URL. Peu importe, le lien est à, votre serveur ne peut pas le comprendre.

410 ne serait pas une réponse appropriée. Cela voudrait dire que vous aviez la ressource et qu'elle est maintenant partie.

Une redirection 301 pourrait être appropriée. Je redirige généralement loin des paramètres de requête inconnus. Vous pourriez envisager de rediriger oursite.com/\&.* vers la page d'accueil. Bien sûr, alors Google le traiterait simplement comme un "soft 404" et il apparaîtrait toujours dans le rapport d'erreur des outils pour les webmasters.

Une autre possibilité serait de rediriger ces requêtes vers votre site de recherche. La redirection de oursite.com/&q=videos+caseros+sexo+pornos+gratis&sa=X&ei=R... vers oursite.com/search?q=videos+caseros+sexo+pornos+gratis afficherait les résultats de tout contenu en votre possession. Ainsi, tout utilisateur réel qui se trouve sur le lien serait heureux. Étant donné que la recherche sur le site doit être bloquée dans votre fichier robots.txt, Googlebot n'explorera aucune des URL après la redirection et ne se plaindra donc plus à propos de 404.

Une autre option pourrait être de simplement bloquer les URL dans le fichier robots.txt. Vous pouvez utiliser une correspondance générique comprise par Googlebot:

Disallow: /*&q=

Les outils pour les webmasters peuvent toujours se plaindre de tous ceux qu'ils ont trouvés avant de mettre cette règle en place, mais Googlebot n'en explorera jamais de nouvelles.

1

Google Webmaster tools avertit contre l'utilisation de 301 pour traiter des URL inexistantes. Ils recommandent de laisser ces 404 et laisser tomber naturellement de l'index de Google.

Aussi frustrant que cela puisse être, je le sais parce que j'ai le même problème. Si vous avez un mauvais lien entrant sur une page que vous avez, cela peut indiquer à Google que ces liens sont réels. Utilisez uniquement un 301 si une page légitime existe et que l'URL a été modifiée, ou 410 si vous avez une vraie page que vous venez de décider de supprimer et de ne pas déplacer.

1
Jimmy

Étant donné qu'ils semblent tous être basés sur des paramètres, vous pouvez essayer d'utiliser fonction Paramètres d'URL dans Outils pour les webmasters pour indiquer à Google de les ignorer.

La plupart des paramètres étrangers ne s'appliqueront probablement pas (comme les ved & ei dans vos exemples). Vous pouvez donc les ajouter et, espérons-le, réduire le nombre de 404 dans vos erreurs d'analyse.

URL Parameters

1
Andrew Lott

Ce que vous ne voulez pas faire, c'est soumettre une liste de 250 000 $ ou plus à l'outil de désaveu de Google. Ils ne le regarderont jamais. D'après ce que j'ai compris, l'outil de désaveu a été surutilisé de toute façon et ne produit pas beaucoup de fruits.

Je recommanderais d'essayer de trouver un motif dans les mauvaises URL. Vérifiez l'onglet "lié à" et voyez quels sites envoient ce mauvais trafic. Nous avons eu mille erreurs qui venaient de 4 domaines au total sur notre site. Dans cette situation, vous pouvez utiliser disavow pour dire à Google "ne faites pas attention aux liens provenant de ce site vers le nôtre".

S'ils proviennent de votre site, Google indexe les résultats de recherche ou les pages de pagination. Vous devez alors probablement utiliser une forme de balise canonique et des solutions similaires, définir vos paramètres d'URL dans GWMT et vérifier les liens internes vers des faux. pages.

Je crains qu'il n'y ait pas de "solution miracle" ici, mais plutôt une myriade de choses que vous devez faire pour démêler lentement ce site. Je serais prêt à parier que votre situation comporte un peu des deux (mauvais liens de dos et problèmes d’architecture.)

0
Jimmy

Les erreurs 404 causées par des liens externes à partir de liens externes ne nuisent pas à votre site Web. Cela a été répété maintes et maintes fois par Google. Ils l'ignorent. Si ce lien n'a jamais existé, ne vous inquiétez pas.

0
Alex Dumitru