web-dev-qa-db-fra.com

DMCA a supprimé une page de Google. Ses liens entrants sont-ils toujours utiles?

Ok voici ce que je crois être une question délicate:

Donc, vous avez un site Web où une suppression DMCA a été effectuée contre un message qui a généré un trafic énorme, la suppression DMCA peut ou peut ne pas avoir été correcte mais je n’ai ni le temps ni les ressources pour le combattre en ce moment.

Ma question, la page qui a été publiée avec la suppression de DMCA a depuis été masquée dans le SERPS, MAIS le message reste toujours sur mon blog - car il a reçu une telle quantité de trafic qu'il a généré une quantité considérable de backlinks de haute qualité. ..ainsi qu'advient-il de ces backlinks, la page est toujours sur le site, mais supprimée (cachée) dans la base de données Google, les backlinks ont-ils encore du poids ...?

EDIT 1: Lors d'une recherche google sur le lien, les éléments suivants sont affichés:

En réponse à une plainte que nous avons reçue en vertu de la loi américaine Digital Millennium Copyright Act, nous avons supprimé 1 résultat (s) de cette page. Si vous le souhaitez, vous pouvez lire la plainte DMCA qui a provoqué le (s) retrait (s) sur LumenDatabase.org.

EDIT 2 L'ancien site d'où provient cette publication existe depuis des mois et a toujours un rel canonical pointant vers la publication du blog sur mon site, désormais publié avec DMCA ... Cependant, le rel canonical a été ignoré depuis sa publication avec DMCA bien que le rel canonical reste dirigé vers mon site ... pour ce que cela vaut

9
Timothy Coetzee

D'accord. Ce sera l’un des cas où je travaillerai tout au long du processus afin que cela devienne plus clair. Ce sera un peu long, mais pas trop long, espérons-le.

Commençons par le début, allons-nous?

Partant de ce que nous savons de la manière dont Google fonctionne à partir du rapport de recherche rédigé par Brin et Page en 1997, nous connaissons certaines choses qui sont probablement encore d'actualité.

Google a une URL dans l'index et la file d'attente de récupération et extrait la page. Le code de la page est stocké dans sa base de données pour diverses formes de traitement. Un des processus serait de trouver de nouveaux liens. Tout lien trouvé par Google sera tout d'abord situé dans l'index des liens, s'il existe. Si ce n'est pas le cas, le lien sera ajouté à la table des liens et à la file d'attente de récupération.

Tout lien dans la table de liens comporte au moins ces éléments, l'URL du lien, l'URL source et le texte du lien. Il est probable qu'il existe d'autres éléments de données, mais ceux-ci ne font pas avancer la discussion. Tout lien ajouté à la table des liens contient l'URL source vérifiée, mais pas nécessairement l'URL cible. En prenant comme exemple les bases de données relationnelles, les URL source et cible pourraient être un ID URL au sein de la table d'URL et une table de jointure rejoindrait l'URL source de la table des liens et les éléments de l'URL cible en utilisant un ID vers la table d'URL. Confus? Ne sois pas.

Dans les cas où la page cible n'a pas été extraite, le lien dans la table des liens est dit lien suspendu. Une fois la page extraite, le lien dans la table des liens est terminé. Si la page cible n'existe pas, le lien dans la table des liens est un lien brisé. Simple?

Seuls les liens complets peuvent transmettre une valeur. L'algorithme PageRank nécessite un lien complet pour calculer la valeur. Tous les liens qui pendent et qui sont rompus arrête tout calcul utilisant le lien. Auparavant, la RP était un processus récursif qui calculait les valeurs de lien en utilisant le tableau de liens jusqu'à ce que la valeur pouvant être ajustée à un lien quelconque tombe dans une valeur numérique si petite qu'elle ne fera réellement pas une différence. Je suis sûr que cela se produit encore comme un processus de ménage. Cependant, la PR actuelle est calculée à l'aide d'une autre méthode similaire à celle du houblon dans un réseau qui mesure la distance d'une page à une autre avec une importance relative. Il est basé sur le modèle de réseau de confiance, qui explique comment le modèle PageRank original a été conçu. Un lien est un vote de confiance d’une entité à une autre. Bien que cela devienne plus compliqué que cela, vous obtenez l'image. Il fait effectivement la même chose que le processus récursif en utilisant un calcul plus en temps réel mais probablement moins précis mais suffisamment précis pour être fiable. Cela nécessite des liens complets car les valeurs de confiance (utilisant le modèle de réseau de confiance) ne peuvent pas être transmises si la confiance n'est pas établie. N'oubliez pas qu'un lien est un vote de confiance ou un lien dans le modèle de réseau de confiance. Le classement PageRank est représenté comme une valeur de confiance dans un réseau de confiance.

Maintenant que vous comprenez les liens et leur importance, passons à autre chose.

Pour un moteur de recherche, il n’a aucun sens de supprimer une URL. Si une URL n'existe pas dans la table d'URL, vous ne pouvez rien savoir de l'URL et vous perdriez votre temps. Les URL ne sont généralement pas supprimées, sauf indication contraire, par exemple, si l'URL n'existe plus. Cependant, lorsqu'une page est définie sur NOINDEX, le moteur de recherche a été explicitement invité à NOT TO indexer la page. Dans la mesure où une page Web au sein de l'index se compose de deux éléments, une URL et le code source HTML, NOINDEX supprime efficacement la page à ce stade. Les liens vers une page NOINDEX sont au moins pendants.

Maintenant que vous savez à quoi ressemble une page indexée, allons plus loin.

Un moteur de recherche pénalise une page Web ou un site de plusieurs manières. L'un est la radiation. C’est la plus sévère de toutes les sanctions et il faut beaucoup de temps pour la récupérer. Vous pouvez prouver cette catégorie de pénalité car la page ne sera pas et ne pourra pas être trouvée. De plus, la console de recherche de Googles vous indiquera que les pages ont été retirées de la liste. Parmi les pénalités restantes, les pénalités sont appliquées dans les filtres SERP.

Lorsqu'une requête de recherche est effectuée, plusieurs requêtes sur l'index en même temps sont ensuite fusionnées dans un jeu de résultats basé sur une partie de l'algorithme. L'algorithme restant, que nous appelons souvent une seule entité, est une série d'algorithmes relativement simples SERP. Les principaux algorithmes réorganiseront le jeu de résultats en fonction de métriques plus en temps réel telles que les tendances. Parmi les algorithmes, ceux qui suppriment des entrées du jeu de résultats ou dégradent sérieusement l'emplacement d'une entrée dans le jeu de résultats sont appelés filtres. Le filtre qui gère DMCA est appliqué, comme en témoigne ...we have removed 1 result(s) from this page...

Alors maintenant que vous savez comment les pénalités sont appliquées, les filtres liens, PR et DMCA sont-ils connectés?

Avec cela, nous savons qu'un filtre a été appliqué, cependant, cela n'a rien à voir avec l'index de lien qui est la façon dont le PageRank est calculé. Il est aussi éloigné du processus de lien/PR que possible. Les liens et les relations publiques sont au début du processus d’indexation, tandis que la suppression de la page pénalisée DMCA se situe à la fin du processus de requête. En fait, ce sont deux moteurs complètement séparés. Ainsi, bien qu'une page puisse être supprimée en raison d'une plainte DMCA, elle n'est pas réellement supprimée de l'index et, par conséquent, les liens vers et depuis la page sont toujours calculés.

Clair comme de la boue? J'espère que j'ai bien expliqué cela. S'il vous plaît laissez-moi savoir si je peux clarifier quelque chose pour vous.

[Mettre à jour]

Une exception qui ne s'applique pas au scénario du PO.

@StephenOstermiller soulève un bon point qui ne remet pas en cause ce qui précède, mais je voudrais l’ajouter par souci de complétude.

Comme vous le savez bien, le classement d'un site ou d'une page dans une recherche nécessite de nombreux facteurs. Bien que ce ne soit pas aussi technique ou mystique que vous pouvez l'imaginer, il reste encore beaucoup de facteurs à prendre en compte. J'ai oublié l'effet des scores de confiance principalement parce que cela ne s'appliquait pas dans le cas du PO. Donc, je l'ajoute ici.

Il est clair qu'il existe des sites qui ne valent rien, tels que les sites de spam. Dans cette classification, les sites sont des utilisateurs abusifs habituels du contenu protégé par le droit d'auteur. C'était un énorme problème il y a de nombreuses années, où les scrapeurs de contenu créaient des sites en dehors de votre travail acharné. Pendant longtemps, rien n'a été fait. Les sites au contenu original perdraient les sites de racleurs de manière assez cohérente. Je devrais le savoir. J'ai eu deux sites PR 8 qui ont perdu presque tout son trafic en raison de sites de raclage sans aucun recours.

Cependant les choses ont changé. Et cela ne fait que quatre ans environ que les changements importants ont commencé.

Pour cette classification spéciale de sites, le score de confiance des sites peut être considérablement réduit. Ceci est bien connu. Il faut des années pour reconstruire les niveaux de confiance et pour certains sites, cela peut ne jamais arriver. Pourquoi, par exemple, pensez-vous que les monétiseurs de domaine sont si disposés à détruire complètement un site avec des centaines de milliers de personnes en attente du même abus? C'est parce que la réalité est qu'un domaine peut ruiner sa valeur au-delà de la rédemption.

De nombreux facteurs sont pris en compte pour établir la confiance. Je ne vais pas entrer dans cela ici. Cependant, sachez que la confiance est un élément majeur de la construction de rang pour n’importe quel site.

Cela dit, pour tout site violant gravement les antécédents du DMCA, le score de confiance serait sérieusement touché. Ce n'est pas le scénario décrit par le PO. Cependant, c'est le scénario que je suppose ici.

Les liens et l'établissement de PageRank ont ​​plus d'un composant. On est PageRank (autorité) de la page elle-même. Pour les pages faisant autorité, il existe un plafond d'autorité. Une page PR 8 ne partagera pas une valeur de 8 parmi les liens de cette page. Cela fait partie de l’algorithme original PageRank destiné à donner une courbe plus naturelle à PR. Sinon, il serait presque impossible pour une nouvelle page de concurrencer une page avec une haute autorité, même après une longue période. La valeur du lien lui-même est évaluée à l'aide de plusieurs facteurs, notamment la valeur sémantique du texte du lien, l'URL du lien, l'emplacement du lien (visibilité), la valeur sémantique du bloc de contenu contenant le lien s'il s'applique, etc. Tous les liens sont marqués de 0 à 0,9. Le calcul du score d'autorité et de lien est la valeur transmise par n'importe quel lien.

Bel et bien. Alors, comment cela affecte-t-il un site qui enfreint de manière significative le DMCA?

La valeur de tout lien entrant ne serait pas nécessairement affectée par le score de confiance du site cible puisque la valeur des liens provient du site source. Cependant, tout lien sortant pourrait être. Le score de confiance affecte l’autorité de tout site qui est un abuseur majeur de DMCA. Après tout, l'autorité vient de la confiance. Ainsi, de cette manière, la valeur d'un lien entrant ne serait pas transmise par des liens sortants sans être dégradée, en fonction du score de confiance.

Cela change quelque peu la réponse.

Bien que cela ne s'applique pas au scénario du PO, il existe un scénario dans lequel une valeur de lien entrant n'est pas complètement transmise à travers le site avec une violation DMCA. Cependant, il s’agit d’un cas difficile et, par conséquent, le seuil avant que cela se produise est important.

7
closetnoc

HAHA ​​ Je pense que je comprends parfaitement cette question maintenant: /

C’est VOUS qui avez reçu la notification, le lien vers VOTRE site est masqué dans la recherche GOOGLE, le FICHIER est toujours sur VOTRE site et de nombreux AUTRES LIENS pointant vers VOTRE site, et CES LIENS pèsent lourdement sur VOTRE site Sur Google, en vous connectant à VOTRE site ET aux LIENS, vous trouverez l’information de la mention OMITÉ au bas de la recherche de Google. : P Ai-je raison?

À la lumière de cela -

Mes réponses originales aurait été d'une grande aide pour les personnes qui déposent les avis de retrait DMCA OH! -drumroll

Alors voici ma réponse: Non et non, non!

Ces liens spécifiques ne sont fondamentalement pas fiables et vous devriez vous inquiéter du fait qu’ils pointent toujours sur votre site. Vous pourriez aussi bien faire le mouvement de désaveu et vous protéger. Pour de vrai.

En outre, ce sont les autres propriétaires de site qui devraient être plus concernés et pourquoi l’audit de vos backlinks peut être très important. Une histoire de ce type d'association dans laquelle l'auteur publie ce type de liens aura de mauvais effets sur eux.

Vous pouvez envisager de faire savoir aux autres personnes qu'elles ont de mauvais liens de contenu pointant vers VOUS et pouvant leur nuire.

Honnêtement, ce type de contenu ne vaut pas la peine d’avoir pour vous ou pour eux et vous ne devriez jamais vous fier à ces types de liens pour améliorer votre référencement.

Les décisions à court terme peuvent avoir des effets à long terme.

Je me demandais pourquoi vous laissiez filtrer des informations un peu à la fois.

2
norcal johnny

Question interessante. À mon avis, aucune équité ne sera transmise par les liens retour, car la page ne sera ni explorée ni indexée par Google car elle a été supprimée de sa base de données. Je pense que Google explore toujours les pages Web non indexées. Cependant, je ne sais pas si cela diffère lorsqu'une page est supprimée de la base de données de Google, même si elle se trouve toujours sur le site.

1
Sean Lloyd-Clarke