web-dev-qa-db-fra.com

Pourquoi ces sites clonent-ils mon contenu et comment puis-je les arrêter?

Je cherchais donc l'un de mes propres sites Web sur Google: http://www.botlibre.com

et à ma grande surprise, j'ai trouvé des clones de mon site, comme:

http://83waystowasteyourtime.adidas.com

et:

http:// mediaiq.astral.comm

Ma question est:

  1. Pourquoi créent-ils des clones de mon site Web? Une sorte de schéma de référencement ou quoi? Quel gain pourraient-ils obtenir?
  2. Comment ont-ils une URL sur adidas.com et astral.comm? Je suppose que ce n'est pas Adidas qui renforce mon contenu.
  3. Comment puis-je fermer ces sites et empêcher les gens de voler mon contenu? (sur Tomcat)
14
James

D'accord. C'est assez étrange, mais pas aussi tragique qu'on pourrait le penser.

Je ne sais pas quel serait le gain. Cela n'a absolument aucun sens pour moi de savoir pourquoi quelqu'un ferait cela. Je ne vois aucun avantage pour le pirate informatique. La bonne nouvelle est que le visiteur atteint votre site. Cependant, il y aura un succès du point de vue du référencement, donc vous voulez résoudre ce problème rapidement.

Je suppose que votre site ne se trouve pas sur un serveur partagé. Par conséquent, si vous accédez à votre site par son adresse IP, il fonctionnera toujours. J'ai testé cela et ça le fait.

83waystowasteyourtime.adidas.com et mediaiq.astral.com sont des sous-domaines utilisant un hack ancien qui permet à quiconque de créer un sous-domaine pour tout domaine non méfiant. Vous pouvez lire à ce sujet ici: http://www.techrepublic.com/blog/it-security/watch-out-for-dns-sub-domain-hijacking/ Il y a plus de sites si vous Google sous-domaine DNS bidouille .

La bonne nouvelle est la suivante. Ce ne sont pas des clones ou des copies de votre site, ils sont votre site. Chaque sous-domaine pointe spécifiquement sur votre adresse IP.

Vous pouvez faire un:

> Dig 83waystowasteyourtime.adidas.com any

et

> Dig mediaiq.astral.comm any

sur n'importe quel ordinateur Linux à voir.

Vous pouvez probablement lutter contre cela, bien que je ne sois pas sûr de la méthode qui fonctionnera:

En supposant qu'Apache soit installé, vous pouvez éditer votre fichier .htaccess dans votre répertoire racine Web et insérer le code suivant.

Ajoutez ce qui suit en haut du fichier pour activer le moteur de réécriture.

RewriteEngine On

Blocage par hôte:

RewriteCond %{HTTP_Host} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

--ou--

Blocage par référent:

RewriteCond %{HTTP_REFERER} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

Vous voudrez les tester et nous dire lequel fonctionne. S'il vous plaît. Il se peut que nous ayons besoin de chercher une autre méthode.

Bien sûr, vous pouvez modifier la règle de réécriture et la rediriger directement vers votre site, avec:

RewriteRule .* http://www.botlibre.com [R=301,L]

--ou--

Envoyez-les en enfer (humour) avec:

RewriteRule .* http://www.hell.com [R=301,L]

... qui est un vrai site. Mais vous leur transmettriez le problème.

Je recommande de les bloquer.

Comme @Martijn l'a mentionné dans son commentaire et qu'il vaut la peine d'être préservé, vous pouvez avoir des liens canoniques par page pour vous protéger. Dans ce cas, le lien pointe vers la page où il se trouve. C'est plus de travail, mais cela semble être une bonne idée ces jours-ci.

<link rel="canonical" href="http://www.example.com/booger-eating-tyrants" />

De même, vous pouvez contacter les propriétaires de domaine parent et les laisser vous rejoindre dans la bataille:

Adidas.com

Admin Name: Albert Pedraz
Admin Organization: adidas AG
Admin Street: Adi-Dassler-Strasse 1
Admin City: Herzogenaurach
Admin State/Province:
Admin Postal Code: 91074
Admin Country: DE
Admin Phone: +49.9132844584
Admin Email: [email protected]

Tech Name: noris.net Hostmaster
Tech Organization: noris network AG
Tech Street: Thomas-Mann-Str. 16-20
Tech City: Nuernberg
Tech State/Province:
Tech Postal Code: 90471
Tech Country: DE
Tech Phone: +49.91193520
Tech Fax: +49.9119352100
Tech Email: [email protected]

Astral.com

Admin Name: Van Tu Duong
Admin Organization: Bell Media Inc.
Admin Street: 9 Channel Nine Court,
Admin City: Scarborough
Admin State/Province: Ontario
Admin Postal Code: M1S 4B5
Admin Country: CA
Admin Phone: +1.5148702477
Admin Phone Ext:
Admin Fax:
Admin Fax Ext:
Admin Email: [email protected]

Tech Name: Van Tu Duong
Tech Organization: Bell Media Inc.
Tech Street: 9 Channel Nine Court,
Tech City: Scarborough
Tech State/Province: Ontario
Tech Postal Code: M1S 4B5
Tech Country: CA
Tech Phone: +1.5148702477
Tech Phone Ext:
Tech Fax:
Tech Fax Ext:
Tech Email: [email protected]
17
closetnoc