web-dev-qa-db-fra.com

L'utilisateur-agent "gce-spider" est-il un arnaqueur bien connu, un mauvais bot?

Mon site Web a été arnaqué en utilisant un "site Web frauduleux" qui vole mon contenu via un proxy et sert le contenu volé à partir de leur propre domaine et remplace mon site dans la technologie "SERP".

Le journal Apache me dit que l'arnaque a commencé avec les entrées suivantes:

185.32.189.38 - - [14/Apr/2017:05:57:32 +0200] "GET / HTTP/1.1" 200 27428 "https://dbwebb.se/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"
185.32.189.38 - - [14/Apr/2017:19:55:46 +0200] "GET / HTTP/1.1" 200 27428 "https://dbwebb.se/" "AppEngine-Google; (+http://code.google.com/appengine; appid: s~gce-spider)"
185.32.189.38 - - [14/Apr/2017:19:55:47 +0200] "GET / HTTP/1.1" 200 24445 "https://dbwebb.se/" "AppEngine-Google; (+http://code.google.com/appengine; appid: s~gce-spider)"
185.32.189.38 - - [14/Apr/2017:19:55:50 +0200] "GET / HTTP/1.1" 200 27428 "https://dbwebb.se/" "AppEngine-Google; (+http://code.google.com/appengine; appid: s~gce-spider)"

Il semble que l'arnaque provienne de User-Agent:

"AppEngine-Google; (+http://code.google.com/appengine; appid: s~gce-spider)"

Ce même agent utilisateur a ensuite visité mon site Web tous les 14 jours jusqu'au 23 juin 2017.

Est-ce que cet utilisateur-agent contient gce-spider un arnaqueur bien connu, un très mauvais bot?

2
Mikael Roos

La première partie de ces agents utilisateurs:

AppEngine-Google; (+http://code.google.com/appengine; appid

indique qu'il s'agit d'un type de logiciel exécuté sur Google App Engine. C'est un agent utilisateur commun.

Il s'agit d'un fragment utilisateur-agent commun que Google ajoute à toutes les applications. Le prochain bit qui suit est le "nom de l'application" individuel choisi par un développeur.

Dans le cas du bot qui frappe votre serveur et vole votre contenu, c'est: gce-spider (parfois, les noms d'applications ont un s~ devant eux aussi)

Il n’ya pas grand-chose de plus qu’on puisse en tirer en regardant l’agent utilisateur.

En effectuant une recherche, elle existe depuis au moins 2016. Si vous êtes sûr que le contenu est volé, vous devez le signaler à Google, en particulier si vous utilisez "GCE" dans son nom d'application (Google Compute Engine). Pour moi, cela devrait être une parole réservée! (dans la mesure où vous ne pouvez pas créer une application Facebook avec le mot "Facebook" car elle semble trompeuse)

3