web-dev-qa-db-fra.com

Pourquoi certains agents utilisateurs ont-ils des URL de spam (et pourquoi sont-ils toujours des agents utilisateurs Opera / Presto)?

Si vous visitez (par exemple) les 100 dernières entrées (visites) du site Web botsvsbrowsers.com (lien exact, n'hésitez pas à jeter un coup d'œil: http://www.botsvsbrowsers.com/recent/listings/index .html ), vous remarquerez que presque tous les agents utilisateurs contenant les mots-clés "Opera" et "Presto" contiennent un lien Web (URL/adresse Web), et ils ont gagné t être simplement une adresse Web normale, mais une balise d'ancrage HTML/un lien vers cette adresse. Pourquoi est-ce le cas, je ne pouvais même pas trouver une seule discussion à ce sujet sur Internet, nulle part, j'ai essayé de varier mes termes de recherche plusieurs fois.

Si l'agent utilisateur contient les mots "Opera" et "Presto", cela ne signifie pas qu'il aura ce lien Web, mais cela signifie qu'il y a un changement d'environ 80%. Un tag/lien d'ancrage typique à l'intérieur d'un agent d'utilisateur ressemblera à ceci:

Mozilla/4.0 <a href="http://osis-uk.co.uk/disabled-equipment"> équipement pour personnes handicapées </a> (Windows NT 5.1; U; en) Presto/2.10.229 Version/11.60

Si vous le vérifiez sur le site Web, http://www.botsvsbrowsers.com/recent/listings/index.html vous remarquerez que les flèches avant et arrière sont au format non échappé.

Ce n'est pas seulement vrai pour les botsvsbrowsers, mais pour plusieurs autres sites listant des agents utilisateurs. Je suis vraiment confus et je sens que je suis dans une salle pleine de 10 000 personnes et que je suis le seul à voir ce fantôme :).

Si je fais une analyse statistique, devrais-je inclure ou exclure ce type d’agent utilisateur de ma liste (c’est-à-dire: s’agit-il uniquement d’utilisateurs normaux qui ont configuré leur agent utilisateur pour tenter de générer du trafic vers leurs sites lors de leur navigation sur le Web? ), Ou y a t il quelque chose d'autre? Le fait qu’il soit si cohérent quant à son format me porte à croire qu’il s’agit d’un processus automatisé (définition ou modification de l’agent utilisateur), de sorte que je ne peux ni décider ni comprendre le processus selon lequel cette modification est apportée (je sais comment. changer d’agent d’utilisateur), mais vous ne savez pas quel programme ou installation le fait, d’autant plus qu’il est exclusif aux agents d’utilisateur Opera (Presto) qui sont au-delà d’une version du navigateur de quelque chose comme 8 ou 9 points.

J'ai effectué des tests statistiques, analysé des entrées de partout, écrit des programmes personnalisés pour mieux comprendre cela. N'oubliez pas que les URL habituelles ne figurent que rarement dans les agents d'utilisateur. Il s'agit simplement de texte tel que + http: //www.someSite.com normalement ajouté à un agent d'utilisateur, en particulier si c'est un robot ou un robot qui fournit l'URL de son service. est normal et ne se fait pas avec un lien incorporé (A HREF =) etc., donc je ne parle pas de "ceux".

6
Erx_VB.NExT.Coder

En regardant les robots par rapport aux navigateurs, ils affichent tous les agents utilisateurs qui ont déjà visité leur page. Un polluposteur intelligent s'est rendu compte que ce serait un moyen astucieux de générer du trafic sur leurs sites. En effet, les webmasters et tous ceux qui consultent le site vont probablement se demander pourquoi il existe une URL dans l'agent utilisateur, si c'est une nouvelle spécification ou quelque chose de ce type, et visiter l'URL essayant d'apprendre plus.

L'agent utilisateur d'Opera ne contient pas d'URL , btw. Et bots vs navigateurs répertorie de nombreux autres agents utilisateurs supposés provenir d’autres navigateurs contenant également des URL.

Ces peuvent également apparaître dans les journaux de votre serveur aussi.

Gardez toutefois à l'esprit que beaucoup de robots répertorient les URL dans leur agent utilisateur ( Google le fait , par exemple), afin que les utilisateurs puissent en savoir plus sur leur robot.

7
user6901

Je pense qu’en incluant une ancre HTML complète dans l’agent utilisateur, le spammeur espère simplement que le site Web cible affichera l’agent utilisateur complet non codé (pour que le code HTML soit restitué), éventuellement dans des pages de statistiques non protégées, et bénéficiera ainsi de lien libre.

C'est un principe similaire à spam de référence .

Afficher une chaîne d'agent utilisateur non codée dans la page Web est une erreur de code évidente (vulnérabilité de sécurité), mais il pourrait y avoir suffisamment d'erreurs dans les millions de sites spammés pour que cette astuce soit payante!?

Je ne pense pas qu'ils s'attendent à tirer profit du développeur curieux (où le lien apparaît sous la forme d'une ancre HTML) qui feuillette ses journaux avec désinvolture. "équipement pour handicapés" quelqu'un?!

1
MrWhite