web-dev-qa-db-fra.com

Comment résoudre un reCaptcha à l'avance à l'aide d'un grattoir Web?

Je suis actuellement en train d'essayer de résoudre un reCaptcha. L'une des suggestions reçues était une méthode appelée l'élevage de jetons.

Par exemple, il est possible de gérer des jetons reCaptcha à partir d'un autre site et, dans les 2 minutes, appliquer l'un des jetons cultivés au site que j'essaie de résoudre en modifiant le code du site à l'arrière.

Malheureusement, je n'ai pas pu obtenir d'explications supplémentaires sur la façon de procéder, en particulier en changeant le code du site à l'arrière.

Si quelqu'un est en mesure d'élaborer ou de donner un aperçu du processus, apprécierait vraiment l'expertise.

10
user3259472

L'agriculture et la récolte de jetons ont été décrites ici en détail: https://www.blackhat.com/docs/asia-16/materials/asia-16-Sivakorn-Im-Not-a-Human-Breaking- the-Google-reCAPTCHA-wp.pdf

L'approche pour "l'élevage de jetons" discutée dans cet article est basée sur le mécanisme suivant:

  1. Chaque utilisateur qui visite un site avec recaptcha se voit attribuer un recaptcha-token.
  2. Ce jeton est utilisé pour identifier l'utilisateur lors de plusieurs visites sur le site et pour le marquer comme utilisateur légitime (ou illégitime).
  3. En fonction de divers facteurs comme l'âge du jeton de recaptcha, le comportement de l'utilisateur et la configuration du navigateur, l'utilisateur à chaque visite se voit présenter l'une des différentes versions de recaptcha ou même aucun captcha du tout.

(plus de détails peuvent être extraits de leur code ici: https://github.com/neuroradiology/InsideReCaptcha )

Signifie que si l'on peut créer un grand nombre de jetons frais et propres pour un site cible et les vieillir pendant 9 jours (c'est ce que l'article a découvert), ces jetons peuvent être utilisés pour accéder à recaptcha quelques sites protégés avant de voir un recaptcha .

À ma connaissance, un tel jeton doit être transmis en tant que cookie au site en question.

Cependant, je me souviens d'avoir lu quelque part que Google a comblé cet écart quelques jours après cette présentation

Il existe également très probablement d'autres approches similaires qui ont été qualifiées de "culture symbolique".

Pour autant que je sache, toutes ces approches exploitaient les failles du système recaptcha et ces failles ont été fermées par google très rapidement - souvent même avant que le document ou la présentation ne soit rendu public, car les auteurs responsables informent généralement google à l'avance.

Donc, pour vous, cela n'a probablement qu'une valeur académique ou pour en savoir plus sur la protection appropriée des systèmes captcha et des services basés sur des jetons en général.

mise à jour

Une vérification rapide sur quelques sites protégés par recaptcha a montré que le système actuel brouille maintenant les cookies, mais le recaptcha-token peut être trouvé dans le formulaire recaptcha sous la forme de deux éléments d'entrée cachés avec des valeurs partiellement différentes et l'id = "recaptcha-token".

Lorsque vous visitez une telle page avec un navigateur propre, vous obtiendrez un nouveau jeton de recaptcha que vous pouvez enregistrer et insérer dans le même formulaire plus tard si nécessaire. Du moins c'est la théorie, il est très probable que tous les cookies et certaines choses persistantes à long terme dans votre navigateur vous empêcheront de le faire.

8