web-dev-qa-db-fra.com

Blocage de l'analyse du chemin

Je vois dans mon journal d’accès un certain nombre de requêtes très suspectes:

/i
/im
/imaa
/imag
/image
/images
/images/d 
/images/di
/images/dis

Ils se séparent d'une ressource connue (dans l'exemple ci-dessus /images/disrupt.jpg).

Tous venant de la même adresse IP. Les demandes varient de 1/s à 10/s, semble quelque peu aléatoire.
C'est évidemment qu'ils essaient de trouver quelque chose et semblent utiliser un script.

Comment puis-je bloquer ce genre de comportement? Je pensais bloquer la demande IP, au moins pour un temps donné. Gardant à l'esprit que:

  • Les intervalles de requête semblent légitimes (du moins je le pense).
  • Je ne veux pas arrêter de bloquer un bot de moteur de recherche, qui peut également trouver 404 URL (et c'est un problème différent, je le sais). Est-ce qu'ils utilisent toujours la même adresse IP?
1
clinisbut

Finalement, j'ai trouvé qui était le responsable, c'était un javascript qui essayait de charger les ressources en temps réel lorsque quelqu'un écrivait un article.
Tandis que l’utilisateur tapait l’URL d’une image, le script a essayé de la charger même si le chemin n’était pas complet, d’où les 404 journaux.

0
clinisbut

Utilisent-ils toujours la même adresse IP?

Non, on peut s’attendre à ce que les moteurs de recherche utilisent diverses adresses IP - mais ils utilisent toujours le même système autonome (et tous les principaux moteurs de recherche ont leur propre AS).

Si vous avez l'adresse IP, vous pouvez aller à ARIN et utiliser "Recherche WHOIS" dans le coin supérieur droit de la page pour rechercher le système autonome associé à l'adresse IP.

1
danlefree