web-dev-qa-db-fra.com

Bad Bot bloquant revisité

J'ai beaucoup lu sur le blocage des robots malveillants, les scripts php, les techniques .htaccess, etc ...

Est-ce une méthode valide?

Puisque .htacces peut réécrire et envoyer un mauvais bot 403 à un refus ou à un élément similaire à du spam, est-il possible d'interdire un dossier, puis de le rediriger vers spampoison via .htaccess dans ce dossier spécifique? Étant donné qu'Apache lit chaque fichier .htaccess indépendamment et suit des instructions spécifiques, un mauvais bot ne respectant pas le fichier robots.txt sera simplement redirigé. Ou toute personne essayant d'accéder,/badbot/ou ce que je choisis d'appeler mon dossier d'interruption.

4
Tom
2
John Conde

Ce que vous suggérez (utilisez un piège contre les robots pour piéger le corps malveillant, puis bloquez-le à l'aide de .htaccess ou de votre langage de script favori) est en effet une technique très utilisée pour traiter les robots du côté obscur.

Vous voudrez peut-être regarder un autre sujet ici à propos de cette technique particulière: Tactiques pour traiter avec des robots qui se conduisent mal

Si vous recherchez un exemple de code qui vous indique comment l'implémenter, utilisez simplement Google pour "piège de bot". Voici une de ces pages: http://www.kloth.net/internet/bottrap.php que j’ai trouvé très instructif.

2
Svartepjotr

Si les robots ne changent pas souvent d'IP, pourquoi les laisser frapper votre serveur et en prendre l'usage? Je voudrais interdire les IPs d'abord dans hosts.deny/ipchains puis utiliser .htaccess et robots.txt comme sauvegarde

1
Anagio