web-dev-qa-db-fra.com

Pourquoi certaines configurations de Nginx bloquent-elles les agents de téléchargement avec Wget?

J'ai remarqué que certaines configurations de Nginx bloquent les agents de téléchargement en utilisant Wget comme ceci:

if ($http_user_agent ~* LWP::Simple|wget) {
    return 403;
}

Pourquoi bloquer Wget? Si j'utilise le code ci-dessus dans ma configuration Nginx, cela empêchera-t-il également le téléchargement de fichiers PDF et d'autres fichiers courants pouvant être téléchargés par des utilisateurs authentiques à partir de mon site Joomla?

3
Neel

Agent utilisateur wget

Blocage de l'agent utilisateur wget bloquera les systèmes d'exploitation qui utilisent wget pour télécharger des fichiers dans le terminal, à savoir Linux, MacOS, Arm etc. Ceci bloquera le téléchargement de tous les fichiers à l'aide de wget example.pdf.

Mais pourquoi bloquer wget?

Il n'y a pas de bonne ou de mauvaise solution à cette question, mais en règle générale, les webmasters veulent que les visiteurs du site visitent leurs pages pour télécharger leur contenu. C'est l'une des nombreuses méthodes de prévention de création de liens à chaud.

Qu'est-ce qui va être bloqué?

Seul l'agent utilisateur wget associé à l'application de terminal, comme décrit précédemment, empêchera tous les types de fichiers, y compris les fichiers .html. Les navigateurs ne seront pas affectés s'ils n'utilisent pas l'agent utilisateur wget, ce qu'ils ne font pas par défaut mais uniquement les utilisateurs avertis, mais les utilisateurs ne bénéficient d'aucun avantage à cet utilisateur, de manière réaliste, aucun blocage ne se produira dans le navigateur de quiconque.

Quand wget est utile

Il n’est pas très utile pour les utilisateurs d’utiliser wget pour télécharger un fichier ou un clip vidéo PDF, sauf s’ils souhaitent le mettre en miroir ou parce que la taille du fichier est très volumineuse et qu’ils veulent le stocker ailleurs. Cependant, cela peut être utile pour des tâches telles que le déploiement de systèmes de gestion de contenu tels que Joomla et Wordpress, qui contiennent plusieurs centaines de fichiers chacun et qui utilisent:

  • wget http://www.example.com/cms.tar
  • tar xvf cms.tar

En effectuant les actions ci-dessus, vous pouvez déployer un système de gestion de contenu en quelques secondes plutôt qu'en quelques minutes, à l'aide de la méthode SFTP ou FTP en raison de la limitation des protocoles. Donc, wget ne devrait pas être utilisé pour des choses telles que les systèmes d’exploitation, les systèmes de gestion de contenu, etc., mais en général, il est inutile pour la plupart des sites Web; le blocage de ces derniers ne devrait donc pas devenir un problème majeur.

3
Simon Hayter