web-dev-qa-db-fra.com

Gestion des images sur une plateforme wiki ouverte

Je développe une page wiki à l'aide de MediaWiki et il y a plusieurs façons d'intégrer des images dans des pages wiki, telles que les télécharger sur le site Web et les télécharger sur des sites Web externes, ce qui est potentiellement une interdiction et demande à d'autres personnes de placer une image.

Certes, les images peuvent être difficiles à gérer, car un jour, quelqu'un peut télécharger une image vulgaire et beaucoup de personnes la verront ensuite. Comment puis-je m'assurer que les images vulgaires ne passent pas et que les administrateurs ne sont pas marqués à vie après les avoir surveillés?

1
Oliver K

Filtrer des images vulgaires est l’une des choses les plus difficiles à faire et pose des exigences très complexes en matière d’analyse d’images. Le problème ici est que ce qui constitue une image vulgaire est très subjectif et difficile (bien que pas impossible) à détecter et à filtrer.

Il existe un large éventail de méthodes utilisées en ligne et je vais couvrir quelques-unes des méthodes les plus courantes ici ...

  • Lien de rapport sur chaque image
    Dans cette situation, vous présumez que la grande majorité des images chargées sont conformes à l'exigence contre la vulgarité. En gros, au-dessous de chaque image (peut-être juste à côté de la légende) se trouve un lien de rapport qui, lorsque vous cliquez dessus, signalera l’image pour une intervention manuelle du modérateur. Le problème ici est que cela permet aux images de commencer et indique en gros que toutes les images doivent être fiables, sauf indication contraire, et que l'intervention d'un modérateur est toujours nécessaire si un rapport est créé.
  • Bloquer les images sauf des utilisateurs de confiance
    Dans cette situation, vous dites que la grande majorité des utilisateurs ne doivent pas faire immédiatement confiance à leur utilisateur et qu'ils doivent au contraire se créer une sorte de réputation dans la communauté avant de pouvoir publier des images (pensez à quelque chose de similaire au Modèle de réputation SE).
  • Exécuter une numérisation avant ou après publication sur chaque image
    C’est là que les choses commencent à se compliquer et que les coûts commencent à s’impliquer. Essentiellement, avant de publier l'image sur le wiki ou après l'avoir publiée, vous envoyez l'image à un service de filtrage d'images en ligne (tel que API Google Cloud Vision ou WebPurify Image Moderation ). Ces services analysent ensuite l'image et renvoient l'analyse sur la probabilité que l'image contienne ou non des éléments vulgaires. Ils peuvent renvoyer des faux positifs car l’analyse d’image n’est pas parfaite, de la même manière que toute autre machine à apprendre, elle commet des erreurs, et il en découle des coûts qui peuvent s’élever si beaucoup d’images doivent être numérisées quotidiennement, mais en gros ceci serait la seule option de protection contre les images vulgaires. Dans le passé, j’ai réalisé une intégration WebPurify pour un tableau d’affichage qui a décidé de numériser chaque image reçue. Même s’il bloquait parfaitement toutes les images vulgaires, il en résultait un coût élevé, même s’il fallait numériser des milliers d’images par mois. ce qui est une charge improbable pour un wiki à moins que ce ne soit un wiki extrêmement volumineux et de type forum (comme Wikipédia lui-même).

Vous rencontrerez peut-être d'autres problèmes, même potentiellement juridiques, dans la mesure où certaines juridictions disposent de lois et de réglementations concernant les contenus illicites en ligne, et de nombreux fournisseurs d'hébergement appliquent également des règles similaires dans leurs conditions de service, qui peuvent définir l'obligation minimale. Au-delà de la liste que je vous ai fournie, vous devez vérifier auprès de votre site Web et auprès de votre fournisseur d’hébergement s’ils ont des exigences supplémentaires.

Notez également que chacune des méthodes que j'ai énumérées ci-dessus peut fonctionner que les images soient téléchargées sur votre serveur ou chargées sur un autre serveur et liées à celles-ci. L'avantage d'utiliser un autre serveur et d'y créer un lien (comme Imgur) est que votre site Web ne prend pas en charge la bande passante nécessaire à la transmission des images au navigateur. Il contribue donc à réduire la bande passante et à augmenter le temps de chargement du site, car l'image peut être téléchargée à partir de l'autre. domaine en parallèle du contenu de votre propre serveur (la plupart des navigateurs ne prennent en charge que deux téléchargements simultanés d'un serveur à la fois) et contribue également à réduire l'utilisation du disque sur votre serveur, car vous n'avez pas besoin de stocker un grand nombre d'images. sur votre serveur. Que vous hébergiez les images vous-même ou que vous les hébergiez sur un service de téléchargement tiers que les utilisateurs associent aux services de modération des images en ligne peuvent généralement fonctionner avec elles. Certaines nécessitent simplement un lien vers l'image elle-même pouvant être fournie par l'une ou l'autre méthode, d'autres exigent le téléchargement du fichier lui-même. Dans ce cas, vous devez disposer d'un script de travail backend exécuté chaque fois qu'une image est chargée qui envoie un fichier. copie de l’image sur le service de modération, et d’autres (comme Google) n’ont besoin que de la version base64 de l’image que vous pouvez obtenir simplement en convertissant l’image sur votre serveur en base64 ou en téléchargeant l’image du service d’hébergement distant sur votre ordinateur. dossier temporaire du serveur et obtenir le base64 avant de le supprimer à nouveau.

1
Chris Rutherfurd

Si vous autorisez les gens à télécharger des images, vous ne pouvez pas les empêcher de télécharger des images que vous pourriez trouver vulgaires. Si vos administrateurs risquent d'être marqués à vie, modifiez votre modèle afin qu'il n'y ait aucune image ou changez vos administrateurs.

Si vous imposez aux personnes de s'inscrire avant de pouvoir télécharger, vous pouvez interdire toute personne qui télécharge des images inacceptables.

Puis dirigez-vous vers la plage et essayez d’arrêter la marée.

0
Steve

Si vous souhaitez autoriser les images, ne pas autoriser les images vulgaires et ne voulez pas vous fier à la surveillance humaine, votre seule chance est un filtre basé sur l'apprentissage automatique, tel que le Google Cloud API =. En pratique, il est peu probable que les gens passent leur temps à télécharger des images d'attaque sur votre wiki, à moins que ce ne soit très volumineux ou lié à un sujet controversé.

0
Tgr