web-dev-qa-db-fra.com

Comment puis-je dédupliquer mes données avec BTRFS?

J'ai installé Lubuntu 15.04 sur mon ordinateur EEE 701 avec le système de fichiers BTRFS. Je souhaite dédupliquer mes données, mais je ne sais pas comment.

14
wb9688

Commencez par faire une sauvegarde complète afin que, en cas de problème, vous n'ayez rien perdu.

Je crois que vous recherchez duperemove -d

"Duperemove est un outil simple permettant de rechercher des extensions dupliquées et de les soumettre à la déduplication. Lorsqu’on leur donne une liste de fichiers, leur contenu est haché par bloc et comparé les uns par rapport aux autres, en recherchant et en classant les extensions qui se ressemblent. Duperemove soumettra ces étendues à la déduplication à l’aide de l’option btrfs-autant-même-ioctl.

Duperemove a deux principaux modes de fonctionnement dont l’un est un sous-ensemble de l’autre.

Mode lecture seule/sans déduplication

Lorsqu'il est exécuté sans -d (valeur par défaut), Duperemove imprimera une ou plusieurs tables d'étendues correspondantes, qui, selon lui, constitueraient des candidats idéaux pour la déduplication. En conséquence, le mode readonly est utile pour voir ce que duperemove pourrait faire lorsqu'il est exécuté avec '-d'. La sortie pourrait également être utilisée par un autre logiciel pour soumettre ultérieurement les extensions à la déduplication.

Il est important de noter que ce mode n’imprimera pas toutes les instances d’extensions correspondantes, mais uniquement celles qu’il prendrait en compte pour la déduplication.

Duperemove ne s’occupe généralement pas de la représentation sous-jacente des étendues qu’elle traite. Certains d'entre eux peuvent être compressés, subir des entrées/sorties ou même avoir déjà été dédupliqués. En mode déduplication, le noyau gère ces détails et nous essayons donc de ne pas répliquer ce travail.

Mode de déduplication

Cela fonctionne de manière similaire au mode lecture seule, à l'exception du fait que les extensions dupliquées trouvées dans notre étape "lecture, hachage et comparaison" seront réellement soumises à la déduplication. Une estimation du total des données dédupliquées sera imprimée une fois l'opération terminée. Cette estimation est calculée en comparant le nombre total d'octets partagés dans chaque fichier avant et après la déduplication.

Voir la page de manuel duperemove pour plus de détails sur l'exécution de duperemove. "

cela ne semble pas apparaître dans le paquet btrfs-tools mais il y a une page git hub pour cela ici. Les derniers numéros ouverts et fermés (aka Pulse) sont disponibles ici.

Des packages pour toutes les versions actuellement supportées d'Ubuntu peuvent être trouvés dans ce PPA

Je dois répéter que la sauvegarde est fortement recommandée . Voir: https://github.com/markfasheh/duperemove/issues/5

Source citée: https://github.com/markfasheh/duperemove

page de manuel: https://manpages.debian.org/testing/duperemove/duperemove.8.fr.html

14
Elder Geek

J'ai toujours utilisé bedup . C'est très rapide et fiable. Cet outil est aussi mentionné sur page officielle de btrfs . Je n'ai jamais utilisé duperemove (le bedup est plus vieux).

3
Adam Ryczkowski