web-dev-qa-db-fra.com

Comment compresser un dossier avec beaucoup de doublons, avec le plus haut niveau de compression possible?

Je sais que l'utilisation de tar avec l'option -J permet de compresser un dossier avec un niveau de compression élevé, ce qui donne un fichier tar.xz.

J'ai un dossier contenant plusieurs sauvegardes de mon espace de travail, chacune contenant de nombreuses bibliothèques (.so et .a, etc.) qui sont généralement, mais pas toujours, les mêmes fichiers à être sauvegardés (fichiers dupliqués).

Existe-t-il une méthode permettant de compresser mon dossier de sauvegardes en tenant compte du fait qu’il contient beaucoup de fichiers en double et qu’il en résulte un niveau de compression plus élevé? Passer l'option -J à la commande tar fait-il le travail?

Je ne veux pas m'occuper des fichiers en double dans chaque dossier tout le temps. Existe-t-il un outil intelligent qui considère tous les fichiers en double comme un fichier, puis le compresse? Si non, quel est le meilleur outil et la meilleure option pour compresser un tel dossier?

1
hmojtaba

Vous voulez probablement exclure entièrement toutes les sauvegardes.

Sinon, tout ce qui produit une archive solide doit gérer les fichiers en double de manière assez efficace, donc tar + *, cpio + *, 7-Zip (avec l'option "solid"), RAR (avec l'option "solid") ou un tas d'autres, mais pas Zip.

Vous pouvez facilement tester cela en comparant la taille d'une archive avec exactement un fichier aléatoire à une archive avec deux copies de ce même fichier.

0
David Foerster