web-dev-qa-db-fra.com

Dans quelle mesure les données sont-elles "brouillées" sur un disque RAID5?

Ma préoccupation est l'élimination d'un disque remplacé à partir d'une matrice de disques RAID5 privée.

J'ai dû remplacer un disque de ma matrice de disques RAID5 personnelle. Il avait commencé à développer des erreurs, donc il est parti.

Mais maintenant, j'ai ce disque posé sur mon bureau et cela m'a fait me demander ... Les données sur la baie n'ont jamais été cryptées. Je crains que le remettre à la station de recyclage puisse être un risque pour la sécurité.
Est-il possible qu'une personne malveillante puisse récupérer des données personnelles (photos, fichiers, etc.) à partir du disque? Ou le fait qu'il faisait partie d'une matrice RAID5 est-il suffisant pour que les données soient brouillées au-delà de la reconnaissance?

40
Mausy5043

Afin de tester cela, j'ai pointé une copie de Foremost sur un disque qui faisait auparavant partie d'une matrice RAID-6 (mis à disposition grâce à Seagate). Le tableau avait une taille de bloc de 512 Ko, donc tout fichier de 512 Ko ou moins est théoriquement présent intact. Les données sur la baie proviennent de près de 25 ans d'utilisation d'un ordinateur, y compris les images de disque de chaque ordinateur que j'ai possédé.

La quantité de données que j'ai récupérées était, franchement, effrayante. Documents Word contenant des devoirs de lycée. Fichiers de données de jeux que j'avais désinstallés il y a des décennies. DLL fichiers d'une centaine de versions différentes de WINE. Images attachées aux publications Usenet non lues. Dix mille pages Web mises en cache. L'ajout d'une règle d'extraction personnalisée a trouvé trois clés privées SSL et une clé SSH.

Une autre chose à noter est que vous n'avez pas toujours besoin d'extraire l'intégralité du fichier pour obtenir des informations compromettantes. Par exemple, les 512 premiers Ko d'un PDF peuvent vous donner la table des matières, les 512 premiers Ko d'un BMP peuvent vous donner une légende (BMP stocke ses les données d'image à l'envers), et les premiers 512 Ko d'un fichier JPEG peuvent vous donner une vignette. Les fichiers MPEG et MP3 sont conçus pour être diffusables, de sorte que même un morceau du milieu peut donner à quelqu'un des données utiles.

Dans quelle mesure les données sont-elles brouillées sur un disque RAID 5? Pas assez brouillé.

35
Mark

Raid 5 répartit les données sur les disques, mais les blocs utilisés pour la répartition sont généralement assez gros. À tout le moins, ce seront des secteurs entiers, mais ils seront normalement beaucoup plus vastes que cela. Par exemple, madm utilise par défaut des morceaux d'un demi-mégaoctet. Même un secteur est assez grand pour que vous trouviez probablement des morceaux de texte recongisables et avec des tailles de morceaux typiques, il est fort probable que des fichiers reconnaissables entiers soient présents sur les disques individuels de la baie.

60
Peter Green

Les sons comme les gens peuvent confondre la taille du secteur de lecteur (généralement 512B à 4KB) avec la taille de bande RAID 5 (généralement 16KB à 128KB, parfois plus grande). La taille de la bande RAID est la taille d'écriture logique pour la baie, de sorte que chaque partie de la bande sur chaque disque contiendra autant de données. Si un fichier entier tient dans la taille de la bande, il sera probablement visible sous forme de bloc contigu sur le lecteur de suppression.

15
Steve Dirickson

Un seul membre d'une matrice RAID 5 se composera de blocs simples et de blocs de parité, par exemple 75% simples et 25% de parité pour une matrice à 4 membres. Les blocs simples peuvent être lus bien en vue; il n'y a pas de brouillage de ces blocs et vous n'avez pas besoin de vous référer à d'autres membres pour le comprendre. La taille de ces blocs est généralement de 16 Ko à 512 Ko, mais avec RAID-5, elle est généralement de 128 Ko ou moins pour minimiser l'amplification d'écriture. Il existe de nombreuses possibilités pour lire des données sensibles qui apparaissent dans de tels blocs simples.

Chaque bloc de parité contient des données générées à partir de trois blocs simples sur d'autres lecteurs, de telle sorte que si l'un de ces trois autres lecteurs (dans un tableau à quatre membres) est perdu, les informations peuvent être récupérées en appliquant un algorithme à la parité bloc et les blocs des deux autres disques restants. Les données d'un bloc de parité n'ont aucun sens et ne pourraient pas être récupérées seules, à moins que vous ne deviniez le contenu de deux des trois autres blocs avec lesquels il se combine - ce qui peut dans certains cas être facile si deux des trois blocs étaient vides (zéros) ou contiennent des données prévisibles. Ainsi, bien qu'il ne soit pas cryptographiquement sécurisé, les informations d'un bloc de parité sont généralement inutiles sans deux des trois autres blocs à partir desquels elles sont générées.

RAID 4 avait une conception similaire à RAID 5, sauf que tous les blocs de parité étaient stockés sur un seul disque, donc si vous n'aviez que ce disque, vous n'auriez pas de données facilement récupérables. RAID 5 a modifié cela pour répartir les blocs de parité de manière égale entre les membres, ce qui signifie que tout lecteur seul contiendra un grand nombre de blocs simples à partir desquels vous pourriez récupérer des données.

8
thomasrutter

Ou le fait qu'il faisait partie d'une matrice RAID5 est-il suffisant pour que les données soient brouillées au-delà de la reconnaissance?

La règle d'or serait de toujours sécuriser les supports magnétiques effaçables avant de les donner dans de telles circonstances (recyclage, donation, etc.). Ne faites aucune hypothèse sur les données sous-jacentes, qu'elles soient chiffrées, qu'elles soient RAID0 ou RAID 5, etc.

Même si la sagesse contemporaine veut que quelque chose soit sécurisé, l'expérience nous a montré que de telles croyances peuvent être invalidées à l'avenir (par exemple, regardez le nombre d'années pendant lesquelles les problèmes de sécurité de Spectre/Meltdown ont été détectés, jusqu'à ce que les chercheurs découvrent comment cela pourrait abuser du comportement des processeurs ).

4
Phylyp

Dans les centres de données où je travaille, nous prenons la sécurité des données très au sérieux. Si le lecteur faisait partie d'une matrice qui n'était pas chiffrée, oui, il y a toujours suffisamment de données qui peuvent être récupérées à partir du lecteur. Je recommanderais honnêtement soit récurage le lecteur s'il est toujours fonctionnel ou s'il n'est pas fonctionnel je recommande démagnétisation le lecteur avec une sorte d'appareil magnétique contrôlé.

2
Terrance