web-dev-qa-db-fra.com

Tableau dégradé. RAID 6 avec panne de trois disques

J'ai une matrice de disques avec RAID 6 et 16 disques. Il y a quelques jours, trois disques ont échoué et la baie a été marquée comme dégradée. Je ne peux pas accéder aux données et je ne peux pas démarrer dans le système d'exploitation. J'ai besoin d'accéder aux données mais je ne peux rien faire. Aucun conseil? Comment récupérer ou accéder aux données? Puis-je utiliser un Live CD pour démarrer un système d'exploitation? J'utilise SAS Disk. Merci d'avance

12
Arturo Castro

Comme indiqué précédemment, si plus de deux disques d'une matrice RAID-6 meurent, la matrice est irrécupérable.

Cependant, trois pannes de disque simultanées sont un événement assez improbable: il pourrait très bien s'agir d'un boîtier, d'un fond de panier et/ou d'un contrôleur défectueux.

Vous devriez essayer de retirer et de réinsérer les disques, de remplacer le contrôleur et/ou le boîtier, et même de placer les disques sur un serveur différent avec le même contrôleur (si vous en avez un de disponible).

42
Massimo

Vous ne donnez aucun détail sur le type de serveur, le type de contrôleur RAID ou quoi que ce soit de spécifique.

Essayez de tout éteindre pendant 10 minutes ... Coupez l'alimentation du serveur. Laissez les disques tourner.

Remettez le serveur sous tension et voyez si le contrôleur RAID reconnaît à nouveau les disques et est capable de démarrer.

19
ewwhite

Comme indiqué dans le commentaire, RAID6 peut supporter jusqu'à deux pannes de disque; si un troisième disque tombe en panne, votre baie est grillée.

La chose la plus évidente est de restaurer à partir d'une sauvegarde. Si cela n'est pas possible et qu'au moins un des disques défaillants est toujours lisible (mais avec des erreurs de lecture), vous pouvez essayer de faire une copie de niveau bloc de chaque disque défaillant sur un autre disque sain (par exemple: via ddrescue <failed_disk> <new_disk>) et pour redémarrer la baie en utilisant ces copies (plus les autres bons disques).

Vous terminerez avec un tableau perforé où certaines données originales peuvent être perdues/corrompues; cependant, avec un peu de chance, la plus grande partie des données devrait être accessible.

Si vous ne disposez d'aucune sauvegarde et qu'aucun des disques défaillants n'est lisible, vous devez contacter un service de sauvetage de données.

14
shodanshok
  1. Vous n'avez probablement pas de RAID logiciel, peu importe ce que dit la balise. Vous ne pouvez pas démarrer le système d'exploitation à partir d'un RAID6 logiciel.

  2. 3 disques sur 16 échouant ensemble sont assez rares, sauf lorsque vous déposez le serveur sur le sol. Il s'agit soit de 3 disques défaillant un par un sur une grande période de temps et personne ne le remarque ou d'un contrôleur défaillant, d'un câble défaillant, d'une alimentation électrique défaillante, d'un fond de panier défectueux ou d'un bogue de micrologiciel. Il est important de déterminer quel cas vous avez, car le la stratégie de rétablissement est différente. Il est possible que les journaux du BIOS ou du contrôleur RAID soient accessibles.

  3. Dans les deux cas, vous commencez par sauvegarder chaque disque sur un autre support, en utilisant un contrôleur différent et connu pour fonctionner. Dans le processus, vous verrez combien de disques sont réellement cassés et combien.

  4. La plupart (probablement tous) les contrôleurs RAID matériels sont de la merde. J'ai appris à la dure. Une condition "panne de disque" peut en fait être un seul secteur défectueux et la plupart (voire toutes) les données peuvent être récupérables.

  5. Un tableau "dégradé" est un tableau qui a toujours toutes les données accessibles. Ce que vous décrivez est un tableau "défaillant" ou "hors ligne", plutôt que "dégradé". Si vous n'avez pas d'expérience dans ces domaines, appelez quelqu'un qui EST.

  6. Le démarrage à partir d'un CD de récupération/live peut ou non faire partie du processus. Si vous ne savez pas comment monter un système de fichiers en mode lecture seule, appelez quelqu'un qui sait. Il est possible de tuer une donnée parfaitement récupérable par une telle erreur.


Après de nombreuses nuits blanches, je conçois mes serveurs de telle manière que tout cesse de fonctionner lorsque le PREMIER disque tombe en panne. CECI est le seul message d'erreur que personne n'ignore.

7
fraxinus

Récupérer à partir d'une sauvegarde. Vous ne verrez plus vos données sur ce RAID LUN.

5
RiGiD5

RAID 6 ne peut survivre qu'à deux disques durs défaillants. Si vous n'avez pas de sauvegardes et avez besoin des données, je recommanderais d'embaucher une entreprise de récupération de disque dur. Je n'essaierais pas de récupérer les données par vous-même, car plus vous travaillez sur les disques durs, plus les chances sont grandes que les données ne seront pas récupérables.

2
Joe

en dernier recours (après avoir essayé tout ce que les autres ont déjà publié comme réponse ici), vous pouvez essayer de forcer un lecteur en ligne/non dégradé.

Je viens d'avoir le cas que 3 des 6 très vieux disques durs dans un raid matériel 6 ont échoué. J'ai eu de la chance et j'ai pu récupérer certaines des données:

  1. supprimé 2 disques défectueux
  2. dans les options de mon contrôleur de raid matériel, j'ai forcé le troisième disque défectueux en ligne (non dégradé)
  3. mettre en 2 nouveaux disques
  4. reconstruit le tableau
  5. et maintenant supprimé le dernier disque défectueux

J'ai eu de la chance et je n'ai pas perdu de données pertinentes, mais bien sûr, il y a un risque de corruption/perte de données avec cette approche, mais les données sur le raid sont perdues autrement de toute façon, donc cela pourrait valoir la peine si le contrôleur du raid donne cette option.

0
Zauberfisch