web-dev-qa-db-fra.com

HP Smart Array P400: comment réparer un disque logique défectueux?

J'ai un serveur HP avec un contrôleur SmartArray P400 (y compris 256 Mo de cache/sauvegarde de batterie) avec un lecteur logique avec disque physique défectueux remplacé qui ne se reconstruit pas.

Voici à quoi cela ressemblait lorsque j'ai détecté l'erreur:

 ~ #/usr/sbin/hpacucli ctrl slot = 0 show config 
 Smart Array P400 dans Slot 0 (Embedded) (sn: XXXX) 
 
 array A (SATA, espace inutilisé: 0 Mo) 
 Lecteur logique 1 (698,6 Go, RAID 1, OK) 
 Lecteur physique 1I: 1: 1 (port 1I: boîtier 1: baie 1, SATA, 750 Go , OK) 
 Lecteur physique 1I: 1: 2 (port 1I: boîtier 1: baie 2, SATA, 750 Go, OK) 
 
 Baie B (SATA, espace inutilisé: 0 Mo) 
 Lecteur logique 2 (2,7 To, RAID 5, échec) 
 Lecteur physique 1I: 1: 3 (port 1I: boîtier 1: baie 3, SATA, 750 Go, OK) 
 physicaldrive 1I: 1: 4 (port 1I: boîtier 1: baie 4, SATA, 750 Go, OK) 
 physicaldrive 2I: 1: 5 (port 2I: boîtier 1: baie 5, SATA, 750 Go, OK) 
 Lecteur physique 2I: 1: 6 (port 2I: boîtier 1: baie 6, SATA, 750 Go, échec) 
 Lecteur physique 2I: 1: 7 (port 2I: boîtier 1: baie 7 , SATA, 750 Go, OK) 
 
 Non affecté 
 Lecteur physique 2I: 1: 8 (port 2I: boîtier 1: baie 8, SATA, 750 Go, OK) 
 ~ # 

Je pensais que j'avais le lecteur 2I: 1: 8 configuré comme disque de secours pour le tableau A et le tableau B, mais il semble que ce n'était pas le cas :-(. J'ai remarqué le problème en raison d'erreurs d'E/S sur l'hôte, même si seul 1 lecteur physique du RAID5 est en panne.

Est-ce que quelqu'un sait pourquoi cela pourrait arriver? Le lecteur logique doit passer en mode "Dégradé" mais être toujours entièrement accessible depuis le système d'exploitation de l'hôte!?

J'ai d'abord essayé d'ajouter le lecteur 2I: 1: 8 non affecté en tant que disque de rechange à la commande logique 2, mais cela n'a pas été possible:

 ~ #/usr/sbin/hpacucli ctrl slot = 0 array B add spares = 2I: 1: 8 
 Erreur: Cette opération n'est pas prise en charge avec la configuration actuelle. 
 Utilisation la commande "show" sur les appareils pour afficher des détails supplémentaires 
 sur la configuration. 
 ~ # 

Il est intéressant de noter qu'il est possible d'ajouter le lecteur non attribué au premier module RAID sans problème. Je pensais que peut-être le contrôleur mettait la baie en état "échoué" en raison de la pièce de rechange manquante et protégeait les baies défectueuses contre toute modification. J'ai donc essayé de réactiver le lecteur logique (pour ajouter le disque de rechange par la suite):

 ~ #/usr/sbin/hpacucli ctrl slot = 0 ld 2 modifie réactiver 
 Avertissement: Toutes les données déjà existantes sur le lecteur logique peuvent 
 ne pas être valides ou récupérables. Continuer? (y/n) y 
 
 Erreur: cette opération n'est pas prise en charge avec la configuration actuelle. 
 Utilisez la commande "show" sur les appareils pour afficher des détails supplémentaires 
 à propos de la configuration. 
 ~ # 

Mais comme vous pouvez le voir, réactiver le lecteur logique, cela n'a pas été possible.

Maintenant, j'ai remplacé le disque défectueux en le faisant correspondre avec le disque non attribué. Le statut ressemble maintenant à ceci:

 ~ #/usr/sbin/hpacucli ctrl slot = 0 show config 
 Smart Array P400 dans Slot 0 (Embedded) (sn: XXXX) 
 
 array A (SATA, espace inutilisé: 0 Mo) 
 Lecteur logique 1 (698,6 Go, RAID 1, OK) 
 Lecteur physique 1I: 1: 1 (port 1I: boîtier 1: baie 1, SATA, 750 Go , OK) 
 Lecteur physique 1I: 1: 2 (port 1I: boîtier 1: baie 2, SATA, 750 Go, OK) 
 
 Baie B (SATA, espace inutilisé: 0 Mo) 
 Lecteur logique 2 (2,7 To, RAID 5, échec) 
 Lecteur physique 1I: 1: 3 (port 1I: boîtier 1: baie 3, SATA, 750 Go, OK) 
 physicaldrive 1I: 1: 4 (port 1I: boîtier 1: baie 4, SATA, 750 Go, OK) 
 physicaldrive 2I: 1: 5 (port 2I: boîtier 1: baie 5, SATA, 750 Go, OK) 
 Lecteur physique 2I: 1: 6 (port 2I: boîtier 1: baie 6, SATA, 750 Go, OK) 
 Lecteur physique 2I: 1: 7 (port 2I: boîtier 1: baie 7 , SATA, 750 Go, OK) 
 ~ # 

Le lecteur logique n'est toujours pas accessible. Pourquoi ne reconstruit-il pas?

Que puis-je faire?

Pour info, voici la configuration de mon contrôleur:

 ~ #/usr/sbin/hpacucli ctrl slot = 0 afficher 
 Smart Array P400 dans l'emplacement 0 (intégré) 
 Interface de bus: PCI 
 Emplacement: 0 
 Numéro de série: XXXX 
 Numéro de série du cache: XXXX 
 État RAID 6 (ADG): activé 
 État du contrôleur: OK 
 Emplacement du châssis: 
 Révision matérielle: Rév E 
 Version du micrologiciel: 5.22 
 Priorité de reconstruction: moyenne 
 Priorité d'extension: moyenne 
 Délai de numérisation de la surface: 15 secondes 
 Notification d'incohérence d'analyse de surface: désactivée 
 Tampon d'écriture Raid1: désactivée 
 Délai d'expiration de l'invite: 0 seconde 
 Carte de cache présente: vrai 
 État du cache: OK 
 Ratio d'accélérateur: 25% en lecture/75% en écriture 
 Cache d'écriture du lecteur: désactivé 
 Taille totale du cache: 256 Mo 
 Cache d'écriture sans batterie: désactivé 
 Source d'alimentation de sauvegarde du cache: Batteries 
 Nombre de batteries/condensateurs: 1 
 État de la batterie/condensateur: OK 
 SATA NCQ pris en charge: Vrai 
 ~ # 

Merci de votre aide à l'avance.

8
TegtmeierDE

La réponse n'est pas agréable. Il y a une forte probabilité que votre baie soit dans un état "en attente de reconstruction", où il y a un autre disque défaillant dans l'ensemble de baies RAID5 qui empêche la récupération de achèvement. C'est pourquoi vous devriez éviter le RAID5 de nos jours . Cela n'aide pas que ce soient des disques SATA ... La probabilité de problèmes est encore plus élevée. Essayez d'éteindre le système (en laissant tourner les disques) et de le rallumer. Suivez les invites à l'écran de la matrice du BIOS et choisissez F2 option pour "réactiver toutes les unités logiques". Cela peut démarrer le processus de reconstruction.

Sinon, c'est une reconstruction/récupération avec de nouveaux disques.

5
ewwhite

Vous devriez démarrer dans ACU et voir exactement ce qui se passe. si l'intégralité du lecteur logique est inaccessible, vous pouvez le réactiver.

0
Kly