web-dev-qa-db-fra.com

Est-ce que mon disque dur échoue?

J'ai juste essayé d'exécuter un test sur mon disque dur et il ne veut pas remplir un test automatique. Voici le résultat:

smartctl --attributes --log=selftest /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-32-generic] (local build)

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       697
  3 Spin_Up_Time            0x0027   206   160   021    Pre-fail  Always       -       691
  4 Start_Stop_Count        0x0032   074   074   000    Old_age   Always       -       26734
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       28
  9 Power_On_Hours          0x0032   090   090   000    Old_age   Always       -       7432
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3186
191 G-Sense_Error_Rate      0x0032   001   001   000    Old_age   Always       -       20473
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       84
193 Load_Cycle_Count        0x0032   051   051   000    Old_age   Always       -       447630
194 Temperature_Celsius     0x0022   113   099   000    Old_age   Always       -       34
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       16
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%      7432         92290592
# 2  Conveyance offline  Completed: read failure       90%      7432         92290596
# 3  Conveyance offline  Completed: read failure       90%      7432         92290592
# 4  Short offline       Completed: read failure       90%      7431         92290596
# 5  Extended offline    Completed: read failure       90%      7431         92290592

Donc, ce disque échoue-t-il?

42
Michel

Votre lecteur est très heureux de faire un autotest; Du résumé, il en a fait plus de cinq d'entre eux au cours de la dernière heure. Et tous ont échoué, tôt dans le test, avec des erreurs de lecture.

Oui, ce disque dur échoue. Comme le dit le célèbre rapport Google Labs a déclaré (bien que je ne puisse pas mettre ma main sur un lien à ce moment-là), si smartctl dit que votre lecteur échoue, c'est probablement (i paraphrase).

Edit: N'essayez pas de l'enregistrer. Obtenez toutes les données de votre part et remplacez-la.

43
MadHatter

Pour répondre à votre question, un échec =SMART est une indication Serfire d'une défaillance d'un lecteur imminent. Vous devez sauvegarder vos données et remplacer le lecteur dès que possible pour éviter la perte de données potentielle.

@ SJ0H a mentionné le nombre de cycle de charge, qui est très élevé à 447 630. (La plupart des disques durs modernes sont conçus pour résister à 600 000 cycles de chargement/déchargement.) Ceci est généralement causé par la fonctionnalité Advanced Power Management (APM), qui tente de conserver la puissance en stationnant les têtes (déchargement des plateaux) après plusieurs secondes de inactif. Les têtes sont chargées sur les plateaux en cas de besoin. Sur la plupart des systèmes, où des disques durs obtiennent des activités intermittentes, actives, cela peut entraîner de nombreux cycles de charge/déchargement. Pour activer APM, exécutez la commande suivante à une invite racine:

smartctl -s apm,off /dev/sda

Cette commande devra être exécutée chaque fois que le système est cyclé ou mis en veille ou le lecteur est hors tension, car ce paramètre n'est pas conservé lorsque le lecteur est éteint.

Dans mon expérience, cela réduira considérablement le nombre de cycles de charge/déchargement et, par conséquent, les chances que vous découlez de nouveau ce type d'échec à l'avenir. Notez cependant que cela augmente la consommation d'énergie et la température de conduite. Si le lecteur fonctionne constamment à des températures supérieures à 50 ° C, le risque de défaillance prématurée est augmenté, vous pouvez donc vouloir quitter APM (ou le faire allumer s'il est éteint) pendant les mois les plus chauds.

10
bwDraco

Oui, vous avez 16 secteurs illisibles, vous avez essayé de faire plusieurs tests qui ont tous échoué à peu près la même zone du lecteur, alors sauvegardez-la, mais gardez à l'esprit que vous avez déjà des données déjà inaccessibles en persistant maintenant à proximité de Secteurs 92290592, 92290596.

Vous pouvez avoir d'autres domaines problématiques, vous ne savez toujours pas si ces 16 secteurs sont consécutifs ou étais, si vous souhaitez jouer après la sauvegarde, vous pouvez effectuer un autotest sélectif avec -t Select, StartLba-endlba.

Courant_pending_sector signifie que le micrologiciel du disque dur a essayé de le lire, mais il ne peut pas essayer quelques fois plus (chaque fois que le système d'exploitation le demande) jusqu'à ce que l'échec et le marquent comme désactivé ou substitueront le secteur endommagé pour un autre secteur de rechange si la Os écrit à elle (augmentant ainsi realLocated_sector_ct quand ce faisant).

2
Jorge Nerín

Outre les échecs de lecture, considérons également le nombre de cycle de charge. À près de 500 000, cela peut indiquer une raison de l'échec, ou d'une usure de cycle de charge élevée au moins. Il y a un cycle de charge pour chaque minute de temps de mise sous tension. Après avoir remplacé le lecteur, assurez-vous que le nouveau lecteur ne le fait pas aussi.

2
sj0h

Je voudrais personnellement remplacer le lecteur. Si vous, pour une raison quelconque, vous ne voulez pas que cela puisse faire cela, mais vous attardez-vous encore avec le lecteur, vous devez un moyen de vous assurer que vous n'utilisez pas accidentellement les mauvaises zones pour les nouveaux fichiers.

J'avais un tel lecteur sur une vieille Mac juste enregistrer une vidéo et j'ai décidé que je ne voulais pas encore le changer, car les vidéos étaient juste agréables à avoir. Donc, je devais isoler les erreurs. J'ai d'abord créé un dossier vide uniquement pour les fichiers incorrects, puis j'ai essayé de lire tous les fichiers existants sur le disque et l'un de ceux-ci avec une erreur d'erreur ont été déplacés dans le répertoire Bad-Files (espérons-le que peu important).

Ensuite, j'ai créé beaucoup de fichiers de mégaoctet uniquement nommés de manière unique pour remplir le disque dur (donc tout espace vide était maintenant dans l'un de ces fichiers de 1 Mo), puis répété la procédure. Tous les fichiers avec des erreurs d'entre eux ont été déplacés vers le répertoire de fichiers Bad-Files, et ceux qui sont laissés étaient bons et pouvaient être supprimés pour récupérer le mauvais espace.

Vous pouvez maintenant utiliser le lecteur un peu plus longtemps, mais ne l'utilisez pas pour des choses importantes. Il volonté échouer plus et il sera probablement gênant quand cela se produit.

Ce n'est pas un très bon signe. Vous devez vous assurer que le contenu du disque est sauvegardé et ne pas utiliser le disque pour quelque chose d'important.

Cependant, j'ai vu des disques avec des secteurs défaillants qui les ont réaffectés et sont restés opérationnels pendant des années. Vous pouvez donc la conserver pendant un moment, par exemple, pour des trucs sans importance, ou des sauvegardes supplémentaires.

Une chose à faire, il s'agirait alors de voir quels fichiers ont été corrompus par les secteurs illisibles et écrivent à ces secteurs pour forcer la réaffectation par le disque (les déplacer à partir de "actuel_pending_sector" à "reallocated_sector_ct"). Si vous utilisez Linux, voir http://smartmontools.sourceforgege.net/badblockhowto.html . Une fois que les secteurs ont été réaffectés, l'autotest doit transmettre ou signaler des secteurs plus illisibles.

Je suis en désaccord avec la plupart des réponses en ce que je ne pense pas que les secteurs défectueux sont nécessairement une indication d'une défaillance imminente. Comme http://blog.mmueh.net/index.php/2010/12/09/LUKS-MEets-badblocks/ dit: "Chaque disque dur commence à produire des secteurs défectueux à un moment donné de sa vie ".

1
a3nm