web-dev-qa-db-fra.com

Comment interpréter les résultats HDD S.M.A.R.T?

Mon ordinateur portable a récemment commencé à devenir un peu peu fiable et, pour une raison quelconque, j'ai commencé à soupçonner que mon disque dur commençait à tomber en panne. Après un peu de chasse sur Internet, j'ai trouvé l'Utilitaire de disque d'Ubuntu dans le menu Système et j'ai exécuté le long diagnostic SMART.

Cependant, comme la documentation de Disk Utility est très médiocre (palimpsest?), Je ne sais pas comment interpréter les résultats:

Value over 50 million for a read-error rate, yet the test is good?!

Par exemple, le taux d'erreur de lecture dépasse 50 millions (!), Mais l'évaluation est considérée comme "bonne".

Quelqu'un pourrait-il alors m'expliquer comment interpréter les résultats de ces tests (en particulier les nombres normalisé, pire, seuil et valeur)? Et peut-être me direz-vous ce qu'ils pensent des résultats obtenus avec mon disque dur? (Merci)

57
Marty

Vous avez une bonne description de la façon dont SMART fonctionne sur wikipedia . Mais une introduction rapide:

  • Valeur: Il s'agit de la valeur brute indiquée par le contrôleur. Il s'agit généralement d'une valeur facile à comprendre (comme le nombre d'heures de fonctionnement ou la température), mais parfois non (comme le taux d'erreur de lecture). Différents fabricants peuvent utiliser différentes structures et significations pour ces données.

  • Normalisé: C'est la valeur ci-dessus normalisée, donc une valeur plus élevée est toujours meilleure. Ainsi, un taux de 114 en lecture/erreur est supérieur à 113. Encore une fois, la façon dont votre disque dur convertit les données brutes en valeur normalisée est spécifique au fournisseur.

  • Pire: La pire valeur normalisée que votre lecteur avait par le passé (où 99 correspond probablement au réglage d'usine).

  • Seuil: lorsque la valeur normalisée est inférieure à celle du lecteur susceptible d'échouer.

Donc, votre disque dur semble aller bien. La valeur du taux d'erreur de lecture n'est pas le nombre de fois où votre lecteur a échoué, mais une structure de données qui dépend du fabricant de votre disque.

52
Javier Rivera

Oui, la valeur brute du taux d'erreur de lecture est généralement absurde. Les valeurs que vous souhaitez surveiller sont le nombre de secteurs réaffectés, le nombre en attente et le nombre offline non corrigible. Ce sont le nombre de secteurs défectueux qui ont été, sont en attente d’être ou ne peuvent pas être corrigés, et les valeurs brutes qui y figurent ont généralement un sens et sont le nombre de secteurs.

Si la lecture d'un secteur échoue, il devient en attente. La prochaine fois que vous essayez d'écrire dans ce secteur, le lecteur tente de le réécrire. Si cela fonctionne, tout revient à la normale. S'il ne peut pas écrire correctement le secteur, il réaffectera le secteur à partir du pool de réserve. S'il ne peut pas le faire (peut-être qu'il a déjà utilisé le pool de réserve?), Il devient alors offline_uncorrectable et essaie de lire ou d'écrire dessus, mais il y a erreur.

25
psusi

le psusi le cloue.

Si vous lisez les fiches techniques (livres blancs), dites à seagate.com que vous verrez comment les disques durs sont fabriqués, testés et comment ils fonctionnent réellement. Il n’existe pas de disque dur parfait, n’a jamais existé, n’existera jamais (histoire et fait). Autrefois, nous devions entrer les secteurs défectueux du contrôleur de disque dur à partir d'une liste sur papier fournie avec le nouveau lecteur, de sorte que le contrôleur les ignore.

Les lecteurs modernes ont une correction d'erreur. Dès le premier jour, les secteurs sont mauvais.

Donc, ils les cartographient, cela signifie que le lecteur ignore les secteurs défectueux. En fait, ils sont "logiquement échangés" - le secteur défectueux est mappé sur un nouveau, bon secteur de cylindre de rechange (il a des cylindres de rechange - considérez les cylindres comme des pistes). Tout cela est transparent pour le monde extérieur - à l'exception de SMART util.

Chaque fabricant peut faire ce qui lui plaît, alors certains fixent le nombre d'erreurs à zéro, même s'il peut y avoir 10 secteurs défectueux dès que le lecteur est fabriqué.

Le micrologiciel du lecteur contient une règle des 3 fois: il lit un secteur 3 fois et, si les 3 fois, il est mauvais, il peut effectuer un "recalibrage" à la volée et lire 3 fois plus. Si le lecteur n'est toujours pas correct, il mappera ce secteur sur l'un des secteurs de réserve. Cela se trouve au cœur du micrologiciel, mais se produit continuellement en arrière-plan, de manière transparente pour l'utilisateur.

Que le fabricant choisisse de signaler les erreurs brutes lorsqu'il y a 3 mauvaises lectures ou après le calibrage est à leur charge. Donc, comme il le dit ci-dessus, ce n'est pas important à moins que vous ayez plusieurs disques du même type et que vous voyiez des tendances étranges.

Point 2: tous les disques durs ont des erreurs de lecture naturelles, vous pouvez aussi l’apprendre chez Seagate, si vous le souhaitez. mais ils ont tous des erreurs à la volée. et sont lus à nouveau et réussissent généralement le test des erreurs CRC. si ce n'est pas le cas, le lecteur tente de l'échanger. Si vous utilisez le disque à froid, cela durera longtemps et vous ne manquerez probablement jamais de cylindres de rechange. mais regardez comme le dit le psusi!

Je tape ceci, sur un vieux PC, exécutant l’un des premiers disques durs de 1 Go. et est toujours bon. (im sauvegardé) (pas de refroidissement jamais ...) la chaleur est le tueur n ° 1 et les surtensions, je cours un UPS. salut et bonne journée. J'espère que ça aide. (Vous avez déjà vu un crash de disque dur de DatA General? et remplissez la pièce de grandes quantités de laine d’aluminium, de bouclages frisés? A l’époque, vous vous amuserez beaucoup ... jamais un moment d’ennui ...

9
jtgh