web-dev-qa-db-fra.com

Comment vérifier la santé du système?

Je souhaite obtenir un rapport sur l'état de mon système afin de savoir que tous mes composants matériels (processeur, mémoire, disques, etc.) fonctionnent comme prévu. Il serait plus facile de lire si le rapport ne répertorie que les problèmes détectés (le cas échéant). Y at-il un outil système qui fait cela?

Notes connexes:

  • Je sais que le tilitaire de disque peut signaler les résultats de SMART sur mon disque. Je voudrais quelque chose de similaire pour tous mes autres composants.
  • Les outils de diagnostic bruts et les benchmarks ne conviennent pas. Les outils de diagnostic répertorient les détails des composants, mais pas leur santé. Les points de repère ne soulignent parfois que des problèmes de santé Je ne m'intéresse qu'aux rapports de santé directs.
  • Je connais un outil équivalent qui remplit cette fonction dans Windows (indique si un composant matériel est défaillant), mais j'ai oublié le nom: P Je voudrais fondamentalement un équivalent.
3
david.libremone

L'électronique fonctionne généralement à 100% ou à zéro pour cent. Les dispositifs mécaniques tels que les disques durs ont des indicateurs de défaillance imminente selon le rapport INTELLIGENT que vous connaissez déjà.

Fans

Les ventilateurs ont des indicateurs de panne imminents, mais ceux-ci dépendent de votre audition et de l'écoute d'indicateurs tels que les vitesses oscillantes, les roulements de crissement, etc.

CPU

Le niveau de chaleur du processeur est un autre indicateur potentiel de dégradation du ventilateur. Sur un ordinateur portable, les orifices de ventilation des ventilateurs sont bouchés ou le nombre de tours par minute est trop bas. Cela pourrait également signifier que le processeur/la carte mère a besoin d'un nettoyage à la poussière avec de l'air comprimé (n'utilisez pas votre souffle qui contient de l'humidité). Cela pourrait également signifier que le dissipateur de chaleur de votre CPU doit être réinstallé avec une nouvelle pâte thermique.

RAM

Si votre machine se bloque et affiche une erreur de mémoire incorrecte, vous pouvez tester votre RAM en suivant ces instructions: Comment vérifier les erreurs dans RAM via Linux? .

Si le vérificateur RAM trouve un bloc de mémoire défectueux, vous pouvez le mettre en liste noire à l'aide des instructions suivantes: Y a-t-il un moyen de limiter le gestionnaire de mémoire du noyau pour qu'il n'utilise que 75% de la mémoire?

NVMe PCIe M.2 Gen 3.0 x 4 (ou 2) SSD

Si vous avez un disque SSD, leur durée de vie est mesurée en milliards d'écritures. Votre utilitaire SMART mesure déjà la durée de vie des disques SSD, mais pas les disques SSD NVMe. Pour cela, vous avez besoin de nvme-cli. Pour l'installer utilisez:

Sudo apt install nvme-cli

Prochain rassemblement des informations disponibles à partir de SSD:

$ Sudo nvme smart-log /dev/nvme0
Smart Log for NVME device:nvme0 namespace-id:ffffffff
critical_warning                    : 0
temperature                         : 40 C
available_spare                     : 100%
available_spare_threshold           : 10%
percentage_used                     : 0%
data_units_read                     : 12,539,332
data_units_written                  : 10,623,582
Host_read_commands                  : 281,194,884
Host_write_commands                 : 96,528,713
controller_busy_time                : 672
power_cycles                        : 1,677
power_on_hours                      : 687
unsafe_shutdowns                    : 105
media_errors                        : 0
num_err_log_entries                 : 279
Warning Temperature Time            : 0
Critical Composite Temperature Time : 0
Temperature Sensor 1                : 40 C
Temperature Sensor 2                : 51 C
Temperature Sensor 3                : 0 C
Temperature Sensor 4                : 0 C
Temperature Sensor 5                : 0 C
Temperature Sensor 6                : 0 C
Temperature Sensor 7                : 0 C
Temperature Sensor 8                : 0 C

Le champ le plus important est Percentage used, qui indique 0%. Ce n’est pas un pourcentage d’utilisation du disque, mais une vie utilisée . Je dispose de ce disque depuis octobre 2017 et nous sommes en décembre 2018. Dès que Percentage used atteint 1%, je peux multiplier par 100 le nombre de mois de possession pour savoir quand il va mourir. Au rythme actuel, je peux dire que le lecteur vivra plus de 100 ans. Bien sûr, il sera de toute façon obsolète dans dix ans.

Moniteur système sur le bureau avec conky

De nombreuses personnes aiment afficher l'état de leur système (et leur santé) sur une partie de leur bureau. J'aime garder mon Conky en marche sur le bon 20% de mon moniteur principal:

Conky all.gif

Remarque: L'utilisation de 97% de la CPU sur une seule CPU est due à l'enregistreur d'écran lui-même.

Pour en savoir plus sur conky et l'utilisation du processeur, voir: Comment stresser le test du processeur et RAM (en même temps)?

6
WinEunuuchs2Unix