web-dev-qa-db-fra.com

Comment surveiller et consigner les températures et la charge matérielles du serveur

Je cherche un moyen de consigner et de surveiller les températures et la charge matérielles de mon serveur (comme pour le processeur ou la mémoire vive). Comment pourrais-je faire ça?

L'objectif est de:

  • s'assurer que le matériel ne chauffe pas
  • identifier ce qui devrait être mis à jour et ce qui est en excès (comme peut-être apprendre par exemple à ne pas obtenir un processeur aussi performant)

Ok, je peux utiliser l’une des applets présentes dans la barre des tâches, mais qu’en est-il de journalisation?

15
Jiew Meng

Si vous voulez quelque chose qui ne dépend pas d'un bureau :

Jetez un oeil à lm-capteursInstall lm-sensors . De la description:

Lm-sensors est un package de surveillance de la santé du matériel pour Linux. Il vous permet 
 D’accéder aux informations provenant des capteurs de température, de tension et de vitesse du ventilateur 
. Il fonctionne avec la plupart des systèmes plus récents. 
 
 Ce paquet contient des programmes destinés à vous aider à configurer et à lire les données provenant de 
 Lm-capteurs.

De leur page du projet (édition 2016: le projet est mort. notre propre wiki a quelques informations ):

  • Serveur haut de gamme, routeur ou autre système de surveillance automatisé essentiel sans surveillance. Créez facilement une tâche cron pour interroger l'état de votre matériel et envoyez-vous un e-mail en cas de problème avant qu'il ne devienne critique. De cette façon, vous pouvez être alerté en quelques secondes d'un composant critique défaillant tel qu'un bloc d'alimentation, un ventilateur ou un autre mécanisme de refroidissement, ou même détecter si le boîtier a été ouvert.
  • Systèmes embarqués sous Linux. Ceux-ci peuvent utiliser cet ensemble pour contrôler les tensions, les températures, les vitesses de ventilation, etc., à l'aide de composants standard et à l'aide d'une gamme d'interfaces de bus (par exemple, ISA, SMBus, I2C ou SPI).
  • Plus généralement, l'acquisition de données. Mesurez facilement divers types de données (vitesses de rotation, tensions, températures, etc.) à l’aide de pièces standard bon marché. Très utile pour l’automatisation des systèmes (à la maison, dans l’atelier, dans la station météo, etc.).

lm-sensors a un démon, appelé sensord, qui utilise RRDtool pour 'le système de journalisation et de représentation graphique des données pour les séries chronologiques'. Donc, il comprend des graphiques comme celui-ci qui peuvent être affichés via un serveur Web:

im1

(extrait de la page de projet lm-sensors).

Pour installer le démon sensord, vous devrez probablement installer le paquet sensord.

Exemple de mon cahier:

im2

Le fichier de configuration correspondant est situé à /etc/sensors3.conf

lm-sensors est en quelque sorte la base de toute mesure de température. Les éléments de bureau sont plus que susceptibles de tirer leurs informations de ce package. Un exemple Si vous voulez quelque chose qui dépend d'un bureau

psensor.

  • capteurs de la carte mère et de l’UC ( nécessite l’installation de lm-capteurs ).
  • GPU NVidia
  • Disques durs (nécessite l'installation de hddtemp).
  • Vitesse du ventilateur (nécessite à nouveau l'installation de capteurs lm).

Installation en ajoutant un PPA:
Sudo add-apt-repository ppa:jfi/ppa
Sudo apt-get update && Sudo apt-get install psensor

(Oneiric aura psensor inclus)

(ancien) exemple de buntugeek.comim6

18
Rinzwind

Si des programmes comme Cacti sont trop nombreux, il existe un script qui enregistre simplement les fichiers texte par jour - exécutez-le avec crontab. Mais doivent être installés programme lm-capteurs.

#!/bin/bash
_now=$(date +"%Y_%m_%d")
_file="temp_log_$_now.txt"
(date; sensors; echo '-----------') | cat >> "/var/log/temperatures/$_file"
5
Darius.V

Pour journalisation de l'unité centrale/RAM/températures/trafic sur un serveur , J'ai recommandé Cacti . Il est annoncé comme une 'interface complète pour RRDtool ', et peut avoir des sources de données multipliées telles que lm-capteurs, SNMP ou même des scripts personnalisés. Les données sont stockées dans RRD et utilisées pour créer des graphiques quotidiens, hebdomadaires, mensuels et annuels.

Voir le site Web Cacti pour plus de détails, captures d'écran et des liens vers des exemples de sites en direct. Il peut être difficile de le configurer dès la première fois, mais cela en vaut la peine.

4
drgrog

J'utilise zenoss pour surveiller environ 70 serveurs Unix et Windows sur mon bureau. Nous surveillons également tous les équipements de réseau et même un thermostat dans la salle des serveurs. La majeure partie est via SNMP. (Cependant, nous utilisons des scripts écrits personnalisés pour surveiller certaines performances de l'application)

La plupart des serveurs (tels que Dell et hp) ont des capteurs de température internes, que vous pouvez interroger à l'aide de SNMP. Vous pouvez également surveiller les processus, l'utilisation du processeur, le débit du réseau, etc. Je reçois des alertes si les serveurs se déconnectent, commencent à utiliser trop de processeur ou si des processus critiques échouent.

Sérieusement, je ne peux pas assez insister pour regarder des choses comme zenoss , hyperic , et nagios ! les versions gratuites peuvent surveiller plusieurs systèmes, mais elles peuvent aussi n'en surveiller qu'un. Ils aident à dépanner et à découvrir ce que faisait un serveur à 2 heures du matin lorsqu'un problème survient.

3
Brian

Vérifiez le paquet munin , il peut surveiller presque tout.

https://help.ubuntu.com/lts/serverguide/munin.htmlhttps://wiki.ubuntuusers.de/munin

Sudo apt-get install Apache2
Sudo apt-get install munin-node`
Sudo systemctl enable munin-node
Sudo a2enconf munin

Vérifiez l'autorisation d'accès dans /etc/Apache2/conf-enabled/munin.conf de cette manière:

<Directory /var/cache/munin/www>
    Require all granted
    AllowOverride None
    Order Allow,Deny
    Allow from all
    Options None
</Directory>

<Location /munin-cgi/munin-cgi-graph>
    Require all granted
    <IfModule mod_fcgid.c>
        SetHandler fcgid-script
    </IfModule>
    <IfModule !mod_fcgid.c>
        SetHandler cgi-script
    </IfModule>
</Location>

Redémarrez Apache2:

Sudo Apache2ctl restart

Lancez votre navigateur pour: http: // localhost/munin - enjoy.

Regardez dans/etc/munin pour d’autres options.

1
Thomas

vérifiez ce lien: https://launchpad.net/indicator-sysmonitor

im1

(de OMG Ubunt )

Installation:

Sudo add-apt-repository ppa:alexeftimie/ppa
Sudo apt-get update && Sudo apt-get install indicator-sysmonitor

Remarque: ne fonctionne que dans Natty/11.04

1
george

J'utilise Pandora fms pour surveiller environ 40 serveurs et 100 systèmes informatiques de ma société, ainsi que sa page Web. Vous trouverez peut-être utile d'installer un agent logiciel sur votre serveur et de configurer des modules locaux pour surveiller ce dont vous avez besoin. Si vous souhaitez l’essayer ici, vous pouvez visiter la page Web de Pandora: Outil de surveillance unifiée FMS Panndora

Cordialement

Ivo Yordanov

1
ivo_yordanov