web-dev-qa-db-fra.com

Identifier ce qui a provoqué un redémarrage du serveur

J'ai une HP ProLiant DL380p Gen8 qui est en cours d'exécution VMware ESXI 5.5. Il se redémarre à des intervalles apparemment aléatoires depuis 24 heures. Il n'y a qu'un seul VM exécuté et même si je l'arrête de tomber dans l'hôte redémarra. Le serveur ne manque pas de mémoire ni de disque, et autant que je puisse dire est ne pas surchauffer. J'ai essayé de regarder à travers des fichiers journaux, mais il y a tellement de choses à regarder.

Quelles sont les étapes les plus importantes dans le diagnostic de ce problème (y compris quels paramètres à vérifier, quels fichiers à regarder, quel message spécifique indiquerait des problèmes, dois-je commencer à tirer la mémoire, est-ce un cd de diagnostic qui fait tout cela pour moi, etc.) ?

Je sais que c'est une question très large. Je suis heureux de fournir des fichiers journaux si nécessaire pour le rendre plus spécifique à ma situation.

8
nachito

Voici quelques suggestions.

  • Votre ILO est-il connecté et configuré? Il vous dira exactement ce qui se passe avec le système. Veuillez consulter le journal ILO4.

  • Affichez le journal IML du système (disponible via l'onglet ILO ou VSPHERE "Matériel")

  • Existe-t-il des indicateurs ou des messages d'erreur à l'écran pendant le crash ou à l'article?

  • Utilisez-vous l'installation spécifique à HP d'ESXI (inclut des pilotes et des outils supplémentaires)

  • Quelle version et numéro de construction d'ESXI utilisez-vous?

  • Si la machine virtuelle que vous utilisez est un invité Windows 2012 ou 2008, vous pouvez être exécuté dans A NIC .

  • Vérifiez vos connexions d'alimentation. Avez-vous une double alimentation? Reposer les câbles d'alimentation une à la fois.

  • Regardez le tableau LED System Insight LED sur le devant du serveur pour déterminer s'il y a un problème de santé interne.

enter image description here

9
ewwhite