web-dev-qa-db-fra.com

Nagios Solutions graphiques vs munin / cacti / ganglia

J'ai une configuration de serveur Nagios pour surveiller ~ 30 serveurs Windows. Je veux ajouter des tableaux de tendance. J'ai lu que les plugins graphiques Nagios sont Simple et de nombreuses personnes utilisent des outils de graphique/de tendance autonome et autonomes.

Quelles sont les restrictions des plugins graphiques Nagios vs produits autonomes comme Ganglia/Munin/Cacti?

Je suis intéressé par des fonctionnalités et des avantages spécifiques que les packages autonomes offrent et Nagios Plugins ne font pas.

9
sumek

étant donné que vous avez déjà une installation Nagios, considérez NagiosGraph ou PnP4nagios.

nagiosGraph et Pnp4nagios font un joli travail intéressant de tracer des données de performance Nagios. NagiosGraph a une approche de la configuration basée sur les paramètres, PNP4NAGIOS a une approche basée sur des modèles.

  • les deux détectent automatiquement de nouveaux hôtes/services chaque fois que la configuration Nagios change
  • les deux graphiques zooms
  • tous deux fournissent des graphiques lorsque vous maîoisinez des hôtes/services spécifiques
  • les deux fournissent de nombreuses façons de trancher et de couper vos données
  • détecter et graphiquement les niveaux critiques et d'avertissement que vous avez déjà définis dans Nagios
  • les deux peuvent être incorporés directement dans le cadre Nagios pour une navigation sans couture et dégagée à partir du statut actuel à l'historique et à l'arrière.

trancher et couper en dés des données sont assez importants, IMHO. Par exemple, vous pouvez afficher tous les services sur un seul hôte ou consulter tous les hôtes avec un service spécifique ou voir des collections arbitraires de graphiques pour des hôtes et des services arbitraires.

l'installation n'est pas triviale, mais pas difficile. Beaucoup dépend de combien vous voulez personnaliser les choses. Par exemple, NagiosGraph est "Installer.pl" ou "RPM -I -I NAGIOSGRAPH.RPM" ou "DPKG -I NAGIOSGRAPH.DEB". pnp4nagios est './configure; Fabriquer; faire installer '.

n2RRD peut également faire certaines de ces choses, mais elle n'est pas aussi polie et nécessite plus de travail à configurer.

rRDTool a un stockage de données WRT QuiRKS et tout système aura des problèmes d'échantillonnage. RRDTool effectue certaines données de lisser par défaut, mais vous pouvez capturer (et graphiquement) maximum et/ou minimums en plus des moyennes si nécessaire.

chaque approche à base de RRDTOOL souffre de la schématisation des données/graphes car le schéma dans chaque fichier RRD est statique et la plupart des systèmes utilisent le nom de fichier RRD pour identifier les données. Les données ne sont généralement jamais perdues lorsqu'un nom d'hôte ou un nom de service change; Les fichiers RRD existent toujours sur le disque. Mais certaines interfaces utilisateur fournissent des moyens de voir les fichiers RRD "Stale", d'autres nécessitent un ménage manuel via une ligne de commande. Sur de nombreuses installations, ce n'est qu'un problème lors de la configuration initiale du système, mais dans des environnements dynamiques (par exemple, surveiller les machines virtuelles dont la durée de vie n'est que quelques mois), elle peut devenir fastidieuse.

une dernière note. Il y a en fait deux parties à la tendance: collecte de données et affichage des données. Si vous allez avec un système de graphique autonome plutôt que d'étendre votre installation NAGIOS existante, vous devrez peut-être installer des composants supplémentaires sur vos machines Windows afin de collecter les données.

7
Matthew Wall

Je suis d'accord avec Lynxman. Nagios est destiné aux données qualitatives immédiates (X OK OK OU PAS?); Munin est destiné à des données quantitatives historiques (quelle est la totalité de x maintenant et à quel point cela a-t-il été complet cette année?). Toutes mes installations de Nagios, dont certaines surveiller plusieurs centaines de services sont liées à Munin Systems pour effectuer la surveillance quantitative.

Notez également que Munin a des crochets spécifiques pour nourrir les données dans Nagios. Il comprend le concept d'avertissement et de seuils critiques, et où la notification (et une vue sur le "Big Board" nagios) est très très facile d'avoir une seule variable Munin informer l'état d'un seul service Nagios.

Le flux de travail habituel est que personne ne regarde à personne des graphes Munin jusqu'à ce que Nagios alerte qu'un seuil a été violé, mais les graphiques Munin deviennent-ils inestimables pour déterminer si quelque chose a diminué lentement au fil du temps, ou c'est un peu de la -L'augment d'altitude, ou nous avons un cycle hebdomadaire de haut en bas qui augmente lentement dans l'amplitude ou quoi.

Comme le dit Lynxman, la voie Unix est "une tâche, un outil". La fabrication d'une boîte à outils de Munin et Nagios fonctionne très bien pour moi de fournir une surveillance quantitative et qualitative ainsi que des notifications. Il a également l'avantage distinct de garder les interfaces propres: lorsque vous regardez Nagios, vous voyez une vue simple sur la façon dont les choses fonctionnent bien maintenant, sans données historiques qui n'embrasse pas la vue; Lorsque vous regardez Munin, vous voyez des informations historiques pertinentes à la question prête pour votre analyse, sans "hôte" ou "sshd ne me parle pas de me parler" d'erreurs encombrant la vue.

13
MadHatter

Au débordement de pile, nous utilisons N2RRD qui est un plugin NAGIOS pour les données de performance graphique. Dans une certaine mesure, je suis d'accord avec Lynxman qu'il a une grosse sensation pirate.

Pourtant:

  • Avec N2RRD, vous pouvez avoir des cactus faire le graphique basé sur les données au lieu du RRD2Graph.cgi fourni avec N2RRD
  • n2RRD avec le RRD2Graph.cgi prend en charge le zoom
  • En ce qui concerne les graphiques agrégés compliqués - vous manipulez essentiellement les graphiques de RRD à la main et peut faire ce que vous voulez avec eux.

Les graphiques RRD sont stockés en fonction des noms de serveur. Si vous modifiez le nom de quelque chose que vous avez en train de perdre les données ... Vous pouvez toujours renommer les fichiers les symboliques et vous ne perdez pas les données.

J'ai quelques exemples de ces graphiques à mon récent quelques conseils pour de meilleurs graphiques RRD Publication de blog de défaut de serveur. En outre, la page N2RRD inclut à la fois la démo de cactus ainsi que RRD2Graph.

Je pense que l'essentiel est que l'itinéraire Nagios pourrait manquer d'une caractéristique ou deux mais est assez complet si cela ne vous dérange pas de vous mettre la main Avec les détails de l'écriture de modèles de RRD vous-même *. Il va probablement prendre plus de votre temps, mais cela encouragera à développer davantage de compétences dans la RRD.

2
Kyle Brandt

J'exige que les données précises et l'affichage des données de RRD ne sont pas exactes - c'est normalisé! Pour la plupart des utilisateurs, cela va bien, car ils n'utilisent pas de données très précises pour commencer. Ils utilisent des données dont les taux d'échantillonnage sont souvent à une minute ou plus et qui ne vont pas vous donner une description très précise de ce qui se passe. Cela signifie également que si vous avez une pointe dans vos données quelque part, vous ne le verrez peut-être jamais.

Considérez ceci - dites que votre réseau GB fredonne à environ 10 Mo/sec et tout à coup, il y a une pointe de 100 Mo/seconde pendant quelques minutes. Notez également s'il ne s'agissait que d'une pointe de 30 secondes, vous ne le verriez peut-être même pas à des taux d'échantillonnage de quelques minutes. Si vous regardez les données de la journée, que "Spike" ne peut apparaître que 15 Mo/SEC, bien que la valeur réelle dépend également d'un certain nombre d'autres facteurs. Il y a aussi une probabilité très probable que votre réseau est heureux quand ce n'est pas!

Ce qui est encore plus frustrant pour moi, ce sont les données normalisées à la largeur physique du graphique et de la plage de l'axe X. Qu'est-ce que cela signifie que Spike, j'ai mentionné que vous n'avez pas vu? Si vous zoomez, il apparaît comme magiquement! Je vais rester à gnuplot - les graphiques peuvent ne pas être aussi jolis mais ils sont solides et gnuplot ne modifie jamais les données avant de l'afficher.

-marque

0
mark seger

Je trouve que l'utilisation de PNP4nagios fonctionne assez bien pour le graphique. Il prend en charge le zoom aussi bien. Ce n'est pas le plus facile à mettre en œuvre, mais rien avec Nagios n'est jamais.

0
Matthew Thode