Quel outil utilisez-vous pour surveiller vos serveurs?

Question

Pour une liste plus complète des outils de surveillance et de leurs fonctionnalités, consultez cette page Wikipedia .

Comme l'indique la question, quels sont les outils les plus couramment utilisés pour cette tâche et quelles sont leurs forces et leurs faiblesses?

jdiaz · Accepted Answer

J'ai utilisé Nagios dans le passé avec succès. Il est très extensible (plus de 200 modules complémentaires), relativement facile à utiliser et beaucoup de rapports. Un négatif serait la configuration initiale.

paulgreg · Answer

Cacti est une très bonne interface Web pour RRDTool , fournissant des graphiques et des statistiques très pratiques. RRDTool est la partie qui rassemble les données de plusieurs systèmes et surveille un large éventail de données techniques.

Nous utilisons cette solution cacti/RRDTool pour surveiller les systèmes Unix et Windows. Nous obtenons de nombreuses mesures utiles, notamment la charge, l'utilisation du processeur/de la RAM, l'espace HD, les utilisateurs connectés, le trafic réseau, les processus en cours d'exécution, etc.

Vous trouverez plus d'informations sur les cactus sur la page Qu'est-ce que les cactus? .

pilif · Answer

Personnellement, j'adore Munin qui est très facile à installer et à écrire pour les plugins car il a une architecture très simple. Il existe déjà de nombreux plugins pour toutes les finalités que vous pourriez imaginer, vous n'aurez donc probablement même pas à écrire de plugins en premier lieu.

Il fournit également de beaux graphiques et la possibilité de configurer des alertes (très basiques).

Tony Meyer · Answer

Zabbix . C'est open-source et assez simple à configurer et à personnaliser. Nous avons beaucoup de scripts de surveillance personnalisés qui alimentent le serveur zabbix, mais il s'occupe de centraliser ces données, de les afficher de manière appropriée, des notifications (e-mail, messagerie instantanée, SMS, Twitter, etc.), etc.

Shard · Answer

J'ai fait des déploiements de Spiceworks dans notre entreprise et nous trouvons que c'est un excellent outil non seulement pour surveiller les serveurs mais tout le reste sur le réseau.

Il fait des choses comme l'inventaire automatique et la surveillance personnalisée pour vous envoyer des e-mails en cas de problème (EG: l'imprimante est à 10% d'encre ou le disque dur de ce serveur en a 20%).

Son inconvénient serait probablement la densité d'informations par ordinateur, ne vous méprenez pas, il a BEAUCOUP de données par machine, mais pour des choses comme les serveurs où vous voudrez peut-être beaucoup de statistiques, vous devrez peut-être utiliser un autre outil.

EDIT: oh ai-je mentionné que son modèle commercial est basé sur le fait qu'il soit gratuit pour toujours.

Linulin · Answer

Smokeping non seulement vérifie la disponibilité de divers serveurs et services mais garde également une trace de leur latence tout en offrant une utilisation facile, agréable à regarder et rapide à afficher graphiques.

Une large gamme de plugins de mesure de latence est disponible immédiatement. Si vous connaissez du Perl, il est facile d'en créer un pour tous les besoins exotiques.

Les grandes installations bénéficieront du système maître/esclave pour la mesure distribuée.

Le système d'alerte hautement configurable vous aidera à remarquer les problèmes avant qu'ils ne commencent à affecter les utilisateurs ou à évoluer en panne majeure.

Smokeping est un logiciel gratuit et OpenSource écrit en Perl par Tobi Oetiker, le créateur de MRTG et RRDtool

jassuncao · Answer

OpenNMS est utilisé là où je travaille pour surveiller plus d'un millier de machines Linux. Nous surveillons le matériel de chaque machine et les applications qui y sont exécutées.

gimel · Answer

Zenoss Core est d'une certaine utilité, nous l'utilisons (depuis environ un an) pour une surveillance légère des serveurs, des commutateurs réseau et des onduleurs.

Zenoss Core est un produit de surveillance informatique open source primé qui gère efficacement la configuration, la santé et les performances des réseaux, des serveurs et des applications via un seul progiciel intégré.

Avery Payne · Answer

J'ai utilisé:

Nagios - nécessite une configuration en ligne de commande ancienne, pas jolie, mais robuste et fonctionnelle. Il a été remplacé par:
Zenoss - nécessite beaucoup moins de jeu de jambes pour l'installation, a une variante commerciale. Une fois exécuté, le reste est contrôlé via un navigateur. Très puissant, mais nécessite un travail MIB si vous utilisez la version gratuite.
Intermapper - programme commercial, coûteux si vous avez beaucoup de nœuds à surveiller. Semble être écrit en Java (pour le meilleur ou pour le pire).
Spiceworks - je n'ai pas essayé la dernière version. Les anciennes versions avaient besoin d'un peu plus de umph sous le capot pour le faire réagir, mais sinon, cela fonctionne bien. La version gratuite est livrée avec des annonces nag.

Robert MacLean · Answer

Nagios est génial car il est gratuit et il existe de nombreux plugins pour cela. Cependant, l'interface utilisateur et la configuration sont très difficiles.

C'est exactement le contraire dans les avantages et les inconvénients, ce qui est également génial est Microsoft System Center Operations Manager (SCOM) qui n'est pas gratuit, a moins de plugins mais la configuration et la configuration sont brillantes et faciles.

Je dois admettre que si j'étais dans une entreprise principalement Microsoft, si j'avais des exigences de dépendance très élevées (c'est-à-dire que je ne pouvais pas me permettre de casser la surveillance) ou si je devais penser à faire travailler les développeurs avec cela, alors SCOM serait ma recommandation par rapport à Nagios.

David Meiers · Answer

Nous utilisons AlertFox depuis quelques semaines et nous en sommes très heureux. Il vérifie non seulement notre disponibilité et nos performances, mais surveille également le panier d'achat, la connexion des utilisateurs et d'autres parties critiques du site Web via des scripts de transaction (basés sur iMacros).

Pour notre surveillance interne (espace disque, etc.), nous utilisons Nagios.

Brandon · Answer

Moniteur réseau PRTG - ne peut pas dire assez de bonnes choses à ce sujet. Interface Web impressionnante et particulièrement idéale pour surveiller les routeurs (bande passante, etc.) et d'autres appareils via SNMP et mesurer la disponibilité des SLA, etc.

www.paessler.com

Richard Gadsden · Answer

En tant que personne Windows, MOM. Nous cherchons à mettre à niveau vers Systems Center Operations Manager (SCOM), mais nous n'aurons pas besoin de le faire avant de commencer à déployer Windows 2008.

Wes Oldenbeuving · Answer

Pour surveiller les statistiques (utilisation de la mémoire, chargement, activité mysql, activité Apache, etc.) j'utilise Munin . Hors de la boîte, il suit déjà beaucoup de choses et trace des graphiques pour différents intervalles de temps (dernières 24 heures, 7 derniers jours, mois dernier, l'année dernière). Grâce à des plugins, encore plus de choses peuvent être surveillées. Sa sortie sont des pages HTML avec de jolis graphiques.

Munin a une architecture maître/nœud: les nœuds collectent des statistiques sur un serveur et le maître stocke les données et produit du HTML et des graphiques.

J'utilise Monit pour garder une trace des processus en cours et pour redémarrer ou m'alerter lorsque certaines conditions configurables se produisent (charge CPU élevée, utilisation élevée de la mémoire, pas de réponse HTTP, etc.) Monit peut également surveiller des choses plus générales sur un serveur, comme la charge du processeur, l'utilisation de la mémoire, l'état du disque dur ou l'utilisation du disque.

Monit doit être configuré pour chaque service ou matériel que vous souhaitez surveiller et comment réagir en cas de problème. Les options les plus utilisées sont de ne rien faire, d'envoyer un e-mail d'alerte ou de redémarrer le service.

Monit est génial quand il fonctionne, mais parfois il ne parvient pas à démarrer, arrêter ou redémarrer un service et il n'y a pas beaucoup d'informations de diagnostic disponibles pour vous dire ce qui s'est mal passé. Cela signifie que vous ne savez pas si le problème est lié à votre service ou à la configuration Monit, qui s'exécute avec un environnement minimal semblable à cron.

Les deux outils sont disponibles par défaut sur la plupart des distributions Linux.

spoulson · Answer

Je fais partie d'un projet de mise à niveau de la surveillance opérationnelle. Nous avons eu plusieurs fournisseurs sur place pour présenter quelques gros systèmes de dollars et mélangés à des alternatives moins chères à comparer.

L'un d'eux est Hyperic , qui est également disponible en tant que solution open source gratuite. J'ai été impressionné par ses capacités et son extensibilité pour les agents personnalisés.

Brent · Answer

Je suis surpris que personne n'ait mentionné logwatch ou logcheck pour les serveurs Linux - économise une tonne de temps à lire les journaux !!

Jon Ericson · Answer

Notre projet utilise Ganglia pour nos 100+ clusters de nœuds. Une des raisons pour lesquelles nous l'utilisons est parce que c'est l'outil de surveillance fourni avec Rocks .

Il est important pour nous d'avoir une surcharge très faible sur chaque nœud afin que le plus de ressources possibles soient disponibles pour le calcul. Ganglia nous donne un bon aperçu de la grappe et nous permet d'explorer les nœuds individuels si nécessaire. En plus de savoir ce qui se passe en ce moment, nous pouvons avoir un assez bon aperçu de ce qui s'est passé au cours de la dernière heure, jour, semaine, mois et année. Les graphiques de diverses statistiques sont basiques et fonctionnels.

Jon Tackabury · Answer

J'utilise Pingdom pour surveiller mon serveur. Il m'envoie un message SMS lorsque le serveur est inaccessible.

David Mackintosh · Answer

Tout dépend de ce que vous entendez par "moniteur"!

Est-ce (système ou service) disponible? Nous utilisons nagios.
Qu'est-ce que ça fait? Nous utilisons munin pour les serveurs linux, et cacti pour à peu près tout le reste, même si c'est parfois difficile à configurer ...
Qu'a-t-il fait? Nous utilisons syslog-ng pour concentrer les syslog en un seul endroit, puis exécutons quotidiennement un script de vérification du journal personnalisé pour envoyer des rapports par e-mail. Nous recherchons quelque chose de similaire pour les serveurs Windows.

cclark · Answer

Un nouveau venu sur la scène pour vérifier la concurrence avec Cacti et les solutions basées sur RRDTool est Graphite ( http://graphite.wikidot.com/ )

RRDTool est remplacé par un magasin de sauvegarde appelé Whisper. Les documents donnent un assez bon aperçu des raisons pour lesquelles cela diffère et j'aime vraiment la CLI pour les graphiques ad hoc lors de l'enquête sur quelque chose.

Paul · Answer

Si vous êtes pressé et que vous voulez un outil rapide pour surveiller votre serveur MS, utilisez le moniteur de performances pour Windows, configurez un journal de compteur avec un modèle de surveillance personnalisé et un programme personnalisé (par exemple: collectez des données pendant 5 min toutes les heures). Téléchargez ensuite LogParser de Microsoft et l'outil d'analyse des performances (PAL) de Codeplex ( http://pal.codeplex.com/ ) pour réduire le journal de votre compteur. PAL générera un excellent rapport documenté avec des liens vers des documents/outils de résolution de problèmes possibles.

Cawflands · Answer

Pour ceux qui n'aiment pas l'interface Web de Nagios, il y a NPC , un plugin pour Cacti qui rend l'interface Nagios disponible à partir de Cacti, mais avec une meilleure apparence (ajax etc.).

Il lit à partir d'une base de données fournie par NDO2DB , ce qui est un excellent moyen d'avoir votre infrastructure disponible à partir d'une base de données pour une utilisation dans des scripts et d'autres outils.

dr-jan · Answer

Hobbit - c'est une meilleure version plus rapide de Big Brother (qui semble être commercialement alarmante de nos jours).

http://hobbitmon.sourceforge.net/

tomjedrz · Answer

Nous utilisons (et aimons) WhatsUp de Ipswitch pour notre réseau Windows relativement petit. Il est facile à configurer et relativement facile à gérer et sait comment gérer les serveurs Windows ainsi que les éléments standard.

Pour les réseaux plus importants, les réseaux non orientés Windows ou les réseaux avec beaucoup de choses variées, je recommande vivement OpenNMS . Le logiciel OpenNMS est gratuit et l'entreprise est plus qu'heureuse de vendre des services de support et de mise en œuvre. Il se trouve également être dirigé par un très vif ami à moi de l'université!

PowerApp101 · Answer

Actuellement, nous utilisons PRTG de Paessler . C'est excellent. Aucun agent requis, excellente interface Web Ajax, journalisation historique, représentation graphique, WMI, etc. Il y a une version à 10 capteurs disponible gratuitement, mais nous avons planté quelques milliers de dollars pour la version entreprise. De l'argent bien dépensé.

jldugger · Answer

Nous utilisons OpsView , qui s'exécute au-dessus de Nagios. L'interface utilisateur Web nous aide à déployer de nouvelles définitions de moniteur d'hôte sans avoir à autoriser l'accès SSH, fournit des vues publiques et enregistre les valeurs historiques. Ceci est pratique pour l'approvisionnement et la détermination de lignes de base appropriées.

Vivek Varghese Cherian · Answer

Zabbix ( http://www.zabbix.com ) est également bon et plus facile à configurer que Nagios.

Milner · Answer

J'utilise une combinaison de Solarwinds, d'onglets de performances du serveur VMware et de scripts personnalisés.

Solarwinds Orion Network Performance Monitor est ce que j'utilise avec notre système Windows. admins sur mes serveurs web. Il contient toujours des mesures d'application utiles, mais il contient de bonnes informations sur les éléments de base de la boîte (disque, réseau, processeur).

Pour mes invités VMware, j'adore les onglets de performances.

Pour mes serveurs Sun, lorsque j'ai besoin de quelque chose qui n'est pas disponible dans Solarwinds (parce que notre administrateur ne l'a pas ajouté ou quoi), j'écris des scripts personnalisés (généralement en Perl) pour surveiller des choses comme la santé des miroirs, l'utilisation des swaps, etc.

J'aimerais en savoir plus sur Solarwinds, mais il n'y a que 26 heures par jour (ou du moins mon patron le croit), donc je trouve que cela peut être un peu limitant ...

DougN · Answer

J'utilise PA Server Monitor . Il est principalement axé sur Windows (journaux des événements, compteurs de performances, services, etc.), bien qu'il s'améliore avec d'autres systèmes maintenant qu'une prise en charge SNMP limitée a été ajoutée. Ce que j'aime le plus, c'est qu'il est facile à configurer par rapport à beaucoup d'applications (pas de fichiers de configuration, pas de ligne de commande, etc.). Je ne le recommanderais cependant pas pour un environnement lourd * nix.

Oh, ce n'est pas gratuit, mais moins cher que certains concurrents.

Matt Lacey · Answer

Désolé de le dire, mais j'ai fini par utiliser de nombreux scripts personnalisés. Bien que loin d'être idéal, je doute qu'il existe une solution plus courante.

John D. Cook · Answer

Nous avons écrit notre propre logiciel de surveillance. Notre code n'est pas aussi sophistiqué qu'un package commercial, mais nous n'avons pas eu besoin de beaucoup de fonctionnalités. Il était plus facile d'écrire le nôtre que d'enquêter sur d'autres packages et d'apprendre à les utiliser. Le code fait exactement ce que nous voulons et il est facile à étendre.

Chopper3 · Answer

Pour les serveurs HP, vous ne pouvez pas battre leur Systems Insight Manager (SIM), beaucoup de jolis compteurs et alertes de bas niveau, etc., pas une mauvaise interface graphique non plus et le lien vers votre contrat de support en vaut la peine.

pconcepcion · Answer

J'ai travaillé avec Pandora FMS , et je l'aime principalement parce qu'il est très très flexible et configuration facile pour l'administrateur système moyen. J'aime aussi l'interface Web avec tous les rapports et la documentation complète . Et pas très utile pour un seul centre de données, mais très cool est l'interface de géolocalisation qui montre la position des agents surveillés.

J'ai aussi essayé Nagios et j'aime tous les plugins qu'il a , et qu'il est bien connu des administrateurs système.

Remarque : Je suis l'un des développeurs de Pandora FMS depuis un certain temps.

J'ai aussi essayé Nagios et j'aime tous les plugins qu'il a , et qu'il est bien connu des administrateurs système.

Remarque : Je suis l'un des développeurs de Pandora FMS depuis un certain temps.

slovon · Answer

Nous avions besoin de quelque chose de personnalisable car nous devons surveiller certains systèmes qui ne sont pas en ligne tout le temps, mais qui peuvent envoyer du courrier ou être connectés.

Nous avons essayé nagios (labyrinthe de scripts), AppManager (Nice, mais non adaptable), Zenoss (Nice, mais quand vous mentionnez Oracle, le prix obtient des multiplicateurs élevés) et atterri sur Zabbix qui a un protocole ouvert, une structure de base de données ouverte, diable, je peux écrire un plugin à chaque niveau en une heure. Il est bien compartimenté (serveur, client, base de données, ...). Et son interface web est assez agréable et personnalisable.

YMMV, pour nous, la surveillance des systèmes "hors ligne" est importante et elle n'est généralement pas couverte par de tels logiciels.

Bob · Answer

J'utilise Polymon et je l'adore.

http://www.codeplex.com/polymon

C'est fantastique pour surveiller tout ce qui peut être communiqué par TCP Port, SNMP, Powershell, WMI, SQL, HTTP, Perfmon ou Ping.

Je ne surveille rien * nix, donc je ne peux pas en parler. Mais pour le monde Windows, il est très simple à configurer, extrêmement intuitif et extrêmement flexible, il a un affichage de tableau de bord intégré très agréable, une notification par SMS ou e-mail, etc.

Andrew B · Answer

Nous venons de commencer à utiliser "Servers Alive" qui est très peu coûteux, il n'est pas trop joli, mais il prend en charge une tonne de contrôles différents et peut alerter de plusieurs façons, gère la planification/les listes de techniciens, etc. pour toutes les notifications. Vous pouvez également faire en sorte que les vérifications reposent sur d'autres, c'est-à-dire que "ce" système nécessite que "cela" soit opérationnel.

Shawn Anderson · Answer

Pour Windows: Admin Arsenal (mais c'est une donnée dans la mesure où nous possédons le produit)

Pour Unix - IBM Tivoli

hoberion · Answer

Nagios combiné avec nagvis (graphiques pour montrer la surveillance)

lié au courrier électronique, à Google Talk et à Twitter. Vous ne pouvez donc pas échapper à la surveillance

il a même un super plugin firefox

Hamish Downer · Answer

Pour l'état des serveurs et des services (qu'ils soient actifs ou inactifs et l'envoi d'avertissements en cas de panne) et pour les questions oui/non ("une sauvegarde a-t-elle été effectuée au cours des dernières 24 heures?"), Nous utilisons nagios . Il est difficile à configurer, mais il est extrêmement configurable. Des scripts personnalisés peuvent être exécutés sur des ordinateurs distants. Les alertes peuvent envoyer des e-mails, envoyer des SMS ou même exécuter des scripts personnalisés.

Pour la santé des serveurs que nous utilisons munin - il fournit de jolis graphiques de l'utilisation de la mémoire, de l'utilisation du processeur, de l'utilisation du réseau, etc. Assez facile à configurer sur linux au moins (je n'ai pas essayé avec Windows).

user57233 · Answer

J'utilise 10-Strike Network Monitor

Il fonctionne comme un service 24/7 et surveille tous les appareils du réseau en interrogeant périodiquement chaque appareil dans le réseau local. Ican a également mis en place la réponse du programme à des événements particuliers, par exemple la mise sous/hors tension de l'appareil ou du service. Le programme peut afficher un message, lire un son, exécuter des programmes externes, écrire un enregistrement pour se connecter, envoyer des SMS, redémarrer/arrêter un service ou un ordinateur, etc.

user56400 · Answer

Nous avons commencé à utiliser Server monitoring Bijk.com - http://www.bijk.com avant plusieurs semaines auparavant.

Et nous sommes heureux pour une installation simple et une interface graphique et une maintenance très faciles - mail & SMS alertes gratuitement est bon pour nous.

Blair Zajac · Answer

Nous utilisons Orca pour surveiller nos systèmes. Ce n'est pas super joli, mais cela donne une tonne de détails de bas niveau que les autres systèmes de surveillance n'utilisent pas.

Alan · Answer

Solarwinds Ipmonitor en combinaison avec Dell Openmanage et MS Scom.

Brian C. Lane · Answer

J'utilise une combinaison de Nagios, Cacti, des scripts personnalisés et l'un de mes propres projets - System Health Monitor . J'aime avoir une surveillance des services externes ainsi que des graphiques des ressources système afin que vous puissiez faire une analyse post-mortem des problèmes du système ou vérifier rapidement les graphiques pour voir si les choses semblent `` normales '' par rapport à leurs valeurs historiques.

Rich · Answer

J'ai utilisé hobbit, big brother et nagios lorsque je travaillais pour des organisations plus pauvres (lire moins cher). Des trois, je préfère le hobbit car il est simple et à l'épreuve des balles. J'ai toujours pensé que Nagios essayait d'être une version open source d'OpenView ou de Tivoli, et franchement, si j'ai le temps de passer à configurer un framework comme OpenView ou Tivoli, la surveillance est probablement tout mon travail et mon organisation peut probablement se permettre acheter openview, alors pourquoi utiliser nagios?

Peter Mourfield · Answer

Ipswitch WhatsUp Gold

Richard · Answer

OPManager (ports, requêtes HTTP Get, ICMP, SNMP (disque/mémoire/CPU)) (favori personnel!) http://www.manageengine.com/network-monitoring/

OpManager est un logiciel de surveillance réseau primé qui aide les administrateurs à découvrir, cartographier, surveiller et gérer une infrastructure informatique complète.

Cacti (graphisme SNMP, trafic, utilisation du disque, utilisation du processeur, etc.) ( http://www.cacti.net )

À propos de Cacti. Cacti est une solution complète de représentation graphique de réseau conçue pour exploiter la puissance de la fonctionnalité de stockage de données et de représentation graphique de RRDTool.

PRTG (Paessler, malheureusement plus disponible)

SmokePing: (perte de paquets et latence) http://oss.oetiker.ch/smokeping/

Pingdom: http://www.pingdom.com

ericslaw · Answer

J'utilise nagios et hobbit (implémentation open source bigbrother) de manière indépendante et j'ai trouvé à la fois des qualités positives et négatives.

nagios:
pro: dispose d'un joli planificateur de sous-minutes pour exécuter des tâches à intervalles réguliers et dispose d'un interpréteur Perl intégré pour démarrer.
con: config insiste pour avoir un "serveur" pour chaque test, alors que parfois vous voulez simplement exécuter un test basé sur une "fonctionnalité" d'application mais pas nécessairement isolé sur un seul hôte. Revenez à une méta-configuration qui génère la configuration réelle des nagios pour surmonter cela.

hobbit:
pro: serveur compilé opensource au lieu des scripts massifs utilisés par l'intégration facile de big-brother avec la commande bb dboard pour interroger les données.
con: également coincé dans une mentalité "orientée serveur", qui convient à la plupart des gens, mais pas à moi.

Tommy · Answer

Nous avons essayé Applications Manager Son fonctionnement sur Java et mysql. Il est vraiment puissant et facile à configurer depuis le navigateur. Ce n'est pas si cher non plus.

Actuellement, nous utilisons SCOM de MS. Je ne le recommanderais à personne!

Alan · Answer

Nous utilisons le directeur d'IBM, Dells Open manage et "whats up gold"

gharper · Answer

Je remarque que personne n'a mentionné HP SiteScope pour l'instant

PawelRoman · Answer

Nous utilisons AlertGrid , il est idéal pour les applications Web. Contrairement à des millions de moniteurs dotcom typiques, il ne surveille pas les performances (temps de réponse, etc.) de l'extérieur, mais il vous permet de suivre l'exécution de votre code et de toutes vos mesures/statistiques personnalisées en envoyant des événements de l'intérieur de votre application. Une fois que vous commencez à envoyer des événements de votre application à AlertGrid, tout est configurable à l'aide de l'éditeur visuel Nice (100% Web) et les personnes non techniques peuvent facilement créer leurs propres règles d'alerte. Des alertes par e-mail, SMS, téléphone et webhook sont disponibles.

Il dispose d'un plugin pour la surveillance simple du serveur (Windows), qui s'installe en tant que service, s'exécute en arrière-plan et émet des événements concernant l'utilisation du processeur, le% de RAM libre et le fonctionnement des processus. Cela prend une demi-minute à installer, et ça marche! La seule mise en garde est que la machine doit avoir une connexion Internet.

John Rudy · Answer

Nous utilisons Level Platforms pour cette tâche. Fournit une tonne d'informations utiles sans surcharger les administrateurs système et facilite la gestion de tout le matériel de notre salle de serveurs (ainsi que de la plupart de nos clients).

hgmiguel · Answer

Nous utilisons WhatsUp d'ipswitch, c'est très facile pour configurer de petits réseaux, il peut découvrir automatiquement les réseaux par balayage de port, il peut utiliser des fenêtres et des informations d'identification SNMP.

Pour les statiques de moniteur comme cpu, mem et disk, nous devons configurer SNMP. WhatsUp prend en charge SNMP v1, v2, v3.

WhatsUp possède un moniteur passif via syslog (Unix), un visualiseur d'événements (Windows) et des pièges SNMP.

Il a une belle interface web ajax avec un utilisateur personnalisé et des espaces de travail personnalisés.

P.D. Désolé pour mon mauvais anglais

Bijo · Answer

Essayez Travail au sol . Il utilise Nagios. Il a donc toutes les fonctionnalités de nagios et vous pouvez éditer graphiquement des contrôles via une interface web qui n'est pas possible par nagios seul. https://kb.groundworkopensource.com/display/SUPPORT/Home

David Rabinowitz · Answer

Nous utilisons hyperic - il a à la fois une version open source et une version commerciale

Il surveille le système d'exploitation (RHES 3, 4 et 5 + Ubuntu), Apache, MySql, JBoss, Tomcat, les serveurs de messagerie, memcached et il peut probablement surveiller plus d'applications. Aucune configuration spéciale n'est nécessaire, tous les serveurs ont été trouvés avec la découverte automatique, même s'ils ont été installés dans un endroit non traditionnel. Il est très facile à utiliser et à configurer, vous pouvez contrôler vos services (démarrage/arrêt etc.) et définir des alertes.

Moins - Vous devez le configurer pour qu'il s'exécute au démarrage (nous utilisons cron pour cela).

TJL · Answer

Quelqu'un devrait mentionner Netgong pour un simple outil de surveillance marche/arrêt via des intervalles de ping.

nray · Answer

ServersAlive est un outil simple et relativement bon marché pour toutes sortes d'interrogations, y compris TCP, services Windows, vos propres scripts personnalisés, etc.). La réponse du développeur sur sa liste de diffusion est rapide et personnelle.

Je l'ai utilisé lors d'un travail précédent pour la surveillance des services et il était fiable, personnalisable et bon marché.

baska · Answer

Nous utilisons Ipswitch whatsup gold 12 pour surveiller environ 2000 appareils, à la fois les performances et les moniteurs basés sur tcp/ip ou wmi et à la fois Windows et Linux. Une bonne chose à ce sujet est qu'il est facile à utiliser et à configurer, a des options de changement en masse et une découverte automatique, plusieurs méthodes de notification. Le mauvais côté: semble avoir eu une limite d'environ 2000 appareils, après que les performances devenaient lentes, en plus il ne fonctionne que sur Windows. La version distribuée ne mérite pas vraiment le nom et le prix. Nous avons évalué nagios (configuration trop complexe pour un environnement dynamique), zenoss (pas de changement en masse ou de découverte automatique, trop limité pour un environnement dynamique) et examinons actuellement Zabbix, qui semble le plus prometteur avec toutes les fonctionnalités de Nice que Whatsup a et plus, comme entièrement architecture distribuée avec sondes et serveur, configuration relativement simple, backend open source (mysql, Apache) ...

Jayakrishnan T · Answer

EventLog Analyzer est un logiciel basé sur le Web, en temps réel, sans agent, de journal des événements et de surveillance et de gestion des journaux d'application. Le logiciel d'analyseur de journal d'événements collecte, analyse, génère des rapports et archive le journal des événements à partir des hôtes Windows distribués, SysLog à partir des hôtes Unix distribués, des routeurs, des commutateurs et d'autres périphériques SysLog, les journaux des applications à partir de IIS serveur Web , IIS serveur FTP, serveur MS SQL, serveur de base de données Oracle, serveurs DHCP Windows et DHCP Linux. L'application d'analyse du journal des événements génère des graphiques et des rapports qui aident à analyser les problèmes du système avec un impact minimal sur les performances du réseau.

dunxd · Answer

Utilise actuellement Groundworks Open Source Community Edition 5.3 - bien que le support soit tombé en désuétude sur cette version maintenant. Peut passer à GWOS 6 ou peut-être passer à Zabbix ou à un système Open Source similaire. J'ai tendance à privilégier ceux basés sur Nagios, mais je n'irais pas pour Vanilla Nagios en raison du cauchemar de la gestion de tous ces fichiers de configuration interdépendants.

Les plugins WMI Monitoring de Groundworks pour NRPE fonctionnent plutôt bien. Nagios déclenche une vérification du service WMI sur une boîte Windows à l'aide de NRPE, qui effectue ensuite l'interrogation WMI de vos autres boîtes Windows. Cela contourne l'exigence d'avoir des agents NRPE sur vos boîtes Windows, et aussi le cauchemar d'essayer de faire fonctionner Nagios sur * Nix pour s'authentifier sur Windows.

Une autre option intéressante est de configurer SNMP sur vos boîtes Windows dans le cadre de votre build de base. Il existe quelques options pour exposer les vérifications WMI via SNMP ( SNMPTools ) (bien que vous deviez l'installer sur chaque boîte Windows, ce qui ne le rend pas sans agent).

Il existe un certain nombre d'outils Windows qui peuvent surveiller les journaux Windows et envoyer une interruption SNMP lorsque certains événements se produisent.

Leigh Riffel · Answer

Nous nous IP Check qui a été renommé PRTG, il permet une large gamme de capteurs qui peuvent surveiller toutes sortes d'activités différentes.

nray · Answer

MSP Center (l'ancien OpManager) est vraiment frustrant à utiliser et je ne peux pas le recommander. L'interface est entièrement basée sur le Web, ce qui signifie zéro rétroaction et un ensemble de choix arbitrairement limité chaque fois que vous voulez faire quelque chose. Leur site Web semble plein de conseils et de documentation, mais c'est un peu comme Outlook - il promet tout un tas de puissance mais est paralysé par l'imagination limitée de certains développeurs.

Si vous cherchez une solution de configuration zéro pour votre service d'assistance, eh bien peut-être, mais ce n'est pas une sorte d'outil électrique. Si vous avez le temps de régler votre surveillance pour répondre à vos besoins, il existe d'autres solutions qui récompenseront davantage vos efforts.

solid7 · Answer

le très TRÈS excellent multitail pour garder un œil sur les fichiers journaux. nagios pour garder un œil sur la disponibilité du service. rrdtool pour garder mon œil sur la bande passante.

colealtdelete · Answer

WhatsUp Gold d'Ipswitch

K. Brian Kelley · Answer

Jetez également un œil à Argent Guardian . Il est multiplateforme, peut fonctionner comme un serveur syslog, il vous donnera le schéma de base de données pour faire vos propres rapports, si vous en avez besoin, et vous pouvez importer vos propres images en tant que "cartes" pour donner des alertes visuelles.

canadiancreed · Answer

Nagios et HPOpenview sont les deux que je connais et avec lesquels j'ai de l'expérience. Les deux sont de bons choix, bien que pour ce dernier, je fasse écho à d'autres affiches qu'il a besoin de quelqu'un qui sait comment le faire correctement. Une fois de plus, le seul endroit où je l'ai vu tourner était quand j'étais avec HP, ce qui aurait pu améliorer ma perception.

goo · Answer

J'ai travaillé avec beaucoup de systèmes de surveillance à beaucoup d'endroits. La plupart d'entre eux ont déjà été mentionnés. Voici quelques-uns qui n'ont pas été:

SMARTS - désormais détenu par EMC. C'est vraiment la meilleure chose qui soit pour la cause profonde. Ce n'est pas bon marché et le support n'est peut-être plus bon car il appartient à EMC. Nous avons eu la chance de travailler avec les fondateurs de l'entreprise pour la mettre en œuvre.

Grand frère. Agréable et simple, mais une mauvaise licence. C'est aussi l'interface graphique la plus laide que j'aie jamais vue, j'ai donc dû la réécrire. Jamais Big Sister au travail.

HP Openview, lorsqu'il est conçu, installé et géré par un ingénieur compétent, peut être bon. Cependant, je ne l'ai vu que bien et une fois plus souvent que je ne m'en souviens. Je ne choisirais jamais de l'utiliser.

BMC Patrol. Tout simplement horrible. Meurs meurs!

Et enfin, pour les journaux et le suivi des problèmes, il vous suffit d'utiliser Splunk. Si cela avait été il y a environ 10 ans, je me serais épargné beaucoup de temps perdu.

Jason Tan · Answer

Nagios avec des bases sur le dessus.

Je ne sais pas si les travaux préparatoires aident ou gênent, mais Nagios est définitivement bon.

Oskar Duveborn · Answer

J'ai utilisé Activexperts Network Monitor avec beaucoup de succès (sur un réseau principalement Windows, mais il y avait des hôtes Unix et Linux, des imprimantes de différentes marques, etc., qui ont également été surveillés avec lui).

Il est vraiment facile à configurer et à apprendre, plutôt bon marché pour ce que vous obtenez (500 $ pour la licence site/entreprise) et prend en charge les commandes vbscript et unix à distance. Si le réseau est petit (quelques centaines de nœuds au maximum), je pense que c'est beaucoup plus intuitif que System Center Operations Manager qui se sent plus orienté uniquement vers les énormes réseaux Windows.

Le Moniteur réseau est livré avec un grand nombre de scripts prédéfinis pour surveiller des choses comme les serveurs de messagerie, y compris les différentes versions d'Exchange et tous ses services, les serveurs http avec réponse attendue, les journaux d'événements, les requêtes SQL et les réponses attendues et ainsi de suite ... et les dépendances sont faciles à configurer ("tout cela dépend de ce routeur donc s'il ne répond pas au ping et au snmp, ne vous embêtez pas à nous alarmer pour tout ce qui se cache derrière lui qui ne répond pas"). SMS avec prise en charge de la passerelle ou du modem GSM local et toutes les règles peuvent bien sûr avoir des actions comme le redémarrage du service, le redémarrage du serveur ou un script personnalisé - pour résoudre les problèmes qui se reproduisent pour vous (c'est important je pense, un peu comme la régression les tests sont pour le développement).

... J'ai également essayé d'apprivoiser un Hobbit et je n'ai pas vraiment apprécié (ni l'agent Windows gonflé) - mais il a été configuré pour la surveillance du serveur Windows et il souffle vraiment - probablement plus adapté pour un réseau Linux ou Unix-centric.

morgant · Answer

J'utilise Sysmon depuis un certain nombre d'années. Il n'y a pas quelques services modernes qu'il ne surveille pas, mais il se compile facilement sur la plupart des plateformes * nix, n'a presque aucune dépendance , est extrêmement léger- poids, peut facilement contrôler un très grand nombre d'appareils et de services, peut gérer des configurations réseau complexes (y compris les topologies en anneau) et la surveillance de basculement. C'est fondamentalement une affaire de fichier de configuration, mais le format est assez facile (basé sur plist/css).

Artur Nowakowski · Answer

Veuillez vérifier Verax NMS . Avantages:

Approche orientée services
Surveillance des serveurs ainsi que des réseaux, des périphériques réseau (par exemple commutateurs, routeurs), de l'infrastructure du centre de données (par exemple alimentation, climatisation) et des applications (par exemple www et serveurs d'applications, bases de données)
Bibliothèque riche de plug-ins et SDK pour les nouveaux
Prise en charge de la virtualisation
Règles de corrélation d'événements avancées
Rapports avancés (conformité SLA)