NAGIOS Administration Réseau/Système Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 1
AGENDA La problématique Nagios Les concurrents Conclusion Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 2
AGENDA La problématique Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 3
Pourquoi Superviser? La problématique des réseaux privés d entreprise La taille des réseaux ne cesse de grandir Besoins d expert en Administration pour surveiller les réseaux Décentralisation des systèmes d information Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 4
Pourquoi Superviser? L évolution des méthodes de travail au sein même de l entreprise Enjeu économique : l activité de toute entreprise dépend de la disponibilité de son système d information La disponibilité du réseau Q.O.S (Contrôler la bonne santé du réseau) La supervision permet de répondre à cette problématique. Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 5
Son objectif Etre réactive, en alertant les administrateurs en cas de dysfonctionnement d un élément du système d information Etre proactive, en permettant d anticiper les futurs incidents Aider à cibler le problème dès son apparition pour agir de la façon la plus pertinente possible. Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 6
Missions et domaines Les missions principales S assurer de l état des systèmes et services Surveillance Réseaux ping, udp, tcp... B a s e d e d o n n é e s Surveillance Applicatives Ssh, Dns, Http Ldap... Plate forme Supervision Surveillance Ressources Disques, mémoire, alementation Surveillance passive Sondes Utilisation snmp Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 7
Superviser, Organisation? Basée sur une organisation logique ou physique Nécessite la mise en place de procédures et d un inventaire précis des principaux éléments (interne ou externe) Implication forte des équipes d administration et de supervision Host X Host X Host X Serveur Console Moniteur Logique Physique Swicht Serveur de supervision Routeur X Routeur Routeur Host X Host X Host X Host X Host X Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 8
Superviser, comment? Analyser des fichiers de log Récupérer les résultats des commandes (scripts locaux ou distants) Utiliser SNMP comme protocole d administration Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 9
Les alertes de notifications Prévenir en temps réel l administrateur de tous les dysfonctionnements (techniques ou autres) aussi bien sur le réseau que sur les serveurs Superviseur Serveur de Supervison Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 10
Les escalades Définition : Une escalade est une stratégie qui consiste à gravir les échelons de mesures techniques ou décisionnelles de plus en plus graves Par groupe de contact pour des services ou Hôtes Criticité des incidents/gravité Fréquence de l apparition d un même incident Délais dépassés Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 11
Interface Web Donne la cartographie du SI Génère une photo à l instant T de son réseau en quelques clics Produit des statistiques sous forme de graphiques (exemple : durées des dysfonctionnements) Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 12
Reporting Créer des rapports sur la disponibilité des équipements Génère des graphes sur les alertes de remontées d anomalies Organise et archive les alertes Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 13
Synthèse supervision des environnements hétérogènes supervision simple, efficace adaptation aux processus de l entreprise supervision de bout en bout (métier) indicateurs et suivi de la Qualité de service Assurance de la disponibilité optimale du parc et de la Qualité de Service Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 14
AGENDA Nagios Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 15
NAGIOS - AGENDA Présentation Les généralités Le principe de fonctionnement Les sondes (ou plugins) Les agents Le stockage des données Architecture L architecture globale L ordonnanceur: NAGIOS Les équipements supervisés Les acteurs Interface L IHM Les informations d état Les cartes Les rapports Les configurations Synthèse Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 16
Présentation Les généralités (1) Historique 1999 NetSaint 2002 Nagios 2004 Nagios v1.2 2001 NetSaint v0.0.7 2002 Nagios v1 2004 Nagios v2 Système d exploitation Linux Operating System Licence GNU General Public License Principaux développeurs Démon: Ethan Galstad Plugins: Karl Debisschop, Subhendu Ghosh, Ton Voon et Stanley Hopcroft Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 17
Présentation Les généralités (2) Fonctionnalités supervision réseaux: routeurs, switchs, supervision des ressources systèmes: cpu, espace disque, supervision applicative: mysql, samba, apache, notification par sms, messagerie, wap, exécution de commandes visualisation de l état des ressources supervisées (coloration) visualisation de la carte de votre réseau en 2D et 3D édition de rapports Support URL: http://www.nagios.org Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 18
Présentation Le principe de fonctionnement Plugins Équipements supervisés Base de données Serveur Web CGI Navigateur Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 19
Présentation Les sondes (ou plugins) Définition Exécutable ou script lancé à partir d une ligne de commande pour tester un service ou un hôte. Conventions retourne un code d état: 0=OK, 1=WARNING, 2=CRITICAL et 3=UNKNOW retourne un texte informatif se lance par une commande:./check_xxx!param1!param2!... fournit une aide: --h ou --help Sécurité à la charge du développeur du plugin souvent SSH (Secure SHell) ou SSL (Secure Sockets Layer) Support URL: http://sourceforge.net/projects/nagiosplug/ Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 20
Présentation Les agents Définition Programme permettant de lancer des processus à heures fixes. Les agents NRPE (Nagios Remote Plugin Executor) 1 Agent NRPE 2 3 Les agents NSCA (Nagios Service Check Acceptor) Agent NSCA 2 1 Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 21
Présentation Le stockage des données Support fichiers: *.cfg et *.log base de données: Mysql ou PostgreSQL Structure des fichiers de configuration define objet { attribut1 valeurs attribut2 valeurs } Structure des fichiers de logs [Temps MAJ] OBJET;valeur1;valeur2;valeur3; Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 22
Architecture L architecture globale Équipements supervisés Superviseurs Contacts supervision web envoie d alertes exécution de sondes exécution de commandes Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 23
Architecture L ordonnanceur: NAGIOS Nagios: démon qui ordonnance l exécution de sondes (check_xxx) et qui stocke les données dans des fichiers ou en BD. Il notifie les alertes aux personnes désignées et peux exécuter des commandes. La visualisation des informations nécessite un serveur web. (nagios.cfg, timeperiods.cfg, checkcommands.cfg et misccommands.cfg) Équipements supervisés Superviseurs Contacts supervision web envoie d alertes exécution de sondes exécution de commandes Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 24
Architecture Les équipements supervisés Host: équipement supervisé définit par une adresse ip, un nom, un plugin d état, éventuellement un parent. Il met en œuvre un à plusieurs services (ping, tcp, http, sgbd, ). Les services peuvent être regroupés: servicegroups. (hosts.cfg, services.cfg et servicegroups.cfg) Équipements supervisés Superviseurs Contacts supervision web envoie d alertes exécution de sondes exécution de commandes Hostgroup: regroupement d équipements dans un but d administration. On peut définir une liste de contacts qui seront alertés en cas de défaillance sur un des équipements du groupe. (hostgroups.cfg) Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 25
Architecture Les acteurs Superviseur: personne qui dispose de droits (consultation, configuration et/ou exécution de commandes) sur l application NAGIOS. (cgi.cfg et htpasswd) Équipements supervisés Superviseurs Contacts supervision web envoie d alertes exécution de sondes exécution de commandes Contact: personne qui doit être contactée (sms, mail, ) en cas de défaillance d un ou de plusieurs services. Les contacts peuvent être regroupés sous la forme de liste: contactgroups. (contacts.cfg et contactgroups.cfg) Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 26
Présentation L IHM Version Menu Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 27
Présentation Les informations d états Exemple: L état des services par équipement Hostgroup Host Service (en erreur) Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 28
Présentation Les cartes Exemple: La carte 2D Hostextinfo Host Parent Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 29
Présentation Les rapports Exemple: L histogramme des états cpu d un équipement Service Host Nombre d évènements Jours Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 30
Présentation Les configurations Exemple: La configuration des équipements Nom Adresse Planification Test d état Description Parent Notifications Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 31
Synthèse Les moins configuration relativement difficile optimisation et tunning IHM nécessite connaissance et expérience Les plus plugins programmables communauté très active (150 plugins dans nagios-plugins) supervision de tous les os et tous les équipements est flexible et ouvert Donc Si vous disposez d un bon administrateur réseau et éventuellement de quelques développeurs, NAGIOS vous permettra d administrer la totalité de vos applications, de vos systèmes et de vos réseaux. Time Warner Cable SA(3000-15000), Intrinsec(2200-5130), Easynet (200-600) Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 32
AGENDA Les concurrents Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 33
Les Concurrents - AGENDA Présentation du Marché Offre Comparatif Nagios HP OpenView Big Brother Crédibilité de Nagios Offres disponibles Suivi et développement Quelques utilisateurs Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 34
Les Concurrents Présentation du Marché 2/4 L Offre Marché encombré par nombreux outils et solutions propriétaire ou open source! Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 35
Les Concurrents Présentation du Marché 3/4 L Offre propriétaire : OpenView de Hewlett-Pacard Tivoli d IBM Patrol de BMC Software Unicenter de Computer Associates etc... Avantages : solutions globales et éprouvés périmètres techniques et fonctionnels étendus support Inconvénients: coût d acquisition et de support incompatibilités entre fournisseur --> choix d un fournisseur unique développement additionnel restreint et coûteux Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 36
Les Concurrents Présentation du Marché 4/4 L Offre open source : Nagios Big Brother Zabbix OpenNMS Scotty Cacti etc... Avantages : faible coût d acquisition développement additionnel peu coûteux et riches respect des standards indépendance des fournisseurs Inconvénients: support difficile périmètres techniques et fonctionnels encore limités Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 37
Les Concurrents Comparatif 1/3 Big Brother Nagios HP OpenView Operations communication Unidirectionnel avec agent Bidirectionnel Bidirectionnel architecture clients - serveurs redondant clients - serveurs redondant clients - serveurs redondant type d'agent scripts plugin modifiable scripts plugin modifiable module plugin paramétrable SPI (Smart Plug-In) Installation et à compiler ou package (relativement complexe) à compiler ou package (relativement complexe) mise en place simplifié et pré-compilé pour simplifié sur versions version professionnelle intégrateur simplifié et pré-compilé Configuration via fichiers de configuration (scripts) via fichiers de configuration (scripts) via interface web via interface d'administration Stockage d'informations OS supporté sous forme de fichier de logs client/serveur: Windows NT4, 2000, Unix / Linux client : Windows XP et 2003, NetWare, Mac OS9, VMS, AS/400 et VM/ESA (plugins existants) sous forme de fichier de logs base de données MySql ou PostgreSQL client/serveur: Linux client : Unix, Windows NT4/2000/XP/2003, NetWare, VMS (plugins existants) base de donnée Oracle (non fourni) client/serveur : HP-UX ou Solaris (existe aussi pour Windows NT4/2000 serveur) client : Unix (AIX, Tru64), Linux (Suse, Red Hat, Turbo), Windows NT4/2000, OS/390, OS/400 (SPI vendu avec) Autres disponible (SPI vendu séparément) Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 38
Les Concurrents Comparatif 2/3 Big Brother Nagios HP OpenView Operations Modularité affichage Nombreux plugins existants Nombreux plugins existants Nombreux modules SPI existants Plugins facile à réaliser et développer sous tout type de langage via client WEB (pages HTML) Plugins facile à réaliser et développer (langage C, perl, shell) via client WEB basé sur des CGI affichage cartographique des machines (2D et/ou 3D) APIs de développement via client lourd java ou web affichage cartographique des machines (2D et/ou 3D) vue simple et dépouillé vue moyennement complexe vue moyennement complexe affichage d'état vert --> OK orange --> erreur / avertissement vert --> OK rouge --> alarme / problème jaune -->erreur / avertissement bleu --> non connecté orange --> inconnu / indéfini noir --> indéfini rouge --> alarme / problème rose --> pas de rapport durant 30 minutes vert --> OK jaune --> erreur mineur orange --> erreur rouge --> alarme bleu --> état inconnu bleu foncé --> non connecté Historique et Reporting affichable graphiques (à l'aide de MRTG) graphiques graphiques historique des logs sous forme historique sous forme de de tableau daté simple avec lien tableau avec vue synthétique vers la logs ou complète des logs indicateurs de disponibilité simple indicateurs de disponibilité complet listing des logs jour par jour historique vue synthétique ou complète des évenements indicateurs de disponibilité complet listing des événements Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 39
Mécanisme de test et autres notification et remonté d'alerte Les Concurrents Comparatif 3/3 Big Brother Nagios HP OpenView Operations Ping, traceroute pour test réseau simple Démons client (Agent) pour informations sur client Ping pour test réseau simple Démons client (Agent) pour informations sur client Dépendance entre différents services et hosts ("parent") Execution d'actions automatiques (programmable) Récupération native des traps SNMP Démons client (Agent) pour informations sur client Dépendance entre différents services et hosts Execution d'actions automatiques (paramétrable) Groupe de Hosts Groupe de Hosts Groupe de services complètement paramétrable complètement paramétrable paramétrable visuel via affichage logiciel visuel et sonore via affichage visuel et sonore via affichage logiciel logiciel escalade via mail, SMS, WAP, escalade via mail, SMS, WAP, beeper, Chat (ICQ, Yahoo, MSN), beeper ou téléphone (version pro) WinPopup escalade via beeper acquittement des alertes possible acquittement des alertes possible acquittement des alertes possible surveillance services réseau et protocoles au dessus de TCP surveillance services réseau et protocoles au dessus de TCP / UDP surveillance services réseau et protocoles basé sur la couche 3 et au-dessus.* supervision surveillance équipements réseau surveillance équipements réseau surveillance équipements réseau via SNMP* par ping et via SNMP (plugin) par ping et via SNMP (plugin) (* Network Node Manager inclut) surveillance ressources système surveillance ressources système surveillance ressources système surveillance des applications et surveillance des applications et base de données base de données Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 40
Les Concurrents Crédibilité de Nagios Offres disponibles Plate-forme COMET : empaquetage certifié Nagios, Webmin et VNC de (SSLL) IDX-Monitoring : Solution de supervision Nagios, avec console web évoluée de etc... Suivi et Développement Nagios 2.0 OREAN (installation simplifié de paquetage Nagios) Nombreux forums et sites de contribution supports et intégrations par SSII et SSLL Quelques utilisateurs Ministère des Finances : Supervision des serveurs et équipements de la DGI et de la DGCP. RATP : supervision de 80 serveurs et 50 équipements réseau. CNRS : supervision de plus d une centaine d équipements. Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 41
AGENDA Conclusion Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 42
Conclusion Outil de supervision particulièrement abouti. Intégré dans les offres de solutions de supervision globale. Bénéficie d une large communauté de développeurs active. Bien connu et supporté par les intégrateurs SSII et SSLL. Outil flexible et évolutif. Bonne qualité technique et fonctionnel. Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 43
Bibliographie Information sur Nagios http://www.nagios.org et http://www.nagios-contribs.org http://www.linagora.com et http://www.linagora.org http://etudiant.univ-mlv.fr/~nchavero/xposesystem http://docs.guill.net/article.php3?id_article=2 Linux Magazine n 65 d octobre 2004 Information sur la concurrence http://www-igm.univ-mlv.fr/~dr/xpose2003/bigbrother http://www.bb4.org http://www.bmc.com http://www.openview.hp.com http://www.cai.com http://www.opennms.org Démonstration de Nagios http://nagios.square-box.com login : guest mot de passe : guest Stéphane BERGEROT Martine EDON Igor BARIC IRE 2005 44