Retour d'expérience sur Nagios 3. Christophe Sahut <christophe.sahut@sgs.com>

Documents pareils

Table des matières 1. Chapitre 1 Introduction à Nagios et la supervision

Recherche d indicateurs et de tendances via des plugins pour Nagios. groupe Quasar IN2P3 Le 11/09/2014

Monitoring des Ressources Informatiques au LAL. Journées Informatique IN2P3 DAPNIA HOURTIN Jacquelin Charbonnel - printemps 2004

ZABBIX est distribué sous licence GNU General Public License Version 2 (GPL v.2).

Gestion de clusters de calcul avec Rocks

SDIS 84 PROJET INFOGERANCE PROCEDURE. Procédure

Zabbix. Solution de supervision libre. par ALIXEN

Nagios 3 pour la supervision et la métrologie

Smart Notification Management

Monitoring & Surveillance SLIM CHAKROUN (ENSI) EMNA BEN HADJ YAHIA (RT3) SAFA GALLAH (RT3)

Etude d architecture de consolidation et virtualisation

Contrôle d accès Centralisé Multi-sites

Fully Automated Nagios

Spécifications techniques

NACIRI Mehdi. Rapport de stage : Mise en place d un moyen pour anticiper les pannes des serveurs de l IUT. Promotion BTS SIO Option SISR

MISE EN ŒUVRE D UNE SOLUTION DE SUPERVISION NAGIOS XI

PRÉSENTATION PRODUITS DE LA GAMME SOLARWINDS + NETWORK CONFIGURATION MANAGEMENT

White Paper - Livre Blanc

Retour d expérience sur Prelude

Licence Pro ASUR Supervision Mai 2013

MISE EN ŒUVRE MOVEIT DMZ V1.8

Présentation de l outil d administration de réseau Nagios

Eyes Of Network 4.0. Documentation d installation et de configuration

TD4 - Supervision et métrologie des réseaux. 1 Supervision des applications et services réseaux et des ressources locales

Les méthodes de sauvegarde en environnement virtuel

La virtualisation de serveurs avec VMWare Infrastructure - Retour d expérience. Rodérick Petetin CRI INSA Rennes

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Supervision système et réseau avec Zabbix. Anne Facq Centre de Recherche Paul Pascal 17 avril 2008

Administration Réseau

Ces deux machines virtuelles seront installées sous VMWARE WORKSTATION.

Virtualisation et Sécurité

MOBILITE. Datasheet version 3.0

PERFORMANCE ET DISPONIBILITÉ DES SI

Présentation des composants WhatsUp Companion & WhatsUp Companion Extended. Version Mars Orsenna

NetCrunch 6. Superviser

MSP Center Plus. Vue du Produit

Configuration de Zabbix

Sommaire. Introduction. Lancement produit. WhatsUp Companion. Démonstration produit Questions et réponses. Présentation Orsenna

TER SUPERVISION RESEAU

Infrastructure Management

Documentation : Réseau

ANF Datacentre. Jonathan Schaeffer Monitoring Environnemental Ad-Hoc. J. Schaeffer. Intro. Dans mon rack.

11/04/2014 Document Technique des Services Disponibles. 16/04/2014. Document Technique des Services Disponibles.

Cloud public d Ikoula Documentation de prise en main 2.0

Mise en place d un système de supervision Open source.

Faulconnier Bastien SIO2. Cahier des charges. Choix et mise en œuvre d'un datacenter pour Infrastructure Cloud. Pour la société :

Plan de cette matinée

Formations. «Produits & Applications»

Cluster High Availability. Holger Hennig, HA-Cluster Specialist

Table des matières 1. Introduction. 1. Avant-propos Remerciements Chapitre 1 Virtualisation de serveurs

Installation d une architecture VMware Infrastructure 3 : Bilan et perspectives

Solution IT Power Management Gérer la consommation électrique de toute votre infrastructure IT

pfsense Manuel d Installation et d Utilisation du Logiciel

VMWare Infrastructure 3

Exploitation d un calculateur

VIRTUALISATION : MYTHES & RÉALITÉS

Cours 13. RAID et SAN. 2004, Marc-André Léger

CT ASS Analyste systèmes Senior

DOCKER MEETUP. Christophe Labouisse

Retour d expérience de la plateforme de virtualisation sous Proxmox VE à l IPHC journée SysAdmin du 04/12/2014 à l INRA de Toulouse

ACQUISITION DE MATERIEL INFORMATIQUE

VMware ESX/ESXi. 1. Les composants d ESX. VMware ESX4 est le cœur de l infrastructure vsphere 4.

Network Shutdown Module V3 Extension du Manuel Utilisateur pour architecture Virtualisée VMWare ESX Server 3, 3.5

Master d'informatique. Réseaux. Supervision réseaux

Rôles serveur Notion de Groupe de Travail Active Directory Utilisation des outils d administration Microsoft Windows Server 2008

PRÉSENTATION PRODUITS DE LA GAMME SOLARWINDS + NETWORK CONFIGURATION MANAGEMENT

Table des matières. Chapitre 1 Les architectures TSE en entreprise

Spécialiste Systèmes et Réseaux

Statistiques réseau et système avec CACTI

SUJET : «Administration et supervision du réseau Par NAGIOS»

VMware ESX : Installation. Hervé Chaudret RSI - Délégation Centre Poitou-Charentes

au Centre Inter-établissement pour les Services Réseaux Cédric GALLO

LIVRE BLANC PRODUIT. Evidian SafeKit. Logiciel de haute disponibilité pour le clustering d application

La Latecion protection anti-intrusion Web Web Le concept «Zero effort Security» La protection des applications Extranet

Virtualisation du poste de travail. Denis CASANOVA UFR Sciences & Technologies CUME - 29 Mars 2012

PPE 2-1 Support Systeme. Partie Support Système

Nouveautés VMware vsphere 5.0 et retour d expérience d un upg

Network Shutdown Module V3 Extension du Manuel Utilisateur pour architecture Virtualisée VMWare ESX Server

Description de l implantation dans le centre d examen (nom du service ou de l outil et caractéristiques techniques)

«clustering» et «load balancing» avec Zope et ZEO

Procédure pas à pas de découverte de l offre. Service Cloud Cloudwatt

Armelin ASIMANE. Services RDS. de Windows Server 2012 R2. Remote Desktop Services : Installation et administration

Du 23 Janvier au 3 Février2012 Tunis (Tunisie)

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Acronis Backup & Recovery 10 Advanced Server Virtual Edition. Guide de démarrage rapide

Configuration du serveur ESX

Fiche produit Fujitsu Serveur NAS CELVIN Q600 STOCKAGE RESEAU

Edition de février Numéro 1. Virtualisation du Poste de Travail

L état de l ART. Évolution récente des technologies. Denis Szalkowski Formateur Consultant

ACTION PROFESSIONNELLE N 4. Fabien SALAMONE BTS INFORMATIQUE DE GESTION. Option Administrateur de Réseaux. Session Sécurité du réseau

UCOPIA EXPRESS SOLUTION

Roadmap 10/06/2011. Tous droits réservés - les dates et le contenu de ce document ne sont pas contractuels et sont susceptibles d'évoluer

vsphere 5 TP2 La virtualisation avec VMware CNFETP F. GANGNEUX technologie GANGNEUX F. 17/12/2012

vcenter Server 1. Interface Lancez le vsphere Client et connectez vous à vcenter Server. Voici la page d accueil de vcenter Server.

Transcription:

Retour d'expérience sur Nagios 3 Christophe Sahut <christophe.sahut@sgs.com>

Introduction SGS : Société Générale de Surveillance Activités Inspection,verification,test,certification Clients IT à la SGS Pourquoi cette présentation 2

Présentation du contexte

Contexte Historique de la supervision à la SGS Big Brother Nagios 2.x Nagios 3.x 4

Contexte Plateforme utilisée : Hardware VMWare ESX en cluster HA Machine virtuelle 2 CPU Xeon 2.66Ghz 512MB de RAM pour ~ 270 hosts et 1200 services 5

Contexte Plateforme utilisée : Software RedHat EL (4&5) RPMs Nagios (SGS) PNP4nagios 6

Contexte Environnement à monitorer Serveurs Linux, Windows, VMware Routeurs, switchs Filers NetAPP, load balancers BigIP Beaucoup d'applications 7

Installation et Administration de Nagios

Installation Serveur Nagios RPM vs Sources : RPMs Scripts de réinstallation : «Disaster Recovery» Réinstallation d'un OS standard Application d'un script Nagios «up and running» 9

Administration Avec rpm/yum tout simplement Mise à jour via miroir local Etant sur une plateforme ESX, on profite des snapshots Retour en arrière très simple en cas de gros problème (?) 10

Configuration Plusieurs méthodes : Fichier texte Beaucoup de manières de s'organiser! Interface graphiques Fruity Monarch Centreon... 11

Configuration Notre choix : par fichier texte : K.I.S.S. Facile à modifier (bash/vim/sed/awk...) Facile à backuper Facile à restaurer Example : Génération automatique avec Vim 12

Configuration Configuration de Nagios Avantages : très flexible Inconvénients : très flexible La configuration peut être très simple comme très compliquée 13

Configuration Configuration classique Définition d'un host Définition de services, appliqué à ce host Définition de contactgroups pour ce host et ses services Exemple : configuration par défaut Difficile à maintenir à grande echelle Nagios 3 apporte beaucoup de facilités 14

Configuration Nos choix (Nagios 3) : Utilisation massive de «templates» imbriqués Pour les machines Pour les services Pour les contacts Utilisation massive de hostgroups Exemple 15

Supervision avec Nagios 16

Supervision Linux Dans notre cas, RedHat uniquement On déploie les agents par ssh via un script, ce en fonction de la version de RedHat Contient les «nagios-plugins» officiels Tout ce qui est test spécifique est gardé dans la mesure du possible centralisé sur le serveur Nagios 17

Supervision Linux Comment : plusieurs méthodes : NRPE checkbyssh SNMP... Nous n'utilisons que checkbyssh 18

ssh Serveur Nagios nagios plugins check_load check_swap check_disk... Serveur distant 19

Supervision Linux En standard, nous monitorons : Le charge du processeur La mémoire (swap) L'utilisation des disques 20

Supervision Windows Nous utilisons le plugin NSClient++ Archive avec la configuration pour notre environnement Déployé manuellement (pour l'instant) Possibilité de le faire via AD Service sous Windows 21

NRPE Serveur Nagios NSClient++ CheckSystem.dll CheckDisk.dll CheckWMI.dll... Serveur distant 22

Supervision Windows En standard, nous monitorons : Le processeur La mémoire L'utilisation des disques Les journaux Event Logs 23

Supervision Windows Possible : Etat d'un service ou d'un processus Vérification de logs Taille de fichier etc... Non limité à NSClient++ en lui-même Possibilité d'extension avec WMI/WSH/VBScript 24

Supervision Windows En évaluation : Performance counters Supervision de clusters Microsoft 25

Divers Exemple pour les NAS NetApp Utilisation de check_netapp.pl, modifié pour nos besoins Basé sur du SNMP 26

SNMP Traps Principe Les équipements envoient des messages de type SNMPTrap à Nagios en cas de dysfonctionnement Nagios gère les alertes et contacte les personnes conçernées Intérêt : On évite beaucoup de trafic réseau inutile 27

SNMP Traps Cartes RSA IBM On reçoit des alertes de type : Critical alerts : Hard disk drive,multiple fan failure,power failure,tamper,temperature,voltage,vrm failure Warning alerts : Single fan failure, Temperature, Voltage, Redundant power supply System alerts : Boot failure, Loader timeout, OS timeout, PFA, POST timeout, Power off, Power on, Partition Configuration, Event Log 28

SNMP Traps De nombreux équipements savent envoyer des SNMPTraps : Aruba Wireless AP BigIPs Cisco switches (modifications de la configuration, link up, link down etc...) Vmware (Etat des machines (powered off, powered on, pause state etc...) Netapps 29

Supervision passive Principe : «push» des résultats des tests au lieu de «pull» Utile pour des évènements irréguliers Vérification du statut d'un backup Utilisation de NSCA pour ceci Egalement utilisé dans des environnements distribués, ou des architectures avec firewalls 30

Spécifique Webinject : utilisation de scénario Connexion sur une page web Entrée d'un login Réalisation de quelques opérations Déconnexion Si tout s'est bien passé => statut OK 31

Notifications Envoi d'email 24x7 pour tout le monde Possibilité de plages horaire, de rotation d'équipes «OnCall Teams» Possibilité d' «Escalation process» 32

Notifications Et si les emails ne fonctionnent pas? Envoi de SMS si le système de messagerie est défaillant Modem itegno 3000 sous Linux avec gnokii Et si Nagios ne fonctionne pas? Supervision du serveur Nagios par un autre serveur Nagios 33

Graphes avec Nagios 34

Graphes Plusieurs solutions, une seule retenue : PNP4Nagios 35

Graphes Très simple, très peu intrusif Utilise les résultats de Nagios pour faire des graphes Utilisé uniquement pour avoir les évolutions 36

Graphes Outil sympathique Recherche Ajax Calendrier Zoom «à la Cacti» Export PDF Example 37

Intégration avec l'existant 38

Authentification AD 39

Authentification AD Utilisateurs autorisés Un groupe AD Un utilisateur pour l'écran de supervision Genève : accès à toute l'infrastructure Un utilisateur pour l'écran de supervision Manille : accès à leur partie 40

Authentification AD 41

Authentification AD 42

Authentification AD Configuration d'apache Redirection HTTP -> HTTPS HTTPS systématique Configuration de l'authentification AD Lien vers le Global Catalog AD Connexion avec un compte de service Vérification d'appartenance à un groupe AD 43

Intégration Intégration avec l'infrastructure existante Wiki Démo Gestionnaire de ticket En cours d'intégration 44

Intégration D'autres outils sont utilisés en complément : Cacti pour le réseau Ganglia pour les clusters TTL (basé sur rrdtool, développement spécifique pour une application) SmokePing : debugging réseau 45

Utilisation avec les équipes de support 46

Support 24x7 Equipe à Manille 24x7 GIMS Global Infrastructure Management Services Une dizaine de personnes (sys & dba) Support niveau 1 & 2 infrastructure Accès à une partie restreinte de l'infrastructure 47

Support 24x7 Besoin de communiquer lors d'incidents Fait via des fonctionnalités de Nagios «Scheduled Downtime» «Acknowledgement» 48

Interconnexion de serveurs Nagios 49

Interconnexion 50

Interconnexion Usage habituel Un nagios maître qui a l'interface web et qui envoie les alertes Plusieurs Nagios esclaves qui font la supervision «local» et qui envoient les résultats au serveur central Configuration assez lourde 51

Interconnexion De part la configuration IT de SGS : Plusieurs Nagios indépendants par pays Des accès au Nagios des applications globales par les équipes de support Une configuration de base commune à tous Nous maintenons en un seul endroit la référence de configuration 52

Remarques / Astuces / Divers 53

Divers Demander des feedbacks des admins DNS vs IP dans la configuration Thresolds de charge sur les systèmes Enable notification / dev_null contact Plugin Firefox Génération de bookmarks Curiosité : Googlemap dans Nagios 54

Contributions SGS et le libre : Contribution d'un serveur quadcore à Ethan Gstaad, auteur de Nagios Bug reports / RFE sur Nagios Membre «grande entreprise» du GULL Evangélisation ;-) 55

Conclusion Nagios, c'est très bien. 56

57