Déploiement d'une solution de supervision et de métrologie automatisée à large échelle

Documents pareils
Présentation Level5. Editeur de Logiciels. «If it s not monitored, it s not in production» Theo Schlossnagle #velocityconf

Optimisation de la supervision by Somone. - Présentation Générale -!

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN

Catalogue de FORMATIONS 2015

Présenta6on Isatech. ERP, Décisionnel, Architecture Systèmes & Réseaux. Isatech Tous droits réservés Page 1

SAUVER LA DISTRIBUTION!

SPIP. Gestion de la performance dans SPIP. Préoccupa)on historique

SOGo Université de Strasbourg Direction Informatique

Design & conception de site web optimisé SEO. augmentez la conversion sur vos sites

Table des matières 1. Chapitre 1 Introduction à Nagios et la supervision

LES SOLUTIONS DE MESSAGERIE ET BUREAUTIQUE PROFESSIONNELLES

Simplifiez la ges-on de votre parc informa-que

Release Notes POM v5

Évolu>on et maintenance

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.

Nagios 3 pour la supervision et la métrologie

Améliorez et industrialisez vos feedback produit

VIRTUALISATION : MYTHES & RÉALITÉS

RESSOURCES INFORMATIQUES UFR IMAG ANNEE Présentation service informatique UFR IMAG année 2010/2011 1

Ges$on des clients du réseau pédagogique. Stéphan Cammarata - DANE Strasbourg - Version 10/2013

Évolution de la supervision et besoins utilisateurs

Ma stack d ou,ls agiles, tout un programme! OU COMMENT BÉNÉFICIER DES TECHNOLOGIES GRAND PUBLIC POUR AMÉLIORER ET OPTIMISER MES OUTILS LOGICIELS.

Formations. «Produits & Applications»

Faulconnier Bastien SIO2. Cahier des charges. Choix et mise en œuvre d'un datacenter pour Infrastructure Cloud. Pour la société :

vsphere 5 TP2 La virtualisation avec VMware CNFETP F. GANGNEUX technologie GANGNEUX F. 17/12/2012

GESTION DE CONTENUS (ECM) Ges1on de l informa1on. Nicolas Bürki, Senior Analyst

FusionInventory. Journées Perl. Gonéri Le Bouder Juin Strasbourg

MTI820 Entrepôts de données et intelligence d affaires. Gouvernance des données et ges1on des données de référence

Sébastien Geiger IPHC Strasbourg

SÉLECTIONNER LES MEILLEURS CANDIDATS : L APPORT DES OUTILS D ÉVALUATION AU RECRUTEMENT ET À LA MOBILITÉ INTERNE

Service de Messagerie Enseignement et Recherche

Speed up your business

L essentiel de la communication Web To Store

PORTAIL DE GESTION DES SERVICES INFORMATIQUES

ZABBIX est distribué sous licence GNU General Public License Version 2 (GPL v.2).

CQP 112 Introduc/on à la programma/on. Thème 2 : Architecture d un système informa/que. Département d informa/que

INTEGRATEURS. Pour un Accompagnement Efficace vers le Cloud SUPPORT DE FORMATION, INFORMATION, COMMUNICATION

Retour d expérience sur Prelude

La démarche Omnicanal Outils d'aide à l'amélioration de l'expérience client Avec le partenaire SKema Alumni

Vers une IT as a service

DATASET / NETREPORT, propose une offre complète de solutions dans les domaines suivants:

Ingénierie des réseaux

1 LE L S S ERV R EURS Si 5

La Virtualisation Windows chez CASINO. Philippe CROUZY Responsable Infrastructure Equipes Systèmes -Stockage

Sébastien Geiger IPHC Strasbourg

Lowinski Marc Mansour Chiguer Dominique N'Diaye SI7. OBJECTIF MISSION 3 : Trouver 2 ou 3 outils gratuits Définir les fonctionnalités de ces outils.

Monitoring & Surveillance SLIM CHAKROUN (ENSI) EMNA BEN HADJ YAHIA (RT3) SAFA GALLAH (RT3)

Pe#t déjeuner Prévention des risques professionnels dans la Mutualité

Marché Public. Serveurs et Sauvegarde 2015

CAHIER DES CHARGES D IMPLANTATION

Mise à jour Apsynet DataCenter

Présenta)on DesignBuilder

IaaS à la sauce Portails Focus sur. Pierre Aubert Orange Portails OF/DMGP/Portails/DOP 1 er Juillet 2013

Produits et grille tarifaire. (septembre 2011)

LETTRE DE CONSULTATION

Introduction 3. GIMI Gestion des demandes d intervention 5

Les méthodes Agiles. Introduc)on aux méthodes Agiles Exemple : Scrum

NACIRI Mehdi. Rapport de stage : Mise en place d un moyen pour anticiper les pannes des serveurs de l IUT. Promotion BTS SIO Option SISR

SQL Server, MySQL, Toad (client MySQL), PowerAMC (modélisation) Proxy SLIS

Procédure d installation de la solution Central WiFI Manager CWM

Sujet Solution de sauvegarde de serveurs et postes de travail avec BackupPC et Bacula. par ALIXEN

Architectures d implémentation de Click&DECiDE NSI

Service Cloud Recherche

Pensezdifféremment: la supervision unifiéeen mode SaaS

14 Octobre 2008 TICPME2010 Sage et TICPME2010

MSP Center Plus. Vue du Produit

Zabbix. Solution de supervision libre. par ALIXEN

MULTITEL, votre partenaire de recherche et d innovation

Nom du client. Date. Client Logo or project name

BCO. Sébastien LECOT Directeur de GESS PARTNERS

La virtualisation de serveurs avec VMWare Infrastructure - Retour d expérience. Rodérick Petetin CRI INSA Rennes

Déployer et sécuriser des applica1ons mobiles dans votre SI / Cloud

LA DIGITALISATION DE LA RELATION CLIENT

NetCrunch 6. Superviser

Savoir- Faire Offres mé1ers Offres technologiques

PRÉSENTATION DES RÉSULTATS DU LIVRE BLANC BIG DATA

LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES

Cabinet de Conseil STRATÉGIE MANAGEMENT ORGANISATION JURIDIQUE FORMATION AVEC BW CONSULTANTS CHOISISSEZ DE GARANTIR VOTRE DEVELOPPEMENT

H2PS engage ses compétences auprès des entreprises et des parculiers par la mise en place de soluons d accompagnements et de services.

Les formations. calipia. novembre 2014 à mai 2015

Comment CEGID et ses solu/ons peuvent elles implémenter les standards TICPME2010?

Réunion de rentrée Licence PER Programma3on en environnement répar3. Année universitaire

PostgreSQL, le cœur d un système critique

Comment optimiser votre. utilisation de POM? 23 avril 2015

ITIL et SLAs La qualité de service nous concerne tous!

DOCUMENTATION KAPTravel Module de gestion des appels de disponibilité

Offre Azimut CONTENT MARKETING. A l a&en)on de : Date de remise : Version : 3.0

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Retour d expérience de la plateforme de virtualisation sous Proxmox VE à l IPHC journée SysAdmin du 04/12/2014 à l INRA de Toulouse

POVERELLO KASONGO Lucien SIO 2, SISR SITUATION PROFESSIONNELLE OCS INVENTORY NG ET GLPI

Projet Personnalisé Encadré PPE 2

Description de l implantation dans le centre d examen (nom du service ou de l outil et caractéristiques techniques)

Entreprise Chiffres clefs

Etude d architecture de consolidation et virtualisation

Catalyse IT. Innovation Digital/Numérique

Documentation : Réseau

Solution IT Power Management Gérer la consommation électrique de toute votre infrastructure IT

Transcription:

Déploiement d'une solution de supervision et de métrologie automatisée à large échelle Sébastien Boggia Benjamin Collet Guillaume Schreiner 14/11/2013

Introduc*on Solu*on de supervision et de métrologie Dans un environnement de DSI Transposée dans un contexte de recherche Solu*on axée autour du logiciel libre Centreon Importants efforts d intégra*ons menés pour Une automa*sa*on maximale avec le SI Une supervision sur différents niveaux équipements, applica*ons, services à l u*lisateur

Plan Contexte et objec+fs Architecture et ou*ls Intégra*on dans le SI Disponibilité des services et tableaux de bord Reproduc*bilité de la solu*on Retour d'expérience et perspec*ves

Contexte 2009 : naissance de l Université de Strasbourg

Contexte 2009 : créa*on de la Direc*on Informa*que CRC ULP CURRI ULP SIIG ULP ULP Mul*média ULP? PRIM UMB CRI URS SICD CRI IUFM Direc*on Informa*que Université de Strasbourg 122 personnes

Contexte Restructura*on des équipes accompagnée de restructura*ons techniques Nécessité de déployer une solu*on de supervision et de métrologie mutualisée Projet lancé dans le cadre du Schéma Directeur Numérique de l Université de Strasbourg mi- 2010 à fin 2011 phase 1 2012 phase 2

Objec*fs fonc*onnels Du point de vue de la gouvernance Proposer des ou*ls pour la mise en œuvre du processus de ges*on de la disponibilité (projet mise en œuvre d ITIL) Du point de vue de l exploita*on Remonter et gérer efficacement les alertes Aider au diagnos*c Apporter de la visibilité sur l état de fonc*onnement des services offerts par la DI Proposer des vues adaptées à chaque équipe

Objec*fs fonc*onnels Direc+on Informa+que 4 départements Infrastructures Services mé+ers Rela+on u+lisateurs Organisa+on missions - infras réseau - serveurs - hébergement services - stockage - bases de données Dév. et main*en : - Applica*ons mé*ers - messagerie et ou*ls collabora*fs - ges*on postes de travail - support u*lisateurs N1 pour les services DI - architecture du SI - PSSI - processus qualité volumétrie - 1680 eq. Réseau - 720 serveurs VM physique - 10 baies de stockage - 850 BDD 171 services et applis 4500 postes de travail 67 services au catalogue besoins disponibilité : - des équipements, - des services d'infrastructure disponibilité des services et applis mé*ers disponibilité : - des serveurs et ou*ls de ges*on de parc - des services offerts aux u*lisateurs données de repor*ng des services

Objec*fs techniques Ra*onaliser les ou*ls Converger vers un ensemble réduit et cohérent d applica*ons Proposer une solu*on performante et évolu*ve Équipements et services en constante progression Automa*ser l intégra*on La supervision ne doit pas être une charge supplémentaire U*liser des ou*ls ouverts Fonc*onner dans un environnement hétérogène Bénéficier d une communauté dynamique

Plan Contexte et objec*fs Architecture et ou+ls Intégra*on dans le SI Disponibilité des services et tableaux de bord Reproduc*bilité de la solu*on Retour d'expérience et perspec*ves

Architecture et ou*ls Solu*on retenue Centreon + Nagios Interac*on avec nos autres ou*ls Base d inventaire des équipements : GLPI + Fusion Inventory Ou*l de topologie et de métrologie réseau : Netmagis Journalisa*on des configura*ons réseau Topologie et métrologie réseau

Architecture et ou*ls Centreon Architecture distribuée basée sur des satellites NAGIOS / NDO Passage à l échelle Interface Web riche Configura*on fine de l ensemble des paramètres Mul*- u*lisateurs avec ges*on fine des droits Graphiques de métrologie Communautés Centreon et Nagios dynamiques Nombreux plugins Open Source

Architecture et ou*ls Fonc*onnement de Centreon Configura*on de Centreon

Architecture et ou*ls Collecte des Fonc*onnement de Centreon données Remontée vers Centreon SNMP NRPE HTTP SNMP SNMP

Architecture et ou*ls Centreon : architecture système et réseau Hébergement sur des machines virtuelles (VM) KVM Rapidité pour le déploiement des satellites Nagios Souplesse dans l alloca*on des ressources Créa*on d un réseau dédié à la supervision Connecté au plus près du cœur de réseau Simplifica*on des règles de filtrage sur les équipements supervisés

Architecture et ou*ls Dimensionnement de la plateforme 2 300 hôtes et 13 400 sondes de supervision Type de machine Fonc*on Nb. Architecture du serveur Centreon Hébergement Centreon + BBD 1 VM 12 VCPU 2GHz - 24 Go RAM Supervision IN- Band 4 VM 8 VCPU 2GHz - 2 Go RAM Satellites Nagios Supervision réseau Out- of- Band 1 VM 2 VCPU 2GHz - 1 Go RAM Supervision à par*r des données de métrologie (Netmagis/METRO) 1 Serveur physique 16 cœurs 2.67 GHz 8Go RAM

Plan Contexte et objec*fs Architecture et ou*ls Intégra+on dans le SI Disponibilité des services et tableaux de bord Reproduc*bilité de la solu*on Retour d'expérience et perspec*ves

Intégra*on dans le SI Objec*f : automa*ser les interac*ons avec le SI Réduire les tâches d exploita*on Maintenir une cohérence avec la réalité des éléments supervisés U*liser le référen*el unique GLPI pour appliquer à un hôte Des groupes de supervision prédéfinis dans Centreon Des modèles de supervision prédéfinis dans Centreon Modèles génériques : liés à l inventaire de la machine (système, disques ) Modèles spécifiques : renseignés par l administrateur de la machine (applica*on, service )

Intégra*on dans le SI Exemple de modèles de supervision sur applica*on SOGo Linux Ubuntu sur serveur HP Agenda partagé SOGo Modèle Host status Modèles génériques à par*r de l inventaire automa*que de la machine Modèle HP Proliant Modèle Linux Ubuntu Modèle spécifique par l administrateur du service Modèle host- srv- sogo- backend Statut du hôte Fan Disk / process ldap UP/DOWN Hard disks Disk /local postgresql Groupes de supervision Linux SOGo Raid RAM Check APT Load average Process SoGo mailq PSU temperature

Intégra*on dans le SI Applica*on des modèles spécifiques Directement sur le serveur : champ TAG de Fusion Inventory Linux : /etc/fusioninventory/agent.cfg Windows : base de registres tag=com-snmp:sogo:host-srv-sogo-backend! Dans GLPI, onglet dédié à la supervision (développement interne)

Intégra*on dans le SI Synchronisa*on entre GLPI et Centreon Développement de l ou*l CentAPI Intègre les machines à superviser dans Centreon à par*r de GLPI Applique aux machines les modèles et les groupes de supervision CentAPI u*lise le module Centreon CLAPI Permet de contrôler Centreon en ligne de commandes (CLI) Permet de s affranchir de l interface Web pour configurer Centreon

Intégra*on dans le SI Intégra*on d un serveur 2. Inventaire : Statut serveur «en produc*on» 1. Agent Fusion Inventory Inventaire serveur + Tag de supervision 3. Requête SQL dans GLPI - IP de management - communauté SNMP - modèles de supervision - groupes de supervision 4. Intégra*on serveur avec CLAPI

Intégra*on dans le SI 2. Requête SQL : Infos supervision 3. Intégra*on Centreon + Netmagis 1. Référencement équipement + statut «en produc*on» SNMP Intégra*on d un équipements réseau Métrologie réseau Voisinage LLDP

Intégra*on dans le SI Configurer la parenté : détecter l origine d une panne

Intégra*on dans le SI Automa*ser la configura*on de la parenté 1. Liaisons VM serveurs 2. Liaisons : serveurs réseau (LLDP) réseau réseau 3. Calcul chaîne de parenté

Intégra*on dans le SI Résultat dans Centreon pour agenda partagé (SOGo) Hôte : sogo- p2- be1 Tests liés à sogo- p2- be1

Plan Contexte et objec*fs Architecture et ou*ls Intégra*on dans le SI Disponibilité des services et tableaux de bord Reproduc*bilité de la solu*on Retour d'expérience et perspec*ves

Disponibilité des services Enjeu : déterminer la disponibilité d un service du point de vue de l u*lisateur Services définis dans le catalogue des services de la DI Service au sens u*lisateur complexe Interac*on entre plusieurs équipements et applica*ons Disponibilité calculée à l aide de Nagios Business Process Combinaison des état des services supervisés par Centreon

Disponibilité des services Exemple avec le service d accès Wi- Fi avec portail cap*f Résultat remonté dans Centreon

Disponibilité des services Rapports de disponibilité Dans le cadre du processus ITIL «ges+on de la disponibilité» Générés automa*quement à par*r des données de disponibilité des services 24h/24 : informa*ons dans la base de repor*ng de Centreon 8h 18h : calculé à par*r des logs d événement de Centreon

Tableaux de bord et vues Demandes d interfaces simplifiées et mul*- support Vues adaptées aux équipes, selon leurs besoins Concep*on des tableaux de bord Applica*on web Nagios Dashboard modifiée Informa*ons affichées récupérées dans Centreon selon : Groupes d'hôtes Groupes de services Groupes d'u*lisateurs Le très complet système d ACL

Tableaux de bord et vues Tableau de bord du support N1 (dpt. rela*on u*lisateurs).

Tableaux de bord et vues Tableau de bord département Infrastructures

Tableau de bords et vues Tableau de bord services mé+ers

Plan Contexte et objec*fs Architecture et ou*ls Intégra*on dans le SI Disponibilité des services et tableaux de bord Reproduc+bilité de la solu+on Retour d'expérience et perspec*ves

Applica*on à un labo de recherche Plate- forme expérimentale de recherche Plate- forme IoT- LAB, Equipex FIT (Future Internet of Things) Recherche dans le domaine de l Internet des Objets Equipements à superviser ~1024 nœuds ~100 robots ~30 systèmes (VM et phy.) ~30 commutateurs

Applica*on à un labo de recherche Contraintes géographiques Distribuée sur 4 sites distants Administrée par différents ingénieurs Pilotée par des chercheurs Repor*ng Passage à l échelle Ajout de nouveaux sites

Applica*on à un labo de recherche Architecture Centreon distribuée Collecteur (1x) : Centreon + ndo2db (serveur dédié) Satellites (4x) : Nagios + ndomod (VM sur serveur KVM) 2Go RAM + 2CPU + 20Go DD ~ 250 hôtes et 300 services par satellite Déploiement packagé grâce à Fabric (Python) Intégra*on des hôtes et services à par*r de CSV Tableaux de bord grâce à Centreon Widgets (Centreon 2.4.X)

Applica*on à un labo de recherche Tableaux de bord «état d un site»

Plan Contexte et objec*fs Architecture et ou*ls Intégra*on dans le SI Disponibilité des services et tableaux de bord Reproduc*bilité de la solu*on Retour d'expérience et perspec+ves

Retour d'expérience Solu*on mise en place a bien répondu aux besoins Réduc*on des délais de détec*on et de traitement des incidents Visibilité et maitrise du SI accrue En temps réel, état global des services Pour analyse à postériori : métrologie et repor*ng Système de vues personnalisées apprécié Op*misa*ons nécessaires Réglage empirique des seuils d alarmes Op*misa*on de la remonté d informa*ons vers le broker Ndo2db

Retour d'expérience Adop*on de la solu*on : les clés du succès Prise en main côté exploita*on facilitée au maximum Automa*sa*on Tableaux de bord simplifiés avec liens directs pour acqui{er les alarmes Procédures simples de ges*on des incidents selon cri*cité Prise en main côté administrateur accompagnée Créa*on d un groupe de travail «supervision» Transferts de compétence vers les responsables de service

Retour d'expérience Adop*on de la solu*on Installa*on de moniteurs de supervision aux endroits statégiques

Perspec*ves Ges*on de la supervision côté serveurs Automa*ser le déploiement et la configura*on des ou*ls de supervision avec l ou*l CHEF Evolu*on du système de collecte Centreon Améliorer les performances NDO - > Centreon Broker Nagios - > Centreon Engine Dépendance entre services Rendre l origine d une panne plus visible Où modéliser les services?

Merci