Monitoring d un Datacenter du concept à la réalisation Par Norbert Andrey Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 1
Objectifs - Détecter les défauts de fonctionnement et les notifier - Collecter des points de mesures et les stocker - Surveillance (écran de contrôle) - Compréhension du comportement du Datacenter et optimisation des systèmes Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 2
Architecture Sécurité Groupe Secours Mesures Notification Climatisation DATACENTER Distribution Electrique Automate FEU EAU Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 3
1. Centralisation des messages -Identification des valeurs à récupérer -Intégration dans le système central -Définir les seuils d alerte Data Data Data Data Data Protocole 1 Protocole 2 Protocole 3 EAU Groupe Secours Distribution Electrique Climatisation Sécurité FEU Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 4
2. Classification des messages INFO WARNING CRITIQUE Aucune intervention Intervention à planifier Effectuer l Intervention immédiatement EAU Groupe Secours Distribution Electrique Climatisation Sécurité FEU Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 5
3. Définir les processus Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 6
4. Matrice de notification Datacenter Piquet Direction INFO x x WARNING x CRITIQUE x x x Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 7
5. Planning de notification Responsable DC Datacenter Piquet Toujours x Planning JOUR (07h00 17h00) x Planning nuit + we (17h00 07h00) 00h00 23h59) x Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 8
6. Canal de distribution Cette étape consiste à définir le canal de distribution pour chaque groupe ou chaque individu qui va réceptionner les messages générés par le système central -GSM (sms) -Email -Pager - Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 9
7. Définir les traces Cette phase consiste à déterminer les points de mesures que nous désirons conserver dans une base de données ainsi que la fréquence d échantillonnage de chaque valeur. - PUE (par minute) - Température ext. (par minute) - Puissance d entrée (par heure) -. Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 10
8. Evénement composite Certains événements «unitaires» ne suffisent pas au monitoring et nous devons les combiner pour créer des événements composites Exemple -Perte d un bloc Chiller -Perte de 2 et plus (warning) (critique) Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 11
9. Suppression des «faux positifs» Lorsque nous supervisons les systèmes, nous découvrons le comportement des automates durant leur fonctionnement. Il peut arriver que certains automates se réinitialisent pendant quelques secondes, ce qui va provoquer le déclenchement d une alerte. Cette phase a comme objectif de détecter ces événements et de les supprimer, en appliquant une temporisation. Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 12
Récapitulation des étapes 1. Mise en place d une centralisation des messages 2. Classification des messages 3. Définir les processus 4. Matrice de notification 5. Planning de notification 6. Canal de distribution 7. Définir les traces 8. Création des événements composites 9. Suppression des «faux positifs» Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 13
Résultat 1: Ecran de contrôle Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 14
Résultat 2: Graphe de mesures Tél: ++41(0)21 316 26 00 - Fax: ++41(0)21 316 27 26 Page 15