Mesurer la consommation électrique des serveurs dans les data-centers: besoins & challenges Code-Watchers! Laurent Lefèvre Inria - laurent.lefevre @ inria.fr M. Diouri, J.-P. Gelas, O. Gluck, A.-C. Orgerie, J.-C. Mignot, F. Rossigneux ANF 2012 Eco info, Villars de Lans 5 Décembre 2012
Rapide présentation Equipe INRIA AVALON / ENS Lyon : Thème de recherche : efficacité énergétique dans les grands systèmes distribués (DC/HPC, Cloud, Réseaux) Projets de recherche : PrimeEnergyIT (petits et moyens DC) : formations, aides achats publics, métriques, services http://www.efficient-datacenter.eu/ Action Européenne COST IC804 : Energy efficiency in large scale distributed systems : http://www.cost804.org/ CompatibleOne : Energy Efficient Open Source Cloud Broker http://www.compatibleone.fr/ XLCLOUD : Energy Efficient HPC as a Service (Openstack) http://xlcloud.org/ GreenTouch : Réduire la consommation des réseaux d un facteur 1000 à l horizon 2015 http://greentouch.org/ Eco-info : http://ecoinfo.cnrs.fr/ ANF2012 5/12/2012 2
Point de vue Du chercheur qui travaille en efficacité énergétique : vous n avez peut être pas encore ces infrastructures.. Mais cela va arriver vite Concepteur de logiciel optimisé (vert) : pas encore disponible sur le marché mais cela va arriver moins vite Mesures énergétiques : quoi /avec quoi? ANF2012 5/12/2012 3
Que mesure t on sur nos serveurs? Ce que l on comprend : des watts! C est quoi une tonne de co2? Dave Ames, Cohasset High School Après la présentation de Robert&Patrick : cosphy ANF2012 5/12/2012 4
Que mesure t on sur nos serveurs? Besoin de précision, besoin de mesures fréquentes De l externe à l interne PDU : EATON, Schleifenbauer, Raritan Wattmetres : Omegawatt / Watt sup Internes : IPMI, Powermon Ressources internes ANF2012 5/12/2012 5
Capteurs utilisés (pdu) EATON Intelligent PDUs Schleifenbauer Raritan Avantages : Dialogue en SNMP Inconvénients: Fréquence :1 mesure toutes les 3 à 5 secondes Précision : paliers de 3 à 5 W Parfait pour des alertes et mesures globalisées
Capteurs utilisés (pdu) Ex : Mesures avec Raritan (site de Reims de Grid5000)
* Consommation électrique/ Usage
Trouver un capteur plus rapide _ Monitoring externe Facile à installer
4 baies de calcul Exemple : Grid5000 Lyon Déploiement à grande échelle : 150 serveurs et équipements réseaux monitorés Wattemetre : grosse boite (25 kg), 48 cables (1 par serveur)
Collecte et affichage (Green) Grid'5000 French experimental testbed 7400 cores 10 sites External energy sensors Full site monitoring 11
Profiler des serveurs (remontée dans ganglia - Omegawatt) 00 MOIS 2011-12
Profiler des applications Profiler la consommation des applications sur un serveur 1 3
Profiler des applications virtualisées HP Proliant 85 G2 Servers (2.2 GHz, 2 dual core CPUs per node) XenServer 5.0 6% increase of energy with 1 VM running 14
Détecter des anomalies ~14% of the electricity consumed by the platform (5 months period) 1 5
Evaluer des leviers verts : shutdown, slowdown Capping Tuning
Evaluer des services : ex migration 17
Donner des infos (utiles) à l utilisateur
Mini déploiement Equipement mono-prise : Watt s UP Pro Remontée d info en USB 1 mesure par seconde Mini : 0.5 W - précision 1.5% 200 euros ANF2012 5/12/2012
Limites : problèmes Wattmètre : c est cher! (100 / 200 euros par prise) Pas de vision interne de la machine : 1 prise pour n coeurs Les constructeurs nous disent : «wattmètre pas utile => tout est monitoré en interne» : utiliser les mesures des capteurs internes Regardons IPMI : Intelligent Platform Management Interface : des interfaces communes qui permettent de surveiller certains composants ANF2012 5/12/2012-21
IPMI vs Wattmetre EMETTEUR - NOM DE LA PRESENTATION 00 MOIS 2011-22
Mesures avec IPMI Pmax = 203 W P7 P5 P6 P3 P4 DELL R610 Dual CPU Quad cœur (Intel Xeon Processor E5506) P1 P2 Lancement de cpuburn toutes les 10 minutes Pidle = 98 W Pidle : 98 W Plus grande conso entre 2-3, 4-5 et 6-7. Cores 2 par 2 Pmax : 203 W Temps de convergence
Précisions des mesures Georges Da Costa (IRIT) Aurélien Ortiz Site de Pau : plate-forme PireGrid Hardware : 16 physical hosts, 128 (real and virtual) cores Intel Xeon E5520 (2.27 Ghz) 8 cores / 24 GB of RAM 4 Xen virtual machines (4GB RAM, 2 Cores) per host racadm (Dell) + IPMI 00 MOIS 2011-24
Mesures internes hautes fréquences Mesurer en interne : prometteur : mais avec du matériel dédié et des fréquences plus hautes Idéal : plusieurs mesures par seconde par ressource (cpu/mémoire/ carte réseaux ), Impact des ventilateurs / qualité de l alimentation? ANF2012 5/12/2012-25
Powermon 2 Equipement RENCI ilab US: ilab.renci.org/powermon Daniel Bedard, Min Yeol Lim, Robert Fowler, and Allan Porterfield PowerMon: Fine-grained and Integrated Power Monitoring for Commodity Computer Systems 15.2cm x 10.2cm x 2.5cm From Renci ilab 10A / channel 8 canaux de mesures 1024Hz / canal, configurable(jusqu à 3072 Hz aggrégé) ADM1191 power sensor IC ATmega168 microcontroller FTDI FT232R IC + hardware UART for USB/I2C étiquetage temporel par matériel ANF2012 5/12/2012-26
From Renci ilab Powermon 2 Mesures DC Précision par canal Connecté directement à ATX API simple Pas cher (~$150) From Wikipedia ANF2012 5/12/2012-27
Utilisation intensive de CPU ANF2012 5/12/2012-28
Consommation mémoire intensive ANF2012 5/12/2012-29
Accès disque ANF2012 5/12/2012-30
Communications réseaux ANF2012 5/12/2012-31
Limites Difficile à déployer dans les nouveaux serveurs ANF2012 5/12/2012-32
Mesures de serveurs pour efficacité énergétique! Mesures par capteurs externes : non intrusif Moins en moins intéressant (trop de ressources (cœurs) par prise) Mesures par capteurs internes : Moins précis (intégré) / Contraignant (dédié) - Diificile à grande échelle Mesures par analyse de l'utilisation des ressources Registres/ accès mémoires / IO - Nécessite encore un peu de calibrage Intrusif Comparatif de 10 capteurs hétérogène en cours (avec Université Jaume1)
La suite Mesures externes à hautes vitesse : LMG Zimmer LMG 450 2 K mesures par seconde / 4 prises monitorées Mais 11 Keuros..pour 4 prises. - 34
Questions? laurent.lefevre@inria.fr Quelques citations : - Marcos Dias de Assuncao, Anne-Cécile Orgerie, and Laurent Lefèvre. "An Analysis of Power Consumption Logs from a Monitored Grid Site", IEEE/ACM International Conference on Green Computing and Communications (GreenCom-2010), Hangzhou, China, December 2010 - Marcos Dias de Assuncao, Jean-Patrick Gelas, Laurent Lefèvre, and Anne- Cécile Orgerie. "The Green Grid5000: Instrumenting a Grid with Energy Sensors", 5th International Workshop on Distributed Cooperative Laboratories: Instrumenting the Grid (INGRID 2010), Poznan, Poland, May 2010 - Anne-Cécile Orgerie, Marcos Dias de Assuncao, and Laurent Lefèvre. "Energy Aware Clouds", Chapter on "Grids, Clouds and Virtualization", M. Cafaro and G. Aloisio (Eds.), pages 145-170. Springer Book, October 2010-35