Efficacité énergétique des technologies et infrastructures dans les datacentres et salles serveurs



Documents pareils
Résolvez vos problèmes d énergie dédiée à l informatique

LES DATACENTRES. ANGD MATHRICE Novembre Françoise Berthoud Violaine Louvet. Merci à Dominique Boutigny. Site web :

Consortium e-server. Avec le soutien de

Achats d équipements de datacentres et salles serveurs : Recommandations pour l inclusion de critères d efficacité énergétique

Energy Logic : Emerson Network Power. Feuille de route pour la réduction r de la consommation d'énergie dans le Centre de données

Le centre de données du futur sobre en énergie et évolutif

DATA CENTER. Règles d'ingénierie du Data Center DATA CENTER

Unités de distribution d'alimentation (PDU) :

LENOVO THINKSERVER GUIDE DES PRODUITS. Haute évolutivité et flexibilité conjointes au développement de l entreprise

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

Emerson montre aux centres de données comment réduire ses coûts énergétiques

en version SAN ou NAS

Réduction des coûts de consommation dans un datacenter

Outils de planification et gestion pour datacentres

SOMMAIRE. 1. Architecture proposée. 2. Constituants de la solution. 3. Supervision DATA CENTER OPTION SERVICE

Indicateurs Normes Codes de conduite. Françoise Berthoud Grenoble, 12 juin 2012

agile Datacenter vert Le monde naissant des datacenters de nouvelle génération ICAR-2013

Conception d une infrastructure «Cloud» pertinente

vbladecenter S! tout-en-un en version SAN ou NAS

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

réduisez la facture électrique

Stratégie intelligente de reprise d activité pour les postes de travail : postes de travail sous forme de service (DaaS) LIVRE BLANC

Modélisation du rendement électrique des datacenters

Choix d'un serveur. Choix 1 : HP ProLiant DL380 G7 Base - Xeon E GHz

Protection des données avec les solutions de stockage NETGEAR

Enjeux énergétiques Datacenter et postes de travail

EHDC. Système de refroidissement pour Data Center et armoires de serveur.

Une présentation de HP et de MicroAge. 21 septembre 2010

Serveurs et solutions PowerEdge pour les applications métiers

EMC DATA DOMAIN HYPERMAX

Toutes les solutions pour l efficacité énergétique de votre entreprise

Fiche produit FUJITSU ETERNUS DX200F Baie de stockage Flash

L unique SAN industriel proposant un stockage multiniveau automatisé (Automated Tiered Storage)

Datacentre : concilier faisabilité, performance et éco-responsabilité

Marché Public. Serveurs et Sauvegarde 2015

IBM CloudBurst. Créer rapidement et gérer un environnement de Cloud privé

Data Center Rittal: standard ou sur mesure? Rittal Yverdon IT

Green (?) datacenter. Green Datacenter - TIC et environnement - Institut Mines Telecom - 13 mai 2014, boutherin@lpsc.in2p3.fr

Etude d architecture de consolidation et virtualisation

Estimation & amélioration du DCiE d un datacenter

DOCUMENT DE TRAVAIL DES SERVICES DE LA COMMISSION RÉSUMÉ DE L'ANALYSE D'IMPACT. accompagnant le document:

Optimisez vos environnements Virtualisez assurément

Prestations de conseil en SRM (Storage Ressource Management)

Résolution des problèmes de refroidissement provoqués par le déploiement de serveurs haute densité en dix étapes

Solution IT Power Management Gérer la consommation électrique de toute votre infrastructure IT

EMC DATA DOMAIN OPERATING SYSTEM

ACQUISITION DE MATERIEL INFORMATIQUE

Gestion de l infrastructure des Datacenters

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?

Présentation Infrastructure DATACENTRE

7 avantages à la virtualisation des applications stratégiques de votre entreprise

Paul-François Cattier, APC by Schneider Electric France : la France est un territoire propice pour les datacenters

COMMENT... Gérer efficacement un centre de données

Présentation de la gestion des infrastructures de centres de données

Portefeuille de solutions HP pour la virtualisation

Système de stockage IBM XIV Storage System Description technique

Solutions globales de monitoring sans fil

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

SAUTER novapro Open : B-AWS. BACnet Advanced Workstation

Fiche produit Serveur FUJITSU PRIMERGY BX900 S2 Système de serveur lame

Cisco Unified Computing Migration and Transition Service (Migration et transition)

La nouvelle solution de stockage V3700

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Description du produit

La surveillance réseau des Clouds privés

Les cinq raisons majeures pour déployer SDN (Software-Defined Networks) et NFV (Network Functions Virtualization)

TBR. Postes de travail virtualisés : IBM simplifie la gestion de l infrastructure avec ses serveurs System x Août 2013

CONSULTATION : (MAPA) MAT_INFO_2013_03 Marché à procédure adaptée (MAPA) MAT_INFO_2013_03

ETUDE D EFFICACITE ENERGETIQUE. MICROSOFT Sites : Paris les Ulis - Issy les Moulineaux

Playbook du programme pour fournisseurs de services 2e semestre 2014

Optimisez votre installation électrique avec StruxureWare Power Monitoring Expert

UMG 20CM. UMG 20CM Appareil de surveillance des circuits de distribution avec 20 entrées et RCM. Analyse d harmoniques RCM. Gestion d alarmes.

Retour d'expérience CC-IN2P3

Retours d expériences et perspectives sur les aspects énergétiques

Experts efficience informatique

Article sur les caractéristiques assignées du neutre dans l'ue

Je bénéficie désormais des avantages exceptionnels de la virtualisation pour mon stockage. Virtual SAN est aussi économique que simple à utiliser.

En ce qui concerne le datacenter de Facebook à Prineville, l Open Compute a permis de :

VMWare Infrastructure 3

Batterie Li-ion Evolion. La solution éprouvée ultracompacte de Saft pour les applications télécoms

Leader belge en énergies renouvelables. Etudes de financement, conception, installation, exploitation et maintenance

Article 2 : Conseils et meilleures pratiques pour gérer un cloud privé

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Green it consulting nouveau leader de l informatique écologique

Guide Dell Alimentation et refroidissement

Alcatel-Lucent VitalQIP Appliance Manager

WHITE PAPER. Quels avantages la déduplication offre-t-elle aux entreprises? Livre blanc Acronis

Conformité aux normes de gestion des PC reconnues par l industrie

Information Technique Derating en température du Sunny Boy et du Sunny Tripower

agility made possible

CA Automation Suite for Data Centers

Cluster High Availability. Holger Hennig, HA-Cluster Specialist

Marché Public en procédure adaptée : Infrastructure Informatique régionale hébergée CAHIER DES CHARGES ET DES CLAUSES TECHNIQUES

Principaux utilisateurs du Réseau

Solutions NEC pour les collectivités territoriales

Économie d énergie dans les centrales frigorifiques : La haute pression flottante

Architecture Technique

Transcription:

floorfour Agentur für Kommunikation Efficacité énergétique des technologies et infrastructures dans les datacentres et salles serveurs Partenaires Soutenu par Contact : Agence autrichienne de l Energie Dr. Bernd Schäppi Mariahilferstrasse 136 A-1150 Vienna Tel +43 1 586 15 24 bernd.schaeppi@energyagency.at www.efficient-datacenters.eu Contact France : BIO Intelligence Service Shailendra Mudgal 20-22 Villa Deshayes 75014 Paris Tel +33 1 53 90 11 80 sm@biois.com

Mentions légales Direction éditoriale : consortium projet PrimeEnergyIT, juillet 2011 Coordination projet : Dr. Bernd Schäppi, Agence autrichienne de l Énergie (Vienne) Version française du document : BIO Intelligence Service (Traducteur - François-Xavier Durandy) Reproduction partielle autorisée, sous réserve de mention exhaustive de la source. Document imprimé sur papier blanchi sans chlore. Le contenu de cette publication relève de la seule responsabilité de ses auteurs et ne prétend pas refléter la position de l Union européenne. L AECI et la Commission européenne ne sauraient être tenues pour responsables de l utilisation pouvant être faite des informations contenues dans le présent document.

Des technologies efficaces pour réduire la consommation énergétique et les coûts des datacentres et salles serveurs La consommation énergétique des datacentres et salles serveurs a fortement progressé au cours des dix dernières années. La montée en puissance des matériels et la complexité accrue des services informatiques ont entraîné une hausse de la demande en énergie. Les coûts liés aux infrastructures et à l énergie dans les datacentres sont ainsi devenus un facteur essentiel de la gestion de site et de l infogérance. Un ensemble de technologies ont donc été développées pour améliorer l efficacité énergétique et de nouvelles options de matériels et de gestion des systèmes d information soutiennent les stratégies d économies d énergie. Le potentiel d économie des datacentres et salles serveurs est généralement élevé, souvent supérieur à 50 %, en fonction des technologies et des infrastructures. Les mesures d économies d énergie ont jusqu à présent surtout porté sur les solutions d alimentation et de refroidissement, mais l efficacité énergétique des matériels fait désormais partie des pistes à l étude. Des travaux récents montrent que les mesures d optimisation entraînent d ores et déjà une réduction significative de la demande en énergie par rapport à un scénario de statu quo [Koomey 2011]. Le potentiel demeure pourtant élevé et les technologies nouvelles permettent un déploiement encore plus efficace des mesures d économies d énergie. Cette brochure présente un aperçu succinct des technologies actuelles (matériel informatique et infrastructure) en faveur de l efficacité énergétique. Elle couvre l ensemble des équipements informatiques essentiels des datacentres : serveurs, stockage et réseaux. Les stratégies pour une plus grande efficacité énergétique englobent la conception des systèmes, la gestion de l énergie à différents niveaux (du matériel informatique au datacentre dans son ensemble) ainsi que les mesures de consolidation et de virtualisation. Des recommandations de bonnes pratiques mettent en avant les choix les plus intéressants à envisager dans la gestion et les achats des matériels. Des suggestions de lecture sont également indiquées. La brochure constitue ainsi une source d informations de base pour aider les gestionnaires en technologies et infrastructures à optimiser l efficacité énergétique et la rentabilité des datacentres. Cette brochure s inscrit dans le projet international PrimeEnergyIT (www.efficient-datacenters.eu), mené dans le cadre du programme de l UE «Intelligent Energy Europe». 1) Koomey, J. (2011): Growth in Data center electricity use 2005 to 2010, Jonathan Koomey, Analytics Press, Oakland, CA, August 1, 2011 3

Table des matières 1 Suivi de la consommation d énergie dans les datacentres et salles serveurs 6 1.1 Concepts de monitoring 6 1.2 Appareils de mesure 9 2 Équipements de serveur 10 2.1 Efficacité énergétique et gestion de l énergie au niveau du serveur et de ses composants 10 2.1.1 Efficacité du processeur 12 2.1.2 Efficacité de l alimentation électrique 13 2.2 Gestion de l énergie au niveau du rack et du datacentre 14 2.2.1 Gestion de la capacité et de l énergie 14 2.2.2 Power capping 16 2.3 Options de gestion de l énergie spécifiques pour serveurs lames 16 2.3.1 Châssis et composants des serveurs lames 17 2.3.2 Problèmes d alimentation et de refroidissement 19 2.4 Virtualisation des serveurs 21 2.4.1 Potentiel d économie d énergie de la virtualisation 22 2.4.2 Exigences et outils de planification de la virtualisation 23 2.4.3 Gestion de l énergie dans les environnements virtualisés : migration vers serveur virtuel 24 2.4.4 Refroidissement et infrastructures des systèmes virtualisés 25 3 Équipements de stockage de données 28 3.1 Appareils de stockage 28 3.1.1 Systèmes à bandes 28 3.1.2 Disques durs (DD) 29 3.1.3 Disques SSD 31 3.1.4 Disques durs hybrides (HHD) 31 3.2 Éléments de stockage 32 3.2.1 Disques de grande capacité et miniaturisation 32 3.2.2 Baies de disques de type MAID 32 3.2.3 Niveaux RAID efficaces 32 3.2.4 Tiering horizontal, virtualisation du stockage et allocation granulaire de capacité 33 3.2.5 Consolidation au niveau du stockage et de la matrice 34 3.2.6 Déduplication de données 34 4

4 Équipements de réseau 36 4.1 Cadre technique et opérationnel 36 4.1.1 Schéma fonctionnel 36 4.1.2 Attributs du réseau 37 4.1.3 Équilibrer la performance et la consommation énergétique 37 4.2 Amélioration de l efficacité énergétique 38 4.2.1 Fusionner les classes de trafic (consolidation E/S) 38 4.2.2 Consolidation du réseau 40 4.2.3 Virtualisation du réseau 41 4.2.4 Sélection des composants et équipements 42 4.2.5 Commutation floor-level 42 5 Refroidissement et alimentation des datacentres et salles serveurs 44 5.1 Refroidissement des salles serveurs 44 5.1.1 Climatiseurs «split» et mobiles 44 5.1.2 Mesures d optimisation de l efficacité énergétique 45 5.2 Refroidissement des datacentres moyens à grands 46 5.2.1 Généralités 46 5.2.2 Contrôle de la température et de l humidité 47 5.2.3 Efficacité des composants (compresseurs, ventilateurs, centrales de traitement d air) 48 5.2.4 Free cooling 48 5.2.5 Refroidissement au niveau du rack/de la rangée 49 5.3 Alimentation et onduleurs dans les datacentres 49 5

1 Suivi de la consommation d énergie dans les datacentres et salles serveurs Carlos Patrao, Université de Coimbra 1.1 Concepts de suivi On peut distinguer trois grands types de suivi : Le suivi de la consommation d énergie dans les datacentres et salles serveurs est un élément essentiel pour évaluer le potentiel d économie d énergie et l efficacité des mesures d efficacité énergétique. Ce monitoring doit être conçu de façon à garantir la collecte de données pertinentes. On tiendra compte des aspects suivants [1] : Niveau requis de précision et de résolution des données ; Répartition de la collecte de données, capacité à recueillir des données à partir de tous les appareils souhaités ; Facilité d utilisation et d intégration des données entre appareils et échelles de temps ; Evolutivité pour un déploiement de masse et capacité multi-sites ; Adaptabilité aux nouveaux besoins de mesure ; Options d analyse des données et intégration avec les systèmes de contrôle ; Capacité à détecter les problèmes et notifier les opérateurs des datacentres ; Montant de l investissement et retour. Charge du site Suivi minimum Reposant sur des mesures réalisées ponctuellement et périodiquement avec un équipement portable, ce suivi se prête surtout aux sites de très petite taille. Certaines données (consommation, etc.) pourront être tirées de la documentation du fabricant. Cette approche ne nécessite pas d investissement dans des équipements et infrastructures de mesure installés de façon permanente. Suivi avancé Les données sont communiquées en temps réel grâce à des équipements installés de façon permanente, avec le soutien éventuel d instruments en ligne. De légères modifications devront sans doute être apportées aux infrastructures. Suivi de pointe Les données sont collectées en temps réel grâce à des systèmes d enregistrement automatisé ou permanent, avec le soutien de logiciels en ligne dotés de fortes capacités d analyse. Ce suivi impose une modification des infrastructures et le soutien d un personnel technique expert. Le système de suivi doit disposer d un nombre adéquat de «nœuds d information» (ou «points d auscultation») pour fournir les informations nécessaires à une analyse exhaustive de la consommation d énergie. Sur les sites de grande taille, la sélection de ces «nœuds» doit commencer par les sous-systèmes les plus représentatifs en termes de consommation (cf. Figure 1.1), qui pourront faire figure de «points d auscultation». Charge informatique Alimentation électrique Équipements informatiques Appareillage électrique Services Consommation totale du site Générateurs Onduleurs Consommation des équipements informatiques Stockage Équipements télécoms etc. etc. Climatiseurs Compresseurs Free cooling etc. Fig. 1.1 Schéma simplifié des principaux sous-systèmes d un datacentre [Source: ASHRAE [2]]. 6

Plusieurs outils logiciels permettent d assurer la collecte des données, leur traitement et leur évaluation. Le programme «Save EnergyNow» du ministère américain de l Énergie a ainsi mis au point une suite logicielle baptisée «DC Pro», comprenant un processus d évaluation, des outils de benchmarking et de suivi de la performance ainsi que des recommandations pour les mesures. Cette suite est disponible en téléchargement gratuit. http://www1.eere.energy.gov/industry/datacenters/ software.html AUTRES EXEMPLES D OUTILS LOGICIELS UTILES : Consommation d énergie : http://estimator.thegreengrid.org/puee Reporting du PUE : http://www.thegreengrid.org/en/global/content/tools/puereporting Mesure de l évolutivité du PUE et analyse statistique : http://www.thegreengrid.org/library-and-tools.aspx?category=metricsandmeasurements&range= Entire%20Archive&type=Tool&lang=en&paging=All# TB_inline?&inlineId=sign_in Mesure du PUE et du DCiE (Data Center infrastructure Efficiency) : http://www.42u.com/measurement/pue-dcie.htm RECOMMANDATIONS DE BONNES PRATIQUES L efficacité du système de suivi de la consommation d énergie suppose que sa conception s appuie sur une bonne compréhension des objectifs principaux, notamment : Évaluer la consommation d énergie totale des équipements informatiques et des infrastructures ; Analyser l évolution de la consommation dans le temps ; Comprendre la demande d énergie instantanée des principaux équipements du site ; Contrôler la facturation ; Calculer les indices et indicateurs d efficacité énergétique. Les logiciels/matériels mis en œuvre pour le suivi de la consommation énergétique devront offrir les fonctionnalités suivantes (source : ASHRAE) : Fiabilité de la collecte de données et du stockage en fonction du taux et du niveau de précision souhaités ; Normalisation des données issues de différents appareils, interfaces et protocoles ; Sauvegarde des données sur de longues périodes de relevé ; Analyse et affichage des données sous forme de tableaux et graphiques ; Architecture extensible pour accompagner l expansion du datacentre. Les principaux aspects à prendre au compte au moment du choix des appareils pour le système de suivi sont notamment la plage de mesure de l instrumentation, sa résolution et sa précision. 7

Tab. 1.1 Exemples d appareils de mesure de la consommation énergétique Désignation Illustration Description Type de suivi Appareils de mesure portables Les appareils portables couvrent un vaste éventail de produits, des multimètres monophasés jusqu aux appareils d analyse triphasés les plus avancés, avec fonctions d enregistrement et de déclenchement programmé. Ils comportent généralement un écran intégré qui permet à l utilisateur de consulter les données mesurées ou enregistrées. Minimum et avancé Source: Chauvin Arnoux Appareils de tableau Source: Chauvin Arnoux Les appareils de tableau sont généralement installés de façon permanente au niveau de l armoire électrique mesurant les onduleurs, générateurs et autres appareils. Ils possèdent un écran qui affiche les mesures en temps réel et les variables cumulées comme la consommation totale d énergie. Ils peuvent être installés pour mesurer la consommation globale ou individuelle des différents appareils. Suivi de pointe et bonnes pratiques Compteurs Source: Itron Les compteurs sont principalement utilisés par les compagnies d électricité et les propriétaires adressant des factures à leurs clients, locataires, etc. Rarement affectés au suivi des datacentres, ils fournissent toutefois des données sur la consommation totale du site. Le fournisseur pourra parfois fournir l accès au port de communication numérique, permettant un relevé et une sauvegarde dans une base de données pour une analyse future (par ex. toutes les 15 minutes). Compatibles avec l ensemble des approches Unités de distribution d alimentation intelligentes Source: Raritan Les unités de distribution d alimentation (PDU) intelligentes ou PDU pour rack avec compteur assurent une fonction de mesure active pour optimiser l alimentation et protéger les circuits. Ils fournissent des données d utilisation de l énergie permettant aux gestionnaires de faire des choix informés sur la répartition de la charge et la micromisation des environnements informatiques pour réduire le coût total de possession. Les PDU peuvent être équipées d un suivi distant en temps réel de l énergie au niveau de l unité ou des différentes sorties : courant, tension, puissance, facteur de puissance et consommation (kwh) avec une marge d erreur de ±1 % (ISO/IEC) compatible avec la facturation. L accès et la configuration se font via une interface sécurisée de type web, SNMP ou Telnet. Compatibles avec l ensemble des approches Fonctions de mesure intégrées au serveur Fonction de mesure de l alimentation électrique intégrée au serveur Minimum et avancé Transducteurs Les transducteurs sont généralement des équipements dépourvus d écran et connectés de façon permanente à l armoire électrique, à l instar des appareils de tableau. Ce type d appareils sert souvent aux systèmes de suivi à obtenir des mesures issues de divers points du datacentre. Compatible avec l ensemble des approches Source: Chauvin Arnoux 8

1 Suivi de la consommation d énergie dans les salles serveurs et datacentres 1.2 Appareils de mesure Un grand nombre d appareils de mesure de tous types permettent de mesurer les variables clés telles que la consommation d énergie, la température, le débit et l humidité. Quelques exemples d appareils de mesure de l énergie sont présentés dans le Tableau 1.1 (cicontre, page 8). Pour tout complément d information, veuillez vous référer aux sources indiquées ci-après ou consulter le «Technology Assessment Report» sur le site web de PrimeEnergyIT. Pour aller plus loin ASHRAE (2010) : Real-Time Energy Consumption Measurements in Data Centres, ASHRAE American Society of Heating, Refrigerating and Air- Conditioning Engineers, 2010. ISBN: 978-1-933742-73-1 Stanley, J. and Koomey, J. (2009) : The Science of Measurement: Improving Data Centre Performance with Continuous Monitoring and Measurement of Site Infrastructure, Stanley John and Koomey Jonathan, October 2009 www.analyticspress.com/scienceofmeasurement.html Ton, M. et al. (2008) : DC Power for Improved Data Centre Efficiency,Ton, My, Fortenbery, Brian and Tschudi, William, Ecos Consulting, EPRI, Lawrence Berkeley National Laboratory, March 2008 http://hightech.lbl.gov/documents/data_centres/ dcdemofinalreport.pdf The Green Grid (2008) : Green Grid Data Centre Power Efficiency Metrics. White Paper 6, The Green Grid, White Paper 6. December 30, 2008 http://www.thegreengrid.org/global/content/white- papers/the-green-grid-data-centre-power-efficiency- Metrics-PUE-and-DCiE Rasmussen N. (2009) : Determining Total Cost of Ownership for Data Centre and Network Room Infrastructure, Neil Rasmussen, APC by Schneider Electric, White paper #6 Revision 4 http://www.apcmedia.com/salestools/cmrp-5t9pqg_ R4_EN.pdf Rasmussen N. (2010) : Avoiding Costs From Oversizing Data Centre and Network Room Infrastructure, Neil Rasmussen, APC by Schneider Electric, 2010. White paper #37 Revision 6 http://www.apcmedia.com/salestools/sade-5tnnep_ R6_EN.pdf Schneider Electric (2011) : E-learning website (Energy University) that provides the latest information and training on Energy Efficiency concepts and best practice www.myenergyuniversity.com Webinar : The Data Centre in Real Time: Monitoring Tools Overview & Demon http://www.42u.com/webinars/real-time- Measurement-Webinar/playback.htm Sources [1] Stanley, J. and Koomey, J. (2009) : The Science of Measurement: Improving Data Centre Performance with Continuous Monitoring and Measurement of Site Infrastructure. October 2009. [2] ASHRAE (2010) : Real-Time Energy Con sump tion Measurements in Data Centres: ASHRAE- American Society of Heating, Refrigerating and Air-Conditioning Engineers, 2010. ISBN: 978-1-933742-73-1. 9

2 Équipements de serveurs, Bernd Schäppi, Thomas Bogner, Hellmut Teschner, Agence autrichienne de l Énergie Les équipements de serveurs représentent environ 30-40 % de la consommation d énergie totale des datacentres et salles serveurs. Ils constituent donc l une des cibles prioritaires pour la mise en œuvre de mesures d économies d énergie. Les équipements les plus courants englobent les serveurs de type rack, lame, mais aussi piédestal et multinœuds. Le potentiel d économie d énergie est élevé : il peut atteindre 20 à 60 %, voire plus, en fonction du type de système et des mesures déployées. Les approches fondamentales pour optimiser l efficacité énergétique reposent sur la sélection de matériels efficaces, la conception des systèmes, la gestion de l énergie à tous les niveaux (du composant hardware jusqu au système dans sa globalité) ainsi, bien sûr, que la consolidation et la virtualisation. Ce chapitre est consacré aux technologies et options d économies d énergie, du niveau du composant jusqu à celui du système. Les problèmes d efficacité énergétique et les améliorations possibles sont traités du niveau du serveur jusqu à celui du rack et du datacentre. La technologie des serveurs lames et la virtualisation en tant que stratégie d efficacité font l objet de deux sous-parties spécifiques. Les recommandations de bonnes pratiques sont récapitulées sous forme d encadrés. Tab. 2.1 Critères Energy Star en mode inactif Catégorie Nombre de processeurs installés Serveur géré Consommation plafond en mode inactif (W) A 1 Non 55 B 1 Oui 65 C 2 Non 100 D 2 Oui 150 Tab. 2.2 Concept de l outil d évaluation SERT Résultat benchmark système Serveur Processeur Résultat benchmark Mémoire Résultat benchmark 2.1 Efficacité énergétique et gestion de l énergie au niveau du serveur et des composants L efficacité énergétique des serveurs s est fortement améliorée ces dernières années, essentiellement du fait du développement d une gestion d énergie efficace pour les composants matériels. À ce jour, l efficacité des serveurs est évaluée et déclarée sur la base des critères Energy Star et du benchmark SPECpower (SPEC : Standard Performance Evaluation Corporation). Le cahier des charges actuel du label Energy Star pour les serveurs d entreprise [1] définit des critères d efficacité énergétique pour les serveurs de type rack et piédestal contenant jusqu à 4 sockets. Il définit des seuils plafonds de consommation électrique en mode inactif pour les serveurs à 1 ou 2 socket(s) ainsi que des critères d efficacité de l alimentation et des fonctions de gestion de l énergie (voir Tableaux 2.1 et 2.4). Les critères du mode inactif sont surtout utiles comme indicateurs pour des conditions de charge moyenne basse et de quasi-inactivité. Ces basses charges (<15 % par ex.) sont encore très courantes en pratique, même si le but doit rester de consolider les matériels afin d atteindre des niveaux plus élevés. L efficacité énergétique des serveurs à charge plus élevée et des systèmes consolidés se mesure avec le benchmark SPECpower, qui est toutefois davantage centré sur l efficacité et la charge au niveau du processeur (voir ci-dessous). Un outil complet d évaluation de l efficacité énergétique des serveurs (SERT) englobant tous les principaux composants matériels à différents niveaux de charge est actuellement mis au point par SPEC [2] et devrait être disponible à l hiver 2011/2012. Il permettra d évaluer l efficacité à partir de benchmarks partiels pour le processeur, la mémoire, le stockage et le système (Tableau 2.2) et aidera les gestionnaires informatiques à sélectionner des matériels efficaces pour des applications données. Stockage Résultat benchmark D E/S 10

SPECpower_ssj2008 [2] a été le premier benchmark standard permettant l évaluation de l effi- fig 2.1 cacité énergétique de serveurs de type volume. Il porte essentiellement sur l efficacité liée au processeur et fournit donc une bonne indication pour les charges importantes au niveau du processeur. Mais ce benchmark n est publié par les fabricants que pour certains matériels. La Figure 2.1 montre un exemple de résultats SPECpower pour un serveur de type volume. Ce graphique type nous renseigne sur la performance moyenne par watt et ce, pour dix niveaux de charge gradués. Il permet de comparer les serveurs du mode inactif jusqu à une charge 100 %. Dans la perspective d un achat, il conviendrait d exiger du fournisseur l information complète SPECpower. Il faut en outre tenir compte du fait que les produits sont souvent testés avec des configurations réduites. Axe des charges (de inactif à 100 % par tranche de 10 %) Target Load 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% Active Idle Axe de la performance Performance to Power Ratio 0 1,000 2,000 3,000 4,000 3,197 overall ssj_ops/watt 4,020 4,073 4,003 3,853 3,653 3,285 2,829 2,305 1,681 955 Score benchmark global (La valeur SPECpower_ssj2008 est égale à la somme des scores ssj_ops pour toutes les charges cibles divisée par la somme des moyennes de consommation (en watts) pour ces charges, y compris l intervalle de mesure en mode active idle) Barres indiquant la performance Courbe de consommation d énergie 0 25 50 75 100 125 150 175 200 225 Average Active Power (W) Axe de la consommation d énergie Fig. 2.1 Diagramme SPECpower et principales données Recommandations de bonnes pratiques Critères et benchmarks pour la sélection de matériels efficaces Acheter en fonction des critères d efficacité Energy Star si disponibles. Pour les serveurs opérant à faible charge, les critères Energy Star Vers. 1 en mode inactif peuvent raisonnablement faire office d indicateurs. Les critères d alimentation sont valables pour tout type d équipement. Exiger du fabricant les résultats du benchmark SPECpower_ ssj2008 (et SPEC-SERT dès sa sortie). Pour SPECpower, tenir compte des points suivants : Ce benchmark ciblé CPU est surtout représentatif des charges intenses au niveau du processeur ; Vérifier la configuration dans laquelle le serveur a été testé, celle-ci pouvant être assez réduite ; Pour bien interpréter les résultats, ne pas se contenter de la valeur globale (opérations par watt), mais tenir compte aussi du détail du benchmark. 11

2.1.1 Efficacité du processeur Le processeur (CPU) est l élément le plus énergivore du serveur. Un modèle de CPU efficace avec gestion d énergie efficace peut donc jouer un rôle important dans l efficacité globale. La consommation du processeur dépend de la tension et de la fréquence d horloge. La gestion d énergie au niveau du CPU ou du cœur repose donc sur l adaptation dynamique de la tension et de la fréquence (DVFS) ou le fait d éteindre des cœurs. La consommation du CPU est souvent comparée en termes d enveloppe thermique (thermal design power, TDP), qui indique la puissance maximale que le système de refroidissement d un serveur doit pouvoir traiter. Or le TDP n est qu une mesure partielle, car l efficacité globale dépend aussi fortement de la gestion d énergie. Les fabricants proposent des CPU conçus spécialement pour une faible consommation et permettant une économie d énergie substantielle si les critères de performance spécifiques sont remplis. L efficacité énergétique d un CPU est étroitement liée à la réussite de la mise en œuvre de la gestion d énergie. Les grands systèmes d exploitation supportent cette gestion sur la base de la norme ACPI (advanced configuration and power interface) pour les états de performance du processeur et de consommation (P-states) et les états de gestion thermique (C-states). Les nouveaux contrôles système et composants que permet la version 3 de l ACPI assurent une gestion de l énergie optimisée et par là un ajustement affiné de l alimentation et de la performance en fonction de la demande. De nombreux modèles de serveurs récents possèdent des modes préconfigurés, par ex. : «Haute performance» (pour des serveurs très fortement sollicités et devant assurer une performance maximale quel que soit le coût de l énergie) ; «Économie d énergie» / «consommation minimum» (ce mode peut entraîner une économie d énergie supplémentaire pour les serveurs peu sollicités et ayant une capacité supérieure à leurs besoins réels) ; «Équilibre consommation/performance». La Figure 2.2 montre les effets positifs de la gestion d énergie des processeurs modernes à travers les résultats de benchmark (SPECpower) pour la famille de produits serveurs HP ProLiant DL 380 : le ratio puissance en mode inactif/puissance pleine charge a été fortement réduit entre les générations 5 et 7 de ce modèle. Sur le DL 380 G5, la puissance en mode inactif (charge zéro) était inférieure de 33 % (170 watts) à celle en pleine charge (253 W). Sur le G7, la différence est d environ 75 %. La nouvelle technologie est donc beaucoup plus efficace à basse charge ou en mode inactif, grâce à une gestion d énergie intelligente au niveau du CPU. Dans le même temps, la performance de calcul de ce modèle a été plus que triplée. Pour sélectionner un matériel dans la perspective d un achat, il est essentiel de vérifier les critères de performance concrets que devront remplir ses composants. Différents types de charges entraînent différentes exigences de performance, dont Target Load 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% Active Idle G7 (3.07 GHz, Intel Xeon X5675) G5 (2.66GHz, Intel Xeon L5430) Performance Performance to Power Ratio to Power Ratio Performance Performance to Power Ratio to Power Ratio 0 1,0000 2,000 1,000 3,000 2,000 4,000 3,000 4,000 0 250 0 500250 750500 1,000750 1,250 1,000 1,250 3,197 overall ssj_ops/watt 3,197 overall ssj_ops/watt 734 overall ssj_ops/watt 734 overall ssj_ops/watt 4,020 100% 4,020 100% 1,214 100% 1,214 4,073 90% 4,073 90% 1,135 90% 1,135 4,003 80% 4,003 80% 1,049 80% 1,049 3,853 70% 3,853 70% 95170% 951 3,653 60% 3,653 60% 85460% 854 3,285 50% 3,285 50% 73850% 738 2,829 40% 2,829 40% 62040% 620 2,305 30% 2,305 30% 48430% 484 1,681 20% 1,681 20% 33520% 335 95510% 955 10% 17510% 175 Target Load Active Idle Target Load Active Idle Target Load Active Idle 0 25 50 075 251005012575150100 175125 200150 225175 200 225 Average Active Average Power Active (W) Power (W) 0 50 0 100 50 150 100 200 150 250 200 250 Average Active Average Power Active (W) Power (W) Fig. 2.2 Exemple de benchmark SPECpower pour deux générations de serveur (serveurs HP G5 et G7) [SPEC (2010, www.spec.org)] 12

2 Équipements de serveurs il faut tenir compte pour une configuration matérielle efficace. Le Tableau 2.3 fournit une indication approximative des exigences de performance pour différentes charges de travail. 2.1.2 Efficacité de l alimentation électrique Le label Energy Star pour serveurs [1] définit des critères d efficacité de l alimentation électrique pour des charges de 10, 20, 50 et 100 %. La certification 80 PLUS possède ses propres critères d efficacité pour l alimentation des serveurs, mais pas à une charge de 10 %. En pratique et dans la perspective d un achat, il est recommandé de privilégier une alimentation remplissant au moins le niveau 80 PLUS «Or», qui correspond à une efficacité de 88 % à 20 % de charge et 92 % à 50 %. Les serveurs racks standards qui fonctionnent couramment à faible charge sont souvent équipés d une alimentation électrique redondante et surprovisionnée. Ceci entraîne une perte d énergie Tab. 2.3 Critères de performance de différentes applications serveur [5] Catégorie CPU RAM Disques durs Fichiers/impression 0 + ++ + Messagerie + + ++ 0 Virtualisation ++ +++ ++ ++ Web + + 0 + Base de données ++ ++ +++ + Application ++ ++ 0 + Terminal ++ ++ + + substantielle due au point d opération très bas de l équipement. Optimiser l alimentation électrique est donc un point essentiel. C est ce que permettent notamment les outils de configuration d énergie en ligne proposés par les fabricants et les outils d évaluation du power capping. Certains serveurs (HP ProLiant G6 et G7 par ex.) possèdent des fonctions spécifiques pour pallier E/S les pertes inutiles des alimentations redondantes. Ces matériels proposent un mode d opération permettant de n utiliser qu une seule alimentation en deçà d un seuil de charge prédéfini. La seconde alimentation demeure en mode veille, ce qui permet d avoir une redondance complète en cas de coupure de courant ou de défaillance du circuit. Tab. 2.4 Critères d efficacité pour l alimentation électrique selon le label Energy Star et la certification 80 PLUS [1, 3] Type d alimentation Puissance nominale de sortie Charge 10 % Charge 20 % Charge 50 % Charge 100 % Energy Star 1 Sorties multiples (CA-CC & CC-CC) Toutes puissances N/A 82 % 85 % 82 % Sortie unique (CA-CC & CC-CC) 500 W 70 % 82 % 89 % 85 % >500 1 000 W 75 % 85 % 89 % 85 % > 1 000 W 80 % 88 % 92 % 88 % Energy Star 2 (en préparation) Sorties multiples (CA-CC & CC-CC) Toutes puissances N/A 85 % 88 % 85 % Sortie unique (CA-CC & CC-CC) Toutes puissances 80 % 88 % 92 % 88 % 80 PLUS Bronze Toutes puissances N/A 81 % 85 % 81 % Argent Toutes puissances N/A 85 % 89 % 85 % Or Toutes puissances N/A 88 % 92 % 88 % Platine Toutes puissances N/A 90 % 94 % 91 % 13

2.2 Gestion de l alimentation au niveau du rack et du datacentre Au-delà des composants matériels et des unités de serveur, la gestion de l énergie au niveau du système est un autre élément important pour optimiser l efficacité globale. Comme expliqué précédemment, la majorité des serveurs restent utilisés à un niveau de charge modeste. Il existe donc un important potentiel d économie d énergie par la consolidation matérielle (voir chapitre suivant) ou la gestion de l énergie au niveau du système. Comme pour le niveau composant, il s agit d ajuster la performance et la consommation en fonction de la demande en temps réel et de couper ou brider les ressources non utilisées. Le Tableau 2.5 résume les diverses approches de la gestion de l énergie à différents niveaux [7]. Certaines de ces options sont traitées dans les pages suivantes. 2.2.1 Gestion de la capacité et de l énergie Les logiciels de gestion de serveur fournissent des outils essentiels pour sécuriser les opérations mais aussi gérer l énergie de façon globale. Ces outils peuvent contribuer efficacement à réduire la consommation en facilitant la mise en œuvre de principes d économie à tous les niveaux du système et en fournissant des fonctions capables de favoriser fortement l efficacité. Ces principales fonctions sont : Provisionnement Monitoring Déploiement Gestion de configuration Contrôle des mises à jour Gestion de l énergie Gestion de la charge Les principaux fournisseurs proposent tous des outils puissants de gestion de serveur. Les solutions IBM (Systems Director) et HP (Systems Insight Manager avec Insight Dynamics) sont particulièrement complètes puisqu elles sont capables d intégrer les systèmes de parties tierces. Fujitsu (Server View Site) propose des produits aux fonctionnalités de base pouvant être intégrés dans les consoles d autres fabricants. Dell fait appel à la suite Altiris Total Management. Sun et Acer fournissent des consoles pour leurs propres environnements. Suites de gestion de l énergie (par ex. IBM Energy Manager) Ce type d outil permet, entre autres, le suivi et la collecte de données de consommation, la gestion de l énergie (configuration d options d économie d énergie et power caps) et l automation de certaines tâches liées à l énergie : configuration d appareils de mesure tels que PDU et capteurs, définition de seuils, création et configuration de principes, calcul des coûts, etc. Pour en savoir plus sur les suites de gestion de l énergie, voir plus bas. Tab. 2.5. Options de gestion de l énergie du niveau composant au niveau datacentre [7] Niveau composant Niveau système Niveau rack Niveau datacentre Processeur (package/core C-states, S-states P-states, T-states, étrangleur Gestion de l énergie sur plateforme thermique) Planificateurs de charge de travail Autres composants (D-states, L- Contrôle de vitesse des ventilateurs states) Gestion système ou nœud Équilibrage application/charge Gestion de châssis Équilibrage application/charge Suivis de sites et d équipements Déduplication des données, etc.. Gestion multi-racks, consolidation dynamique 14

2 Équipements de serveurs Outils de gestion de la capacité (e.g. HP Capacity Planner) Les outils de gestion de la capacité sont utilisés, entre autres, pour accroître l utilisation des serveurs, réduire la consommation d énergie et améliorer les performances des applications. Ils permettent de recueillir des données d utilisation pour les cœurs de processeur, la mémoire, le réseau, les E/S disque et l énergie. Ils permettent par ailleurs la planification des charges ou les modifications du système et l évaluation de l impact sur l utilisation des ressources. Ils évaluent enfin les tendances pour prévoir l évolution des besoins. Pour en savoir plus sur les outils de gestion de la capacité, voir plus bas. L outil HP, par ex., fait appel aux journaux d utilisation pour apporter une aide à la décision en évaluant la demande en ressources des applications candidates à la consolidation. La Figure 2.3 montre un exemple de comparaison d utilisation de deux systèmes. On voit que les pics de performance interviennent à des moments différents : une consolidation matérielle ne provoquerait donc qu un accroissement modeste de la charge moyenne. 3,0 2,5 Nombre de coeurs 2,0 1,5 1,0 Pic d utilisation du système Pic d utilisation du système 1 2 0,5 0,0 21 fév. 28 fév. 6 mars Temps 13 mars Système 1 Système 2 Allocation Fig. 2.3 Comparaison de l utilisation du CPU de deux systèmes (voir HP Capacity Planner) 15

2.2.2 Power capping Le terme power capping désigne l allocation active d un budget énergie à un serveur. Les gestionnaires informatiques peuvent définir un power cap pour leurs serveurs en fonction des besoins réels. Le dynamic power capping réduit la demande maximum du système et optimise ainsi le provisionnement au-delà du niveau généralement supporté par les configurateurs des fabricants. Les économies réalisées en pratique dépendent de la valeur du cap. Celui-ci doit être fixé de façon à limiter les pics d alimentation mais sans affecter de façon perceptible les performances de calcul RECOMMANDATIONS DE BONNES PRATIQUES Planification et gestion d un datacentre efficace du système. Un capping optimisé exige donc une évaluation des tendances de la charge et de la consommation. Pour les charges relativement uniformes, le cap pourra être fixé au niveau moyen sans affecter sensiblement la performance. D une façon générale, le cap ne doit jamais être situé en deçà de la valeur médiane entre plancher et plafond de consommation du serveur. Certains outils de gestion permettent un capping dynamique en définissant différentes valeurs sur différentes périodes, en fonction de la charge, du coût de l énergie, etc. Utiliser les outils de gestion de serveur pour la planification de la capacité, le suivi de la charge et de la puissance et la gestion spécifique de l énergie. Un descriptif détaillé et des recommandations sur l utilisation de la fonction gestion de l énergie sont fournis avec la documentation technique des suites de gestion de serveur. Équilibrer les applications et les charges pour optimiser l utilisation des ressources matérielles. Utiliser le power capping pour maintenir la demande au niveau souhaité sur l ensemble du système. Profiter des niveaux de résilience optimisés des matériels. Évaluer le niveau réellement justifié au vu de l impact prévu des incidents de service sur l activité pour chaque service déployé. Désaffecter les services et supprimer entièrement les matériels non utilisés. Évaluer la possibilité de désaffecter des services à faible valeur pour l activité en identifiant ceux pour lesquels le coût financier et environnemental n est pas justifié. 2.3 Options de gestion de l énergie spécifiques pour serveurs lames La technologie des serveurs lames est déployée à la fois dans les datacentres et les salles serveurs. Ce segment du marché est celui qui connaît la croissance la plus rapide de ces dernières années. Il est donc important de rendre cette technologie aussi efficace que possible. Les châssis à lames (voir Figure 2.4.) rassemblent généralement 7, 14 (ou plus) modules de serveurs lames, au moins un module de gestion ainsi que des interfaces KVM. Ils supportent des modules serveur, stockage et réseau et peuvent être optimisés pour des applications et types d utilisateur spécifiques. Par rapport aux serveurs racks standard, cette technologie permet de réduire certains composants matériels comme l alimentation électrique, les E/S réseau et la câblerie, qui sont partagés par plusieurs serveurs dans un coffret commun. Les principaux avantages de ces systèmes sont les suivants : Forte densité de calcul et faible encombrement ; Réduction du temps de maintenance et de mise à niveau grâce au remplacement à chaud des modules et aux fonctions de gestion intégrées ; Efficacité énergétique légèrement supérieure à celle des racks si la gestion de l énergie et le refroidissement sont optimisés. Fig. 2.4 Châssis à lames Fig. 2.5 Serveur lame à deux nœuds 16

2 Équipements de serveurs L utilisation de fortes densités de lames entraîne toutefois une demande élevée en infrastructure et refroidissement. Une forte densité de calcul accroît la puissance jusqu à 10-25 kw/rack. Les solutions de refroidissement standard des datacentres et salles serveurs sont donc souvent insuffisantes et il faut mettre en place une solution de refroidissement spécifique. L efficacité énergétique d un serveur lame est donc fortement dépendante de la conception d ensemble du système. Les concepts à deux nœuds ou multi-nœuds reposent en partie sur la même philosophie. Le modèle multi-nœuds consiste à combiner un nombre fixe d unités de serveur (souvent 2 ou 4) sur un châssis unique monté en rack. À l instar des lames, ces serveurs partagent l alimentation et les ventilateurs, mais leur capacité d expansion est limitée. fig 3.7 Cette technologie permet de mettre en œuvre de hautes densités de calcul à un coût relativement réduit et correspond souvent aux besoins des petites et moyennes entreprises. Il existe toutefois des serveurs à deux nœuds hautes performances disponibles par exemple pour les systèmes à lames et qui combinent deux nœuds sur une seule lame. Les principaux avantages des systèmes à plusieurs nœuds standards sont les suivants : Coût et encombrement inférieurs à ceux d un serveur rack standard ; Consommation d énergie légèrement inférieure du fait du partage de l alimentation et des ventilateurs. 2.3.1 Châssis et composants des serveurs lames Les alimentations de grande taille sont souvent plus efficaces : le nombre réduit d alimentations dans les systèmes à lames peut donc accroître l efficacité énergétique par rapport aux serveurs racks. Dans la pratique, toutefois, l efficacité dépend aussi du rapport entre demande et capacité d alimentation. La Figure 2.6 représente la courbe d efficacité d une alimentation labellisée Platine [80plus 2011] d une puissance nominale de 2990 W pour un châssis à lame : les valeurs sont comprises entre 92 et 95 % en fonction de la charge. Pour être efficace, l alimentation des serveurs lames doit dépasser 90 % d efficacité entre 20 % et 100 % de charge. Efficiency (%) 100% 90% 80% 70% 60% 50% 40% 30% Sur les serveurs lames et multi-nœuds de dernière génération, certains fabricants fournissent plusieurs modèles d alimentation de puissance nominale différente, permettant de s adapter à la demande réelle. Des configurateurs en ligne proposés par les fabricants fournissent une aide à la sélection. Des alimentations moins nombreuses et plus efficaces, des ventilateurs plus efficaces et des options avancées de gestion de l énergie dans le châssis à lames permettent en théorie d accroître l efficacité énergétique globale par rapport aux serveurs racks standard. Dans la pratique, l effica- Efficiency of the Power Supply RECOMMANDATIONS DE BONNES PRATIQUES Sélectionner la technologie à lame sur des critères précis Définir et évaluer les principales raisons pour la mise en œuvre de la technologie à lame dans le datacentre (contrainte d espace par ex.). Évaluer les avantages escomptés par rapport à la technologie rack et vérifier le caractère réaliste des attentes. Vérifier si la virtualisation peut être une solution alternative au regard des objectifs définis. Évaluer le coût total de possession (TCO) et l efficacité énergétique par rapport à d autres options (d après les données fournisseurs). 0% 25% 50% 75% 100% 125% Loading (% of Rated Output Power) Fig. 2.6 Efficacité de l alimentation d un serveur lame [3] 17

Serveur lame Dell M610 Serveur rack R610 1U Target Load Performance to Power Ratio Performance to Power Ratio 0 1,000 2,000 3,000 4,000 0 1,000 2,000 3,000 4,000 3,093 overall ssj_ops/watt 2,938 overall ssj_ops/watt 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% Active Idle 3,885 3,911 3,873 3,733 3,502 3,158 2,754 2,255 1,653 940 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% Active Idle 3,739 3,725 3,697 3,572 3,337 2,999 2,623 2,125 1,549 868 0 1,000 2,000 3,000 4,000 0 25 50 75 100 125 150 175 200 225 250 Average Active Power (W) Average Active Power (W) Target Load Fig. 2.7 Comparaison SPECpower_ssj2008 entre un serveur lame (Dell M610) et un serveur rack (R610 1U). Système à 16 lames avec configuration du processeur identique à celle du serveur rack (2 x Intel Xeon 5670, 2.93GHz). SPEC (2010, www.spec.org) cité dépend toutefois aussi de la configuration du châssis et de l utilisation des options de gestion de l énergie. Un châssis comportant un petit nombre de lames sera évidemment moins efficace, du fait du sur-provisionnement de ses capacités de refroidissement, d alimentation et de réseau. Pour une comparaison approximative de l efficacité entre serveurs lames et racks, on peut prendre l exemple d un système à lames entièrement configuré. La Figure 2.7 reprend les données publiées par Dell pour le diagramme SPECpower (SPECpower_ssj2008) de systèmes à lames et de serveurs racks comparables. À 100 % de charge, la performance maximale est de 3885 ops/watt pour le système à lames et 3739 ops/watt pour le serveur rack, soit une différence de 4 % en faveur du premier. Cet écart de performance par watt ou d efficacité énergétique atteint environ 8 % dans les basses charges (10 %) et 11 % en mode repos. Si cette simple comparaison ne doit pas être surinterprétée (SPECpower n évalue qu une partie de l efficacité des serveurs), elle suggère toutefois que les systèmes à lames, même entièrement configurés et optimisés pour un test, ne présentent sur les serveurs racks standard qu un avantage marginal en terme d efficacité énergétique, surtout à fort niveau de charge. L écart est plus significatif à basse charge, ce qui indique une meilleure gestion globale de l énergie dans ces conditions. Les solutions à lames semblent donc ne présenter qu un potentiel limité d amélioration de l efficacité énergétique, comparées notamment à la virtualisation. Comme avec les serveurs racks, il est possible de combiner les deux approches pour renforcer l amélioration de l efficacité énergétique. Les problèmes posés par les fortes densités de chaleur au niveau du rack et des rangées sont traités ci-après (2.3.2). Les châssis lames modernes contiennent des matériels et logiciels de gestion qui, associés à des contrôleurs d accès distant au niveau des lames, permettent un inventaire et une gestion de l alimentation des différentes lames. Des cartes de gestion spécifiques permettent un inventaire des matériels et de la demande en alimentation. Le contrôleur d accès distant transmet les informations de budget énergétique à la carte de gestion du châssis (CMC), laquelle confirme la disponibilité de l alimentation au niveau du système à partir de l inventaire total du châssis. La CMC peut définir des principes au niveau du système et la 18

2 Équipements de serveurs RECOMMANDATIONS DE BONNES PRATIQUES Critères à prendre en compte pour l achat d un serveur lame efficace consommation en temps réel de chaque module est suivie de façon à ne pas excéder la valeur allouée. Les fonctions de base de la gestion d énergie en mode automatique restent généralement invisibles pour l administrateur système. Mais les priorités de chaque module peuvent aussi être configurées manuellement : on pourra par exemple désigner les lames prioritaires pour passer en mode économie. Sur un châssis à lames, le dynamic power capping peut être utilisé de façon encore plus efficace que sur un serveur rack standard, sachant que le power cap peut être spécifié pour de multiples serveurs. Celui-ci peut être ajusté de façon dynamique par le module onboard administrator et le processeur de service. Les lames opérant à charge réduite recevront ainsi un cap moins élevé. L intensité de la charge et son évolution variant généralement d une lame à l autre, les pics de consommation peuvent se produire à des moments différents. Le cap global du châssis pourra donc être fixé à un niveau plus bas que la somme des caps des lames pris séparément. HP a calculé l économie d énergie et la réduction du TCO pour un centre à lames dont l alimentation reposait sur le power capping : le coût d alimentation maximum et de provisionnement baissait d environ 20 % par rapport à un design sans power capping [HP2011]. Définir les charges de travail et les niveaux prévus pour les systèmes à lames. Comparer la rentabilité et l efficacité énergétique entre fabricants. Exiger du fournisseur une information produit sur : Le coût total de possession (TCO) ; L efficacité énergétique globale (par ex. SPECpower_ssj2008, SPEC-SERT dès sa sortie) ; Les composants matériels efficaces (efficacité et optimisation de l alimentation) ; Les outils de gestion, surtout pour l énergie et l optimisation de la conception du système. Sélectionner l équipement présentant la plus haute efficacité énergétique pour le type et le niveau de charge prévus et les bonnes options de gestion de l énergie. 2.3.2 Problèmes d alimentation et de refroidissement On a souvent tendance à sous-estimer le défi posé par la conception d un système de serveurs lames, surtout en cas de forte densité. Les principales difficultés sont : Conception et capacité du refroidissement pour faire face aux fortes densités de chaleur ; Capacité et distribution de l alimentation (capacité du PDU local, câblerie, etc.). Les systèmes de refroidissements traditionnels sont conçus pour une puissance de 2-3 kw/rack, soit dix fois moins que la puissance d un rack de lames entièrement peuplé. Le refroidissement standard des datacentres et salles serveurs est donc souvent insuffisant pour les grands systèmes à lames et doit être modifié dans sa conception même. RECOMMANDATIONS DE BONNES PRATIQUES Utiliser les outils de gestion pour optimiser l efficacité des systèmes lames Utiliser les outils de gestion et les équipements réseau et alimentation intelligents pour effectuer un suivi de la consommation énergétique et de la charge de travail. Analyser les options pour équilibrer et gérer les charges et la consommation au niveau des châssis et des racks. Utiliser les fonctions de capping et d équilibrage de l énergie du châssis. Utiliser les outils de calcul fournis par les fabricants pour estimer approximativement la demande en énergie/capacité de refroidissement. Évaluer la demande réelle en énergie à l aide des outils de gestion disponibles pour un cycle d utilisation complet et définir des caps en fonction des pics de charge. Ajuster l alimentation et le refroidissement en fonction de ces caps. 19

Le Tableau 2.6 récapitule les options traditionnelles de conception pour différentes densités en fonction des exigences et contraintes de l activité telles qu infrastructures et capacités de refroidissement. Selon le niveau de densité de lames, on pourra envisager les options suivantes pour la conception du refroidissement [Rasmussen 2010] : Répartir la charge thermique des châssis à lames vers les différents racks : cette méthode n est possible que si les châssis à lames ne représentent qu une très faible partie du système global. Dédier la capacité de refroidissement : la capacité en excédent est affectée spécifiquement aux lames. Cette méthode n est possible qu avec un pourcentage de lames relativement bas, sachant qu on n utilise que la capacité de refroidissement existante. Installer un refroidissement supplémentaire pour les racks de lames. La densité de puissance par rack peut atteindre 10 kw. Cette technique permet d optimiser l espace au sol et l efficacité. Délimiter/concevoir une zone à forte densité (jusqu à 25 kw) au sein du datacentre. Cette technique permet d optimiser l efficacité et l utilisation de l espace. Concevoir un centre à forte densité (entièrement composé de racks de lames à forte densité). Cette solution extrême, plutôt rare, entraîne dans la plupart des cas des coûts substantiels et une forte sous-utilisation des infrastructures. Les datacentres existants présentent souvent certains obstacles au déploiement de la technologie lame du fait de leurs infrastructures. Un système à faux plancher standard peut par exemple ne pas permettre de densité de puissance supérieure à 5 kw par rack. Une bonne spécification de la densité électrique et thermique est donc une condition majeure à la conception de systèmes efficaces en termes d énergie, d espace et de coûts. Un point essentiel de l efficacité énergétique au niveau du système est d éviter le sur-provisionnement des infrastructures et du refroidissement. La spécification de la densité doit tenir compte de la variabilité dans l espace (différentes densités électriques locales dans les datacentres pour les racks de lames et les racks standard) et le temps (risque d augmentation à terme). La densité électrique doit donc être spécifiée au niveau du rack ou de la rangée. Pour les systèmes de grande taille, la rangée convient mieux, sachant que le refroidissement et la distribution électrique se font généralement à ce niveau. Dans la mesure du possible, il est recommandé de définir les spécifications pour chaque rack/rangée et de les laisser inchangées pendant les périodes d opération. La mise en œuvre d une nouvelle technologie avec des niveaux de densité différents doit donc se faire sur un rack ou une rangée nouveau/elle. Certaines solutions alternatives permettent toutefois de faire varier la densité sur un rack ou une rangée installé(e) : Ajout à chaud de modules onduleurs ; Utilisation de PDU remplaçables à chaud ; Ajout de capacité de refroidissement avec appareils montés en rack. Tab. 2.6 Configuration des systèmes à lames au niveau du rack et exigences liées pour le refroidissement [d après Rasmussen 2010] Nombre de châssis/racks Répartition de la charge entre racks Affectation d un refroidissement dédié Refroidissement supplémentaire Zone à forte densité Centre à forte densité 1 Possible dans la plupart Possible dans la plupart Possible dans la plupart Non rentable Non rentable des DC des DC des DC 2 Peu pratique dans la Possible dans la plupart Possible dans la plupart Non rentable Non rentable plupart des cas des DC des DC 3 Impossible Possible dans la plupart Possible dans la plupart Maximum pour les Non rentable des DC des DC selon solution retenue systèmes à faux plancher à efficacité optimisée 4 Impossible Peu pratique dans la Selon solution retenue Systèmes à balayage d air Balayage d air chaud, plupart des cas chaud réagencement des locaux 5 Impossible Impossible Impossible Systèmes à balayage d air Balayage d air chaud, chaud réagencement des locaux 6 Impossible Impossible Impossible Extrêmement coûteux Extrêmement coûteux 20