Comment le logiciel de gestion de l infrastructure du datacenter améliore la planification et réduit les coûts opérationnels Livre blanc 107 Révision 0 par Torben Karup Nielsen et Dennis Bouley > Résumé Les chefs d entreprise challengent leur équipe IT pour transformer les datacenters de manière à ce qu ils ne soient plus un centre de coûts mais une source de valeur pour l entreprise. Les datacenters peuvent avoir un impact significatif sur les résultats en permettant à l entreprise de répondre plus rapidement aux demandes du marché. Ce livre blanc démontre, par une série d'exemples, comment les outils du logiciel de gestion de l infrastructure du datacenter peuvent simplifier les processus opérationnels, diminuer les coûts et accélérer la livraison d'informations. Table des matières Cliquer sur une section pour y accéder Introduction 2 Planification : effet/impact des décisions Opérations : achever plus de tâches plus rapidement Analyse : identifier les atouts et les faiblesses opérationnels 3 6 10 Conclusion 13 Ressources 14 TM
Selon l'uptime Institute (une division du Groupe 451), le marché des systèmes de gestion d'infrastructure des data centers passera de 360 millions d euros en 2010 à 5,5 milliards d euros en 2020. 1 Les chefs d entreprise et les responsables informatique se sont rendu compte qu il est possible de réaliser des centaines de milliers de dollars d'économies en énergie et frais opérationnels en améliorant la planification de l'infrastructure physique, en reconfigurant légèrement le système, et en modifiant quelque peu les processus. Les systèmes qui permettent à la Direction de réaliser ces économies sont des logiciels modernes de gestions de l infrastructure physique du data center (alimentation et refroidissement). Les systèmes de reporting existants, conçus pour prendre en charge les data centers traditionnels, ne sont plus suffisants pour les nouveaux data centers «polyvalents», qui doivent pouvoir gérer les changements de capacité constants et les chargements dynamiques. Un nombre étonnant de petits et moyens opérateurs de data centers pensent pouvoir gérer leur data center sans outils de gestion de l'infrastructure physique. L'un de ces opérateurs, qui ne gère que 15 racks dans une petite entreprise industrielle, estime ainsi que grâce à «la connaissance tribale» du fonctionnement du data center qu il a acquise au cours des années,, il est capable de maîtriser n importe quelle situation critique. Toutefois, la densité de ses 15 racks a progressivement augmenté. Ses factures d'électricité ont également augmenté et ses systèmes de refroidissement et d alimentation se sont déréglés. Jusqu'au jour où il a ajouté un nouveau serveur, créant une surcharge sur un circuit de dérivation et entraînant la panne d'un rack complet. Lien de référence Livre blanc d APC nº104 Classification des outils de gestion de la technologie d exploitation du data center Les nouveaux outils de planification et d'implémentation du logiciel de gestion (voir la Figure 1) améliorent l'allocation énergétique et de refroidissement à la salle informatique (planification), fournissent une analyse d'impact rapide quand une partie du parc ne fonctionne pas correctement (exploitation), et utilise des données d'historique pour améliorer le rendement futur (analyse). Ces trois types d'outils de planification et d'implémentation (planification, exploitation et analyse) sont expliqués individuellement dans les sections suivantes de ce livre. Pour une description des outils de logiciel de l'infrastructure physique du data center inclus dans les sous-ensembles et les sous-systèmes de Technologie d'exploitation (Operations Technologie, OT), consulter le Livre Blanc d'apc nº104, Classification des outils de gestion de la technologie d exploitation (OT) du data center. Sous ensemble de technologie d exploitation (OT) du data center* Tableau de bord Surveillance et Automation Planificationet Implémentation Recueil des données Figure 1 Les outils du logiciel de ce livre appartiennent au sous-ensemble OT Planification et Implémentation Sous systèmes (listepartielle) Outils d exemple > > Flux de travail salle TI/ Gestion capacité salle TI/ Gestion durée de vie et installation salle TI Outils de planification/ Outils d exploitation/ Outils analytiques * Consulter le Livre Blanc d APC nº104 Classification des outils de gestion de la technologie d exploitation (OT) du data cente, pour une description complète des ensembles et sous systèmes.d OT 1 Andy Lawrence, The 451 Group, Data Center Infrastructure Management: Consolidation, But Not Yet, 7 décembre 2010 Livre blanc 107 Rév 0 2
Certains gestionnaires de data center n'ont jamais été convaincus par la première génération des outils de gestion d'infrastructure physique car leur portée était limitée et supposait une intervention humaine considérable. Ces outils de première génération créaient un préchargement de la liste des dispositifs et signalait qu'une température d'admission à l unité de refroidissement avait dépassé un seuil défini. L'opérateur devait alors déterminer seul quel équipement était affecté par l'erreur. Les outils n'étaient pas capables de produire une corrélation entre le dispositif d'infrastructure physique et le serveur. Ils n étaient pas non plus capables d'initier des actions pour empêcher les pannes, comme le fait d accélérer les ventilateurs pour disperser un point chaud. Les nouveaux outils de gestion de deuxième génération sont conçus pour identifier et résoudre les problèmes avec une intervention humaine réduite au minimum. Ces outils plus intelligents permettent aussi au responsable IT d'informer les équipes commerciales des conséquences de leurs actions avant que leurs décisions de dimensionnement du serveur soient prises. Les décisions commerciales entraînant la hausse de la consommation d'énergie du data center, par exemple, influenceront le bilan carbone et la taxe sur le carbone. La contre-passation de la consommation énergétique est également possible avec ces nouveaux outils et peut modifier la manière de prendre les décisions en alignant l usage énergétique sur les résultats financiers. Planification : Effet/Impact des décisions Les outils logiciels modernes de planification illustrent l état physique du data center au travers d une interface d utilisateur graphique, et simulent l effet résultant de futurs ajouts, déplacements et modifications physiques. Cette capacité apporte des réponses à certaines questions courantes de planification (voir Figure 2). Par exemple, les outils modernes de planification peuvent prévoir l impact d un nouveau serveur au niveau de l alimentation et de la distribution du refroidissement. Les outils de logiciel de planification calculent aussi l impact des déplacements et des modifications réalisés sur l espace du data center et les capacités énergétiques et de refroidissement. Questions classiques auxquelles répondent les outils de planification: Figure 2 Questions de planification courantes Où placer mon prochain serveur? Vais je conserver la redondance de puissance ou de refroidissement en cas de défaillance ou de maintenance? Dois je déployer mes serveurs lames pour une exploitation fiable? Quel est l impact d un nouveau serveur sur un circuit de dérivation existant? Quel est l impact du nouvel équipement sur mes marges de redondance et de sécurité? L équipement actuel d alimentation et de refroidissement ont ils la capacité d héberger de nouvelles technologies? Livre blanc 107 Rév 0 3
Symptômes d une planification insuffisante Les exemples suivants illustrent le genre de problèmes rencontrés à la suite d une planification insuffisante : Une évaluation récente de l alimentation et du refroidissement d'un data center a révélé de nombreux points chauds au niveau du sol, points qui devraient être refroidis. D autres zones étaient refroidies, et elles n avaient pas subies l action de la chaleur. Pourquoi? Même si le data center possédait une capacité suffisante en kilowatts, aucune planification réelle n avait été mise en place au moment du choix de l'emplacement de l équipement. La distribution de l air est insuffisante, alors que la capacité totale est disponible. Un rack de serveurs a été perdu lorsqu un administrateur réseaux a surchargé involontairement une barre multiprises déjà saturée. Les lecteurs et la mémoire retirés de serveurs qui avaient été achetés pour un projet d installation ne sont pas adéquats pour un autre projet de gestion. Aucun outil de surveillance n était en place pour enregistrer l'activité telle que le retrait de l'équipement d un rack. Puisqu'aucun suivi automatisé des installations de rack n'était prévu, la planification de projet était incorrecte. Le jour où arrivent les ressources du projet d installation, le coût de leur livraison atteint un montant considérable. Malheureusement, les installateurs ont passé la plupart de leur temps à essayer de localiser le mauvais équipement. Une grande entreprise industrielle a virtualisé son data center et a consolidé ses applications commerciales les plus critiques sur une batterie de serveurs. Comme elle utilisait le mécanisme de basculement de la plateforme de virtualisation (la capacité de migrer la VM Machine virtuelle), l entreprise s est sentie protégée contre la défaillance du matériel. Malheureusement, dans sa planification, elle n'avait pas pensé à reconnaître chacun des serveurs comme dépendant du même onduleur. Aussi, quand l'onduleurs a connu une panne, aucun serveur protégé par onduleur n était disponible pour effectuer la migration. Comprendre l'impact des défaillances et des modifications Les chefs d entreprise et les opérateurs de data center partagent l'objectif de maintenir l'intégrité opérationnelle même en cas de défaillance du data center. La compréhension de l'impact des défaillances aide la Direction de l entreprise à se sentir rassurée en ce qui concerne la disponibilité du traitement commercial. Les opérateurs de data center doivent aussi faire face aux défaillances ou doivent les empêcher de survenir. Les outils de planification aident à maintenir la continuité des activités. Les outils logiciels modernes de planification exécutent les fonctions suivantes : Les chefs d entreprise et les opérateurs de data center partagent l'objectif de maintenir l'intégrité opérationnelle même en cas de défaillance du data center. Fournir des représentations graphiques de l équipement informatique et de son emplacement dans le rack. Cela évite à l'opérateur d'avoir à rechercher dans des tas de feuilles de calcul pour trouver ces informations, ou d être physiquement présent dans le data center. Afficher visuellement l'impact des déplacements et modifications en attente sur la capacité d'alimentation et la distribution du refroidissement (voir Figure 4). Cela évite à l'opérateur de devoir s engager dans des calculs mathématiques complexes et de commettre éventuellement de graves erreurs pouvant entraîner une indisponibilité imprévue. Simuler les conséquences de la défaillance du dispositif de refroidissement et d alimentation sur l équipement informatique pour identifier les impacts d'applications commerciales critiques. Cela fournit une évaluation préalable du risque, basée sur des calculs scientifiques plutôt que sur un pressentiment. Livre blanc 107 Rév 0 4
Prendre en compte les poids maximums du rack et du plancher (afin de ne pas compromettre l intégrité du rack ou de ne pas voir celui-ci traverser un plancher en mauvais état). Simuler des scénarios de refroidissement du data center selon l approche en CFD Continu. Cela produit une analyse de débit d'air en quelques secondes contrairement à une analyse actuelle en CFD qui prendrait des jours et exige l introduction d une grande quantité de données. Créer les emplacements recommandés pour l installation de l équipement informatique monté en rack. Le choix de l'emplacement se base sur l alimentation, l agent de refroidissement, l espace, et les ports de réseau disponibles. Cela afin d éviter le problème des circuits de dérivation surchargés ou les points chauds. Les outils de planification améliorent l'efficacité opérationnelle du data center et créent un environnement pour améliorer le processus. Prenez en considération le scénario traditionnel où un opérateur essaie de déterminer si la puissance installée qui vient d être dépassée sur un rack est seulement une anomalie ou une tendance en voie de développement. Il agira selon son pressentiment. S'il a tort, un disjoncteur saute si la puissance installée dans un rack est dépassée. Cela signifie que tous les serveurs en aval de ce disjoncteur réalisant ces missions critiques s éteindraient. Les outils de planification, d'autre part, peuvent simuler l'allocation des charges de travail au niveau du rack en cas de dépassement d un seuil. L utilisation énergétique de chaque dispositif du rack est mesurée afin de pouvoir prendre des décisions équilibrant la charge à partir de données scientifiques. Les outils modernes d'infrastructure physique envoient une alerte en provenance du rack avant qu un disjoncteur ne saute. Ce système d'avertissement précoce donne à l'opérateur l'occasion de faire des ajustements avant que ne se produise l'interruption de service. Des rapports sont créés pour une utilisation minimum, maximum, et moyenne progressives pour ce rack et pour chaque rack du data center (voir Figure 3). Si un rack approche du seuil de surcapacité, des options de simulation conditionnelles peuvent être produites et réexaminées pour déterminer la meilleure façon de résoudre le problème. La planification implique la possibilité de simuler des résultats, de prévoir un plan, et de gérer l'inventaire et le flux de travail. Figure 3 Recueil de données pour la simulation en temps réel (capture d'écran extraite de l'application APC by Schneider Electric InfraStruxure Capacity) Livre blanc 107 Rév 0 5
Prenons la situation dans laquelle un opérateur détermine où placer le prochain serveur. Dans les data centers traditionnels, l'opérateur exécute un contrôle manuel des racks, en quête d espace libre. Il peut passer la main derrière le rack pour vérifier s'il est trop chaud. Il prend alors le nouveau serveur, le place dans le rack, le branche et croise les doigts. Figure 4 Les outils de planification peuvent être utilisés pour analyser l'impact des déplacements et des changements sur l alimentation et le refroidissement du data center (capture d'écran extraite de l application APC by Schneider Electric InfraStruxure Operations ) Le déploiement d'outils de planification modernes peut faire gagner des centaines d'heures de travail par an et des milliers d euros du point de vue des coûts induits par les temps d indisponibilité ainsi évités. Comme les outils modernes de gestion d exploitation recueillent constamment des données des divers appareils des racks, les outils sont capables d'utiliser les données recueillies pour exécuter en temps réel la simulation de positionnement du serveur à partir des exigences d alimentation, de refroidissement, d'espace et de poids du serveur (voir Figure 4). Les outils créent alors un ordre de travail pour placer le serveur dans le bon rack. Le déploiement d'outils de planification modernes peut faire gagner des centaines d'heures de travail par an et des milliers d euros du point de vue des coûts induits par les temps d indisponibilité ainsi évités. Ces avantages s'étendent aux nouveaux environnements privés en Cloud. La sélection et le déploiement de l hôte sont essentiels pour profiter des avantages d'une infrastructure privée en Cloud. La quantité de données et de calculs nécessaires pour faire des choix fondés est importante. Les outils de planification servent de guide pour éviter les incidences de temps d indisponibilité ou les pertes de données. Tout comme le logiciel de planification favorise l amélioration de l'efficacité des opérations, l'accès aux données de planification du data center peut aussi aider à convaincre la direction qu'une mise à niveau d un data center peut être justifiée (voir la section «Analytique : Identifier les atouts et les faiblesses opérationnels» de ce livre). Le manque d informations utiles renvoyées par les systèmes de gestion rend difficile la justification de budgets pour les améliorations d'infrastructure des data centers. L'usage d outils de planification avancés peut également aider les professionnels des data centers à préparer les audits et autres contrôles de conformité. Les nouvelles interfaces d utilisateur graphiques rendent les outils de gestion plus conviviaux. Les racks peuvent désormais être vus en trois dimensions, de haut en bas ou depuis le devant du rack (voir Figure 5). Les outils de gestion mettent en corrélation des données entre les unités de refroidissement, les PDU, et les onduleurs. La chaîne entière est contrôlée. Les outils mettent en relation le rack refroidi par une unité de refrodissement à l'équipement informatique de ces racks. L impact d'une défaillance d'infrastructure physique (comme celle d une unité de refroidissement) logé dans le matériel informatique peut donc être prédit. Livre blanc 107 Rév 0 6
Figure 5 Vue de face de la rangée de racks dans la salle informatique (écran extrait de l'application APC by Schneider Electric InfraStruxure Operations) Exploitation : achever plus de tâches plus rapidement Les nouveaux outils de flux de travail automatisé permettent aux opérateurs d assigner les ordres de travail, de réserver de l'espace, de suivre le statut et d extraire une vérification rétrospective au sujet de la visibilité et de l'historique complets du cycle de changement quand l'équipement est mis sous tension ou hors tension. La Figure 6 souligne les types de questions opérationnelles auxquelles les outils de gestion d'infrastructure physique modernes répondent. Symptômes d exploitations insuffisantes Les exemples suivants illustrent le genre de problèmes survenant par manque d outils de logiciel d exploitation d infrastructure physique utilisables : Dans un grand data center financier, le dimensionnement et l'installation des serveurs sont devenus si complexes que seuls des ingénieurs très bien rémunérés peuvent s'en charger. Un directeur de data center basé à New York s'inquiétait de l'installation d'un serveur dans son nouveau data center de Londres. Il trouvait que ses employés de Londres étaient relativement peu qualifiés et pensaient qu'ils ne sauraient pas placer correctement le serveur. Il a pris un avion de New York à Londres pour coller un Postit sur l'emplacement de rack qu il souhaitait réserver, juste pour s assurer qu aucune erreur ne serait commise. Il voulait être sûr que les systèmes d alimentation et de refroidissement pourraient accueillir les serveurs supplémentaires. Le propriétaire d'un data center de taille moyenne en Floride surdimensionnait intentionnellement sa capacité de refroidissement depuis des années afin de garantir que le data center ne connaisse pas de surchauffe. En outre, il ne connaissait pas l'origine d'un certain nombre de serveurs au sein de son data center. Il a été déterminé que le refroidissement était encore plus excessif qu'envisagé initialement et que 10% de ses serveurs refroidis étaient très peu utilisés. Livre blanc 107 Rév 0 7
Un opérateur de data center de l'industrie des finances a été chargé de l'installation de neuf nouveaux serveurs. Il a localisé un rack dans le data center qui était presque vide, et installé les serveurs dans celui-ci. Il a vérifié que tous les serveurs étaient allumés, et quand ils furent tous initialisés, il a considéré que l'installation était réussie. Ce n'est que le lendemain qu'il a remarqué que l'onduleur qui alimentait les nouveaux serveurs avait dérivé. Il s'est avéré que la charge de passage sur les serveurs récemment installés avait atteint un pic durant la nuit, surchargeant ainsi l'onduleur et exposant des centaines de serveurs à de graves risques. Dans un grand data center du secteur de la santé avec une configuration à la fois à faible densité (sans redondance) et à haute densité (avec redondance 2N), un serveur à faible densité a été installé par inadvertance dans un rack à haute densité. Cette erreur n'a été découverte que lorsque le serveur est devenu hors service. Finalement, le serveur a coûté environ 20 fois plus en électricité que nécessaire. Questions classiques auxquelles répondent les outils d exploitation : Figure 6 Questions d exploitation clés Quel est mon flux de travail actuel? Le data center a des points chauds, comment y remédier? Quel est l état général de mon data center? J ai perdu un ventilateur de CRAC, que puis je faire? J ai dépassé ma consommation électrique dans un rack, que puis je faire? Qu est ce que mon PUE? Les outils logiciels d'exploitation moderne exécutent les fonctions suivantes associées à l exploitation : Distribuer et suivre la puissance de traction monophasée et triphasée de l équipement, en garantissant que les trois phases du système d alimentation atteignent une charge équilibrée. Cela signifie qu'un opérateur devient moins dépendant d un fournisseur ou d un électricien pour déterminer l équilibrage des phases du système électrique. Illustrer le cheminement de l alimentation (de l'onduleur au rack aux dispositifs individuels) dans le rack, charge mesurée, et capacité de rack (au lieu de la découverte par tentatives). Cela aide l'opérateur à identifier immédiatement les serveurs qui seront affectés en cas de défaillance d un rack ou d'un onduleur spécifique. Illustrer l utilisation moyenne et de crête par rack (pour justifier les décisions en déterminant où placer un nouveau serveur). Créer une vérification rétrospective pour tous les changements des ressources et ordres de travail pour une plage temporelle spécifiée, y compris un enregistrement des alertes activées ou désactivées. Lorsqu'il essaie de déterminer pourquoi un système a subi une panne, au lieu de se fier à l opinion de plusieurs individus quant à l équipement déplacé et au moment du déplacement, l'opérateur peut utiliser le système pour fournir la preuve factuelle. Identifier la capacité supplémentaire et indiquer les appareils qui peuvent être mis hors service ou être utilisés ailleurs. Cela peut aider à réduire les coûts d'énergie en réattribuant les actifs de la salle informatique qui ne sont pas utilisés. Créer quotidiennement une valeur de PUE et suivre son historique. Cela permet à l'opérateur d analyser si les stratégies de réduction des coûts et d économie d'énergie de la Direction fonctionnent correctement. Livre blanc 107 Rév 0 8
Les outils logiciels modernes de Planification et d'implémentation permettent d améliorer la procédure opérationnelle standard. La Figure 7 compare des flux de travail traditionnels et d autres améliorés en ce qui concerne la perte d'un ventilateur sur une unité de refroidissement. Les Figures 8 et 9 illustrent des exemples d'approches différentes concernant la gestion des problèmes de consommation d'énergie de data center. Approche traditionnelle Le système de surveillance détecte la perte de ventilateur du CRAC Le personnel est informé pour maintenance Les nouveaux ventilateurs commencent à fonctionner Intervention humaine : élevée Risque d indisponibilité : élevée Figure 7 Approches traditionnelle et moderne : perte du ventilateur de l unité de refroidissement Approche mise à jour Le système de surveillance détecte la perte de ventilateur du CRAC et donne l ordre de maintenance Les ventilateurs proches accélèrent pour compenser la perte Le système identifie les serveurs spécifiques à risque u Les applications à risque sont déplacées vers des serveurs alternatifs La maintenance répare le ventilateur Les applications sont restaurées dans les serveurs d origine Intervention humaine : faible Risque d indisponibilité : faible Dans une approche traditionnelle, l'opérateur humain raisonne de la manière suivante : «J'ai trois unités de refroidissement et 15 racks. C'est l unités de refroidissement nº 3 qui fonctionne mal, donc je ne dois me soucier que des 5 derniers racks de ma chaîne». Ce calcul/corrélation de connaissances humaines pourrait fonctionner dans le cas d un nombre limité de racks à gérer. Toutefois, au fur et à mesure que les environnements de la salle informatique grandissent, la situation devient de moins en moins gérable. Les points chauds et les circuits surchargés apparaissent quand les opérateurs se fient à leur mémoire et/ou à un ensemble d hypothèses. C est alors que les problèmes surviennent. Aux plus hauts degrés de complexité, les outils de gestion exécutent la tâche d une manière beaucoup plus efficace et exacte que le cerveau humain. La méthode traditionnelle pour faire le suivi des journaux d entrée/sortie de l équipement de la salle informatique implique le retrait ou l'installation d'un dispositif puis sa consignation dans un livre (par une personne désignée). Cette procédure est suivie pour tous les appareils de la taille d'un disque ou d une bande ou plus volumineux. Toutes les baies de disque sont vérifiées tous les soirs par mesure de sécurité et si des disques manquent, le système de sécurité réexamine les journaux d'accès et le volume de sécurité de la salle du serveur pour savoir qui les a pris. Les logiciels d'exploitation modernes peuvent fournir des informations concernant l'inventaire du data center à partir d un dispositif portable au niveau du sol du data center. Un lecteur intégré de code-barres simplifie l exécution des ordres de travail et l identification de l'équipement. À l aide d un réseau sans fil, les emplacements du serveur sont automatiquement synchronisés, et les attributs du dispositif et de l installation sont détaillés. Il est possible de lancer une recherche sur le nom du fournisseur de l'équipement, son modèle, et son type. Les informations peuvent aussi être exportées au format Excel. Livre blanc 107 Rév 0 9
Les points chauds et les circuits surchargés apparaissent quand les opérateurs se fient à leur mémoire et/ou à un ensemble d hypothèses. Considérons un scénario où l'opérateur du data center tente de déterminer l état général de l'infrastructure physique d alimentation et de refroidissement. Dans un data center traditionnel, l'opérateur devrait mesurer puis interpréter l état de chaque dispositif individuel. Ces informations de mesure devraient être conservées dans des feuilles de calcul. Les données seraient ajoutées manuellement aux informations de reporting. Les outils modernes de gestion sont capables de découvrir, gérer et surveiller le dispositif centralisé 7 jours sur 7, 24 heures sur 24. En cas de problème, les alertes et les alarmes de l'infrastructure se déclenchent immédiatement selon les seuils et les conditions définis par l utilisateur. Les rapports et les graphiques sont rapidement créés pour faciliter le diagnostic concernant la nature du problème. Problème : la gestion de l'efficacité énergétique Les data centers classiques sont de trop grands consommateurs d'énergie. Historiquement, la conception et l exploitation du data center misent sur la fiabilité et la capacité. Cela a malheureusement abouti à la situation où des data centers ne sont pas optimisés pour être efficaces. En fait, il est difficile d identifier l'emplacement adapté à l'optimisation du data center car les décisions indépendantes des concepteurs d'équipement, des intégrateurs du système, des programmateurs de contrôle, des installateurs, des entrepreneurs, des responsables informatique, et des opérateurs contribuent tous substantiellement au rendement énergétique général. 2 Les études montrent que l utilisation de l'énergie est un coût important des opérations informatiques, dépassant dans certains cas le coût du matériel informatique lui-même. Cette pression financière, et le fait de réaliser que les data centers peuvent être beaucoup plus efficaces dans leur utilisation de l'énergie, a poussé beaucoup d'opérateurs de data centers à réduire leur consommation d'énergie. Les opérateurs sont mal équipés pour mesurer la consommation d'énergie bien qu'ils en soient responsables. Heureusement, les nouveaux outils de gestion énergétique font leur chemin parmi la suite de systèmes de gestion des salles informatiques. Approche traditionnelle Charge réduite du data center la nuit Aucun changement des systèmes de TI, alimentation et refroidissement Économie d énergie : aucune Figure 8 Approches traditionnelle et moderne : déplacement de charge Approche mise à jour Le système détecte la charge réduite du data center la nuit Déplacement de charge selon les données de consommation électrique Économie d énergie : élevée Applications consolidées dans le rack nº1 Rack nº2 éteint, avec augmentation de l économie d énergie 2 US Department of Energy, Creating Energy Efficient Data Centers, U.S. Department of Energy, May 2007 Livre blanc 107 Rév 0 10
Ces nouveaux outils permettent aux opérateurs de salle informatique de gérer le déplacement de charge de la période de pointe (voir Figure 8). Quand les machines virtuelles migrent d'une zone à l'autre, les outils de gestion permettent à l alimentation et au refroidissement de se déplacer aussi dynamiquement. Les Figures 8 et 9 illustrent la façon dont les pratiques de gestion de l'énergie peuvent réduire les coûts opérationnels. Approche traditionnelle Le système actuel détecte le besoin de charge inférieure la nuit Température du data center peut augmenter Vitesse variable des ventilateurs des CRACS au minimum Figure 9 Approches traditionnelle et moderne : paramètre de température intelligente Économie d énergie : modérée Approche de mise à jour Le système détecte le besoin de charge inférieure la nuit Charge de refroidissement réduite notée dans le système BMS Vitesse variable des ventilateurs des CRACS au minimum Économie d énergie : élevée BMS optimise le compresseur en levant la température d eau réfrigérée Analyse : Identifier les atouts et les faiblesses opérationnels L'objectif de cette analyse est d'arriver à une décision optimale ou réaliste établie à partir des données. Par exemple, une vérification rétrospective peut être créée pour tous les changements des installations de la salle d ordinateurs. Si un pic de la demande énergétique semble se produire sur le même rack à la même heure toutes les nuits, et que ce pic risque fortement de déclencher un seuil de disjoncteur, il faut donc prendre une décision pour modifier le flux de travail de manière à réduire le pic de consommation. L'analyse des données opérationnelles de l'infrastructure physique peut aussi déterminer la cause des problèmes (dispositifs lents ou coûteux). La combinaison de la simulation analytique et conditionnelle offre une autre façon d'aider le data center à induire de la valeur. La Figure 10 souligne le type de questions pouvant trouver une réponse à travers l'utilisation des outils de gestion de l'infrastructure physique du data center. Les rapports de rendement suivent les interruptions par rack, rangée et zone de distribution énergétique. Quand les serveurs défaillent plus fréquemment dans une zone, une raison fondamentale peut alors être déterminée. Sans un cadre de référence, la valeur des paramètres du data center est limitée si le but de l'opérateur est d'augmenter l'efficacité du data center et d en réduire le coût. Livre blanc 107 Rév 0 11
Qu estio ns cl as si ques auxquelles répond ent les outils d'analyse : Figure 10 Questions analytiques clés Que contient mon da ta center? Qui a utilisé quel équipement et quand? Le système possède t il un e fonction de refroidissement et d'alimentation isol és? Quand le micrologicieldevra t il être mi s à jour? À qu elle da te l 'alimenta tion et la fonction de re froidissement du data center de viend ro nt elles ina ctiv es? Dans qu el ordre? Quand les batteries do iven t elle s être chargées sur un UPS? Quand le prochain investissement important en in frastruc tu re phy si qu e de da ta center sera t il nécessaire? Co mmen t prév oir les besoins futurs en infrastructure, investissements et déploiements? Les outils logiciels d analyse modernes exécutent les fonctions suivantes : Identifier des incohérences entre l'utilisation prévue de l'énergie, à partir des informations des spécifications, et sa véritable utilisation, à partir des données énergétiques réelles. Cela aide les opérateurs à produire des estimations de capacité plus précises, ce qui facilite la prise de décisions concernant les budgets et les acquisitions. Créer des rapports d'inventaire organisés par type de dispositif, âge, fabricant, et propriétés du dispositif. Cela permet à l'opérateur d identifier rapidement les installations sous-utilisées, exclues de la garantie, et celles qui ont besoin d'être mises à niveau. Créer des rapports d'utilisation de l'énergie (voir Figure 11) par sous-système. Cela permet aux opérateurs de déterminer quels racks ou sous-systèmes produisent le coût le plus élevé en énergie et de repérer si la consommation d'énergie augmente à la suite de changements récents dans la salle informatique. Fournir des détails sur le lien entre les frais d exploitation et les contre-passations pour chaque groupe d'utilisateurs de chaque unité commerciale. Cela permet à l'opérateur de modifier le comportement de la consommation d'énergie de plusieurs unités commerciales et permet à l entreprise de prendre de meilleures décisions concernant les technologies déployées. Livre blanc 107 Rév 0 12
Efficiency dashboard Interface Web Pour une intégration simple avec une page Web tiers avec application d interface de programmation(api) Figure 11 Analyse de consommation d'énergie (capture d'écran extraite de l'application APC by Schneider Electric InfraStruxure Energy Efficiency) Calcul de l efficacité énergétique Valeurs de PUE passées et actuelles de la charge de TI pour une compréhension basée sur les faits de l efficacité énergétique au niveau des installations 2009 APC by Schneider Electric Pertes d énergie du sous-système Pertes d énergie et coût des soussystèmes, avec détails des soussystèmes aux coûts les plus élevés Quand les caractéristiques géographique du plancher et du rack du data center ne sont pas coordonnées avec les capacités d alimentation, de refroidissement, de distribution d énergie, et de distribution de refroidissement, il en résulte une perte de capacité. L exemple d un PDG qui se promène dans le data center, voit plusieurs racks qui ne sont qu à moitié pleins, et demande pourquoi le responsable du data center affirme que le data center est à son «rendement maximum» illustre encore mieux ce concept. Les exemples de perte de capacité du data center incluent : Un climatiseur possède une capacité suffisante mais pas la distribution d'air adéquate pour la charge informatique. Un PDU possède une capacité suffisante mais aucun emplacement de disjoncteur n est disponible. L'espace au sol est disponible mais l'alimentation disponible est insuffisante. Les climatiseurs sont positionnés de façon incorrecte Certains PDU sont en surcharge alors que d'autres possèdent une charge très faible. Certains secteurs sont en surchauffe alors que d'autres demeurent froids La perte de capacité est un problème de gestion de la capacité frustrant pour les professionnels des data centers. Il est difficile d'expliquer aux utilisateurs ou à la Direction qu'un data center doté de 1 MW de puissance installée et de refroidissement ne peut pas refroidir de nouveaux serveurs alors qu il ne fonctionne qu à 200 kw de charge totale. Lien de référence Livre blanc d APC nº150 Gestion de la capacité énergétique et de refroidissement pour data centers Un outil efficace de gestion de la capacité identifie et souligne non seulement la capacité isolée, mais aide surtout le personnel du data center à ne pas créer cette situation. Pour plus d'informations sur la façon dont gérer la capacité, voir le Livre Blanc d'apc nº 150, Gestion de la capacité électrique et de refroidissement des data centers. Livre blanc 107 Rév 0 13
Conclusion Avec les défis de l'informatique à plus haute densité, des charges de travail dynamiques, et la nécessité d'optimiser la consommation d'énergie, les organisations exigent un logiciel qui leur permet de planifier, d exploiter à faible coût et de produire des analyses pertinentes pour l'amélioration du flux de travail. Grâce à une visibilité accrue, il est possible d'exercer un plus grand contrôle et d améliorer l'automatisation pour remplir l'engagement de création de valeur commerciale. Les capacités de gestion globale disponibles de nos jours peuvent permettre aux professionnels des data centers de maximiser leur capacité à contrôler les coûts énergétiques et à conseiller l entreprise sur la façon dont utiliser plus efficacement les installations informatiques. En partageant des données de base, des données historiques et les informations de suivi de l installation, tout en développant la possibilité d'accorder une contre-passation aux utilisateurs, les nouveaux outils de Planification et d'implémentation permettent aux utilisateurs de prendre des mesures à partir des données commerciales du data center. À propos des auteurs Torben Karup Nielsen est directeur de la recherche sur les logiciels de l'équipe APC by Schneider Electric's Data Center Software Research. Il détient une maîtrise en informatique et mathématiques de l'université du Danemark-du-Sud. Il a beaucoup travaillé sur le logiciel d'efficacité énergétique et de gestion du data center, ainsi que sur l'intégration entre la gestion d'infrastructure du data center (DCIM), les TI et les systèmes de gestion de flux de travail. Dennis Bouley est analyste senior au centre APC by Schneider Electric's Data Center Science Center. Il détient un diplôme de journalisme et de français de l Université de Rhode Island et le Certificat Annuel de la Sorbonne (Paris, France). Il a publié de nombreux articles dans des journaux du monde entier traitant des environnements TI de data center et de leur infrastructure physique et a rédigé plusieurs livres blancs pour The Green Grid. Livre blanc 107 Rév 0 14
Livre blanc 107 Rév 0 15 Comment le logiciel de gestion de l infrastructure physique du datadenter
Ressources Cliquez sur l'icône pour accéder à la ressource Parcourir tous les Livres whitepapers.apc.com Classification des outils de gestion de la technologie d exploitation (OT) du data center Livre blanc d APC nº104 Gestion de la capacité énergétique et de refroidissement pour les data centers Livre blanc d APC nº150 Parcourir tous les outils APC TradeOff Tools tools.apc.com Calculateur pour le dimensionnement de la puissance APC TradeOff Tool 1 Calculateur d'allocation énergétique APC TradeOff Tool 2 Calculateur d efficacité énergétique APC TradeOff Tool 6 Nous contacter Si vous avez des questions ou des commentaires concernant ce livre blanc : Data Center Science Center, APC by Schneider Electric DCSC@Schneider-Electric.com Si vous êtes client et avez des questions concernant votre projet de data center : Contactez votre représentant APC by Schneider Electric Livre blanc 107 Rév 0 16