UA311W : Mémoire. Master STIC. Présenté par Benjamin OBOUSSIER le 01 juillet 2009



Documents pareils
Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

1 ère Partie Stratégie et Directions Stockage IBM

Virtualisation CITRIX, MICROSOFT, VMWARE OLIVIER D.

en version SAN ou NAS

LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES

VIRTUALISATION : MYTHES & RÉALITÉS

Technologie de déduplication de Barracuda Backup. Livre blanc

FAMILLE EMC RECOVERPOINT

vbladecenter S! tout-en-un en version SAN ou NAS

Portefeuille de solutions HP pour la virtualisation

EMC DATA DOMAIN HYPERMAX

Protection des données avec les solutions de stockage NETGEAR

Le data center moderne virtualisé

EMC DATA DOMAIN OPERATING SYSTEM

LA VIRTUALISATION. Etude de la virtualisation, ses concepts et ses apports dans les infrastructures informatiques. 18/01/2010.

VMWare Infrastructure 3

Le stockage unifié pour réduire les coûts et augmenter l'agilité

DES SAUVEGARDES ET DES RESTAURATIONS DE DONNEES SANS CONTRAINTES DE LIEU NI DE TEMPS

Nouvelles stratégies et technologies de sauvegarde

Résolvez vos problèmes d énergie dédiée à l informatique

La plate forme VMware vsphere 4 utilise la puissance de la virtualisation pour transformer les infrastructures de Datacenters en Cloud Computing.

Square-IT-Consulting. Présentation

A Les différentes générations VMware

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

Conception d une infrastructure «Cloud» pertinente

Green it consulting nouveau leader de l informatique écologique

LES 5 PRINCIPALES RAISONS DE DÉPLOYER MICROSOFT SQL SERVER SUR LE SYSTÈME DE STOCKAGE UNIFIÉ EMC VNX

EMC AVAMAR. Logiciel et système de sauvegarde avec déduplication

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

Par CADICI Grégory & FRITZ Rémy

WHITE PAPER. Quels avantages la déduplication offre-t-elle aux entreprises? Livre blanc Acronis

Table des matières. A - Introduction 13. B - Qu'est-ce que la virtualisation? 13

LENOVO THINKSERVER GUIDE DES PRODUITS. Haute évolutivité et flexibilité conjointes au développement de l entreprise

FUJITSU WORLD TOUR 2014 Paris

LE STOCKAGE UNIFIÉ ASSOCIÉ À LA VIRTUALISATION D'ENTREPRISE

Installation d une architecture VMware Infrastructure 3 : Bilan et perspectives

Vers une IT as a service

Entrer. Dans le Cloud

Simplifier la gestion des données et réduire les coûts grâce à la virtualisation intelligente des fichiers

Livre blanc rédigé par ENTERPRISE MANAGEMENT ASSOCIATES (EMA ) pour VMware Avril 2010

virtualisation et consolidation des infrastructure: comment amèliorer la performance du SI

Système de stockage IBM XIV Storage System Description technique

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Etude d architecture de consolidation et virtualisation

La Continuité d Activité

Système de stockage sur disque IBM Storwize V5000

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

Architectures d implémentation de Click&DECiDE NSI

Les hyperviseurs leaders du marché qui ont fait leurs preuves en production

Je bénéficie désormais des avantages exceptionnels de la virtualisation pour mon stockage. Virtual SAN est aussi économique que simple à utiliser.

Virtualisation des Serveurs et du Poste de Travail

Dossier Solution - Virtualisation CA arcserve Unified Data Protection

Dynamic Computing Services solution de backup. White Paper Stefan Ruckstuhl

L unique SAN industriel proposant un stockage multiniveau automatisé (Automated Tiered Storage)

Cycle Innovation & Connaissance 12 petit déjeuner Mardi 15 mai Cloud Computing & Green IT : nuages ou éclaircies?

La Virtualisation Windows chez CASINO. Philippe CROUZY Responsable Infrastructure Equipes Systèmes -Stockage

Automatisation de la découverte, de la surveillance et de l analyse des causes premières dans le datacenter virtualisé (VDC) EMC SERVER MANAGER

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Garantir une meilleure prestation de services et une expérience utilisateur optimale

TRANSFORM IT + BUSINESS + YOURSELF

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

Solutions NEC pour les collectivités territoriales

Regard sur hybridation et infogérance de production

Entrez dans l ère du Numérique Très Haut Débit

Solution IT Power Management Gérer la consommation électrique de toute votre infrastructure IT

Sauvegarde et restauration EMC Avamar en environnement VMware

Kick Off SCC Vers de nouveaux horizons

Intervenant : Olivier Parcollet olivier.parcollet@semtao.fr Architecte Systèmes & Réseaux. RETOUR D EXPERIENCE Virtualisation à lasetao

Mise en œuvre de la virtualisation à l IGBMC. Guillaume Seith Remy Fritz

Serveur EMC/CX Solution de stockage hautes performances dotée d'une connectivité flexible

e-novatic PRATIQUES, PLANIFICATION SUITE

Virtualisation & Sécurité

Marché Public. Serveurs et Sauvegarde 2015

La virtualisation, des postes de travail

Les data centers. à l ère de la consolidation, de la virtualisation. l informatique verte

Les méthodes de sauvegarde en environnement virtuel

Symantec Backup Exec 2012

CA ARCserve Backup r12

Architecture complète de protection du stockage et des données pour VMware vsphere

Le e s tocka k ge g DAS,NAS,SAN

Virtualiser ou ne pas virtualiser?

CONSULTATION : (MAPA) MAT_INFO_2013_03 Marché à procédure adaptée (MAPA) MAT_INFO_2013_03

Symantec Backup Exec 11d

Stockage Dell. Vos données disponibles, au bon endroit, au bon moment et au juste coût

au Centre Inter-établissement pour les Services Réseaux Cédric GALLO

CA Automation Suite for Data Centers

Marché Public en procédure adaptée : Infrastructure Informatique régionale hébergée CAHIER DES CHARGES ET DES CLAUSES TECHNIQUES

Migration des données Une histoire sans fin

Unitt Zero Data Loss Service (ZDLS) La meilleure arme contre la perte de données

Plan de cet après-midi

stockage, pour des économies en termes de temps et de coûts. Avantages principaux

Cahier des charges pour la mise en place de l infrastructure informatique

NEC Virtual PC Center

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

Bull, un catalogue de service particulier pour répondre aux environnements complexes

PPE 1 PRISE EN MAIN DE VMWARE VSPHERE 5.5 & CONFIGURATION D UNE MACHINE VIRTUELLE

Transcription:

UA311W : Mémoire Master STIC Dans un avenir proche, quelle sera l évolution des Data Centres en matière d administration et d infrastructure des serveurs mais surtout dans le domaine du stockage? Présenté par Benjamin OBOUSSIER le 01 juillet 2009 Examinateurs : F. MILLER Tuteurs : J.R De LAMOTTE R. KOBYLANSKI C. SANCHEZ C. GARNIER J.L. PAROUTY

Mémoire II INPG / CUEFA

Date de rédaction : Avril-Juin 2009 Rédacteurs : Benjamin Oboussier (benjamin.oboussier@gmail.com) Révision : V1.00 Licence et droits d utilisation : Ce document est publié sous licence Creative Commons CC BY-NC-SA 1 : CC : Creative Commons cf http://creativecommons.org/worldwide/fr/, BY : Paternité. L auteur conserve la paternité de son oeuvre, et vous ne pouvez vous attribuer que vos propres contributions, NC : Pas d Utilisation Commerciale (Noncommercial). Ce travail ne peut faire l objet d une utilisation commerciale 2, SA : Partage des Conditions Initiales à l Identique (Share Alike). Toute altération, transformation, tout produit dérivé de ce travail doit être distribué sous une licence identique ou similaire. 1. Vous trouverez le contrat de licence complet à http://creativecommons.org/licenses/by-nc-sa/2.0/fr/legalcode 2. Pour une compréhension des usages autorisés, voir le tableau www.adamfields.com/cc-nc-allowed-uses-flowchart. pdf Mémoire i INPG / CUEFA

Mémoire ii INPG / CUEFA

Ce mémoire a été réalisé dans la Business Unit Bull Storeway dans le cadre du Master STIC conduit par le Cnam de Grenoble. Tuteur Académique : Jean-Luc Parouty Tuteur Professionnel : Jean-René De Lamotte Rédacteur : Benjamin Oboussier k benjamin.oboussier@bull.net k benjamin.oboussier@gmail.fr Mémoire soutenu le 01 juillet 2009 au Cnam de Grenoble. Version 1.00 iii

Mémoire iv INPG / CUEFA

Remerciements La réalisation de ce mémoire marque la fin de deux années d études en alternance chez Bull dans la BU Storeway. Je tiens en premier lieu à remercier toutes les personnes qui m ont soutenu pendant ces deux années. Etablir une liste exhaustive m est impossible. Aussi ne soyez pas déçus si votre nom n apparaît pas sur cette page. Merci à Cécilio de m avoir accueilli dans son équipe ainsi que Patrice et Mohammed pour m avoir guidé et transmis leur savoir faire en matière de stockage. Plus largement merci à toute l équipe Produits Storeway ainsi que l équipe d Architecture pour leurs conseils et leur disponibilité au quotidien. Un grand merci à Jean-Luc Parouty pour m avoir suivi tout au long de la réalisation de ce mémoire, et m avoir prodigué conseils et remarques constructives. Merci également à Caroline et Margaux pour la relecture de ce mémoire Merci à tous nos enseignants pour nous avoir (parfois avec patience...) transmis leurs connaissances. Merci à mes parents qui m ont soutenu tout au long de mes études et qui, même s ils n ont pas trop compris dans le détail mon travail, m ont permis de m en sortir 3 dans la logistique. Merci à toi Martin pour avoir fermé le Vice-Versa à temps, sinon je pense que nous aurions (Damien, moi et tous les autres) été beaucoup moins studieux...... Ultime remerciement : merci à la machine à café (K) pour avoir tenu bon pendant ces deux années d études... 3. Merci maman pour tes bons petits plats préparés depuis ces deux dernières années avec amour le dimanche afin que mes repas culinaire ne se résument pas à la gastronomie Italienne :) v

Remerciements Mémoire vi INPG / CUEFA

«Un beau jour, le pouvoir sera bien contraint de pratiquer l écologie. Une prospective sans illusions peut mener à penser que, sauf catastrophe, le virage écologique ne sera pas le fait d une opposition très minoritaire dépourvue de moyens, mais de la bourgeoisie dirigeante, le jour où elle ne pourra faire autrement. Ce seront les divers responsables de la ruine de la terre qui organiseront le sauvetage du peu qui en restera, et qui après l abondance géreront la pénurie et la survie. Car ceux-là n ont aucun préjugé, ils ne croient pas plus au développement qu à l écologie : ils ne croient qu au pouvoir, qui est celui de faire ce qui ne peut être fait autrement.» Bernard Charbonneau, 1980 vii

Mémoire viii INPG / CUEFA

Table des matières iii Remerciements v vii Introduction xi Terminologies et Concepts xiii 0.1 Data-Centre............................................ xiii 0.2 NAS & SAN........................................... xiv 0.3 Virtualisation........................................... xiv 0.4 Green computing......................................... xv 1 Evolution de l administration de l infrastructure de stockage 1 1.1 Virtualisation du Data-Centre.................................. 1 1.1.1 Pourquoi une virtualisation du Data-Centre?..................... 1 1.1.2 Nouvelles problématiques que les infrastructures virtualisées peuvent poser vis-à-vis du stockage........................................ 1 1.1.3 Acteurs et fournisseurs de solutions........................... 2 1.1.4 Apport de ces technologies de virtualisation d infrastructure............. 3 1.2 La virtualisation du Stockage.................................. 3 1.2.1 Pourquoi virtualiser l infrastructure de stockage?................... 4 1.2.2 Comment répondre à une demande de virtualisation globale du stockage?..... 5 1.2.3 Evolution vers des baies de stockage multi-protocoles................. 7 1.3 Impact et positionnement des solutions de virtualisation................... 8 2 Le "Green storage" dans le Data-Centre 11 2.1 Le Green IT............................................ 11 2.1.1 Nouvelles problématiques du Data-Centre....................... 11 2.1.2 Les acteurs du Green.................................. 12 2.1.3 Rappel sur les contraintes légales............................ 13 2.1.4 Les besoins et les attentes dans ce domaine...................... 14 2.2 Le Green Storage......................................... 15 2.2.1 Les enjeux du stockage dans le Data-Centre de demain................ 15 2.2.2 Des technologies novatrices............................... 16 2.3 Stratégies du Green....................................... 18 2.3.1 Axes de développement................................. 18 2.3.2 Entre marketing et bonne conscience : le Green................... 19 ix

TABLE DES MATIÈRES TABLE DES MATIÈRES Conclusion 21 Glossaire 27 Glossary................................................. 27 Abréviations 29 Références 30 Mémoire x INPG / CUEFA

Introduction Je suis apprenti chez Bull SAS dans la business Unit Storeway au Storage Excellence Center d Echirolles. Le service dans lequel j évolue a pour vocation l expertise des problèmes et des solutions à apporter aux problématiques de nos clients dans le domaine du stockage et de la pérennisation des données. En tant qu intégrateur de stockage, Bull conçoit et bâtit des solutions de stockage de bout en bout pour répondre aux défis propres et à l activité de chacun de ses clients. Ces solutions allient les technologies innovantes de sa gamme StoreWay TM à celles de ses partenaires tel EMC ou NetApp, principaux acteurs du marché. Dans ce contexte, nous sommes amenés à proposer des solutions basées sur différentes technologies. L une des difficultés est de concevoir une architecture cohérente, adaptée au budget et aux besoins demandés tout en gardant la possibilité d une évolution future. Les responsables informatiques doivent aujourd hui faire face à un nombre toujours plus croissant d exigences professionnelles internes et/ou externes. Ils doivent donc s assurer que le Data-Centre est un actif stratégique pour accompagner une croissance et une expansion continue de l entreprise. Nous nous trouvons dans une période où la quantité de données explose, où la virtualisation s accroît et où un besoin d engagement écologique se fait ressentir. De plus, la pression pour réduire les coûts, améliorer la souplesse et la sécuriser les données devient une nécessité. Tous ces facteurs mènent indéniablement à l évolution et à la transformation du Data Centre. Au coeur de celle-ci, apparaît un besoin sous-jacent d unifier, de consolider, de faire évoluer, ainsi que de simplifier l administration et d automatiser l infrastructure du Data-Centre. Le modèle informatique traditionnel est donc devenu inapplicable. Les départements informatiques passent le plus clair de leur temps à gérer la complexité des infrastructures : traitement des urgences, opérations courantes de maintenance ; autant de tâches extrêmement complexes ne laissant aucune marge de manœuvre. Dans une économie fortement marquée par l automatisation et les technologies, le potentiel commercial est désormais inextricablement lié aux capacités informatiques. De plus en plus complexe, l infrastructure informatique a perdu en souplesse, et est devenue fragile et onéreuse. En fait, une entreprise consacre généralement près de 70 à 80% de son budget informatique à maintenir un statu quo, se privant ainsi de toute possibilité de renouveler ou d actualiser ses capacités. Nous sommes arrivés à un point où les opportunités commerciales sont littéralement prises au piège dans l infrastructure informatique. Il est difficile d avoir des Road maps de produits sur les nouvelles technologies devant être proposées par les différents constructeurs du marché en terme de nouvelles architectures et fonctionnalités apportées à l ensemble du Data-Centre. Cependant, en connaissant les différents éléments actuels, nous devrions être en mesure d anticiper la tendance en sachant vers quelles technologies le Data-Centre, et particulièrement le stockage, devrait tendre. Pour traiter cette réflexion, nous commencerons par un court rappel des 4 concepts et terminologies en rapport avec cette réflexion. nous étudierons ensuite les technologies de type Cloud Computing en analysant les avantages liés à l utilisation de cette architecture à l intérieur du Data Centre. Puis, nous en découlerons sur l évolution de l administration qui pourrait être faite du stockage avec les avantages de la virtualisation. Enfin, cette réflexion se terminera par une analyse critique du Green IT dans le stockage. xi

Introduction Mémoire xii INPG / CUEFA

Terminologies et Concepts Ce document s adressant aussi bien aux managers et responsables d entité qu à des personnes non spécialistes des domaines du Data-Centre et du stockage, il me semble opportun, par ces quelques lignes, de redéfinir le contexte dans lequel porte ma réflexion. 0.1 Data-Centre Le Data-Centre, que l on peut traduire en français par centre de traitement des données, est une infrastructure qui gère l ensemble des données numériques d une société. Il peut se décliner en différentes tailles suivant le contexte de sa sollicitation (petite infrastructure pour une PME, grande, voir très grande, dans le cas d une multinationale). Figure 1 Data-Centre de la société Free, gérant une partie des mails et du stockage de ses abonnés. Les attentes qui sont faites d une architecture de ce type se déclinent principalement en trois fonctions : la gestion des bases de données, la gestion des serveurs de fichiers, la gestion des applications dédiées ou non à l activité métier des clients. Quant aux limites, du fait du nombre toujours plus important d informations et de l accroissement exponentiel des données à traiter ; des problèmes de consommation électrique ainsi que de la gestion de l énergie dégagée ; elles sont de plus en plus difficiles à gérer. xiii

Terminologies et Concepts NAS & SAN 0.2 NAS & SAN Le NAS et le SAN sont des infrastructures réseau 4 permettant l acheminement des données, provenant d une part des serveurs ou directement des utilisateurs du système d information de l autre. Ces réseaux n ont pas la même finalité, et sont utilisés dans deux contextes bien précis : Le NAS est principalement utilisé à des fins de serveur de fichiers avec les protocoles CIFS, NFS, etc, et a pour«client» les utilisateurs eux-mêmes. Il est donc implanté sur le réseau LAN et a pour contraintes les limitations de celui-ci (limité par la vitesse des équipements réseau.) Le SAN est principalement utilisé dans la gestion des données avec de fortes contraintes sur les performances, ainsi que sur la quantité des données à traiter comme on peut le trouver dans des applications de type MS Exchange ou des bases de données de type Oracle. Ces réseaux restent très onéreux à implanter dans de petites sociétés, ce qui est une contrainte indéniable.. Le schéma de la figure 2 permet de comprendre les limites physiques et les protocoles supportés par les réseaux de stockage SAN et NAS. Figure 2 Schéma des différences entre SAN et NAS dans une architecture réseau (source Wikipedia). Ayant réalisé mon étude bibliographique sur ce sujet, mon document de synthèse est consultable à l url suivante : http://boboussier.free.fr/master%20rie/etudebibliographique.pdf 0.3 Virtualisation Suite aux lois de Moore qui sont toujours respectées, la virtualisation moderne 5, a pour ambition, d utiliser des machines physiques (toujours plus puissantes) dans le but de permettre le fonctionnement de plusieurs systèmes d exploitation indépendamment les uns des autres comme s ils fonctionnaient sur des machines physiques. Comme le montre la figure 3, le matériel physique reste commun aux machines virtuelles supportées dans la machine physique. Des avantages comme : la réduction des côuts (électricité et climatisation), la facilité à administrer un parc de machines, la portabilité des VM sont des arguments porteurs dans l investissement de ces technologies, qui évoluent et gagnent en fonctionnalités. Actuellement, ce type d architecture rencontre des problèmes de type partage d interface entre VM ainsi que des limites de bande passante dans l utilisation de carte réseau NIC pour ne donner qu un exemple dans le domaine d orientation de mon mémoire : le stockage. 4. Le SAN est une architecture réseau à part entière. Quand au NAS, on ne doit pas le considérer comme une architecture réseau mais comme un périphérique réseau de stockage sur le LAN. Cependant, dans un souci de simplification, nous faisons l amalgame entre Baies de stockage (qu est le NAS) et réseau de stockage (qu est le SAN). 5. Relative à la virtualisation sur micro-processeur Intel de type X86. Mémoire xiv INPG / CUEFA

Terminologies et Concepts Green computing Figure 3 Principe général de la virtualisation.. Ayant réalisé une synthèse sur le sujet dans le cours de Mr AOUANE, mon document est consultable à l url suivante : http://boboussier.free.fr/master%20rie/syntesevirtualisation.pdf 0.4 Green computing Le Green computing peut se traduire par «l informatique verte» ou de façon plus provocante : l écologie au service du marketing. Celui-ci s inscrit dans une politique de développement durable dans le domaine informatique. Il englobe aussi bien la partie Data-Centre que la partie micro-informatique du côté utilisateur (poste informatique fixe ou mobile, imprimante, fax, etc). Le Green computing se dissocie en deux parties : utilisation courante du produit englobant les coûts / frais de fonctionnement impactant l environnement, développement du produit englobant les coûts / frais de fabrication impactant l environnement. Les limites actuelles de ces politiques menées par les industriels visent à communiquer sur les gains énergétiques réalisés ou par les matériaux utilisés par rapport aux produits finis manufacturés précédemment. En terme de chiffres, il est constaté dans la majorité des Data-Centres que le rendement énergétique est médiocre. En moyenne, sur trois Watt facturés par le fournisseur d énergie, un seul est réellement utilisé par le système d information, le reste étant consommé par l infrastructure. Les constats dans le domaine qui nous intéresse dans ce document (infrastructure de stockage) porte une part de responsabilité importante : volumétrie des données doublant tous les 18 mois, mauvaise gestion des capacités de stockage, espace de stockage inapproprié par rapport à la valeur des données, etc. Mémoire xv INPG / CUEFA

Terminologies et Concepts Green computing Mémoire xvi INPG / CUEFA

Chapitre 1 Evolution de l administration de l infrastructure de stockage 1.1 Virtualisation du Data-Centre Comme cela peut être observé depuis quelques mois, la virtualisation des serveurs fait la une des magazines, des journaux spécialisés et des lettres d information. Outre l aspect marketing, quel gain peut-il en être fait dans le Data-Centre et dans la gestion du stockage? Les produits et les technologies mis à la disposition des DSI sont multiples et proposent plus de fonctionnalités à chaque nouvelle version. L hyperviseur n est plus qu une brique de base autour de laquelle se multiplient les outils d administration. 1.1.1 Pourquoi une virtualisation du Data-Centre? La virtualisation des infrastructures du Data-Centre poursuit principalement trois buts. Tout d abord, la séparation des fonctions assignées au serveur, dans le but d avoir un seul serveur par fonction, ce qui permet au responsable informatique (DSI) de diminuer les effets de bords ainsi que les incompatibilités qui peuvent exister entre les applicatifs. Puis, la recherche d optimisation et de l utilisation au maximum des ressources physiques disponibles, car passer de l utilisation de plusieurs serveurs sous exploités (15% des ressources CPU) à un serveur virtualisé qui sera mieux exploité (75% des ressources CPU) permet la réduction de la consommation électrique ainsi que la probabilité de pannes matérielles, tout en simplifiant les tâches de sauvegarde. Enfin, la dématérialisation de la configuration du système apporte l aisance de migrer des machines virtuelles d un serveur à l autre et cela avec encore plus de facilité dans le cas d un «Boot On SAN 1». 1.1.2 Nouvelles problématiques que les infrastructures virtualisées peuvent poser vis-à-vis du stockage La mise en oeuvre dans les Data-Centre de ces nouveaux outils de virtualisation vont solliciter de nouvelles interrogations auprès des administrateurs et des responsables DSI. En effet, aujourd hui, les salles serveurs font cohabiter des installations virtualisées et des installations non virtualisées, ce qui génère une multitude d outils d administration différents. Des problématiques de performances vis-à-vis de la virtualisation avec de nouvelles applications vont apparaître et poser des contraintes d I/O. De même que des confusions devraient germer en relation aux différentes fonctionnalités introduites il y a peu dans les baies de stockage, tel : le SnapShot, le Thin Provisioning ou encore la Déduplication. La question qu il faut se poser est la suivante : où va se faire cette gestion ; dans la baie 1. Le Boot On SAN consiste à héberger le système d exploitation directement sur un LUN du SAN et non plus dans le serveur lui même. 1

Evolution de l administration de l infrastructure de stockage Virtualisation du Data-Centre comme c est le cas encore aujourd hui? Dans les outils d administration des serveurs? Ou bien encore dans l outil de management des VM? Cela reste une question en suspend sur laquelle certains éditeurs commencent à apporter des solutions concrètes (Cf. tab. 1.1). Le dernier point sur lequel une question reste hautement sensible dans les environnements virtualisés, et en suspend : la gestion des backups. Quelle méthode doit être préconisée? Est-il envisageable de garder la même méthode que pour les environnements physiques, et surtout, quel va être l impact sur les fenêtres de backup ainsi que sur le temps de restauration? 1.1.3 Acteurs et fournisseurs de solutions J ai volontairement restreint mon comparatif (orienté stockage) de solution de virtualisation sur les trois grands acteurs de ce marché 2 : Xen, HyperV, Vmware. En effet, ces trois solutions représentent 95% du marché de la virtualisation de machines de type X86. Xen Cytrix Xen est un projet universitaire libre racheté par Citrix permettant de proposer une offre de virtualisation à son catalogue produits. La communauté Open Source participe encore au développement de quelques produits du projet, et les améliorations stratégiques sont reportés aux produits sous licence. L avantage des solutions de virtualisation Xen, est qu il a été intégré une interopérabilité avec Microsoft dans les composants propriétaires de ses solutions de mise à disposition d applications afin qu elles s intègrent en toute transparence avec Microsoft Server 2008 via Microsoft Hyper-V. D ailleurs, c est là que la relation entre Citrix et Microsoft prend tout son sens. Elle permet aux entreprises de choisir les solutions correspondant le mieux à leur environnement. Hyper-V MS Hyper-V est la solution de Microsoft pour répondre à la virtualisation d infrastructures. Elle s inscrit dans une architecture ou l ensemble des systèmes d exploitation virtualisés restent Microsoft. Microsoft, parle alors de «System Center», qui comprend l ensemble des outils de virtualisation de l infrastructure (Hyper-V, Virtual Pc, SoftGrid, Terminal Server). Vmware VmWare est le leader incontesté de la virtualisation en parts de marché dans les architecture X86. Cet éditeur, avec la dernière version de sa distribution (ESX4,0), semble aller très loin dans sa volonté de gérer les infrastructures du Data-Centre. En effet, VmWare fait sortir la virtualisation du serveur pour l étendre à toute la salle informatique en intégrant la gestion des réseaux et du stockage ; son hyperviseur devenant un système d exploitation distribué ou un MainFrame logiciel. Solutions Open Source Il existe d autres solutions dans le domaine de la virtualisation, dont l utilisation reste pour l instant marginal. On peut nommer KVM 3 comme étant la solution Open Source la plus abouti à ce jour. Très prisé dans le milieux universitaire ainsi que dans la recherche, cette solution, pourtant très performante, stable et tout à fait exploitable dans un secteur de production industriel, n est que très peu utilisée dans les entreprises. Ne disposant pas d outils d administration graphique et de console de management, elle pourrait cependant fortement concurrencer Xen car étant de base intégré au noyau Linux. Administrations du stockage à partir de l outil d administration des VM L administration du stockage évolue. En effet, elle se déplace de l outil d administration de la Baie de stockage vers l outil de management de la plate-forme virtualisée. La possibilité fonctionnelle est donc 2. On peut noter que VioServeur qui est une solution de virtualisation dans le monde PowerPc d IBM a les mêmes problématiques d évolution et d administration de ses infrastructures virtualisées. 3. Kernel-based Virtual Machine Mémoire 2 INPG / CUEFA

Evolution de l administration de l infrastructure de stockage La virtualisation du Stockage donnée à l administrateur, sur un même tableau de contrôle, le management des VM ainsi que de toute la partie stockage. Les Snapshots, les Clone, la gestion du Thin Provisioning, les Backups, les réplications distantes et autres, étant ainsi gérées au sein d un même outil facilitant la prise en mains et la non gestion de multiple outils. Comme le résume le tableau 1.1, on constate que le produit le plus évolué en terme de gestion de l infrastructure avancée est VMware. La stratégie de ce dernier ayant pris de cours l arrivée récente de Microsoft dans le domaine de la virtualisation. Editeur Nom du produit Nom de l hyperviseur Gestion du réseau Gestion du stockage Outil de gestion Microsoft Hyper-V V1 Hyper-V - - Système Center Virtual Machine Manager Citrix Xen Server 5,5 Citrix Xen Server - - Xen Center VMware vsphère 4 VMware ESX vnetwork vstrorage vcenter Server KVM KVM KVM VOE - ligne de commande Table 1.1 Tableau de syntèse des outils d administration des infrastructures virtualisées. 1.1.4 Apport de ces technologies de virtualisation d infrastructure Sur l ensemble des fonctionnalités se situant autour des hyperviseurs, les éditeurs de ces produits innovent et créent des produits pour répondre à l ensemble des nouvelles problématiques dûes à la virtualisation (Cf 1.1.2). Après avoir étudié chacune des solutions de virtualisation d infrastructure, j en déduis qu actuellement la seule solution ambitieuse et couvrant l intégralité de ces problèmes, est VMWARE ESX4,0, qui propose non seulement un hyperviseur puissant et convivial de fait de son administration graphique, mais également toute une série d outils capables de gérer et d administrer de façon très pointue l ensemble du Data-Centre (Cf. figure??) comme le stockage ou bien l infrastructure réseau. Les autres éditeurs proposent des solutions toutes aussi performantes sur le plan de l hyperviseur mais n englobent pas les fonctionnalités connexes de réseau et de stockage. Nous pouvons donc observer deux analyses différentes de la problématique et des stratégies à apporter. Il existe d un côté celle d un éditeur généraliste avec un produit intégré par ses soins, qui fournit toutes les fonctions dans un environnement qu il contrôle seul (VmWare). De l autre, les produits Citrix ou Microsoft qui pensent que si chacun apporte une partie de la solution, le résultat sera plus puissant et mieux adapté qu une solution clé en main et que le client ne se trouvera pas confronté qu à un seul fournisseur. Une infrastructure virtualisée peut très bien être constituée d hyperviseurs multiples car des applicatifs installés sur des hyperviseurs d architecture et de conceptions différentes peuvent avoir des comportements différents en terme de performance. 1.2 La virtualisation du Stockage La virtualisation des infrastructures de stockage est une autre approche. Elle est la réponse à des problématiques d évolution et d intégration sur des architectures matérielles de constructeurs différents. Mémoire 3 INPG / CUEFA

Evolution de l administration de l infrastructure de stockage La virtualisation du Stockage La seule virtualisation qui est souvent pratiquée se situe en interne de la baie elle-même. Elle se traduit par la gestion des disques avec le RAID, permettant la panne potentielle d un ou plusieurs disques ou bien encore à la gestion du Thin Provisionning sur lequel nous reviendrons en détail dans le troisième axe d étude. 1.2.1 Pourquoi virtualiser l infrastructure de stockage? La virtualisation d une infrastructure de stockage dans un Data-Centre répond à une problématique majeure : la gestion de baies de stockage dans un environnement hétérogène à «moindre coût 4» (et où le TCO 5 reste sur le point de vue économique plus avantageux), masquant du fait la complexité du SAN. Le principe, comme le montre la figure 1.1, est de connecter les serveurs de production à un élément spécialisé (appliance + logiciel), lui-même connecté au travers du réseau SAN aux différents éléments de stockage. L avantage devenant la simplification des différentes interfaces d administration des baies se faisant uniquement par le biais d un seul outil géré par l appliance. Figure 1.1 Schéma de virtualisation de l infrastructure de stockage. Pour ne donner qu un exemple, le fait de ne pas virtualiser par ce principe une infrastructure de stockage non hétérogène requière la gestion d un outil de fail over 6 le plus souvent soumis à licences sur chacun des serveurs connectés aux stockage. Le cas concret d une telle application est : soit la volonté politique de la DSI d une entreprise de gérer un parc de stockage hétérogène tout en ayant une administration simplifiée (la virtualisation est utilisée de façon permanente en production), dans le cadre d une équipe de gestion réduite. 4. nous parlons ici de coûts humains, car comme nous le verrons dans la suite de cette partie les outils de virtualisation d infrastructure sont souvent très onéreux. 5. TCO pour Total Cost of Ownership 6. Outil de gestion d équilibrage des chemins. Mémoire 4 INPG / CUEFA

Evolution de l administration de l infrastructure de stockage La virtualisation du Stockage soit la fusion ou le rapprochement de deux ou plusieurs entités ayant des infrastructures de stockage différentes, qui demandent, pour une simplification d utilisation, un outil de virtualisation d infrastructure. Dans ce cas, la mise en place de ces outils et souvent temporaire, et une homogénéisation est faite ultérieurement, soit à la fin de la période de transition, soit lorsque le matériel est amorti. Financièrement parlant, la gestion virtualisée dans son ensemble de ressources de stockage dans le Data-Centre peut rapidement, suivant les technologies utilisées, doubler la facture (prix du stockage multiplié par 2). L investissement dans ce type d administration est donc à étudier avec attention! Avantages : - Centralisation de la gestion des données en un même point, - Simplification de la gestion, - Virtualisation des données, - Solutions gérant l hétérogénéité ; Inconvénient : - Côut financier. 1.2.2 Comment répondre à une demande de virtualisation globale du stockage? Les principaux outils du marché à la disposition des DSI se divisent en trois grandes catégories. Ceux-ci ne s adressent pas aux même profils d utilisation (en terme de volumétrie de données et de performance), ils sont de technologies et de constructeurs différents. Virtualisation embarquée dans les baies La virtualisation embarquée dans la baie est la plus simple et l une des moins coûteuses financièrement, puisqu elle se résume à l achat d une licence additionnelle à la baie «maître». Le principe de cette virtualisation est de se baser uniquement sur une application logicielle dont le but est de router les I/Os destinés aux stockages connectés en cascade sur la baie principale. Deux acteurs majeurs implémentent cette gestion de virtualisation embarquée : Hitachi avec la gamme TagmaStore, NetApp avec la gamme V-Series. Comme il peut être constaté sur la figure 1.2, le flux d I/O à destination de la baie EMC passe intégralement par les Storages Processor de la baie maître. Cela peut engendrer des goulots d étranglement en cas de volumétrie de trafic importante. Avantages : - Côut financier (licence fix), - Simplification pour les gestionnaires, Inconvénient : - Limitation par la bande passande des SP de la baie maître. Virtualisation In Band La virtualisation In Band se caractérise par la mise en place d une appliance au niveau du SAN. On peut définir le rôle de cette appliance (clusteurs en noeuds) par le rôle de «Suppra Zoning» avec d un côté les serveurs gérant l applicatif et de l autre, le stockage comme le montre la figure 1.3. L énorme intérêt d une telle infrastructure est de conserver le SAN actuel. En effet, l appliance utilise l infrastructure du réseau de stockage pour virtualiser le stockage. Néanmoins, du point de vue physique, le goulot d étranglement se situe toujours au niveau de l appliance bien que géré en mode cluster, donc parallélisant les flux. Ce type de solution est faite en général pour atteindre la gestion d environ cinq à six cents serveurs et correspond aux besoins d entreprise comme STmicroélectronique. Acteur majeur des solutions basées sur ce principe : Mémoire 5 INPG / CUEFA

Evolution de l administration de l infrastructure de stockage La virtualisation du Stockage Figure 1.2 Schéma de virtualisation logicielle dans une baie maître. SVC de IBM. Avantages : - S intègre sur un SAN existant, - Répond au besoin d entreprise de moyenne et grande taille ; Inconvénients : - Goulot d étranglement reste au niveau de l applience, - Performances. Virtualisation Out of Band La virtualisation Out of Band est une virtualisation beaucoup plus complexe à mettre en œuvre que les virtualisations vues précédemment. Elle demande une restructuration complète du SAN. En effet, l infrastructure de commutation se base sur des commutateurs «intelligents» de type directeur, permettant grâce à une appliance la gestion de méta-données permetant le routage des I/O directement par le commutateur sans être limité en terme de bande passante par un élément connexe (type appliance. Cela a pour avantage une bande passante fabuleuse du fait de la non limitation du nombre de ports et de directeurs (cascade des commutateurs). En terme financier, ce type d infrastructure est très onéreux à mettre en œuvre, car il faut prendre en considération le renouvellement de l infrastructure réseau, l appliance et la licence qui est proportionnelle à la volumétrie des infrastructures de stockage à gérer. Sur le marché il y a très peu de fournisseurs pour ce type de solution. On peut néanmoins citer le produit Invista de la firme EMC. Ces solutions, d une certaine complexité à mettre en oeuvre, demandent des compétences spécifiques qu il est très difficile, voire impossible, à trouver en Europe. Les seuls à pouvoir nous aider sur ce type de projet, note Didier BAUCHARD Senior Storage Consultant chez Bull, se trouvent en principe chez l éditeur de ces solutions au Etats-Unis. Les entreprises pour lesquelles sont destinés ces produits sont AirBus, la City Bank (US) ou la Général Bank (US). La figure 1.4 illustre de façon graphique l architecture à mettre en oeuvre. Mémoire 6 INPG / CUEFA

Evolution de l administration de l infrastructure de stockage La virtualisation du Stockage Figure 1.3 Schéma de virtualisation In Band. Avantages : - Pas de limite de bande passante, - Répond à des architectures complexes et très grandes ; Inconvénients : - Prix, - Limite en terme de souplesse d utilisation, - Flot de données redirigées. Synthèse sur la virtualisation de l infrastructure du SAN Comme cela a été démontré, la virtualisation des infrastructures est une opportunité pour les environnements où le stockage est très hétérogène (SAN et NAS), et permet la simplification de son administration. Différentes approches sont possibles suivant le besoin (principalement en terme de performance), mais des limites financières peuvent rebuter les DSI à passer ce cap. 1.2.3 Evolution vers des baies de stockage multi-protocoles La tendance qui semble se profiler se situe principalement dans la capacité des éléments de stockage à répondre à une certaine problématique du «tout en un». Le stockage serait à la fois capable de se positionner sur une infrastructure SAN et en même temps sur une infrastructure LAN (NAS). Deux acteurs sont leaders dans ces fonctionnalités, il s agit de NetApp et de EMC comme le montre le tableau 1.2. Suite à une étude faite par l IDC [7] notant que les entreprises ont tendance à délaisser les réseaux de stockage SAN pour préférer les baies iscsi et NAS, il est très probable que tous les constructeurs dans leurs nouvelles générations de produits intègrent cette caractéristique permettant leur présence simultanée sur les deux marchés. Mémoire 7 INPG / CUEFA

Evolution de l administration de l infrastructureimpact de stockage et positionnement des solutions de virtualisation Figure 1.4 Schéma de virtualisation Out Of Band. Fonctions EMC HP NetApp Hitachi IBM Protocoles de communication (NAS, iscsi et FC) X X Table 1.2 Tableau des constructeurs embarquant les protocoles NAS et SAN dans une même solution de stockage. 1.3 Impact et positionnement des solutions de virtualisation Limites des solutions de virtualisation de l infrastructure du Data-Centre La limite d utilisation de ces architectures est tout d abord une restriction aux l outils de management des environnements virtualisés. Le fait de proposer des fonctionnalités avancées, avec les outils de management de l ensemble de l infrastructure permet un gain d efficacité, que ce soit un gain de temps pour l administrateur ou un gain de consolidation pour la DSI. Mais il est sous-entendu que les fonctionnalités présentes dans ces nouveaux outils d administration peuvent parfois ne pas être au même niveau 7 que sur l interface d administration de la baie elle-même. Limites des solutions de virtualisation du SAN Globalement, ce type de management se limite aux environnements non virtualisés ou semi-virtualisés. La virtualisation de l infrastructure se contraignant au SAN, la proposition de fonctionnalités avancées se limite de même à ce que propose l appliance, donc l ensemble des fonctionnalités de la baie peuvent ne pas être suportées. De plus, suivant l architecture recherchée, on doit faire une concession soit sur le prix de l équipement soit sur ses performances. Positionnement global Les deux solutions de virtualisation ont pour but la simplification de l administration ainsi que la réduction des coûts. Elles ne s utilisent pas dans les mêmes conditions, mais poursuivent le même but comme le détaille la figure 1.5 7. En terme de performance et de détails des fonctionnalités présentes. Mémoire 8 INPG / CUEFA

Evolution de l administration de l infrastructureimpact de stockage et positionnement des solutions de virtualisation images/positionnementvirtualisation.jpg Figure 1.5 Schéma de synthèse. Au cours de cette deuxième partie, il a été démontré que les solutions de virtualisation d infrastructure sont un véritable gain dans la gestion et l administration du Data-Centre, avec un léger bémol sur la virtualisation unique du stockage rendant certes des services à l administrateur mais, pour un coût généralement élevé. Nous allons maintenant nous intéresser à une partie qui devrait être source d économie dans l entreprise grâce aux nombreuses améliorations technologiques faites depuis peu : l intégration de technologies Green dans le Data-Centre et principalement dans le stockage. Mémoire 9 INPG / CUEFA

Evolution de l administration de l infrastructureimpact de stockage et positionnement des solutions de virtualisation Mémoire 10 INPG / CUEFA

Chapitre 2 Le "Green storage" dans le Data-Centre Une traduction large du Green IT, se traduit par informatique «verte» ou «écologique», peut consister en un produit, une solution, un service ou une pratique pouvant améliorer l efficacité énergétique, diminuer l impact sur l environnement, et contribuer au développement durable. Le Data-Centre de demain dans son infrastructure sera indéniablement green! Les évolutions technologiques permettent aujourd hui, malgré des coûts encore élevés (bien que les ROI deviennent intéressants) d architecturer des infrastructures informatiques optimisant le besoin de ressources électriques. Pour le Gartner 1, l informatique durable se résume aux centres informatiques et à une simple équation : alimenter plus de machines avec la même empreinte carbone, ou délivrer plus de transactions avec le même centre informatique. Il s agit également de devancer l évolution de la loi qui sera de plus en plus contraignante en matière d environnement. 2.1 Le Green IT 2.1.1 Nouvelles problématiques du Data-Centre Les Data-Centres sont saturés, cependant il leur est demandé de fournir toujours plus de puissance pour répondre aux demandes des utilisateurs ainsi que des applicatifs. La quantité d énergie mise en œuvre pour faire fonctionner les centres de calcul est devenue au fil des années une charge non négligeable dans le budget des DSI. Certains très importants Data-Centres sont dans l impossibilité de s agrandir du fait que leur fournisseur d énergie n ait plus la possibilité de fournir la puissance demandée. Tout comme il est devenu très difficile de fournir des solutions capables de répondre au besoin de dissipation thermique. L énergie électrique en France est encore bon marché mais tendrait, avec toutes les difficultés que nous traversons, à être certainement être revue à la hausse dans les mois ou les années à venir. Pour mettre l accent sur ce premier point, la «crise» ajoute une dimension financière et un besoin implacable de réduire les dépenses quand cela est possible, l optimisation des besoins associée aux coûts étant devenue LA priorité de beaucoup de DSI. Problématiques : - Manque de puissance de l alimentation électrique distribuée, - Problématique de dissipation thermique, - Réduction des coûts, - Solutions gérant l hétérogénéité. La forte augmentation ces dernières années de la densité énergétique dans le Data-Centre est illustrée par la figure 2.3. 1. Le Gartner est fondé en 1979, et est une entreprise américaine de conseil et de recherche dans le domaine de la technologie. 11

Le "Green storage" dans le Data-Centre Le Green IT Figure 2.1 Evolution énergétique moyenne par rack, source [?]. Ainsi, de 1000 watts au m 2 en 2000, puis 6 à 8000 en 2006, les prévisions dépasseraient les 25 000 watts au m 2 en 2010 : cette évolution et accélération du besoin en électricité est autant liée au déploiement des serveurs «lames» (blade) associant puissance et compacité qu à celui des systèmes de stockage beaucoup plus performants et capacitifs. Pour illustrer cette estimation, une étude faite par le groupement des utilisateurs de Data-Centre (Data- Center User Group - DCUG) en 2006 et conduite par la société Emerson 2, affirme que 96% des Data- Centres auront atteint leur consommation énergétique possible maximum d ici 2011. On estime en général à 1 watt le besoin en climatisation et refroidissement pour faire fonctionner 1 watt en équivalent d équipement informatique. Ainsi, 50% de l électricité du Data-Centre est utilisée au refroidissement et à la ventilation des systèmes d information. Pour ne donner qu un chiffre, IDC estime à 200 000 euros la facture mensuelle d électricité d un Data- Centre de 2000 m 2 et ajoute que d ici 2015, les coûts opérationnels et énergétiques seront supérieurs aux coûts d acquisitions. Nous pouvons donc en conclure que la gestion de l énergie est le point central du problème, et que la résolution de celui-ci devrait atténuer ou réduire fortement la globalité des problématiques qui en découle. Cela doit passer par des acteurs forts avec de réelles ambitions. 2.1.2 Les acteurs du Green Les accords mondiaux environnementaux semblent extrêmement complexes à réaliser. En Europe et en France, les institutions ont commencé depuis peu à encourager les initiatives vertes dans les T.I.C. 3. Parallèlement, elles poussent les autres secteurs à se servir des nouvelles technologies pour réduire leurs impacts et améliorer leur efficacité. Il est constaté une forte tendance vers une normalisation et une réglementation des T.I.C., notamment au niveau de l Europe ou en plus de normalisations, sont mis en place des Labels certifiants la mise en œuvre et l application de normes et codes de bonne conduite. Les labels et organismes Les labels et organismes incitant à la réduction de consommation d énergie ne sont pas une chose nouvelle, puisque déjà en 1992, Energy Start 4 avait pour objectif de mesurer l efficacité énergétique du 2. http://www.liebert.com (Emerson Network Power) 3. Les T.I.C sont les technologies de l information et de la communication. 4. http://www.energystart.com Mémoire 12 INPG / CUEFA

Le "Green storage" dans le Data-Centre Le Green IT matériel informatique aux Etats Unis. La majorité des pays européens rattrapent leur retard sur la mise en place de labels favorisant dans un premier temps des règles de bonnes conduite ainsi que des chartes à respecter. Ces Labels n ont pas tous la même finalité, mais tendent à réduire l impact des T.I.C. sur l environnement. C est le cas pour «80 plus», qui est destiné à l amélioration énergétique des alimentations électriques des systèmes informatiques donnant un rapport de plus de 80% d énergie restituée. L organisme «The green grid» propose une métrique donnant un ratio 5 permettant de comparer facilement l efficience de la consommation énergétique. Cette métrique seraient en passe de devenir une référence. Bien évidement, d autres programmes environnementaux sont en développement actuellement tel que : «Choix environnemental» et «Ecologo» (Canada), «Green Gard» (USA, orienté CO2), «PC Green Label» (Japon), «CECP» (Chine), La normalisation L ISO14001 est la normalisation la plus connue et la plus veille proposé par l ISO en terme d environnement et de système de management environnemental. Son objectif est de réduire au maximum l impact des activités de l entreprise sur l environnement. Cela ne signifie pas que l entreprise ne pollue pas, mais qu elle met en œuvre des moyens pour respecter la réglementation existante en faisant preuve d amélioration continue. Depuis quelques années des directives européennes on également vu le jour, tel que la RoHS, qui contraint à la restriction de l utilisation de certaines substances dangereuses dans les équipements électriques et électroniques. Plus globalement, en France, une loi sur les Nouvelles Régulations Economiques (N.R.E.) oblige depuis 2002, les sociétés françaises cotées en bourse, à préciser dans leur rapport annuel la manière dont elles prennent en compte les conséquences sociales et environnementales de leurs activités 6. Pour conclure sur les différentes avancées en notion de prise de conscience dans le domaine, on peut souligner le programme européen «Code of Conduct», qui conduit un code de bonne conduite des Data- Centres. Lancé en octobre 2008 par la commission européenne, il devra permettre d atteindre l objectif de réduction des émissions de CO2 de 20% d ici 2020. Basé sur l initiative volontaire, le C.O.D. a pour objectif de sensibiliser les opérateurs et propriétaires à l impact environnemental de leur centre de données, mais aussi toutes les autres parties prenantes comme les constructeurs, les sociétés de conseils, les fournisseurs d énergies, pour les inviter à développer, améliorer et intégrer les meilleures pratiques possibles. Les objectifs poursuivis par ce programme sont nombreux et parmi les plus attendus, on retrouve : le développement et la promotion de métrique pour évaluer et mesurer l efficacité énergétique, la mise à disposition d un guide clair et pédagogique sur les meilleures pratiques, un forum ouvert de discussion en Europe de toute les parties prenantes, une coordination des pratiques, avec celles des autres initiatives internationales, accroître la prise de conscience des dirigeants, fournisseurs, et investisseurs de l impact positif de bonne pratiques sur le Data-centre, sur la dépense énergétique et surtout sur l environnement, pour un développement durable. 2.1.3 Rappel sur les contraintes légales La conservation de certains documents et l archivage électronique légal depuis les nouvelles lois sur la dématérialisation des documents, que se soit dans les entités publiques ou privées, contribue à l accroissement exponentiel des données à gérer. De ce fait, tend à accentuer les problématiques citées dans le paragraphe 2.1.1. Il est de constater une tendance dans les appels d offre que les collectivités ou les entreprises rédigent, de retrouver une close relative à l obligation de répondre à des critère environnementaux, que ce soient des critères d utilisation (consommation énergétique) ou/et des critères de fabrication (relatifs à la loi 5. Le DCPE pour Data Center Performance Efficiency est une mesure innovante permettant de connaître l efficacité des systèmes. 6. http://www.ecologie.gouv.fr/article.php3?id_article=4030 Mémoire 13 INPG / CUEFA

Le "Green storage" dans le Data-Centre Le Green IT RoSH). Cela est une réalité, une évolution, une prise de conscience, et l attente d un besoin dans ce domaine. 2.1.4 Les besoins et les attentes dans ce domaine Gestion des pollution Les Data-Centres sont responsables par leur consommation énergétique et leur dispositif de refroidissement, d importantes émissions de CO2, mais aussi du traitement des déchets électroniques pouvant être toxiques. Deux instituts américains (McKinsey et Uptime Institute), dans un rapport commun ont publié 7 en 2008 une estimation des émissions de CO2. Les Data-Centre avec une émission estimée à 170 millions de tonnes, se placent devant des états comme l Argentine (142Mt), les Pays-Bas (146Mt), où encore la Malaisie (178Mt). Et affirme que ceux-ci consomment environ 0,5% de l électricité mondiale ; ce qui représente pour une unité la consommation de 25 000 foyers. Du fait du vieillissement des centres de calcul et des réglementations environnementales, les constructeurs sont obligés en amont d améliorer leur produits, dès la fabrication. En estimant la durée de vie d un Data-Centre entre 12 et 15 ans, il faudra identifier, traiter et recycler ses déchets, conformément aux lois. Heureusement, les directives européennes telles que RoHS (Cf. 2.1.2) permettent aujourd hui de limiter l utilisation des substances toxiques dans les équipements. La société Farnell 8 a publié un guide législatif et technique 9 introduisant les enjeux de la directive et son application. La figure 2.2 détaille la toxicité de certains composants utilisés couramment dans l électronique du Data-Centre. Figure 2.2 Composant toxique, source [11]. Par contre, les analyses de cycle de vie des produits sont problématiques. En effet, il est impossible d obtenir des documents proposant une analyse de cycle de vie d un système d information pour ce qui me concerne dans le stockage (même pour un disque dur!). Les constructeurs sont souvent des intégrateurs de composants qui font appel à des sous-traitants. Cependant, ceux-ci commencent à être sensibilisés à l impact environnemental de la fabrication des composants. Mais rien ne les oblige à fournir des analyses de cycle de vie et/ou les mesures et engagements environnementaux pris pour le fonctionnement de leur usine pour constituer un bilan écologique global d un système. 7. rapport disponible à l url : http://uptimeinstitute.org/content/view/168/57 8. Farnell est leader mondial dans la fabrication de produits électroniques 9. http://fr.farnell.com/images/fr_fr/rohs_manual_fr.pdf Mémoire 14 INPG / CUEFA

Le "Green storage" dans le Data-Centre Le Green Storage L analyse de cycle de vie se voit donc réduite à la partie «recyclage et déchet», pour laquelle en dehors de l application stricte des directives RoSH et autres, les constructeurs montrent peu d initiatives environementales. Les bénéfices du Green Les bénéfices attendus de la mise en œuvre de la technologie Green se décomposent en trois domaines, appelés aussi la règle des trois «P» : Profitability : Créer la prospérité économique, la fondation, People : Apporter un l équilibre social, les individus sont les acteurs clés du succès, Planet : Assurer une qualité environnementale, réduire le gaspillage, la pollution ;. Le tableau 2.1 permet sur des problématiques contenues dans la règle des trois «P» de dégager des solutions de principe qu il faut adopter pour dégager un retour positif des technologies Green. Financier Opérationnel Environnemental Les bénéfices du Green IT Cause Hausse globale des prix de l énergie Diminution du budget IT Contraintes sur croissance de l IT Haute densité de serveurs Explosion des coûts de power & cooling Vieillissement des Data- Centres Responsabilité sociale et sociétale d entreprise Manque d image publique Améliorer le moral des employés Solution Economies par utilisation plus efficace de l énergie Capacité à maîtriser et prévoir l évolution des coût énergétiques Relâcher les pressions budgétaires pour permettre la croissance Plus d efficacité = plus de puissance de traitement par KWatt et par m2 Remplacer ratio énergie pour refroidir per énergie pour traiter Gagner en disponibilité, flexibilité et la durée de vie des équipements Attitude citoyenne responsable et amélioration de l image publique Contribution«Verte» positive à la protection de l environnement Réduction de l empreinte carbone Table 2.1 Tableau de synthèse des bénéfices attendus par le Green IT. 2.2 Le Green Storage Le Green Storage ne compte que pour partie du Data-Centre, mais de réels progrès sont envisageables. 2.2.1 Les enjeux du stockage dans le Data-Centre de demain Les enjeux pour le stockage en termes de gain de tous bords sont nombreux. Comme nous l avons vu précédemment, la principale source d économie portera sur la consommation énergétique des équipements. Cette amélioration permettra, tout d abord une dissipation thermique moindre (effet joule), donc engendrera une longévité des équipements, mais permettra aussi une gestion optimisée des données (le type de support devenant adapté à la valeur de l information). La technologie permet dès aujourd hui de donner un début de progrès et de réponse. Mémoire 15 INPG / CUEFA

Le "Green storage" dans le Data-Centre Le Green Storage Enjeux : - Dissipation thermique moindre, - Vieillissement optimisé du matériel, - Gestion optimisé des données. 2.2.2 Des technologies novatrices Technologie de disque SSD Les disques SSD 10 sont une véritable révolution dans la gestion du stockage. Ils portent les performances de l espace de stockage primaire à un niveau inégalé et pourraient remplacer progressivement les disques Fiber Channel bien moins coûteux mais aux consommations énergétiques très fortes. Les principales caractéristiques de ce type de disque sont les suivantes : des performances de traitement d entrée/sortie supérieures de 10 à 30 fois les disques FC, des temps de réponse inférieurs de près de 10 fois un disque FC, une très faible consommation énergétique dûe à l absence de pièces mécaniques ; Comparés aux autres type de disques qu il est possible de retrouver dans les éléments de stockage (S-ATA, SAS, FC), on constate que pour une volumétrie donnée et une capacité de traitement transactionnel, la technologie SSD se positionne bien au dessus des technologies FC. La figure 2.3 du constructeur EMC met en avant ces arguments et positionne les disques «Flash Drives» 73GB (SSD) à gauche, pour une volumétrie d un Téraoctet de données, comme ayant le meilleur ratio «Consommation énergétique / Capacité de traitement transactionnel», comparé aux autres technologies de disques durs (on visualise sur le schéma, les capacités des disques durs Fibre Channel : 73, 146, 300Go et disques S-ATA : 500Go et 1To). Figure 2.3 Comparatif des technologies de disque en fonction de leur consommation et de leur capacité de traitement transactionnel (source EMC). Avantages : - Gain énergétique, - Performances accrues ; Inconvénients : - Prix. 10. aussi appelés disque «Flash Drives» Mémoire 16 INPG / CUEFA

Le "Green storage" dans le Data-Centre Le Green Storage Thin provisionning Dans une architecture serveur - stockage classique, les serveurs ont un espace de stockage alloué et basé sur l anticipation des besoins applicatifs. En cas de saturation de l espace de stockage par les données venant de l application, celle-ci ne pourra continuer de fonctionner et entraînera une défaillance applicative. C est dans cette optique que le Thin provisionning est une véritable révolution, car il permet d allouer une capacité de stockage supérieure à la capacité physiquement installée dans la baie. Cela peux être considéré comme une sorte de virtualisation, mais surtout comme une adaptation en temps réel des besoins de stockage. Le résultat est la diminution notable de la sous-utilisation typique générée par la plupart des applications ou des espaces alloués aux utilisateurs. Cette fonctionnalité permet de fournir du stockage à la demande en réduisant la quantité de disques nécessaires à l activité. Cette fonctionnalité est illustrée figure2.4. Figure 2.4 Schéma de principe de Thin Provisioning, source EMC. Avantage : - Réduction de la quantité de disques en fonctionnement, - Gain énergétique. Déduplication des données Cette fonctionnalité est utilisable en mode fichier ou bloc. Son principe est d éliminer dans un volume, tous les fichiers redondants pour n en conserver qu un seul avec les pointeurs associés. En opposition à la compression des données qui s opère au niveau du bit, la déduplication peut agir au niveau du fichier et aussi au niveau du bloc de données. Elle peut réduire le besoin de stockage d une volumétrie de données d environ 15 :1 Néanmoins, en mode fichier, elle peut être moins efficace. En effet, dès lors que deux fichiers sont identiques à 99,99%, deux copies seront tout de même conservées. Les ratios de déduplication seront alors seulement de 3 ou 4 :1. Cette fonctionnalité est illustré à la figure 2.5. Avantage : - Gain d espace disque, - Optimisation des sauvegardes associées. Autres technologies D autres technologies sont également extrêmement efficaces pour réduire la consommation énergétique. Tel le Spin Down, permettant sur un laps de temps, ou un disque n est pas sollicité, l arrêt complet de Mémoire 17 INPG / CUEFA

Le "Green storage" dans le Data-Centre Stratégies du Green Figure 2.5 Schéma de principe de la déduplication, source EMC. ses plateaux. Les disques basse consommation utilisés dans des applicatifs dont le besoin de performances n est pas utile. Mais également les disques à vitesse variable. 2.3 Stratégies du Green Comme cela a été présenté, la technique et la mise en place de bonnes pratiques permet de faire dès à présent des gains d énergies, sans que cela devienne un frein pour l utilisation des différents éléments. Nous sommes encore au début et les techniques devraient évoluées pour tendre peu être un jour vers un besoin faible d énergie. 2.3.1 Axes de développement Sur la «mécanique», des évolutions peuvent rapidement voir le jour. Une suppression total des systèmes de ventilation avec un remplacement par refroidissement liquide permettrait un gain énergétique non négligeable. De plus, l énergie calorifique pourrait être utilisées à des fins de chauffages (intra-entreprise, voire être revendu pour du chauffage collectif). Mais cela pose encore des contraintes (notamment de sécurité) et demande une réorganisation complète de l infrastructure physique des Data- Centres (électricité sur le haut, et eau sur le bas de l infrastructure). Des prises de conscience sont également à prendre en compte dans le domaine de l applicatif. Celui-ci n est pas la première source d économie d énergie à laquelle on pense, et pourtant c est un domaine ou beaucoup d efforts restent à faire. En effet, si l on compare la programmation en C et la programmation JAVA, on s aperçoit que pour un même résultat applicatif, le besoin d énergie globale a besoin d être multiplié par six pour des programmes en Java! Les solutions pour optimiser et avoir une consommation faible de l infrastructure, passeront par l optimisation des consommation électrique en fonction de l utilisation et du besoin de celui-ci. L outil permettant cela sera «la mesure». Outre l intégration des nouvelles technologies ainsi que le respect des normes actuelles ; aujourd hui dans les Data-Centres, la tendance constatée est plutôt une évolution vers des solutions «coup de point», ou de la consolidation. Pour pouvoir réellement gérer au mieux ces problématiques de consommation énergétique, les technologies de «Cloud» ainsi que la virtualisation, associées à des tableaux de bord complets, permettraient une mesure en temps réel de : la consommation énergétique, la puissance de calcul disponible, Mémoire 18 INPG / CUEFA

Le "Green storage" dans le Data-Centre Stratégies du Green la puissance de calcul utilisé, le taux d I/O, le besoin de stockage ; Le but, à terme étant de se rapprocher d un système asservit, s adaptant donc instantanément aux besoins sollicités. 2.3.2 Entre marketing et bonne conscience : le Green En lisant ce chapitre, vous aurez bien compris que le Green IT répond essentiellement à une attente économique. Greenpeace a récemment réalisé un joli coup médiatique en démontrant, preuves à l appui, que les produits TIC, prétendument démantelés, se retrouvaient en réalité déposés dans des décharges sauvages... au Nigéria! Il faut en effet comprendre que le Green IT est avant tout une préoccupation sectorielle, dont l un des buts principaux est de rassurer le consommateur, et non de l impliquer ou de lui faire changer ses habitudes, ce qui risquerait de porter atteinte à la santé resplendissante des marchés TIC et l image positive des produits. La seule chose qui lui est demandé est de trier ses déchets. Mais cette demande est tellement timide que le pictogramme sensé la matérialiser (une poubelle barrée) se retrouve souvent niché au sein de dizaines d autres, voire dans des endroits inaccessibles (derrière les batteries)! Le citoyen se retrouve alors confronté à des exigences totalement contradictoires voire impraticables de la part des différentes institutions, chacune dans leur secteur. La consommation «verte» devient un véritable champ de bataille puisqu il s agit de protéger la planète tout en ne dérangeant pas les lobbies, les différents services de l Etat, voire même les priorités des ONG... Comment se faire entendre!? Ceci nous permet de rappeler que le développement durable est en réalité un enjeu bien plus large que la «consommation verte» qui se présente comme sa solution. Le développement durable, ce n est pas de faire la même chose en plus vert mais de faire autre chose : voilà ce qui semble assez difficile à comprendre. Autrement dit, optimiser les processus existants, tendre au zéro gaspillage etc. ne suffira pas et ira voire même à l encontre de la productivité car cela conduira à éviter de poser les bonnes questions : celle de l obsolescence accélérée engendrée par la pression publicitaire, des inégalités sociales qui conditionnent l accès à tel ou tel service, notamment «verts». Le développement durable c est bien plus que cela : c est de répondre à l interrogation légitime quant à l avenir, en particulier de la part des plus vulnérables. Le processus en cours, de nature gestionnaire, doit donc prendre un tour plus politique. Ce dont nous avons besoin, ce sont des idées et des objectifs concrets, d imaginer un nouveau modèle de société et d économie, plutôt que... de faire semblant de trier des déchets... Mémoire 19 INPG / CUEFA

Le "Green storage" dans le Data-Centre Stratégies du Green Mémoire 20 INPG / CUEFA

Conclusion Comme on a pu le constater dans l ensemble de ce document, le Data-Centre est en pleine évolution, notamment dans le domaine du stockage. Que se soit pour de la puissance de calcul ou bien du stockage, la gestion du centre de données semble se diriger vers un service ou : de «l informatique à la demande». Tout porte à croire que l administration du stockage va être complètement centralisée. Cela est dû en partie aux nouvelles solutions de virtualisation qui tentent une approche de management global du Data-Centre avec ses propres outils, tendant aux même fonctionnalitées que les outils dédiés. Quant à l évolution de l infrastructure, la vision qu apporte les nouvelles approches Cloud va complètement révolutionner le management de l informatique interne et repenser, ou tout du moins faire évoluer le rôle des DSI. La notion de service prend là tout son sens. Des solutions commencent à être disponibles chez certains fournisseurs. Mais il est fort probable que dans les mois qui viennent, ces offres mettent en concurrence les différents acteurs. L évolution de l infrastructure passe également par une gestion maîtrisée de l énergie absorbée par le Data-Centre. Le temps ou la facture énergétique «n était pas un souci» est révolu. C est aujourd hui un point où beaucoup d économies peuvent être faites en utilisant des solutions simples à mettre en oeuvre. Ces trois axes d évolution sont indéniablement solidaires et dépendants les uns des autres. La consolidation et l adaptation des ressources à fournir en temps réel ne peut se faire sans une certaine virtualisation de l infrastructure, la réduction des coûts se faisant également par de la virtualisation. Mais également avec la mise en place de solutions moins consommatrices d énergie. L invention du microprocesseur et l avènement de nouveaux moyens de communication mobiles et à haut débit ont transformé profondément nos vie. Désormais les technologies de l information et de la communication se sont rendues indispensables à nos usages personnels et professionnels. Pour l entreprise, l adoption continue des progrès technologiques est capitales si elle veut rester compétitive et rentable, car les systèmes d information sont aujourd hui l épine dorsale et le talon d Achille de ses activités. L ère de l utilisation intempestive des TIC dans une société «hautement carbonée» doit laisser place à une ère où chaque usage des TIC est justifié et efficiente, s intégrant dans une nouvelle économie «faiblement carbonée», fortement orientée vers le développement durable. 21

Conclusion Mémoire 22 INPG / CUEFA

Table des figures 1 Data-Centre de la société Free, gérant une partie des mails et du stockage de ses abonnés. xiii 2 Schéma des différences entre SAN et NAS dans une architecture réseau (source Wikipedia). xiv 3 Principe général de la virtualisation............................... xv 1.1 Schéma de virtualisation de l infrastructure de stockage.................... 4 1.2 Schéma de virtualisation logicielle dans une baie maître.................... 6 1.3 Schéma de virtualisation In Band................................ 7 1.4 Schéma de virtualisation Out Of Band.............................. 8 1.5 Schéma de synthèse........................................ 9 2.1 Evolution énergétique moyenne par rack, source [?]...................... 12 2.2 Composant toxique, source [11]................................. 14 2.3 Comparatif des technologies de disque en fonction de leur consommation et de leur capacité de traitement transactionnel (source EMC)........................... 16 2.4 Schéma de principe de Thin Provisioning, source EMC.................... 17 2.5 Schéma de principe de la déduplication, source EMC..................... 18 23

TABLE DES FIGURES TABLE DES FIGURES Mémoire 24 INPG / CUEFA

Liste des tableaux 1.1 Tableau de syntèse des outils d administration des infrastructures virtualisées........ 3 1.2 Tableau des constructeurs embarquant les protocoles NAS et SAN dans une même solution de stockage............................................. 8 2.1 Tableau de synthèse des bénéfices attendus par le Green IT.................. 15 2.2 Tableau des abréviations..................................... 29 25

LISTE DES TABLEAUX LISTE DES TABLEAUX Mémoire 26 INPG / CUEFA

Glossaire Glossaire Baie de stockage : élément doté d une intelligence permettant la sécurité et l intégrité des données. 10 Cloud externe : infrastructure de Cloud Computing dont le propriétaire et le gestionnaire est un prestataire de services informatiques externes. Par exemple, un hébergeur ou un fournisseur de logiciels sous forme de services (SAAS). On lui attribue souvent le nom d infrastructure de type cloud public. 4, 6, 7 Cloud interne : infrastructure de Cloud Computing mise en place au sein de l environnement informatique interne et qui apporte les avantages du Cloud Computing aux équipes informatiques internes. Il s agit de ce que Gartner appelle un cloud privé.. 4, 6 Cloud prive virtuel : environnement de Cloud Computing qui englobe une infrastructure de Cloud Computing interne et externe afin de présenter à l entreprise un cloud transparent et géré. 4 Grid Computing : infrastructure virtuelle constituée d un ensemble de ressources informatiques potentiellement partagées, distribuées, hétérogènes, dé-localisées et autonomes. Une grille est en effet une infrastructure, c est-à-dire des équipements techniques d ordres matériel et logiciel. Cette infrastructure est qualifiée de virtuelle car les relations entre les entités qui la composent n existent pas sur le plan matériel mais d un point de vue logique.. 4 MainFrame (Ordinateur central en français) est utilisé en informatique pour définir un ordinateur de grande puissance de traitement. 1 SOA : architecture orientée service de type logiciel, s appuyant sur un ensemble de services simples. L objectif étant de décomposer une fonctionnalité en un ensemble de fonctions basiques, appelées services, fournies par des composants et de décrire finement le schéma d interaction entre ces services. 4 Systeme d exploitation du Cloud Computing : spécialement conçu pour gérer de façon globale un large ensemble d infrastructures (processeurs, stockage, réseau) sous forme d environnement d exploitation transparent, souple et dynamique. À l instar du système d exploitation chargé de gérer la complexité d un poste de travail, l OS basé sur le Cloud Computing gère la complexité d un Data-Centre. Bien que d autres stratégies soient envisageables, VMware considère la virtualisation comme la technologie par excellence pour le Cloud Computing. 6 Utility Computing : propose de ne garder en interne que les postes clients, le reste étant outsourcé chez un prestataire. Cette technique permet de réduire le TCO et de gagner en efficacité.. 4 27

Glossary Glossary Mémoire 28 INPG / CUEFA

Abréviations Acronyme CPU DSI FC GCOS I/O IP IT ISO LAN LUN NAS NIC PME QOS RoHS ROI S-ATA SaaS SAN SAS SOA SNIA SP SSD TCP TIC VM Central Processing Unit (Unité centrale de traitement) Directeur des systèmes d information ou Direction des systèmes d information Fiber Channel General Comprehensive Operating System Input / Output (entrée - sortie) Internet Protocol Information technology International Organization for Standardization Local Area Network Logical Unit Number (identifiant d unité logique) Network Attached Storage Network Interface Card Petite et Moyenne Entreprise Quality of Service Restriction of the use of certain Hazardous Substances Return On Investment Serial Advanced Technology Attachment Software as a Service Storage Area Network Serial Attached SCSI Service Oriented Architecture Storage Networking Industry Association Storage Processor Solid State Disk Transmission Control Protocol Technologies de l Information et de la Communication Virtual Machine Table 2.2 Tableau des abréviations. 29

Abréviations Mémoire 30 INPG / CUEFA

Bibliographie [1]. L informatique vert : Cap sur l intelligence énergétique. Livre blanc, Bull S.A, 2008. [2] F. Laura. Green Storage : Enjeux et facteurs, clé de succès. Thèse de l Ecole des Hautes Etude Commerciales, mars 2009. [3] J.P. Soulès. Le cuivre résiste toujours à la fibre. 01 Informatique, (page 30 à 33) mars 2009. [4] R. Bonnet, Y. Serra. Vmware crée le mainframe logiciel. 01 Informatique, (page 10 à 12) mars 2009. [5] Data sheet. EMC Invista : Making virtual storage a realit for youy entreprise. EMC Comporation, 2008. [6] Quick Note. EMC Invista. Illuminata Inc, juin 2005. [7] A. Bertrand. Stockage : les entreprises privilégient le NAS et l iscsi. Article lu en mai 2009 sur le site Génération Nouveles Technologies. Lien http://www.generation-nt.com/ etude-stockage-entreprise-francaise-progression-nas-iscsi-actualite-235471.html. [8] V. Nicolet. Storage for servers virtualisation. Présentation interne Bull StoreWay, mai 2009. [9] A. Cohen. Bio Data Center, Diagnostique d efficacité énergétique. Bull SAS, avril 2009. [10] C. Belady. The green grid productivity indicator. Green Grid, 2008. [11] Data sheet. Guide de mise en conformité à la Directive RoHS. Farnell pic, 2005s. [12] B. Bergerot. Cloud Storage, SNIA et vidéo Active Circle. Article lu en juin 2009 sur le site SaaS & co. Lien http://www.saas-and-co.com/tag/cloud-storage. [13] Data sheet. vsphere : les nouveautés. Bull SAS, mars 2009. 31