RÉTENTION À LONG TERME DANS LE CLOUD AVEC EMC CLOUDBOOST Coût total de possession et Cloud RÉSUMÉ La bande a longtemps été le support de sauvegarde traditionnel pour la rétention à long terme. Avec l'essor du stockage Cloud comme niveau de stockage peu coûteux, un rapide changement de paradigme est en train de s'opérer. Ce livre blanc traite des avantages de la solution EMC CloudBoost et offre un comparatif du coût total de possession entre EMC ECS et des solutions de Cloud public. Août 2015 LIVRE BLANC EMC
Pour savoir comment les produits, services et solutions d EMC peuvent vous aider à relever vos défis IT et métiers, contactez un responsable de compte ou un revendeur agréé EMC, visitez notre site Web à l adresse france.emc.com, ou découvrez et comparez les produits sur l EMC Store Copyright 2015 EMC Corporation. Tous droits réservés. EMC estime que les informations figurant dans ce document sont exactes à la date de publication. Ces informations sont modifiables sans préavis. Les informations contenues dans ce document sont fournies «en l état». EMC Corporation ne fournit aucune déclaration ou garantie d aucune sorte concernant les informations contenues dans cette publication et rejette plus spécialement toute garantie implicite de qualité commerciale ou d adéquation à une utilisation particulière. L utilisation, la copie et la diffusion de tout logiciel EMC décrit dans cette publication nécessitent une licence logicielle en cours de validité. Pour obtenir la liste actualisée des noms de produits, consultez la rubrique des marques EMC via le lien Législation, sur france.emc.com. Référence H14500 2
SOMMAIRE RÉSUMÉ ANALYTIQUE... 4 Introduction... 4 POURQUOI CHOISIR CLOUDBOOST?... 4 Le pouvoir du choix... 4 IMPORTANCE DU TCO... 5 TCO EN ACTION... 6 CONCLUSION... 6 3
RÉSUMÉ ANALYTIQUE Les entreprises se trouvent devant un dilemme : la nécessité de conserver les données tout au long d'un cycle de vie potentiellement long entre en conflit avec le principe économique fondamental de l'informatique, à savoir d'en faire plus avec moins. Ce livre blanc traite des avantages de la solution EMC CloudBoost et offre un comparatif du coût total de possession entre EMC ECS et des solutions de Cloud public. Les entreprises ont longtemps exploité la sauvegarde sur bande dans le cadre de leur plan de continuité d'activité. Dans un souci d'économies, l'infrastructure de bande a perduré à la faveur du statu quo. «Suffisante» pour la sauvegarde, elle évitait d'adopter une autre stratégie qui aurait imposé : une restructuration de l'infrastructure de sauvegarde en place ; des dépenses importantes en vue de former les administrateurs IT aux nouveaux workflows de sauvegarde ; la justification d'une nouvelle facture auprès de la direction. L'avènement de la sauvegarde sur disque économique avec technologie de déduplication, et l'adoption de méthodes de réplication multisite, avec des objectifs de point de restauration (RPO) proches de zéro et des objectifs de temps de restauration (RTO) quasi instantanés, permettent d'envisager sérieusement le stockage sur disque des données présentant de longs cycles de vie. L'histoire se poursuit avec la montée en puissance du stockage en mode objet, et sa structure à plat qui facilite la gestion, optimise l'évolutivité et favorise la réplication entre plusieurs sites géographiquement distribués. Mais les solutions possibles se multiplient et chacune offre des atouts de taille. Au final, les entreprises se demandent où placer leurs données afin de répondre le plus efficacement possible aux besoins métiers d'aujourd'hui... Et ne parlons pas des obligations sectorielles et des réglementations à venir. Avec les sauvegardes traditionnelles sur bande, les entreprises n'ont pas à restructurer ni à modifier le mode opératoire établi. Les sauvegardes sur disque déjà en place répondent à l'objectif de haute disponibilité des données garantissant la continuité d'activité, mais leur volume/fréquence d'accès et leur modèle économique ne constituent pas forcément la meilleure solution pour la rétention à long terme. Le stockage en mode objet dans un Cloud public ou privé est une solution viable, mais il peut exister quelques appréhensions concernant les contraintes de bande passante, l'adaptation aux nouvelles exigences de TCO, et la capacité de stocker des sauvegardes primaires dans le Cloud sans profiter des avantages des copies locales. Avec la maturation rapide de ces deux technologies, les entreprises peuvent désormais envisager une nouvelle approche pour traiter les données nécessitant une longue période de rétention, à savoir un déploiement hybride qui valorise les sauvegardes sur disque existantes tout en profitant de la durabilité, de l'élasticité et du modèle économique du Cloud. INTRODUCTION Ce livre blanc vise à explorer les avantages que peut procurer le remplacement des sauvegardes sur bande pour la rétention à long terme par un modèle hybride de disponibilité sur site couplée à la flexibilité du clonage des données dans le Cloud au moyen de la solution EMC CloudBoost. Il envisage également les atouts de la solution CloudBoost pour la rétention à long terme avec le stockage en mode objet, et compare le TCO des services de sauvegarde entre des fournisseurs de Cloud public et EMC Elastic Cloud Storage (ECS). Pourquoi choisir CloudBoost? LE POUVOIR DU CHOIX Avec la solution CloudBoost, les entreprises peuvent utiliser les workflows NetWorker existants pour cloner les sauvegardes vers l'implémentation de Cloud public, privé ou hydride de leur choix à des fins de rétention à long terme. La solution CloudBoost joue le rôle d'un nœud de stockage NetWorker configuré comme une unité de type de fichier avancée (AFTD, Advanced File Type Device), qui autorise les opérations de clonage NetWorker vers la solution CloudBoost. Ensuite, les données sont dédupliquées, chiffrées et envoyées vers la zone de stockage objet. La solution CloudBoost est déployée sous la forme d'un modèle OVA (Open Virtual Applicance) au sein de vsphere. Les profils Cloud et la surveillance du système sont gérés à partir d'une interface Web pratique, EMC Cloud Portal, dans laquelle les administrateurs peuvent gérer plusieurs systèmes CloudBoost sur un même écran. La solution CloudBoost est compatible avec les services de plusieurs fournisseurs de Cloud public et privé ; elle comprend divers mécanismes garantissant la sécurité des données en cours de transfert et au repos, élimine les goulots d'étranglement freinant les performances et résout les problèmes d'intégrité des données et d'abstraction du Cloud. Abstraction du Cloud Une architecture fractionnée dissocie les métadonnées («control plane») des données («data plane») ; elle permet donc de réaliser des sauvegardes software-defined conformes aux exigences de continuité d'activité tout en choisissant parmi plusieurs cibles de Cloud public et privé. En outre, la solution CloudBoost est spécialement conçue pour offrir une indépendance totale au type de Cloud : il est ainsi possible d'évoluer avec le système de stockage en mode objet existant ou l'implémentation d'un futur fournisseur pris en charge. Cette caractéristique atténue le risque de dépendance à un fournisseur spécifique, en particulier sur un marché avec une croissance aussi rapide, où il peut être nécessaire de changer de fournisseur pour diverses raisons. 4
Hausse des performances La séparation des données et des métadonnées entraîne également des avantages en matière de performances : les métadonnées sont mises en cache dans le système CloudBoost afin d'accélérer les recherches tout en supprimant les goulots d'étranglement propres aux métadonnées, qui pourraient entraver l'accélération du déplacement des données. La déduplication à longueur variable côté source, effectuée en ligne, améliore aussi les performances, car elle garantit que les données dupliquées ne sont jamais transférées ; et réciproquement, que les données ne sont jamais envoyées deux fois. L'avantage est grand, puisque seules les données nouvelles et uniques sont envoyées sur le réseau. Pour faire face à la latence élevée des API de stockage en mode objet, CloudBoost segmente les fichiers en fragments de taille variable avec une moyenne de 256 Ko. Cette taille établit un équilibre optimal entre maximisation du taux de déduplication (avec de petits fragments) et minimisation du temps système (avec des fragments de grande taille). Questions de sécurité Installée dans le datacenter local du client, la solution CloudBoost chiffre l'ensemble du trafic en utilisant SSL pour la transmission de la zone de stockage en mode d'objet et en tirant parti des URL signées avec une valeur d'expiration courte afin de se protéger de l'exploit communément utilisé pour répéter les transactions. Chaque fragment est chiffré avec une clé indépendante basée sur l'algorithme de chiffrement AES (American Encryption Standard) 256 bits, une méthode qui n'a subi aucun exploit connu à ce jour. Garantie de l intégrité des données Pour s'assurer que les données sont correctement écrites, le serveur CloudBoost vérifie que le hachage de chaque fragment écrit par l'agent CloudBoost correspond au hachage fourni par l'agent. Importance du TCO Lorsqu'il s'agit d'examiner le TCO et la multitude des offres de Cloud public, il est important d'envisager d'autres facteurs que les seuls coûts de stockage. Coûts d'infrastructure existants Lors de l'évaluation du TCO, il convient d'envisager l'investissement de l'entreprise dans l'infrastructure de stockage existante. Pour parfaitement comprendre les avantages que le Cloud peut apporter à votre entreprise, il est impératif de prendre en compte l'infrastructure déjà en place, et surtout les éléments activement utilisés pour répondre aux besoins organisationnels dans le cadre de la stratégie de continuité d'activité. Coûts de conformité Selon le type de l'entreprise, la conformité est souvent une préoccupation majeure, à cause des conséquences financières (coût des amendes reçues en cas de non-conformité) mais aussi des risques pour la réputation de l'entreprise. Les grandes entreprises ont souvent quelques scrupules à sécuriser leurs sauvegardes dans un Cloud public multitenant, même si la multitenancy reflète uniquement leurs directions opérationnelles. Coûts de sortie La dépendance vis-à-vis d'un fournisseur est un véritable problème lorsqu'il s'agit de stockage dans le Cloud public. Pour de nombreuses entreprises, la possibilité de contrôler l'emplacement de stockage des données et de garder une maîtrise totale des mouvements de ces données peut jouer un rôle déterminant dans le choix d'une solution. Les mouvements des données critiques, en particulier si l'entreprise a un but lucratif, sont essentiels pour profiter de nouvelles économies d'échelle sur le stockage des données à longue durée de rétention. Le seuil critique reste ainsi clairement établi et l'entreprise est sûre de pouvoir le faire valoir facilement, quel que soit le niveau de tarif requis pour envisager un nouveau fournisseur. Coûts associés au WAN et points à prendre en compte Une liaison WAN dédiée peut être nécessaire pour supporter l'influx initial des données de sauvegarde qui doivent impérativement être envoyées sur le réseau. La demande quotidienne sera probablement inférieure à ce premier pic de charge lié aux «nouvelles» données. Il convient de déterminer le temps nécessaire à la transmission des nouvelles sauvegardes de base vers le Cloud, soit les débits quotidiens plus un certain pourcentage d'opérations de restauration (probablement inférieur à 10 %). Il est possible d'utiliser des techniques d'accélération du WAN pour atténuer certains délais de transmission, mais le facteur critique est la distance que les données doivent parcourir. Coûts de restauration Les sauvegardes stockées dans un Cloud public s'accompagnent d'un coût lié aux opérations de restauration. Un RTO agressif peut également constituer un facteur primaire dans l'évaluation du TCO global. Il est important de réfléchir à la période d'interruption et aux dépenses que l'entreprise est prête à tolérer le temps que les données soient restaurées du Cloud public. 5
TCO en action Il est souvent supposé que les offres de stockage dans un Cloud public, ou au moins les plus prisées d'entre elles, sont non seulement élastiques mais également économiques et agiles. Si cela est avéré dans certains cas, il convient de mettre en lumière la façon dont les chiffres réels montrent où s'arrête l'élasticité. Le graphique ci-après présente le TCO du stockage d'un demi-téraoctet de données dans trois régions AWS avec un contrat de support d'entreprise, 5 % de la capacité totale étant restaurés à partir de compartiments S3 et 1 % de la capacité totale récupéré à partir d'un stockage Glacier à froid. Tous les coûts AWS-S3/Glacier sont présentés à la Figure 1 ci-dessous, à côté des coûts associés à un environnement Elastic Cloud Storage (ECS) de trois sites. $0.07 $0.06 $0.05 $0.04 $0.03 $0.02 $0.01 Oregon Californie du Nord Virginie Coût du stockage utile + maint. Alimentation, refroidissement, encombrement, admin. $0.00 AWS S3 AWS Glacier ECS Figure 1. Comparés à deux solutions AWS, les coûts d'ecs sont inférieurs. Non seulement il est financièrement intéressant d'entretenir une infrastructure de type Cloud privé ou hybride avec ECS, mais les données stockées dans ECS sont également accessibles dès que nécessaire, à la même vitesse que sur votre réseau, et sous votre contrôle. Les objets stockés dans AWS Glacier présentent des délais de récupération variant de 1 à 3 heures, sans parler des coûts qui s'accumulent avec les restaurations AWS S3. Conclusion La question de la sauvegarde et de la rétention des données à long terme n'est plus aussi simple qu'elle l'était. Les entreprises se retrouvent aujourd'hui face à un éventail toujours changeant de solutions novatrices. Comme toutes ces solutions semblent viables, il est de plus en plus difficile de déterminer celle qui conviendra le mieux à la stratégie de continuité d'activité choisie. L'utilisation de la bande induit un RTO plus élevé, sans aucun des bénéfices de la sauvegarde sur disque, notamment la réplication rationalisée sur plusieurs datacenters et la déduplication des données. Le Cloud public pose lui aussi des défis particuliers : comment éviter la dépendance à un fournisseur spécifique ou respecter au mieux la réglementation et gérer les questions de gouvernance dans un contexte de multitenancy et de SLA rigoureux. La solution qui l'emporte est celle qui joue sur les deux tableaux : un modèle hybride qui conjugue la flexibilité du Cloud et l'efficience du disque, avec la solution CloudBoost pour assurer la rétention à long terme dans le Cloud, et ECS pour fournir le stockage en mode objet à des fins de protection et de sécurité. 6