STOCKAGE SCALE-OUT EMC ISILON SANS COMPROMIS Clusters de système de fichiers unique ou clusters d espace de nommage global EMC PERSPECTIVE
5 bonnes raisons de choisir EMC Isilon 1. Simplicité : simple à acheter, mettre en place, gérer et développer ; il suffit d une seule personne pour traiter plusieurs pétaoctets de données, ce qui réduit les coûts d exploitation et permet au personnel de se consacrer à la gestion des données plutôt qu à leur stockage. 2. Évolutivité : jusqu à 15,5 Po et plus de 85 Go par seconde (Go/s) de débit total à partir d un seul système de fichiers. 3. Efficacité : taux d utilisation du stockage supérieur à 80 % pour les applications stratégiques et modèle modulaire d achat suivant l évolution des besoins permettant de réduire les coûts opérationnels. 4. Disponibilité : protection contre les pannes jusqu à quatre fois supérieure, garantissant la disponibilité de l intégralité des données même en cas de panne simultanée d un maximum de 4 noeuds ou disques. 5. Réussite : un stockage adapté permet de réduire les coûts et la complexité tout en favorisant l innovation, en soutenant la croissance et en offrant un avantage concurrentiel. Aujourd hui, de nombreux fournisseurs informatiques adoptent la terminologie marketing du stockage scale-out et vantent ses mérites. Cette forme de stockage a pour principal objectif d accroître les performances, la capacité et le débit grâce à l ajout de ressources sans perturbation. Malheureusement, le terme scale-out est souvent employé pour décrire, à tort, l utilisation d'un réseau et d'utilitaires en vue de regrouper plusieurs systèmes de stockage RAID, avec à la clé l agrégation de plusieurs systèmes de fichiers indépendants et leurs nombreux volumes dans un seul et même espace de nommage. En réalité, les mises en oeuvre de cette nature ne présentent pas les avantages attendus de l utilisation du stockage scale-out. En effet, avec ou sans cluster, les limitations indépendantes et l efficacité opérationnelle des systèmes RAID individuels restent inchangées. DÉFINITION DE SCALE-OUT Il est relativement simple de faire la distinction entre des systèmes RAID en cluster et un véritable stockage scale-out. Le stockage scale-out offre les cinq capacités uniques, mais indissociables, suivantes : 1. Facilité d utilisation et de gestion depuis plusieurs noeuds présentant un seul système de fichiers et un seul volume évolutifs 2. Niveaux renforcés de protection des données et haute disponibilité assurés par la résilience évolutive N-way 3. Élimination des goulots d étranglement des applications et de la nécessité de surprovisionner grâce à un débit et à des E/S prévisibles et évolutifs de façon linéaire 4. Réduction des coûts d investissement grâce à une utilisation améliorée de la capacité et de l efficacité du stockage 5. Fonctionnalités d entreprise intégrées adaptées aux exigences du marché de l informatique d entreprise pour la gestion des données scale-out et la protection des données Chacun de ces attributs est présenté plus en détail ci-dessous. UN SYSTÈME DE FICHIERS ET UN VOLUME UNIQUES ET ÉVOLUTIFS Les clusters de systèmes de stockage, couplés mais peu intégrés, qui utilisent plusieurs systèmes de fichiers non évolutifs et plusieurs volumes dans un espace de nommage global, ne remplissent pas le premier critère du scale-out : un système de fichiers à volume unique de plusieurs noeuds. À l inverse, l environnement d exploitation EMC Isilon OneFS favorise une véritable évolutivité en faisant passer de façon transparente la capacité d un seul volume de système de fichiers de plusieurs dizaines de téraoctets (To) à plusieurs dizaines de pétaoctets (Po), simplement grâce à l ajout de noeuds supplémentaires. Chaque noeud ajouté s accompagne d une capacité et de performances supplémentaires dans la mesure où chacun d eux accroît les capacités de traitement, de mémoire et d E/S réseau. Lorsque vous ajoutez des noeuds, la fonctionnalité AutoBalance de OneFS rééquilibre automatiquement les données à travers l ensemble des noeuds, déplaçant les données à travers le réseau InfiniBand interne au cluster de manière automatique et cohérente, de sorte que les données existantes du cluster soient transférées vers la capacité du nouveau noeud de stockage. Ainsi, OneFS permet le stockage scale-out transparent de plus de 15 Po de données au sein d un seul système de fichiers et d un seul volume. 2
Scale-out Isilon sans compromis EMC Isilon constitue la référence en matière de stockage scale-out grâce à son adoption massive dans les infrastructures informatiques d entreprise pour les répertoires personnels, partages de fichiers, zones de stockage de fichiers virtualisées et archives, ainsi que dans les secteurs de l informatique commerciale hautes performances, notamment les sciences de la vie, la fabrication, les médias et loisirs, les services financiers et le Web 2.0. RÉSILIENCE ÉVOLUTIVE N-WAY Les clusters de systèmes de stockage RAID utilisent les calculs de parité RAID traditionnels pour minimiser la perte de données due aux défaillances des disques. Toutefois, le système RAID ne peut être performant que si les données du disque en échec peuvent être reconstruites avant que d autres erreurs de lecture ou défaillances de disques se produisent au niveau d un autre disque du RAID. Alors que la taille des disques ne cesse d augmenter, les délais de reconstruction des données d un disque défaillant augmentent, ce qui accroît la probabilité d une autre défaillance de disque pendant le processus et se traduit par la perte de données. Du point de vue applicatif, lorsqu un contrôleur effectue une reconstruction de disque à partir de la parité (stockée sur un petit nombre de disques), ses performances d E/S sont fortement compromises.plus important encore, il n existe aucun moyen d adapter la protection par parité ou le temps de reconstruction du disque à la croissance de la capacité du système. Les clusters de systèmes RAID basés sur des paires de contrôleurs peuvent fournir un accès aux données dans leur système de fichiers en cas de défaillance d un seul contrôleur. Si les deux contrôleurs sont défaillants, les données d un système de fichiers restent indisponibles pour les applications qui tentent d y accéder depuis l espace de nommage global. Les résultats d une reconstruction d ensemble RAID ou d une défaillance de contrôleur dans un espace de nommage global ont des répercussions importantes sur les performances globales du cluster. En raison de ces limites, le stockage scale-out doit assurer la résilience évolutive au-delà des systèmes RAID et s adapter au modèle des deux contrôleurs des systèmes RAID en cluster utilisant des espaces de nommage globaux. Par ailleurs, ces systèmes ne fournissent pas la protection évolutive des données à l échelle du cluster, ni la capacité d adapter le niveau de protection en fonction de la valeur des données. Dans un cluster d espace de nommage global, la protection des données est définie par le type RAID du volume, qui est généralement limité à la structure RAID du contrôleur/volume et plus généralement au niveau RAID-1 (mise en miroir) pour les données les plus critiques ou RAID-6 (DP) pour tout le reste. Au fil du temps, la valeur des données de votre entreprise peut évoluer. La mise en adéquation des niveaux de protection des données avec ce changement de valeur nécessite de déplacer manuellement ces données d un volume RAID-1 vers un volume RAID-6 ou de modifier manuellement le niveau de protection RAID de toutes les données du volume. L environnement d exploitation OneFS assure la protection des données scale-out avec EMC Isilon FlexProtect, qui utilise des codes Reed-Solomon pour apporter des capacités de redondance et de disponibilité bien supérieures à celles des systèmes RAID traditionnels. FlexProtect crée un fabric redondant N-way qui évolue à mesure que vous ajoutez des noeuds au cluster. FlexProtect est en mesure de protéger jusqu à quatre défaillances simultanées de noeuds complets ou de disques individuels dans un cluster ou un pool, tout en préservant l accès aux données. À l'heure actuelle, jusqu à 144 disques peuvent être mis hors ligne au sein d un pool tout en préservant un accès complet et transparent aux données du cluster. Si le niveau de protection est dépassé, le cluster ne subit qu une indisponibilité partielle des données. Lorsque FlexProtect est associé à EMC Isilon SmartPools, un cluster Isilon est capable d adapter automatiquement le niveau de protection à la valeur des données. La hiérarchisation automatisée basée sur des règles, telle qu'elle est fournie par SmartPools, déplace les données entre les pools de noeuds Performance et Capacité (plus économique), dont les niveaux de protection peuvent être définis individuellement. Par exemple, les données actives en ligne peuvent être protégées contre deux défaillances de noeuds simultanées au sein du pool Performance, puis, à mesure que les données vieillissent et sont automatiquement déplacées vers le pool Capacité, le niveau de protection est automatiquement défini sur une protection de 4 noeuds afin d assurer la disponibilité à long terme des archives critiques. 3
Position dominante d EMC Isilon Aujourd hui, EMC compte plus de 2 200 clients Isilon dans le monde avec plus de 30 000 systèmes installés. Le stockage scale-out Isilon sans compromis bénéficie d un fort taux d adoption, avec une moyenne de 120 nouveaux clients par trimestre. Ce leadership, EMC l a obtenu en proposant l environnement d exploitation scale-out de 6e génération le plus avancé, le plus éprouvé et le plus innovant du marché, offrant des performances évolutives par linéarité inégalées ainsi qu une grande facilité d utilisation et de gestion. Le stockage scale-out doit permettre de faire évoluer le temps de reconstruction en cas de défaillance des noeuds et des disques. OneFS stocke les informations de protection de chaque fichier indépendamment. Ces informations sont ainsi réparties à travers le cluster en même temps que les données des fichiers, ce qui accroît considérablement le parallélisme de reconstruction à mesure que le cluster évolue. FlexProtect identifie les fichiers défaillants et utilise plusieurs noeuds du cluster pour reconstruire uniquement ces fichiers. Étant donné que la fonctionnalité AutoBalance de OneFS répartit les fichiers à travers les noeuds du cluster, le nombre de piles et de CPU participant à la reconstruction dépasse de loin celui de n importe quelle implémentation RAID. À mesure que des noeuds sont ajoutés au cluster pour accroître les performances et la capacité, la protection et la disponibilité des données évoluent au même rythme. En outre, la reconstruction ayant lieu au sein d un espace libre disponible dans le cluster, OneFS élimine le goulot d étranglement provoqué par la reconstruction des données sur un seul disque de secours. ÉVOLUTION LINÉAIRE DES E/S ET DU DÉBIT Une des méthodes couramment utilisées pour mettre en oeuvre les systèmes RAID en cluster consiste à coupler, sans les intégrer entièrement, des systèmes de stockage RAID au moyen d'un réseau et en cumulant leurs ressources dans un espace de nommage unique. Si cette méthode peut contribuer à l extension des ressources du point de vue du stockage, elle ne produit pas l évolutivité linéaire des performances du point de vue applicatif. En réalité, cette implémentation fournit un niveau immuable de performances. Avec une approche basée sur des systèmes RAID en cluster, les E/S d un fichier d application sont dirigées vers un volume spécifique. Ce volume est présent dans un seul système de stockage RAID. Les ressources de stockage disponibles pour l application qui accède à ce fichier sont limitées à un seul volume sur un même système RAID, quel que soit le nombre total de systèmes RAID compris dans le cluster. En matière de performances, les applications ne bénéficient pas du cache, de la puissance de traitement du contrôleur, ni des ressources réseau des autres noeuds du cluster. Pour contourner cette contrainte des performances fixes, les données sont fréquemment répliquées ou mises en cache en mode lecture seule sur plusieurs systèmes et volumes RAID du cluster. Cet équilibrage manuel des performances mobilise d importantes ressources administratives et consomme une capacité de stockage supplémentaire, diminue le débit du réseau et accroît l utilisation des ressources des systèmes de stockage. À l opposé, OneFS permet d obtenir une évolutivité linéaire des performances par la répartition des données sur l ensemble des noeuds de stockage du cluster. Grâce à une technologie symétrique parallèle multiprocesseurs, tous les processeurs de tous les noeuds peuvent traiter des tâches d E/S, quel que soit l emplacement des données de ces E/S dans le cache du cluster ou le système de stockage sur disque. Cette fonctionnalité de traitement symétrique multiprocesseurs équilibre efficacement et en continu les charges de travail des applications en déplaçant aisément les tâches des processeurs et des données entre les noeuds. À chaque ajout de noeud, le cluster accroît la capacité totale de stockage, le cache partagé globalement cohérent, le traitement ainsi que la bande passante réseau. Bien que les données soient agrégées par bandes et distribuées sur plusieurs noeuds, elles sont présentées aux applications sous la forme d un seul système de fichiers cohérent et d un seul volume au sein d un même système de stockage. Au niveau des applications, les E/S et le débit évoluent de manière transparente et linéaire à mesure que des noeuds sont ajoutés au cluster. 4
OPTIMISATION DU STOCKAGE Chaque système individuel d un cluster RAID couplé et peu intégré comporte un système de fichiers constitué de plusieurs volumes. Même si les multiples systèmes de fichiers peuvent être regroupés dans l espace de nommage, du point de vue applicatif, les E/S sont dirigées vers un volume donné d un système de fichiers sur un seul contrôleur. Les E/S des applications étant associées à des volumes spécifiques, la capacité de certains volumes est sous-utilisée alors que d autres volumes sont surprovisionnés. En raison de cette relation application/volume, le taux d utilisation du stockage est faible et la capacité d espace libre orpheline ne peut être exploitée qu au moyen d un processus manuel complexe d équilibrage de la capacité à travers les volumes. L analyse des déploiements du stockage sur le marché suggère qu en moyenne, 43 % de la capacité de stockage est gaspillée en raison de ces inefficacités. Souvent, les administrateurs du stockage surprovisionnent la capacité de façon à éviter ce processus continu d équilibrage manuel, ce entraîne des taux d utilisation du stockage réduits à 50-60 % et une augmentation des dépenses d investissement. FONCTIONS D ENTREPRISE INTÉGRÉES De nombreux systèmes de stockage regroupant plusieurs systèmes RAID dans un espace de nommage unique dépendent d applications existantes basées sur les volumes pour la gestion et la protection des données. Par conséquent, les activités telles que les snapshots, la réplication, le Thin Provisioning, la déduplication et la compression ne peuvent être effectuées que sur les données de volumes spécifiquement identifiés. N ayant aucun impact global à l échelle du cluster, chaque instance d application doit être gérée manuellement sur chaque système RAID et sur les volumes associés. En outre, les outils d efficacité du stockage tels que la compression et la déduplication ont uniquement des répercussions sur le volume individuel du système RAID sur lequel ils agissent. L espace libre récupéré n est pas disponible en dehors de ce volume. Il ne présente donc aucun intérêt pour le cluster dans son ensemble. La gestion des applications de l infrastructure sur des systèmes RAID en cluster et leurs volumes accroît les coûts opérationnels et ne présente aucun intérêt pour l entreprise au niveau des applications de l infrastructure scale-out. Avec EMC Isilon, les applications de protection et de gestion des données sont intégrées dans l architecture à un seul volume du système de fichiers OneFS couvrant l intégralité du cluster. Cette approche rationalise l efficacité de la gestion en réduisant le nombre de processus manuels associés aux clusters RAID couplés sans être intégrés. Les applications OneFS peuvent être appliquées à l intégralité du système de fichiers, aux pools ou aux répertoires sans gestion manuelle supplémentaire. En effet, les applications d infrastructure d entreprise Isilon ont été précisément conçues pour apporter, en matière de gestion, les avantages indispensables au scale-out dans un environnement d entreprise. NOUS CONTACTER Pour savoir comment les produits, services et solutions EMC Isilon peuvent vous aider à relever vos défis informatiques et métiers, contactez un responsable de compte ou un revendeur agréé EMC, ou visitez notre site Web à l adresse http://france.emc.com/isilon. SIMPLE ET SMART Une fois les 5 attributs clés du stockage scale-out clairement définis et caractérisés, il est possible d effectuer une évaluation simple de l approche scale-out de n importe quel fournisseur. Cela permet de déterminer si cette approche est en mesure d apporter les avantages métiers et opérationnels attendus ou s il s agit d un produit d agrégation d espace de nommage présentant les mêmes contraintes que le stockage RAID scale-up individuel. De nombreux systèmes de stockage portant «l étiquette» scale-out sont incapables de satisfaire la majorité, sinon l ensemble, des critères de cette évaluation et d offrir les avantages du stockage scale-out EMC Isilon sans compromis. EMC 2, EMC, Isilon, FlexProtect, OneFS, SmartPools et le logo EMC sont des marques déposées ou des marques commerciales d EMC Corporation aux États- Unis et dans d autres pays. VMware est une marque commerciale ou une marque déposée de VMware, Inc. aux États-Unis et dans d autres juridictions. Copyright 2012 EMC Corporation. Tous droits réservés. 12/12 EMC Perspective H10511 EMC Computer Systems France River Ouest, 80 Quai Voltaire, CS 21002, 95876 Bezons CEDEX Tél. : +33 1 39 96 90 00 Fax : +33 1 39 96 99 99 http://france.emc.com