Bien choisir son système RAID par Pierre SALAVERA Service Technique ACTN «Lorsque nous dimensionnons un NAS ou un serveur, nous nous posons souvent la question : Quel système RAID vais-je choisir? Est-il fiable? Combien vais-je avoir d'espace? Sera-t-il rapide? Qu'à cela ne tienne!! Je vais aujourd'hui vous faire un petit rappel sur le fonctionnement des modes RAID. Certains de ces concepts sont relativement simples, d'autre beaucoup plus complexes, préparez l'aspirine c'est parti!» Tout d'abord, voici l'explication des notations utilisées plus loin dans ce document : C : capacité d'un disque (tout les disques sont supposés identiques) Cm : Capacité totale du RAID V : vitesse d'un disque Vm : vitesse du RAID G : nombre de disques par grappe (nombre de disque si une seule grappe) N : nombre de grappe ACTN Pierre SALAVERA Support Technique - Audiotel: 0 892 700 131 (0.34, /min.) www.actn.fr 1
Le RAID 0 ou volume agrégé par bande : Le RAID 0 permet d'obtenir un gain significatif de performance aussi bien en lecture qu'en écriture. Si un fichier A doit être stocké sur la grappe il sera scindé en plusieurs partie de taille fixe (taille dépendant de la configuration appelée granularité) pour être écrit de manière simultanée sur les 2 disques de manière alternative (première partie sur le disque 1, deuxième sur le disque 2, troisième sur le disque 1, etc.). Chaque disque se répartissant la tache, les temps d'accès aussi bien en lecture qu'en écriture en sont d'autant réduits. A noter qu'il n'y a pas de perte d'espace, la totalité de l'espace de stockage des 2 disques est disponible. ATTENTION : Bien que le gain de performance soit important, le risque qui en découle l'est tout autant. En effet, la perte d'un seul des disques du RAID entraine la perte TOTALE de l'ensemble des données. Il est bien sur possible d'utilisé plus de 2 disque, le gain de performance en devient alors plus important le risque aussi (cependant beaucoup de système limite ce mode à 2 disques). Cm= C * G Vm = V * G Tolérance aux pannes disque : aucune Le RAID 1 ou miroir : Le RAID 1 est à la fiabilité ce que le RAID 0 est à la performance. Le principe est extrêmement simple : lorsqu'un fichier A doit être écrit sur la grappe, il est écrit dans sa totalité sur le disque 1 et le disque 2. Son intérêt réside dans cette redondance, il n'offre aucun gain de performance par rapport à un disque simple mais assure une parfaite sauvegarde des donnée. Il permet de perdre jusqu'à N-1 disque (par exemple un RAID 1 à 5 disques permet de perdre 4 disques) L'inconvénient majeur de ce RAID réside dans ses performances médiocre (ni mieux, ni pire qu'un disque seul) et son coup élever puisque la capacité totale de la grappe est la capacité d'un disque seul (par exemple un RAID 1 sur 5 disque de 1 To aura une capacité de 1 To) Il est généralement utilisé seul dans les très petites configuration ou dans des RAID combinés (dont je vous parle plus loin). Cm = C Vm = V Tolérance aux pannes disque : G 1 disques ACTN Pierre SALAVERA Support Technique - Audiotel: 0 892 700 131 (0.34, /min.) www.actn.fr 2
Le RAID 5 ou volume agrégé par bande à parité répartie : Lorsque un fichier A doit être écrit sur la grappe il est découper en G-1 partie, chacune étant écrite sur un disque différent. Le dernier disque accueille la parité qui est calculée à l'aide de l'algorithme XOR (pour Exclusive OR dont je vous épargne le détail ici). Tout ceci est illustré dans le schéma ci-dessous pour une meilleure compréhension. Si nous perdons un disque, 2 possibilités se présentent : 1. Soit pour une bande A nous avons perdu la parité auquel cas cela n'a aucune importance car les données sont intactes. 2. Soit nous avons perdu une parti des données, ce qui n'est pas grave non plus puisqu'il est possible de la recalculée en fonction de la parité et des G-1 données restantes. Attention : l'algorithme utilisé pour ce calcul ne permet pas le recalcul des données si plus d'un bloc est perdu. Le RAID 5 permet donc la défaillance d'un disque est pas plus quelque soit le nombre de disque utilisé. La bonne pratique consiste à intégrer au système un disque dit «de spare» qui est en attente en cas de défaillance et prendra le relai automatiquement. A noter qu'une reconstruction disque n'est pas sans impact sur les performances générale du système, cet impact dépend directement de la puissance de calcul de la machine hôte. Pour résumer, ce RAID est un bon compromis entre le RAID 0 et le RAID 1. ACTN Pierre SALAVERA Support Technique - Audiotel: 0 892 700 131 (0.34, /min.) www.actn.fr 3
Cm = (G 1) * C Vm (en lecture)= V * (G - 1) Vm (en écriture)= V * (G -1) si l'on néglige le calcul de parité Tolérance aux pannes disque : 1 disque Le RAID 6 : Pour simplifier, il s'agit d'une évolution du RAID 5 permettant la perte de plus d'un disque. L'algorithme mathématique employé est si lourd à traiter que l'on se limite généralement à une tolérance aux pannes de 2 disques. En cas de perte de 2 disque (ou plus si la configuration le permet) la reconstruction est extrêmement longue et lourde pour la machine hôte. Cm = (G ND) * C où ND est la tolérance aux pannes disque Vm (en lecture)= V * (G - ND) Vm (en écriture)= difficile à dire car dépendant de la puissance de calcul de la machine (pour le calcul de la parité). Plus la tolérance aux panne est élevée plus cette vitesse chute. Les RAID dit «combinés» : Tous les RAID énoncés ci-dessus son combinables afin d'optimiser une configuration, je e vous citerai ici que les 3 plus courant : Le RAID 10 (1+0): Illustré par l'image ci-dessous, il est plutôt fiable puisqu'il est possible de perdre G-1 disques par grappes. Cependant, la perte totale d une grappe entraine une défaillance générale. Cm = N * C Vm = N * V Tolérance aux pannes : G-1 disques par grappes ACTN Pierre SALAVERA Support Technique - Audiotel: 0 892 700 131 (0.34, /min.) www.actn.fr 4
Le RAID 50 : RAID 0 Basé sur des grappes en RAID 5, c'est un excellent rapport entre fiabilité et rapidité. Cependant, sa tolérance aux pannes n'est pas très grande car limité à 1 disque par grappe. Si une seule grappe perd 2 disques, tout le système tombe. Cm = N * (G-1) * C Vm = N * (G-1) * V (si l'on néglige le calcul de parité pour l'écriture) Tolérance aux pannes : 1 disque par grappe. Le RAID 51 : Ce RAID privilégie la fiabilité avant tout, il est très couteux aux vues du nombre de disque par rapport à l'espace obtenu. Il offre une excellente redondance puisqu'il est possible de perdre N-1 grappes avant de le mettre en default, ainsi que 1 disque par grappe sans perte totale de la grappe (Cf. capture ci-dessous) ACTN Pierre SALAVERA Support Technique - Audiotel: 0 892 700 131 (0.34, /min.) www.actn.fr 5
Cm = (G-1) * C Vm (en lecture)= V * (G 1) si vous cherchez un peu vous trouverez une formule de type: N * V * (G-1). Ceci n'est plus du RAID 51 mais du RAID (5 + 1.5). Vm (en écriture)= V * (G - 1) si l'on néglige le calcul de parité. Tolérance aux pannes : N-1 grappes et 1 disque pour chaque grappe. Conclusion «Voilà pour notre petit point sur les différents modes de RAID. N'oubliez jamais une chose, quelque soit le mode que vous choisirez dans vos différentes installations, tout ceci ne vous dispensera jamais de prévoir un système de sauvegarde robuste en complément. Tout système est faillible, même si sa probabilité de chute est faible, elle existe donc ne la négligez pas!!!! A bientôt pour un nouveau sujet dans cette rubrique «Le Coin du Tech»!» Pierre SALAVERA Service Technique ACTN Audiotel : 0 892 700 131 (0.34, /min.) www.actn.fr Source documentaire pour les illustrations : Wikipedia ACTN Pierre SALAVERA Support Technique - Audiotel: 0 892 700 131 (0.34, /min.) www.actn.fr 6