Inexpensive/Independent Disks)

Documents pareils

Le Raid c est quoi? Comment ca marche? Les différents modes RAID :

1 - Rappel. Historique

INTRODUCTION GENERALE... 3 LES NIVEAUX SIMPLE (RAID 0,1,2,...)... 4

Distinguer entre «Enregistrer» et «Sauvegarder»

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

«clustering» et «load balancing» avec Zope et ZEO

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Chapitre 1 : Introduction aux bases de données

Gestion des sauvegardes

Concepts et systèmes de stockage

Guide pour l Installation des Disques Durs SATA et Configuration RAID

EX4C Systèmes d exploitation. Séance 14 Structure des stockages de masse

Cours 13. RAID et SAN. 2004, Marc-André Léger

Sécuriser les données 1

Thomas Briet Ingenieurs 2000 Cyril Muhlenbach

Symantec Backup Exec.cloud

Module 12 : Configuration et gestion des disques

Artica. La déduplication. Révision Du 08 Février 2011 version

PC Check & Tuning 2010 Optimisez et accélérez rapidement et simplement les performances de votre PC!

Quel niveau RAID est le mieux adapté à mes besoins?

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1

La continuité de service

Système de stockage IBM XIV Storage System Description technique

Structure et fonctionnement d'un ordinateur : hardware

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Serveur EMC/CX Solution de stockage hautes performances dotée d'une connectivité flexible

Gestion de mémoire secondaire F. Boyer, Laboratoire Sardes

Agenda. Exemple : données et back à Eurecom SANs and NAS. Les bases: SANs. Back-up Partage de fichier. Disques et Raid SCSI et FCP

Sage 50 Comptabilité. Solutions logicielles en nuage, sur place et hybrides : Qu'est-ce qui convient le mieux à votre petite entreprise?

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

Architecture complète de protection du stockage et des données pour VMware vsphere

Démontage d'un ordinateur

Stockage Réseau. Le stockage s'échappe du système pour devenir une fonction réseau

Ajouter un cache SSD à son ordinateur

Ebauche Rapport finale

VMWare Infrastructure 3

Boîtier NAS à deux baies

Technologie SDS (Software-Defined Storage) de DataCore

Virtualisation de Windows dans Ubuntu Linux

Installation et Réinstallation de Windows XP

HYPER-V CLOUD GUIDES DE DÉPLOIEMENT MODULE 1: ARCHITECTURE ET DIMENSIONNEMENT

vbladecenter S! tout-en-un en version SAN ou NAS

TP 1 : prise en main de Windows. TP 1 : prise en main de Windows

Architecture des ordinateurs. Environnement Windows : sauvegarde

en version SAN ou NAS

Server Administrator Storage Management

Nouvelles stratégies et technologies de sauvegarde

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

Projet : PcAnywhere et Le contrôle à distance.

1 LE L S S ERV R EURS Si 5

Service WEB, BDD MySQL, PHP et réplication Heartbeat. Conditions requises : Dans ce TP, il est nécessaire d'avoir une machine Debian sous ProxMox

DÉVELOPPEMENT INFONUAGIQUE - meilleures pratiques

Microsoft Windows NT Server

Hubert & Bruno Lundi 12 octobre 2009 SAINT-QUENTIN (02)

Retrouver de vieux programmes et jouer sur VirtualBox

1 sur 5 10/06/14 13:10

Informatique pour scientifiques hiver Plan général Systèmes d exploitation

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Le e s tocka k ge g DAS,NAS,SAN

Manuel de l utilisateur de HP Array Configuration Utility

Système de stockage sur disque IBM Storwize V5000

SYSTÈME RAID 2-BAIES DISQUE DUR SATA 3,5

Guide de l informatique Fichiers et dossiers

Protection des données avec les solutions de stockage NETGEAR

PARAGON SYSTEM BACKUP 2010

L ORDINATEUR. Les composants. La carte mère. Le processeur. Fréquence

Immobilier de prestige, biens d exception, Tour d horizon. de stockage 48 // 49

Windows Internet Name Service (WINS)

Check-list de maintenance du système Instructions impératives pour l'utilisateur du système Dernière mise à jour 09 juin 2011

Sur un ordinateur exécutant Windows 2000 Server Ayant une adresse IP statique

Network storage solutions

Sauvegarde. de données. Nos conseils de prise en main

Retrospect 7.7 Addendum au Guide d'utilisation

Seagate Business Storage NAS 1 baie, 2 baies et 4 baies Guide d'utilisation

Au-delà de la disponibilité «cinq neuf» : atteindre une haute disponibilité avec Dell Compellent Storage Center

Haute disponibilité avec Microsoft SQL Server

EMC DATA DOMAIN HYPERMAX

Module 0 : Présentation de Windows 2000

EMC DATA DOMAIN OPERATING SYSTEM

SRAL Saint Raphaël. Maison des associations 213, rue de la Soleillette Saint Raphaël. : : dromain.jean-pierre@neuf.

Sauvegarde avec Windows 7

Licences Windows Server 2012 R2 dans le cadre de la virtualisation

Fonctionnalités d Acronis :

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Formateurs : Jackie DAÖN Franck DUBOIS Médiapôle de Guyancourt

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long,

DOSSIER SOLUTION : CA RECOVERY MANAGEMENT

HP Data Protector Express Software - Tutoriel 3. Réalisation de votre première sauvegarde et restauration de disque

DOSSIER SOLUTION : CA ARCserve r16. Recours au Cloud pour la continuité d'activité et la reprise après sinistre

Quel PC pour quels usages? 1) PC de Bureau ou Portable? Les différents types de portables. - Les ultra-portables. - Les portables généralistes

ETI/Domo. Français. ETI-Domo Config FR

Conception d'applications de base de données ios plus rapides Guide Pratique FileMaker

Transcription:

Introduction. Historique : Qu'est ce que le RAID? (Redundant Array of Inexpensive/Independent Disks) En 1987, un devis fut rédigé par l'université de Berkeley, en Californie, pour définir plusieurs types de "Redundant Arrays of Inexpensive Disks",traduit régulièrement par RAID. L'idée de base du RAID était de combiner plusieurs petits disques peu coûteux ( d'où le I (Inexpensive) de l'acronyme RAID) en un groupe afin d'atteindre les performances des disques plus gros et plus dispendieux. De telle façon qu'ils seraient vus comme un seul disque. On peut d'une certaine façon voir le RAID comme l'opposé du partionnement : Dans un cas on créé plusieurs unités logiques avec un seul disque (partionnement) et dans l'autre on crée une seule unité logique à partir de plusieurs disques. On voit fleurir actuellement sur les cartes mères des contrôleurs Highpoint ou Promise qui permettent aux particuliers d'utiliser le RAID sur leur machine personnelle. Les constructeurs de carte mère sont toujours prêts à ajouter de nouvelles fonctionnalités à leurs modèles, mais encore faut-il en avoir l'utilité, et en ce qui concerne le RAID, il faut déjà savoir de quoi il s'agit! Le RAID a surtout une utilité dans le monde professionnel : nombreuses sont les entreprises qui ne peuvent se permettre de voir leur système informatique arrêté pour quelques heures, voire quelques minutes, à cause d'un simple disque dur en panne. Il n'est pas rare non plus de rencontrer des entreprises dont le système d'informatique contient des Téra-octets de données qui ne peuvent être perdues sans conséquences financières catastrophiques. Sans compter les besoins de certaines applications en terme de performances de disques dur, comme par exemple les traitements de données multimédia (traitement vidéo, imagerie numérique, etc...). Or si les performances et la fiabilité des disques durs ne cessent de s'améliorer, elles ne sont pas suffisantes pour satisfaire les professionnels. Le RAID est donc censé apporté une réponse à tous ces besoins. La mise en place d'une solution RAID est donc à l'origine destinée aux professionnels, et le coût de mise en oeuvre était assez élevé (le RAID est traditionnellement utilisé avec du SCSI). Mais il n'y a pas que les professionnels qui peuvent avoir besoin de tels systèmes, et l'on voit apparaître des solutions économiques de RAID destinées aux gros utilisateurs particuliers. Les contrôleurs RAID que l'on trouve intégrés sur certaines cartes mères permettent l'utilisation de disques IDE, qui coûtent nettement moins chers que les disques SCSI (une solution RAID nécessitant plusieurs disques, l'utilisation de l'ide pour les particuliers est salvatrice). Le RAID en tant que simple agrégat (Ensemble d objets regroupés pour former un tout) de disques durs présente un inconvénient majeur : la fiabilité de l'ensemble Introduction raid.doc Page 1 05.06.2001

est inversement proportionnelle au nombre de disques travaillant de concert (plus il y a de disques, plus il y a de chance qu'il y en ait un qui rende l'âme, causant la perte de toutes les données!). Or avec l'évolution de la capacité des disques durs et donc la quantité de données stockées, la fiabilité est de plus en plus un élément primordial. C'est pourquoi le système RAID a été décliné en plusieurs méthodes (appelée niveaux), qui définissent chacune un degré de fiabilité et de performance. Au départ (en 1988), les niveaux de RAID étaient au nombre de 5, de 1 à 5. Puis les RAID 0 et 6 ont été rajoutés : il existe donc à la base 7 niveaux de RAID qui sont standardisés : niveaux 0, 1, 2, 3,4,5, 6. Il existe aussi d'autres niveaux de RAID, qui sont en fait des combinaisons ou des évolutions des RAID de base : Niveau 10, 53. Mais tous les niveaux de RAID ne sont pas utilisés, certains ayant une utilité assez faible ou étant destiné à des cas bien particuliers. Ce qu il faut savoir? $ Le RAID peut être géré de façon logiciel ou hardware. $ Par voie logiciel, la partition système ne peut bénéficier du mode RAID puisque c'est elle qui le gère ( à l'exception du mode Mirroir "RAID1" ). $ Par voie matérielle, le système est plus rapide et devient transparent pour le système d'exploitation dont la partition peut ainsi être intégrée dans le RAID. Attention! Les niveaux de RAID qui proposent de la tolérance de panne (tous sauf le RAID 0 en fait) ne dispensent en aucun cas des systèmes de sauvegarde : il est nécessaire d'effectuer des sauvegardes qui doivent être stockées dans des lieux différents (pour se protéger contre les sinistres par exemple). Nous abordons à ce niveau un aspect beaucoup plus vaste de l'informatique, à savoir la sécurité, mais il est important de noter que le RAID n'est pas une solution de sauvegarde : le RAID ne protège pas contre l'effacement de fichiers par exemple... Attention, un RAID 5 n'est pas forcément mieux qu'un RAID 0, 1 ou 3, tout dépends de l'utilisation et du but recherché. Les RAID simples. Raid 0 Raid 1 Raid 2 Raid 3 Raid 4 Raid 5 Orthogonal RAID 5 Raid 6 Raid 7 Les combinaisons de Raid 10 Raid 53 RAID simples. Raid S Raid H JBOD Introduction raid.doc Page 2 05.06.2001

RAID 0. RAID 0 : striping Le RAID 0 correspond en fait au RAID tel qu'il a été inventé au départ : il consiste à utiliser plusieurs disques comme un seul. Les données à écrire sont divisées en blocs (dont la taille est paramétrable) chaque bloc étant écrit sur un disque différent du bloc précédent (c'est une rotation dans les disques). De cette façon, les disques sont utilisés en parallèle, ce qui augmente d'autant les performances globales, dans la limite du contrôleur disque bien évidemment. Cependant, ce système ne tient pas compte de la redondance, et n'offre donc aucune sécurité en cas de panne d'un disque (comme chaque partition est divisée en blocs répartis sur l'ensemble des disques, perdre un disque signifie perdre toute la partition). Le RAID 0 est applicable avec au minimum 2 disques (sachant que plus il y a de disques, plus les chances de panne sont grandes). Le RAID 0 se distingue des autres niveaux de RAID par le fait qu'il est le seul à ne pas proposer de tolérance de panne. Ce n'est donc pas un vrai RAID car le R (Redundant) de RAID n'est pas appliqué. Il présente cependant l'avantage d'être très simple à mettre en place. Il est souvent utilisé dans des systèmes qui nécessitent des performances élevées mais pour lesquels la tolérance de panne n'est pas primordiale : par exemple pour des Les données sont réparties sur deux disques. Ainsi, l'espace de stockage est multiplié par 2, et les accès sont plus rapides. Ce niveau n'offre aucune sécurité. Introduction raid.doc Page 3 05.06.2001

RAID 1. RAID 1 : Appelé aussi "Mirroring ou Duplexing. Le Mirroring : utilise un seul contrôleur pour tous les disques. Le duplexing utilise un contrôleur par disque ce qui permet de tolérer les pannes d'un contrôleur. Ce système accroît la sécurité des données par duplication d'un disque sur un autre. Il améliore les performances en lecture par accès simultané aux 2 disques. Et correspond au Mode Miroir de Windows NT4 Server. Le but de ce niveau de RAID est d'offrir une plus grande sécurité. Pour cela, les données sont copiées simultanément sur 2 disques. Si jamais un disque tombe en panne, l'autre contient toutes les données, d'où un très bon niveau de sécurité. Tant que l'un des deux disques est en panne, le RAID fonctionne en mode dégradé, et dès que l'on remplace le disque défectueux, les données sont recopiées automatiquement. Les performances en écriture sont identiques à celle d'un seul disque dur, car les disques durs doivent enregistrer exactement les mêmes données au même moment. En revanche, les performances en lecture sont quant à elle doublées, la lecture s'effectuant sur les deux disques en parallèle sur des données différentes. Ce niveau de RAID présente l'inconvénient de revenir très cher, puisque vous n'avez que la moitié de la capacité totale qui est disponible (1 seul des deux disque, l'autre servant de miroir). Le RAID 1 n'est pas limité à une matrice de 2 disques comme on pourrait le croire : la matrice peut être de 2, 4, 6, etc... disques. Les disques étant associés par paires (l'un étant le miroir de l'autre). Quand une paire de disque est pleine, l'écriture continue sur la paire suivante. Le RAID 1 existait bien avant d'être appelé "RAID", puisqu'il est utilisé depuis les années 60. Il est utilisable avec au minimum 2 disques : dans ce cas on parle de mirroring. Si chaque disque est relié à un contrôleur différent, on parle alors de Introduction raid.doc Page 4 05.06.2001

duplexing. Cette solution est plus sécurisée car elle offre l'avantage de protéger également contre une défaillance du contrôleur. Les données sont écrites simultanément sur le disque et son miroir. La capacité de stockage n'est pas accrue, mais la sécurité est optimale. Introduction raid.doc Page 5 05.06.2001

RAID 2. RAID 2 : Identique au RAID 1 mais un seul disque est sollicité lors des opérations de lecture. Donc il n'y a aucune amélioration des performances en lecture/écriture. Autant le dire tout de suite, le RAID 2 est très peu utilisé, voir même pas du tout. Le RAID 2 nécessite des disques pour les données et des disques pour les codes de correction d'erreur (ECC). Il utilise en effet une segmentation des données en ce qui concerne les bits, et calcule des codes de correction d'erreur suivant les codes de Hamming. Chaque écriture de données nécessite le calcul et l'écriture du code de correction d'erreur associé. De même, chaque lecture de données nécessite la lecture du code de vérification d'erreur, ce qui permet de vérifier que les données sont les bonnes, et même de faire des corrections d'erreurs "à la volée". Tout cela est bien beau, mais il faut savoir que TOUS les disques durs actuels sont pourvus de systèmes de détection d'erreur basés sur le même principe, ce qui limite grandement l'intérêt du RAID2. Mais surtout, le RAID 2 nécessite un contrôleur complexe et donc très cher, ce qui explique le peu d'intérêt pour ce niveau de RAID. L'un des disques est dédié à l'enregistrement des sommes de contrôle ; les données sont enregistrées sur les autres disques. L'écriture met en œuvre tous les disques, la lecture n'active que les disques de données. Introduction raid.doc Page 6 05.06.2001

RAID 3. RAID 3 C'est un RAID 0 plus un disque de parité afin de détecter les erreurs d'enregistrement. Si le disque de parité tombe en panne, on se retrouve en RAID 0. Le RAID 3 nécessite au minimum une matrice de 3 disques : il utilise un disque pour stocker les bits de parités, qui servent à contrôler les erreurs. De cette façon, si un disque de données tombe en panne, il est possible de reconstruire les données à partir du disque de parité. Si jamais c'est le disque de parité qui tombe en panne, le RAID 3 devient en fait un RAID 0. C'est pourquoi le disque de parité doit être le plus fiable possible (mais il peut aussi tomber en panne sans mettre en péril toute la matrice, les données de parité pouvant être reconstruite à partir des autres disques). Le principe des bits de parité est assez simple : cela revient en gros au principe des additions. Par exemple si A + B = C, si jamais vous perdez B (cas d'un disque dur qui tombe en panne), vous pouvez le retrouver à partir de A et de C. C'est exactement le même principe avec les bits de parité. Les disques du RAID 3 doivent être synchronisés, ce qui explique les performances un peu limitées en écriture. Par contre, en lecture, les performances sont nettement augmentées, car la lecture se fait simultanément sur tous les disques de données. Il n'y a en théorie pas de limite au nombre de disques possibles dans la matrice en RAID 3, mais comme chaque écriture sur un disque de donnée entraîne une écriture sur le disque de parité, ce dernier devient rapidement l'élément limitant du RAID 3. L'un des disques est dédié à l'enregistrement des sommes de contrôle ; les données sont enregistrées sur les autres disques. L'écriture met en œuvre tous les disques, la lecture n'active que les disques de données. Introduction raid.doc Page 7 05.06.2001

RAID 4. RAID 4. Ce mode présente des différences de structure des données par rapport au RAID 3, les données sont organisées de la même façon mais la taille des segments est variable. Il crée un goulet d'étranglement des données et le disque de parité travaille deux fois plus. En règle générale, le RAID 5 est toujours préféré au RAID4. Le principe est exactement le même que celui du RAID 3, si ce n'est au niveau de la structure des données : le RAID 4 utilise une segmentation des données par blocs alors que le RAID 3 utilise une segmentation des données par octets. D'autre part, les disques de la matrice du RAID 4 n'ont donc pas besoin d'être synchronisés. Les informations sont regroupées dans des segments de taille variable, d'un ou plusieurs secteurs. Cela permet d'assurer le traitement de demandes de lecture de taille inférieure au segment en parallèle sur plusieurs disques physiques. Lors d'écritures de taille inférieure à la taille des segments, le contrôleur doit mettre à jour les données de parité. Cette opération nécessite entre autre une lecture de l'ancienne parité suivie de l'écriture de la nouvelle parité (d'où des pertes de performance). Comme pour le RAID 3, l'élément limitant est le disque de parité (pour les mêmes raisons). En fait le RAID 4 est à mi-chemin entre le RAID 3 et le RAID 5 : il utilise un segmentation par blocs comme le RAID 5 (ce qui améliore les temps d'accès), mais utilise un disque dédié aux données de parité comme le RAID 3. C'est pour cela que le RAID 4 est finalement peu répandu, le RAID 3 ou le RAID 5 étant finalement plus populaires. Introduction raid.doc Page 8 05.06.2001

RAID 5. RAID 5. Le "disque de contrôle" est réparti entre tous les disques, ce qui élimine le goulet d'étranglement du RAID 4. Les disques travaillent tous autant. Si les disques sont compatibles "HotPlug", ce mode permet l'échange de disques à chaud. Il améliore la vitesse en lecture et en écriture. Ce mode correspond à l'agrégat par bandes avec parité sous NT4 Server. Le RAID 5 est le plus utilisé des niveaux de RAID. Les données sont divisées en paquets de la taille d'un cluster. Les disques de la matrice RAID 5 travaillent donc de façon asynchrone, (Qui n est pas synchronisé avec le reste du système.) et plutôt que d'utiliser un disque pour les données de parités, chaque disque en contient une partie. Il n'y a donc plus de goulet d'étranglement en ce qui concerne le disque de parité. Les performances en RAID 5 sont au final très élevées, égales à n-1 fois la vitesse d'un seul disque, où n est le nombre de disque de la matrice RAID 5. Comme pour le RAID 3 et 4, la capacité offerte par la matrice de disque est de n-1 fois la capacité d'un disque, où n est le nombre de disque (au moins égal à 3). En cas de panne d'un disque, il est possible de le changer, les données étant alors reconstruites à partir de celles des autres disques. Cette opération peut bien évidemment prendre un certain temps, pendant lequel les performances sont dégradées. A noter que pour le RAID 5, comme pour le RAID 3 et le RAID 4, le changement de disque dur à chaud (hot spare et hot plug) est possible, ce qui évite d'avoir à rebooter un serveur (la reconstruction des données démarre aussitôt le nouveau disque en place). Ici, la parité est répartie de manière égale entre les disques de l'ensemble. Les opérations d'écriture sont plus lentes qu'en niveau 3, mais la lecture est plus rapide. Introduction raid.doc Page 9 05.06.2001

Orthogonal RAID 5. Orthogonal RAID 5. C'est une technique logicielle créé par IBM. Ce mode est identique au RAID 5 mais utilise un contrôleur par disque comme en "duplexing". Le système ORTHOGONAL RAID 5 a été proposé par IBM. D autres niveaux ont été proposés par différents constructeurs de matériels informatiques. Le système proposé par IBM est basé sur une technique logicielle qui utilise un contrôleur par disque dur appartenant à une matrice. Le reste de la configuration est identique à une matrice RAID5. Ainsi, la matrice peut continuer à fonctionner malgré la panne d un disque (RAID5), mais aussi d un contrôleur de disque (un contrôleur par disque). Introduction raid.doc Page 10 05.06.2001

RAID 6. RAID 6. Il a la même organisation que le RAID 5 mais utilise 2 codes de redondance. Ce qui permet de continuer de fonctionner après la panne de 2 disques simultanés. Le RAID 6 est une évolution du RAID 5, qui offre une tolérance de panne encore accrue. Pour cela, il y a un calcul d'un deuxième code de redondance, ce qui permet au système de pouvoir résister à la panne de 2 disques à la fois. C'est pourquoi le RAID 6 convient parfaitement pour les applications critiques. L'espace disque réservé aux codes de redondances est donc égal à 2 disques de la matrice, ce qui augmente le coût de la solution. Autre inconvénient : les performances en écriture sont dégradées par rapport au RAID 5, car il faut écrire 2 codes de redondance au lieu d'un. Le RAID 6 est en fait très peu utilisé, le coût supplémentaire induit par cette solution étant assez prohibitif et ne se justifiant finalement pas vraiment : il est vraiment très rare que 2 disques d'une même matrice RAID tombent en panne simultanément, et si ce cas arrive, c'est qu'il y a plus sûrement un problème plus grave et c'est la matrice entière qui est en danger. Introduction raid.doc Page 11 05.06.2001

RAID 7. RAID 7 : Il met en jeu une carte microprocesseur fonctionnant sous un noyau tempsréel qui contrôle et calcule la parité, la gestion du cache ainsi que la surveillance des disques. Ce mode supporte la perte de plusieurs disques simultanément. Le RAID 7 est étudié pour offrir les meilleures performances (il annoncé comme étant de 1,5 à 6 fois plus rapide que n'importe lequel des autres niveaux de RAID). Pour cela, il met en jeu une carte microprocesseur fonctionnant sous un noyau temps-réel qui contrôle et calcule la parité, la gestion du cache ainsi que la surveillance des disques, et chaque disque est associé à un contrôleur SCSI. Comme pour le RAID 3, le RAID 7 utilise 1 disque pour les codes de parité, mais tous les disques travaillent de manière asynchrone, aussi bien en écriture qu'en lecture, contrairement au RAID 3. C'est principalement la gestion du cache sur plusieurs niveaux qui permet au RAID 7 de faire travailler les disques de manière asynchrone et d'augmenter les performances globales. Le RAID 7 n'est finalement ni plus ni moins qu'un RAID 3 asynchrone. Mais il faut savoir que le RAID 7 est un RAID propriétaire développé par Storage Computer Corporation, qui coûte très cher à mettre en oeuvre et qui est encore très peu répandu. Introduction raid.doc Page 12 05.06.2001

Les combinaisons de RAID simples. Comme nous venons de le voir, les RAID simples offrent chacun leurs avantages et leurs inconvénients, ce qui permet de trouver en théorie le RAID le mieux adapté pour le type d'application que l'on veut utiliser. Mais il existe aussi des combinaisons de ces niveaux de RAID qui offrent encore d'autres solutions spécifiques, en tirant avantages de plusieurs solutions RAID à la fois. Le RAID qui est le plus utilisé en combinaison est le RAID 0, pour ses performances inégalées. Combiné à du RAID 1, 3 ou 5, cela permet d'obtenir à la fois des performances très élevées et de la tolérance de panne. Le problème des RAIDs combinés, c'est que suivant le sens de la combinaison, le résultat n'est pas le même : Quand on parle de RAID 01, le RAID 0 est appliqué en premier et le RAID 1 en deuxième, et quand on parle de RAID 10, c'est l'inverse. Mais il est nécessaire d'être vigilant, car il arrive que des abus de langage se glisse dans certaines documentations, et que le RAID 10 soit appelé RAID 01 et inversement. Prudence donc! Pour illustrer la différence du sens d'implémentation des RAIDs, prenons l'exemple du RAID 01 et du RAID 10, avec une matrice de 10 disques : RAID 01 : on divise les disques en 2 groupes de 5, chaque groupe étant configuré en RAID 0. Puis on configure le RAID 1 entre les 2 groupes. RAID 10 : on divise les disques en 5 groupes de 2, chaque paire étant configurée en RAID 1. Puis on configure le RAID 0 avec les 5 paires. La véritable différence entre le sens d'implémentation des RAID est surtout au niveau de la tolérance de panne, les performances et le coût notamment restant identiques. En effet, reprenons l'exemple précédent : en RAID 01, si un disque tombe en panne, c'est toute un groupe qui est perdu, et on se retrouve avec un simple RAID 0 (avec une matrice de 5 disques). Si jamais un disque de cette matrice tombe lui aussi en panne, c'en est fini de vos données. Par contre, avec le RAID 10, si un disque tombe en panne, pas de problème, il y a juste une paire en RAID 1 qui fonctionne en mode dégradé. Si un deuxième disque tombe en panne, là encore pas de problème, sauf dans le cas où c'est celui de la paire dégradée. Mais cela diminue encore le taux de probabilité... C'est pourquoi le RAID 10 est considéré comme plus fiable et est donc plus utilisé. On peut ajouter que le temps de reconstruction (après une panne) est plus élevé pour le RAID 01 que pour le RAID 10, puisque pour le RAID 01 il faut reconstruire les données de 5 disques, alors que pour le RAID 10 il n'y a qu'un disque à reconstruire. A noter que les contrôleurs IDE Highpoint et Promise n'implémente pas le même RAID 0+1 : en fait le Promise fait du RAID 10 alors que le Highpoint ne fait que du RAID 01. Il existe principalement deux combinaisons de RAID qui sont utilisées, c'est pourquoi je ne détaillerais pas les autres. Introduction raid.doc Page 13 05.06.2001

RAID 10. RAID 10. C'est une combinaison entre l'agrégat et le miroir. Ce système est plus sûr et plus performant. Aussi appelé RAID 0 + 1. Ce système n'est pas recommandé pour un Serveur car il gère mal les accès disque simultanés. : C'est donc a combinaison du RAID 1 et du RAID 0 : Cela revient à faire du mirroring de disque en RAID 0. Ce RAID est le plus répandu des RAIDs combinés : il permet d'obtenir de très bonnes performances tout en offrant une tolérance de panne élevée (du même niveau que le RAID 1). Un autre avantage est qu'il n'y a pas de calcul de parité à effectuer, ce qui permet de ne pas perdre en terme de performance. Ce RAID a par contre le même inconvénient que le RAID 1, à savoir le coût de la mise en oeuvre (la moitié de l'espace disque est utilisée pour le mirroring, et donc "perdu"). Il nécessite 4 disques au minimum, ce qui peut poser un problème de coût, mais étant donné que le prix des disques durs ne cesse de baisser, cette solution devient plus facilement accessible. Introduction raid.doc Page 14 05.06.2001

RAID 53. RAID 53: Alors là, vous vous dites : "le RAID 53, c'est le RAID 5 plus le RAID 3". Et bien faux! Il y a un piège : le RAID 53 est en fait un RAID 03, donc l'association entre le RAID 0 et le RAID 3. Il se peut même que par abus le RAID 53 soit en fait implémenté comme un RAID 30. Je vous conseille donc de vérifier les spécifications du contrôleur utilisé dans le cas où vous voudriez mettre en place une solution de ce type. Le RAID 53 étant plutôt complexe, retenons juste que ce RAID permet d'obtenir des performances supérieures au RAID 3, mais pour un coût de mise en oeuvre plus élevé. RAID S. RAID S : Ce mode de RAID est presque identique au RAID 3 et comprends aussi un disque de contrôle de parité dédié. RAID H. Raid H : Ce mode RAID est encore à l'état de prototype. Introduction raid.doc Page 15 05.06.2001

JBOD Il existe une autre possibilité pour gérer plusieurs disques, qui n'est pas une sorte de RAID, mais qui s'en rapproche quand même un peu : le JBOD, pour "Just a Bunch Of Disks". Cette méthode consiste à rassembler plusieurs disques durs en une seule unité logique. Cela peut présenter un avantage certain dans le cas où l'on manipule de très gros fichiers par exemple. Par contre il n'offre aucun gain de performance et aucune tolérance de panne. Comparé au RAID 0, il n'y a qu'une situation où le JBOD peut être avantageux : avec 2 disques de capacité différente (par exemple 10 et 30 Go), faire du RAID 0 signifie perdre 20 Go sur le disque de 30 Go, alors que faire du JBOD permet d'utiliser tout l'espace disque disponible (soit 40 Go). Le JBOD nécessite aussi un contrôleur pour être mis en oeuvre. Mise en oeuvre Vous êtes maintenant incollables sur les différents types de RAID, mais comment implémente-t-on le RAID? Et bien il y a deux façons de mettre en oeuvre le RAID : soit par software, soit par hardware : Software : pour gérer le RAID en software, il faut que le système d'exploitation le propose. Windows NT et Windows 2000 intègrent la gestion des RAID 0, 1 et 5. C'est alors lui qui gère tous les aspects du RAID, segmentation des données et calcul des codes de parité. La partition sur laquelle se trouve le système d'exploitation ne peut évidemment pas bénéficier du RAID dans ce cas (ce qui implique donc l'ajout d'un disque dur à la machine juste pour booter). Hardware : c'est alors un contrôleur qui gère le RAID, qui est alors transparent pour le système d'exploitation. Il existe de nombreux type de contrôleurs, les prix variant beaucoup et pouvant devenir très élevés suivant la capacité et les performances proposées. Le choix du contrôleur RAID est très important et ne doit pas être sous estimé. A noter que le RAID hardware est celui qui est utilisé dans les configurations professionnelles. Le RAID hardware peut être implémenté de deux façons : o Carte contrôleur : c'est la solution le plus utilisée pour faire du RAID hardware. C'est une carte qui s'insère dans un port (généralement PCI 32 ou 64 bits) de la machine qui va utiliser le RAID. Les disques durs de la matrice RAID sont branchés sur cette carte contrôleur, au lieu d'utiliser les contrôleur SCSI ou IDE de la carte mère. C'est alors cette carte contrôleur qui gère les échanges entre le système et la matrice RAID. Il existe de plus en plus de cartes mères qui intègre un contrôleur RAID, qui fonctionne de la même façon (mais qui évite d'avoir à acheter une carte contrôleur RAID supplémentaire). o Contrôleur RAID externe : pour les solutions haut de gamme, le contrôleur RAID et les disques de la matrice RAID se situent dans Introduction raid.doc Page 16 05.06.2001

une tour externe. C'est alors du SCSI qui est utilisé. L'interface avec le reste du système passe par une carte SCSI située dans le PC (autrement dit un serveur à ce niveau là). Pour ce serveur et sa carte SCSI, la matrice RAID est totalement transparente et apparaît comme un gros disque dur externe. Pour un particulier, il existe des cartes contrôleur RAID IDE à des prix raisonnables, sinon les cartes mères avec contrôleur RAID IDE intégré sont aussi une solution peu coûteuse. Par contre, à ce prix là, seul les RAID 0, 1 et 01 (ou 10) sont possibles (mais ce sont aussi les RAID qui intéressent le plus les particuliers). Il faut savoir que le prix des cartes contrôleur haut de gamme SCSI peut excéder les 10000 FF! Et si vous voulez obtenir des performances élevées, il est bien sur préférable de choisir un solution hardware plutôt qu'une solution software, qui elle demande beaucoup de ressources à l'utilisation notamment du RAID 5. Le seul véritable avantage du RAID software, c'est son coût inférieur. Les désavantages sont quant à eux nombreux : performances inférieures (cycles CPU utilisés pour la gestion du RAID), la partition système ne peut pas faire partie du RAID, tous les niveaux de RAID ne sont pas accessibles, etc... RAID 0 RAID 1 Niveau Avantages Inconvénients Performances en Lecture / Ecriture. Performances en Lecture. Pas de tolérance des pannes. Perte d'espace disque de 50 %. RAID 3 Performances en Lecture / Ecriture. Nécessite l'utilisation d'un disque très solide pour le contrôle de parité RAID 5 Performances en Lecture / Ecriture. Possibilité de changer un disque défectueux à chaud. Dégradation des performances lors de la reconstitution du disque défectueux. Introduction raid.doc Page 17 05.06.2001

Conclusion Pour conclure, voici un petit récapitulatif sur les différents niveaux de RAID possible et leurs caractéristiques : RAID Nb de disque minimum. Espace disque disponible. Pourcentage d'espace disque utilisable. Tolérance de panne. Disponibilité. Performances en lecture. Performances en écriture. Coût. 0 2 N*T 100% Aucune 2 8 8 2 1 2 N*T/2 50% 8 8 6 6 4 3 3 (N-1)*T (N-1)/N 6 8 6 4 4 4 3 (N-1)*T (N-1)/N 6 8 8 4 4 5 3 (N-1)*T (N-1)/N 6 8 8 4 4 Type d'utilisation Traitement demandant une bande passante importante mais pour lequel la tolérance de panne n'est pas critique : traitement vidéo Stockage de données pour lesquelles la tolérance de panne est critique : données financières, petites bases de données Les mêmes applications que pour le RAID 0 (performances), mais pour lesquelles la tolérance de panne est aussi importante Très peu répandu, le RAID 3 ou le RAID 5 lui sont presque toujours préférés Le RAID 5 est la solution souvent vue comme la plus polyvalente (performance, tolérance de panne, espace disque utilisable), et souvent utilisée pour toutes sortes d'applications Introduction raid.doc Page 18 05.06.2001

6 4 (N-2)*T (N-2)/N 9 10 8 3 6 7 varaiable variable variable 6 8 9 8 10 10 (01) 53 (03) 4 N*T/2 50% 8 9 9 7 6 6 (N3-1)*(N0)*T (N3-1)/N3 7 8 8 5 8 Destiné aux applications utilisant du RAID 5 mais ayant besoin d'encore plus de tolérance de panne. Très peu répandu. Destiné aux applications nécessitant les meilleures performances possibles. Le RAID 10 est utilisé par des applications ayant besoin de meilleures performances que le RAID 5 (serveurs d'entreprise, base de données) Pas très répandu comme RAID, il est quelquefois utilisé pour des applications ayant besoin des performances du RAID 0 et de la tolérance de panne, comme des données multimédia importantes Introduction raid.doc Page 19 05.06.2001

Quelques explications sur ce tableau : Le RAID 2 n'est pas détaillé dans ce tableau, vu qu'il n'a aucun intérêt de nos jour. Les notes sont sur 10. Elles sont là justes à titre de comparaison, pour pouvoir plus facilement hiérarchiser les performances des niveaux de RAID entre eux. T est la taille du plus petit disque de la matrice RAID. N est le nombre de disque de la matrice RAID. Pour les RAID combinés, NX ou X est un chiffre est la dimension de la matrice RAID en RAID X (exemple : N0 est la dimension de la matrice en RAID 0). La colonne "pourcentage d'espace disque utilisable" est calculée Introduction raid.doc Page 20 05.06.2001