Concepts et systèmes de stockage Francesco Termine, professeur HES, francesco.termine@he-arc.ch 1
Plan Gestion de volumes de stockage Systèmes RAID DAS SAS Concepts Technologies actuelles NAS Concepts Technologies actuelles SAN Concepts Technologies actuelles Synthèse 2
Gestion de volumes de stockage Stockage de l information stockage d'information est l'enregistrement de l'information sur un support matériel pour sa réutilisation future Méthode de stockage dépend, la fréquence d'utilisation de l'information ; la criticité de l'information ; la pérennité de l'information ; la confidentialité de l'information ; le volume d'information à stocker ; le temps alloué au processus de stockage ; et son coût. => ILM (Information Life cycle Management) 3
Gestion de volumes de stockage Stockage de masse Persistance sur le long terme En septembre 2008, le gigaoctet en SSD coûte au minimum 3 (en moyenne plutôt 5 et jusqu'à 15 ) contre 0,08 à 0,15 pour un disque dur. 1 ère génération : Carte et ruban perforé..obsolètes en 2009. 2 ème génération : la bande magnétique, sa petite sœur la cassette, le disque dur, la disquette. Les bandes magnétiques ne sont plus utilisées que pour la sauvegarde ou l'archivage des données (ex. LTO). un support privilégiédesauvegardeetd'archivagedesdonnées en raison de leur très grande capacité et de leur caractère amovible qui permettent de les délocaliser aisément. (en 2008, 200 GB/bandes). 3 ème génération: les supports optiques, CD (CD-R ou CD-RW), le DVD (DVD-Rom ou DVD-RW -> 8gb/dc) ou le Blu-ray (-> 50gB/dc). 4 ème génération : SSD et Internet 4
Gestion de volumes de stockage Volumétrie et fiabilité des supports inflation du volume d'information, ne peut que croitre! problématique des entreprises en termes de coût (il consomme actuellement une grande partie du budget informatique) et de gestion des données stockées (où les conserver et comment les réutiliser). tous les supports de stockage ont une durée de vie limitée! Pour s'en affranchir, il faut constamment les vérifier et recopier les données sur des supports fiables Catégoriser l information et la stocker sur un support adapté Avec l'utilisation des nanotechnologies, la capacité de stockage informatique n'est pas un problème à l'horizon 2020; par exemple, il suffit de placer les zéros sur des carbones 12 et les uns sur des isotopes 13. Par ailleurs, 2 terabytes suffisent à mémoriser tous les textes, images et sons utilisés en moyenne annuellement par un être humain. src: wikipedia 5
Gestion de volumes de stockage Stockage et accès depuis une machine Disques durs pour stockage persistants Systèmes de fichiers Accès via une arborescence Extension dynamique des espaces logiques Point d entrée dans l arborescence 6
Systèmes RAID BUT Matrice redondante de disques indépendants Utilisation d une batterie de disques généralement de même capacité Les combiner pour offrir une meilleure sécurité (fiabilité) et/ou une meilleure performance Eviter les temps de backup et de restauration Pouvoir remplacer «à chaud» un disque défectueux Améliorer les débits d écriture/lecture Mécanisme basé Code Correcteur d erreur (calcul de parité) Redondance 7
Systèmes RAID RAID 0 n disques Travail de n disques durs en parallèle pour améliorer le débit la perte d'un seul disque entraîne la perte de toutes les données Le RAID 0 n'apportant pas de redondance, tout l'espace disque disponible est utile. 8
Systèmes RAID RAID 1 n disques La capacité totale est égale à celle du plus petit élément de la grappe accepte une défaillance de n 1 éléments Cout directement proportionnels au nombre de miroirs utilisés 9
Systèmes RAID RAID 5 RAID 5 ne supporte la perte que d'un seul disque à la fois. Capacité de stockage réelle : (n-1) * capacité performances en lecture aussi élevées qu'en RAID 0 et sécurité accrue pénalité en écriture du fait du calcul de la parité 10
Systèmes RAID COMBINAISON RAID 0+1 et RAID 1+0 RAID 01: un disque défectueux entraîne le défaut de toute une grappe -> fiabilité moyenne il faut au minimum 4 unités de stockage pour créer un volume RAID0+1 ou 1+0. RAID10 :tous les éléments d'une grappe soient défectueux pour entraîner un défaut global ->fiabilité assez grande 11
Systèmes RAID COMBINAISON RAID 5+1 Chaque grappe contenant au minimum 3 disques, et un minimum de 2 grappes étant nécessaire, il faut au minimum 6 unités de stockage pour créer un volume RAID51 12
Systèmes RAID Implémentation de systèmes RAID RAID logiciel Logiciel spécifique qui gère les contrôleurs disques «classiques» via les pilotes standards pour émuler un système RAID + : peu onéreux, voir gratuit - : lent, monopolise des ressources CPU, RAM, FSB RAID pseudo-matériels Contrôleur disques avec fonctions avancées géré par le pilote ad-hoc + : un peu plus rapide que RAID logiciel - : solution propriétaire RAID matériels Contrôleur matériel + mémoire + cpu dédié. + : sysex «ne voit pas» la gestion raid - : solution la plus chère, crash contrôleur! 13
Systèmes RAID Synthèse Nombreuses variantes et combinaisons possibles RAID 50 + 05 RAID 5DP (dual parity) RAID 6 (perte de 2 disques simultanés tolérés) Systèmes RAID propriétaires (RAID 1,5 /RAID-Z) Baie de disques (matériel) Hotspare (remplacement automatique du disque défaillant par un disque dormant) Ne protège pas totalement des défaillances matérielles (éventualité de pannes successives de plusieurs disques). Ne protège pas les données des erreurs humaines (suppression accidentelle de fichiers). Ne protège pas des risques extérieurs au système (surcharge électrique, incendie, vol, inondation, vandalisme). Ne protège pas des virus et des spywares qui pourraient corrompre les données. 14
DAS-SAS Technologies actuelles Direct Attached Storage, Server Attached Storage Liaison (bus) directe et courte entre le traitement et le périphérique de stockage de données Débit et connectiques IDE [PATA] (133 Mo/S) SATA (600 Mo/s, 2009, p-a-p) esata (external SATA sur 2 mètres) SCSI (640 Mo/S 16 périphériques) SAS [Serial Attached SCSI] (300 Mo/s, 16 000 périph) Types de disques HDD (temps d accès 7-20 ms) -> ~150Mo/s SSD (temps d accès 0,2-0,7 ms) -> ~240 Mo/s HDD hybride (cache SSD) http://en.wikipedia.org/wiki/list_of_device_bandwidths#storage 15
DAS-SAS Pistes, plateaux disques durs magnétiques 16
Importance du temps d accès pour un fichier réparti sur 1000 pistes DAS-SAS Défragmenter et Favoriser les grands disques 17
NAS FreeNAS OpenFiler Network Attached Storage Centralisé le stockage de données Sur un ou plusieurs serveurs Utilisation du réseau local (LAN) Débit et connectiques Ethernet 100Mb/s et 10Gb/s WIFI 300 Mb/s Protocole TCP/IP niveau 4 (Applications) Applications réseaux NFS SMB CIFS FTP WebDav AFS 18
NAS schéma Src: www.usr.com/images/products/8700/8700-diagram.png 19
SAN Storage Area Network Centralisé le stockage dans un réseau dédié Sur une ou plusieurs baies de disques Utilisation d un réseau spécialisé (SAN-Fabric) Débit et connectiques Fibre Channel (FC), 8Gbit/s Fibre Channel over Ethernet (FCoE) iscsi (SCSI sur TCP/IP) 20
SAN Schéma SAN 21
SAN et NAS Backup du SAN et et du NAS BACKUP Src: http://www.raidinc.com/images/san-nas-fusion.jpg 22
NAS vs SAN 23
Avantages SAN vs NAS Avantages du stockage NAS Facilité d'installation Allégement de votre serveur réseau Simplification du partage de données Avantages du SAN Consolidation des informations Accélération de l'extraction des données Simplification des sauvegardes et restaurations Évolutivité exceptionnelle 24
Comment se décider SAN ou NAS? Sécurité Fonctions de redondances et d alertes Temps d'accès SAN -> accès blocs NAS -> accès fichiers Interopérabilité Plus flexible NAS Interopérabilité SAN plus complexe Gestion NAS «abordable» SAN «très spécialisé» Prix ~15 000 CHF entrée de gamme à bcp plus 25
Réplication au niveau du SAN http://www.bit.lv/images/storage_shema.gif 26