LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES



Documents pareils
Le e s tocka k ge g DAS,NAS,SAN

11 janvier 2006 NAS - SAN 1 / 42. Exposé - Nouvelles Technologies Réseau. Les solutions de stockage. NAS et SAN KOMAR MANCEL LE CAM

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Concepts et systèmes de stockage

Cours 13. RAID et SAN. 2004, Marc-André Léger

Consolidation de stockage

FAMILLE EMC RECOVERPOINT

NOTIONS DE RESEAUX INFORMATIQUES

CA ARCserve Backup Option NAS (Network Attached Storage) NDMP (Network Data Management Protocol)

Thomas Briet Ingenieurs 2000 Cyril Muhlenbach

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Network storage solutions

Easy as NAS Supplément Entreprises. Guide des solutions

Présentation Infrastructure DATACENTRE

Nouvelles stratégies et technologies de sauvegarde

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

La Continuité d Activité

Agenda. Exemple : données et back à Eurecom SANs and NAS. Les bases: SANs. Back-up Partage de fichier. Disques et Raid SCSI et FCP

Introduction. René J. Chevance

Stockage Réseau. Le stockage s'échappe du système pour devenir une fonction réseau

EMC DATA DOMAIN OPERATING SYSTEM

Pour les entreprises de taille moyenne. Descriptif Produit Oracle Real Application Clusters (RAC)

Exposé de réseau IR3 10/02/2003. Abdelwaheb DIDI Gilles SCALA Michael DIOT. Nouvelles technologies - SAN/NAS - 1/24

VMWare Infrastructure 3

CONSULTATION : (MAPA) MAT_INFO_2013_03 Marché à procédure adaptée (MAPA) MAT_INFO_2013_03

Unitt Zero Data Loss Service (ZDLS) La meilleure arme contre la perte de données

EMC DATA DOMAIN HYPERMAX

Sauvegarde : Supports de données et Infrastructures

Marché Public. Serveurs et Sauvegarde 2015

L unique SAN industriel proposant un stockage multiniveau automatisé (Automated Tiered Storage)

Système de Stockage Sécurisé et Distribué

Livre blanc Haute disponibilité sous Linux

Protection des données avec les solutions de stockage NETGEAR

Entrez dans l ère du Numérique Très Haut Débit

10 choses à savoir sur le 10 Gigabit Ethernet

Guide des solutions My First SAN. 2ème édition

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles

Table des matières. A - Introduction 13. B - Qu'est-ce que la virtualisation? 13

Immobilier de prestige, biens d exception, Tour d horizon. de stockage 48 // 49

Architectures d implémentation de Click&DECiDE NSI

CLOUD PRIVÉ EMC VSPEX Microsoft Windows Server 2012 R2 avec Hyper-V - Jusqu à machines virtuelles

Direction de l Innovation et des Systèmes d Information. Pôle Systèmes Informatiques CONSULTATION POUR L ÉVOLUTION DE L ARCHITECTURE DE SAUVEGARDES

Une présentation de HP et de MicroAge. 21 septembre 2010

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

ERP Service Negoce. Pré-requis CEGID Business version sur Plate-forme Windows. Mise à jour Novembre 2009

SYSTÈMES DE STOCKAGE AVEC DÉDUPLICATION EMC DATA DOMAIN

Le stockage unifié pour réduire les coûts et augmenter l'agilité

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

La continuité de service

Marché à procédure adaptée (en application de l article 28 du code des Marchés Publics)

Le data center moderne virtualisé

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

RESEAUX SAN iscsi VIRTUALISES :

Tout sur les Réseaux et Internet

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

APX Solution de Consolidation de Sauvegarde, restauration et Archivage

Cours n 12. Technologies WAN 2nd partie

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

VIRTUALISATION : MYTHES & RÉALITÉS

Consultation pour la virtualisation des serveurs informatiques. Règlement de la consultation et Cahier des charges

Concours interne d ingénieur des systèmes d information et de communication. «Session 2010» Meilleure copie "étude de cas architecture et systèmes"

Sauvegarde des données au LAAS

Plan du Travail. 2014/2015 Cours TIC - 1ère année MI 30

Définition. Caractéristiques. - Du partage des ressources : espace de stockage, imprimantes, lignes de communication.

et dépannage de PC Configuration Sophie Lange Guide de formation avec exercices pratiques Préparation à la certification A+

HP Simply Storage Consolidation

Technologie de déduplication de Barracuda Backup. Livre blanc

JRES 2007 Solution de stockage répartie sur les centres de recherche INRIA, à base de serveurs de fichiers de type «NAS»

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

L état de l ART. Évolution récente des technologies. Denis Szalkowski Formateur Consultant

Logiciel HP StorageWorks Enterprise Virtual Array (EVA) Fiche technique

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

Table des matières 1. Introduction. 1. Avant-propos Remerciements Chapitre 1 Virtualisation de serveurs

PageScope Suite L accélérateur de workflow * L essentiel de l image

Hébergement de base de données MySQL. Description du service (D après OGC - ITIL v3 - Service Design- Appendix F : Sample SLA and OLA)

Fiche technique RDS 2012

LES 5 PRINCIPALES RAISONS DE DÉPLOYER MICROSOFT SQL SERVER SUR LE SYSTÈME DE STOCKAGE UNIFIÉ EMC VNX

Automatisation de la découverte, de la surveillance et de l analyse des causes premières dans le datacenter virtualisé (VDC) EMC SERVER MANAGER

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

LIVRE BLANC. Guide des fonctionnalités. Aperçu des avantages et des fonctions.

Prestations de conseil en SRM (Storage Ressource Management)

Système de stockage sur disque IBM Storwize V5000

Migration des données Une histoire sans fin

SAN AoE (ATA over Ethernet)

LA VIDÉOSURVEILLANCE SANS FIL

Kick Off SCC 2015 Stockage Objet. Vers de nouveaux horizons

Fourniture d une solution complète destinée au stockage sécurisé de données scientifiques

Les hyperviseurs leaders du marché qui ont fait leurs preuves en production

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

Xsan Premiers contacts. Instructions pour la configuration de volumes partagés sur un réseau de stockage (SAN)

Les cinq raisons majeures pour déployer SDN (Software-Defined Networks) et NFV (Network Functions Virtualization)

Fiche produit FUJITSU ETERNUS DX200F Baie de stockage Flash

NiceLabel pour Services Microsoft Windows Terminal Serveur et Citrix MetaFrame

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

VMware vsphere 5 au sein du Datacenter Complément vidéo : La configuration et la sécurisation de l'esx

Plan de reprise d activité PRA - PCA Informatique

Transcription:

LE SAN ET LE NAS : LE RESEAU AU SERVICE DES DONNEES Marie GALEZ, galez@cines.fr Le propos de cet article est de présenter les architectures NAS et SAN, qui offrent de nouvelles perspectives pour le partage des fichiers et la gestion globale des données en milieu hétérogène. Les configurations informatiques classiques organisées autour des serveurs imposent rapidement leurs limites. Parallèlement, les demandes augmentent très rapidement, liées à l accroissement des volumes à traiter et aux débits grandissants de réseaux. Les architectures SAN et NAS tentent de répondent aux aspects suivants : - performance - sécurité et intégrité - souplesse de gestion - économie 1. l architecture classique Le modèle classique couramment mis en place dans les organisations informatiques est né de l assemblage d un nombre de serveurs et machines personnelles connectées par le réseau. Des postes de travail individuels ont trouvé grâce à la connexion sur le réseau, la possibilité de mettre en place réaliser l échange de données et le travail coopératif. Un tel réseau est représenté par la fig 1. Le réseau s est étendu, mais les principes qui régissent les échanges de données restent identiques. Les données sont stockées sur disque dur, l accès à ces données est piloté par le serveur local. Les partages ou échanges de données entre les machines, est basé sur un protocole client/serveur (NFS ou FTP). Sollicité par un client, le serveur est le passage obligé de tous les flux concernant ses espaces disques locaux. Le débit du réseau devient rapidement un point sensible de l architecture, mais ce n est pas le seul. Le protocole SCSI(Small Computer Systems Interface) limite le nombre de périphériques connectés, les performances de la machine hote et les applications hébergées ont un impact direct sur les performances des entrées/sorties. Une panne de la machine, entraîne l indisponibilité des données. On peut aussi ajouter que cette topologie, en favorisant le morcellement des espaces, rend difficiles les évolutions (en volume ou en débit). Cette architecture a tendance à être limitée aux configurations de taille réduite 1.1 le serveur de fichier Fig. 1 L évolution naturelle de la topologie précédente est le serveur de fichiers. Elle consiste à dédier un gros serveur aux fonctions de stockage. Les aspects spécifiques sont développés sur ce serveur pour une meilleure efficacité et un meilleur service. Fig. 2 103

Dans schéma, chaque machine réserve la totalité de ses ressources aux applicatifs qu elle héberge. La fonction de gestion de données, centrée sur un tel serveur, permet une économie de moyens, (matériels et humains) et un service plus souple et plus efficace. On doit veiller cependant soigner particulièrement les aspects débits réseaux,.. Dans cette configuration, on tire les avantages classiques d une solution centralisée : Une réponse efficace à l augmentation des besoins en espace disque Mise en place plus avisée de la sécurité Intégration de matériels fiables ( comme des éléments matériels redondants, la technologie RAID(.Redundant Array of Independant Disks.) Le partage des données est aisé Cependant, du choix de la configuration dépendront directement les performances des entrées/sorties, les possibilités d extension, la sécurité des données. Des moyens matériels appropriés doivent etre intégrés afin d assurer la meilleure disponibilité des données, le serveur devient un point central de l architecture, indispensable à la bonne marche des applications. 2. Du serveur de fichiers au NAS Le NAS (Network Attached Storage) est une forme condensée du serveur de fichiers. L ensemble disques et serveur est proposé comme une «boîte noire». Il dispose d une adresse sur le réseau. Il supporte un ou plusieurs protocoles réseau (TCP/IP, IPX,Appletalk..) et héberge les fonctions «serveur» de protocoles de partage de fichiers qui sont implantés dans le NAS. Ces protocoles sont généralement FTP, NFS, CIFS. Fig. 3 Les équipements NAS, très proches des serveurs de fichiers dans le principe, présentent les memes avantages. En outre, ces machines spécialisées, affichent d excellentes performances, une sécurité accrue et une souplesse d administration. 2.1 Description du mécanisme de sauvegardes Le mécanisme de sauvegardes classique client-serveur a montré rapidement les limites liées à l architecture. On peut noter les inconvénients suivants : - performances liées aux performances du serveur de sauvegardes. - Nécessité de dimensionner le réseau en fonction du flux des sauvegardes - fenêtre de sauvegarde étroitement dépendante de tous les paramètres précédents L équilibre de l ensemble peut être remis en cause par l évolution d un des acteurs de la configuration (volumétrie d une client, activité réseau plus intense). Le serveur de sauvegardes s il est dédié à cette fonction est sous utilisé en période diurne. Pour sortir de cette impasse, il est indispensable que les données puissent être sauvegardées «localement» sans transfert réseau. Dans le cas d un serveur de fichiers, la solution est d implanter le serveur de sauvegardes sur la même machine, et de lui affecter les dérouleurs ou la robotique). Les transferts deviennent locaux. Dans le cas d un serveur NAS, il est souvent possible de mettre en place le «lan free backup». 104

Fig. 4 Le principe est le suivant : Dans un premier temps, la sauvegarde est initialisée par un dialogue entre le client et le serveur de sauvegardes. La copie des données se fait ensuite, localement sur le client qui a des dérouleurs locaux. C est le protocole NDMP(Network Data Management protocolprotocol) qui est mis en jeu. Les principaux logiciels de sauvegarde et équipements NAS, sont compatibles avec ce protocole. Fig. 5 Le protocole NDMP (Network Data Management Protocol) est une initiative qui tente d atteindre l inter-opérabilité maximale pour les sauvegardes des NAS. L objectif étant d offrir une interface commune pour les logiciels de sauvegarde en milieu hétérogène (machines et logiciels de sauvegarde). Les équipements NAS disposent ainsi d une interface commune. Un serveur NDMP répond à deux fonctionnalités : - le serveur disque : réalise la lecture de données depuis le disque et produit un flot NDMP, ou inversement écrit des données sur disque depuis un flot NDMP - le serveur bande : écrit des données sur bande à partir d un flot NDMP, ou bien lit des données bandes pour produire un flot NDMP. Une solution mixte (sauvegarde réseau et sauvegarde locale pour le NAS) est souvent mise en place. La version 3 est généralement proposée par les éditeurs de logiciels et les fournisseurs de disques ou bandes. NDMP peut devenir le standard de sauvegardes pour les réseaux locaux, les SAN et les NAS. Les spécifications de la V4 ont pour objectif de traiter le cas des SAN et la fonction copie éclair snapshot. La copie éclair des données est réalisée en cours de fonctionnement de l application, sur un disque réservé à cet effet. La sauvegarde est ensuite réalisée à partir de la copie. Les modifications éventuelles touchant les données sont prises en compte et intégrées à la copie sur média magnétique. Un autre interet de cette copie éclair est la fourniture instantanée de jeux de données pour des tests applicatifs. 3. Le SAN L architecture SAN (Storage Area Network) est apparue il y a quelques années. Elle avait pour objectif d offrir une réponse différente (augmentation des performances des serveurs, augmentation des débits réseaux) aux problèmes de l explosion de la volumétrie des données. 105

Cette architecture est basée sur la constitution d un réseau performant dédié aux entrées/sorties avec les périphériques de stockage. Ce réseau est totalement indépendant du réseau classique. Les données sur disques ou bandes sont accessibles via le réseau dédié, déchargeant ainsi le réseau local. Fig. 6 Comment est constitué le réseau SAN? Le réseau SAN est basé sur le protocole Fibre Channel (FC). Le SAN est un réseau sur lequel sont connectés des serveurs et des périphériques de stockage. Chaque serveur peut accéder à chaque périphérique. La majorité des SAN sont basés sur un réseau de transport en fibre optique, mais on peut aussi utiliser le cuivre. Les standards FC définissent une architecture en couches FC0-FC4. Les couches FC0 et FC1 transportent les données, FC4 établit l interface entre FC et les applications. Le protocole utilisé pour le transfert des données est le SCSI série (SCSI-3). L implantation actuelle autorise des débits de 100Mo/s, des distances jusqu à 10 km, et des centaines (voire des millions suivant la topologie) de périphériques sur un même réseau. 3 topologies ont été définies : 3.1 La topologie «point à point» C est la topologie la plus simple qui relie 2 entités. Dans ce cas se sont un serveur et une unité de disques. Les 2 entités ainsi reliées disposent de la totalité de la bande passante. Fig. 7 Les configurations «point-à-pointpoint à point» sont souvent les plus anciennes. Le protocole était alors limité à 25Mo/s à cause des performances des serveurs et des disques. Les configurations point à point sont encore tout à fait adaptées à des environnements simples, bien que l augmentation des débits, et le développement des switchs FC aient favorisé l émergence des deux autres topologies. 3.2 La boucle arbitrée Topologie point à point 100Mo/s dans chaque sens C est la topologie la plus fréquente. Elle est moins limitée que la topologie «point-à-pointpoint à point», et moins onéreuse que la topologie «Fabric». Fig. 8 Topologie en boucle 106

Les premières boucles ont été réalisées comme l indique la figure 8. Si un composant est défaillant, la boucle est cassée et lescomposants de la boucle sont hors circuit. Les boucles sont actuellement réalisées à l aide d un hub qui réalise une topologie en étoile pour une configuration en boucle. Ceci permet de mettre hors circuit un élément défaillant sans casser la boucle. Fig. 9 Cette topologie est assezsouple. Elle permet la connexion de 126 périphériques. Elle estrelativement peu coûteuse, mais impose le partage de bande passante. 3.3 La topologie «fabric» Topologie en boucle configuration en étoile Dans une telle configuration, les éléments du SAN sont reliés entre eux par un ou plusieurs switch. Dans ce cas, chaque port a un débit de 100Mo/s. Fig. 10 Chaque serveur accède aux données stockées sur le disque. Il peut également accéder aux lecteurs de bandes. On peut aussi réaliser des combinaisons de ces configurations : des topologies fabric en connectant plusieurs switchs en cascade et des boucles arbitrées sur une ossature fabric. Quels avantages immédiats peut-on attendre d un SAN? - un réel désencombrement du lan - des performances importantes On considère sur un SAN, plusieurs niveaux de fonctionnalités : - partage d unités magnétiques : chaque lecteur magnétique est visible depuis chacun des serveurs du SAN. L unité est affectée temporairement à un serveur. Aucune intervention n est nécessaire sur le matériel. L arbitrage pour accéder à l unité est nécessaire, il est réalisé par une des machines du SAN (par exemple par l intermédiaire d un logiciel gestionnaire de sauvegardes). Ce mécanisme permet à chaque serveur du SAN, de faire des copies locales de données sur bandes, exactement comme sur un lecteur SCSI. La mutualisation des lecteurs permet une économie importante : la réduction du nombre total de lecteurs, possibilité de redondance en cas de panne d un lecteur et permet à budget égal l acquisition de lecteurs plus performants. Ces éléments contribuent à de meilleures performances et à un service de qualité. - la consolidation des données : il s agit de rassembler sur une seule baie disque, une multitude d espaces disques locaux répartis sur de nombreux serveurs. Il y a, sur cet aspect, un point commun avec le NAS, même si les méthodes d accès sont différentes. L avantage immédiat est d apporter une grande souplesse de gestion à l allocation dynamique d espace et d induire une réduction des coûts. On peut cependant craindre qu une architecture centralisée introduise une faiblesse ; c est pour cette raison que les fournisseurs de SAN se sont attachés à sécuriser leurs produits. Les baies disques proposent les architectures RAID avec disque de secours. Les alimentations et les accès sont doublés pour éviter les points de défaillance. - La «virtualisation» (zoning) permet d organiser des sous réseaux virtuels dans le SAN. Les composants de la zone sont des nœuds (serveurs, systèmes de stockage, disques ou bandes). Chaque zone est logiquement isolée des autres 107

et garantit une étanchéité des transferts. On peut également utiliser le zoning pour garantir des canaux d accès à une application, donc ses performances. Un nœud peut appartenir à plusieurs zones (par exemple les bandes). Le zoning est réalisé par le paramétrage des commutateurs ou par un logiciel de supervision du SAN). A un niveau plus fin, certains proposent également de gérer les LUN pour former des volumes logiques. - Le partage de fichiers : c est le niveau ultime de partage de données sur un SAN. Cette fonctionnalité est offerte par certains éditeurs de logiciels sur SAN. Elle consiste en l implémentation de protocoles de fichiers répartis (comparables à NFS ou CIFS) ou de systèmes de fichiers de grappe. Dans ce cas, le transfert des métadonnéesméta données s effectue sur le lan, tandis que les accès aux données sont réalisés directement par le SAN. Un des nœuds serveurs joue le rôle de serveur de métadonnées où il assure la cohérence des accès aux fichiers. Dans un système de fichiers partagé, plusieurs machines clients peuvent accéder simultanément sur le même disque, et plusieurs utilisateurs sur des machines différentes peuvent accéder à un même fichier. Une telle configuration permet d atteindre des objectifs de disponibilité et de performance. Les données étant accessibles depuis plusieurs machines, les flots de traitements sont répartis sur toutes ces machines, pour équilibrer les charges et offrir une puissance globale accrue. En cas de défaillance d un élément du SAN, les fonctionnalités sont toujours disponibles. Si le serveur de métadonnées est en panne, la fonction est reprise par une autre composant du cluster. Le SAN semble offrir une large panoplie de fonctionnalités. Il faut cependant rester prudent car aujourd hui le manque de standardisation a pour conséquence une difficile interopérabilité entre matériels hétérogènes. De nombreux constructeurs et éditeurs de logiciels sont désireux de répondre à la nouvelle demande, mais ont des difficultés à harmoniser les produits. Il semble indispensable d obtenir d un fournisseur la validation globale d une solution SAN avant de s engager ou de faire une maquette préalable. 3.4 Les évolutions futures : Le marché du SAN est en pleine expansion. On peut s attendre à des évolutions dans 3 domaines : - l interopérabilité qui fait défaut actuellement, surtout pour les fonctions avancées. Elle est un passage obligé pour le développement des solutions SAN. le développement de logiciels de supervision de SAN, et l interaction avec les logiciels de gestion de réseau. - l augmentation du débit FC à 200 Mo/s et 400 Mo/s. 4. En conclusion Dans la plupart des infrastructures informatiques aujourd hui, l explosion des volumes de données pose un réel problème, dont la solution doit être étudiée de façon globale. Les solutions NAS ou SAN ouvrent des perspectives nouvelles et font du réseau un acteur prépondérant dans le service des données. Mais stocker un volume important n est pas la seule question. Le réel enjeu se situe au niveau des services associés à ces données : les temps de réponse, la disponibilité et la sécurité. L architecture NAS, proche du concept de serveur de fichiers, s intègre sans bouleversement dans une configuration existante, même de petite taille. Les serveurs NAS se démocratisent ; leur succès réside dans leur souplesse d utilisation et leur faible coût. L architecture SAN impose une transformation du réseau. Le manque d interopérabilité et les coutscoûts encore élevés sont encore un frein à l installation de solutions SAN à grande échelle. Cependant, ses attrayantes possibilités devraient permettre au marche du SAN de se développer dans les années futures. 108

Quelques références : Designing Storage Area Networks Tom CLARK (ADDISON WESLEY) Logiciels de stockage de données Guy CHESNOT (VUIBERT) Et quelques références sur : www.backupcentral.com Solutions NAS : - AUSPEX : www.auspex.com - METASTOR : www.metastor.com - NETWORK APPLIANCE : www.netapp.com - HP : www.hp.com Solutions SAN : - BROCADE :www.brocade.com - STORAGETEK : www.storagetek.com - COMPAC : www.compac.com - EMC : www.emc.com Logiciels de sauvegarde : www.quadratec.fr www.veritas.com www.legato.com Divers : www.ndmp.org 109