Etude de systèmes de stockage et de sauvegardes et détermination d une solution pour la M2L PPE2 : Appel à consultation GROUPE : TiLuBenj Thierry Gaiola Lucien Devars Du Mayne Benjamin Cohen SUIVI PAR : Mohammed Karroum EPSI Paris BTS SIO 2015 / 2017
CONTEXTE Constatant que les organisations hébergées n'ont pas de sauvegardes suffisamment efficaces de leurs données de gestion, la direction de la M2L demande une étude sur la mise en place d'une solution de sauvegarde sécurisée des données. Chargée de l administration du réseau et de la plus grande partie du parc informatique, M2L se doit de fournir des services de protection des données et des accès à ces données. On rappelle que l association M2L exploite l infrastructure informatique et réseau qui comprend l administration des services de stockage des données en général y compris celles de ses clients. Dans cette prestation nous devons réaliser un document d analyse de différentes solutions de stockage et leurs caractéristiques techniques (stockage local, hébergé, modes de sécurisation etc ). Nous choisirons une solution parmi celles que nous aurons analysées en justifiant ces choix par une argumentation technique détaillée. On s intéresse également au prix de revient de la solution. Afin d aider le Direction dans sa décision notamment sur ce critère, il est nécessaire de comparer les coûts des différentes solutions de stockage étudiées.
SOMMAIRE Les types de sauvegarde 1) Raid 0 2) Raid 1 3) Raid 5 Les types de stockage 1) NAS 2) SAN 3) DAS 4) Serveur dédié 5) Cloud
I) Les types de sauvegardes La technologie RAID (acronyme de Redundant Array of Inexpensive Disks, parfois Redundant Array of Independent Disks, traduisez Ensemble redondant de disques indépendants) permet de constituer une unité de stockage à partir de plusieurs disques durs. L'unité ainsi créée (appelée grappe) a donc une grande tolérance aux pannes (haute disponibilité), ou bien une plus grande capacité/vitesse d'écriture. La répartition des données sur plusieurs disques durs permet donc d'en augmenter la sécurité et de fiabiliser les services associés. a. RAID 0 Permet de combiner tous les disques durs pour ne former qu un disque virtuel. La taille est alors égale au nombre de disques, constituant la grappe RAID 0, multiplié par la plus petite capacité de stockage. Il est donc préférable d utiliser des disques de même taille, afin d éviter toute perte en capacité de stockage. Prenons par exemple, trois disques durs de respectivement 120, 160 et 250 Gigaoctets, pour former une grappe RAID 0. Nous obtiendrons un disque virtuel de 3 x 120 Go, soit 360 Go. La perte est donc de 170 Go. b. RAID 1 Il nécessite uniquement deux disques et permet de sécuriser ses données en effectuant une copie conforme du premier disque vers le second (d où le nom mirroring), de façon transparente. Les performances en lecture sont sensiblement meilleures qu un seul disque (bien qu elles dépendent également du contrôleur RAID utilisé), et l on obtient une meilleure tolérance aux pannes. Car si un des disques venait à tomber subitement en panne, le système continuera de fonctionner, l intégralité des données se trouvant sur chaque disque. Il suffit alors de remplacer le disque défectueux pour rétablir la grappe RAID 1. En contrepartie, le coût d un tel système est assez élevé puisqu on «sacrifie» un disque entier pour bénéficier d une plus grande fiabilité pour les données. Si vous choisissez, par exemple, de constituer une grappe RAID 1 à l aide de deux disques de 320 Go, la taille de votre disque virtuel ne sera que de 320 Go. Et là encore, afin d éviter de perdre plus d espace disque, il est préférable d utiliser deux disques de même taille.
c. RAID 5 Combine performances disques et fiabilité des données. Trois disques au minimum requis. Les données sont segmentées, puis réparties entre les disques avec en plus une information de parité pour chaque donnée. Ce qui permettra en cas de panne de régénérer le disque après remplacement. La capacité totale est équivalente au nombre de disques 1 multiplié par la plus petite taille des disques de la grappe. Soit une capacité de 640 Go, si l on prend l exemple d une grappe RAID 5 constitué de trois disques de 320 Go. D ailleurs, plus on utilise de disques, plus la perte de capacité de stockage diminue. Ce qui rend le RAID 5 plus intéressant et moins coûteux que le RAID 1.
II) Les types de stockage a. Stockage NAS Un serveur de stockage en réseau, également appelé stockage en réseau NAS, boîtier de stockage en réseau ou plus simplement NAS (de l'anglais Network Attached Storage), est un serveur de fichiers autonome, relié à un réseau dont la principale fonction est le stockage de données en un volume centralisé pour des clients réseau hétérogènes. Utilisation : - Serveur de stockage directement attaché au réseau IP fournissant un service de partage de fichiers aux clients /serveurs d un environnement hétérogène. - Serveur gonflé (Redondance à tous les niveaux : carte mère, alimentation et ventilateur doublés). - Os spécifique. - Utilise un protocole de transport de fichier pour fournir les données aux clients (FTP, ) Avantages : - Facile à mettre en place - Spécialement adapté au partage de fichier - Partage multi-environnement lié aux différentes implémentations du protocole (NFS, CIFS ) que l on utilise - Faciliter la gestion des sauvegardes des données d'un réseau ; - Prix intéressant des disques de grande capacité par rapport à l'achat de disques en grand nombre sur chaque serveur du réseau. - Accès par plusieurs postes clients aux mêmes données stockées sur le NAS ; - Réduction du temps d'administration des postes clients en gestion d'espace disques. Inconvénients : - Déconseillé avec des applications demandant de grosses performances disques. - Demande des ressources CPU. Synology NAS DS416J Nombre de baies : Boitier 4 baies Capacité (totale) : Livré sans disque (boitier nu) Format de baie : Pour disque 2,5" ou 3,5" Interface disque : SATA III Processeur : Marvell Armada 388 à 1,3 GHz (Dual-Core) Mémoire vive : 512 Mo Prix : 319,99
b. SAN Le réseau SAN fait référence à une architecture. Ce dernier est son propre réseau, puisqu'il connecte l'ensemble des unités de stockage et des serveurs. Le SAN est un réseau dédié au stockage attaché aux réseaux de communication de l'entreprise. Les ordinateurs ayant accès au SAN possèdent donc une interface réseau spécifique reliée au SAN, en plus de leur interface réseau traditionnelle. Le réseau SAN permet de résoudre les problèmes de connectivité entre plusieurs serveurs et unités de stockage. Il fournit en outre de nouvelles solutions en matière de stockage, telles que le regroupement de disques et de bandes, le partage de données hétérogènes, ainsi que la sauvegarde et la restauration de données hors réseau/sans serveur. Ce réseau secondaire soulage le réseau principal des charges induites par le transfert massif de données, dans la mesure où le trafic de sauvegarde s'effectue uniquement entre les unités de stockage au sein du réseau SAN. Avantages : - Accélération de l extraction, possibilité de partager des données sans sacrifier les performances du réseau ; - Simplification des sauvegardes et restaurations ; - Evolutivité simple, indépendant du réseau internet ; - Sécurité. Inconvénients : - Prix très élevé car il s agit d une architecture complète ; - Mise en place d un second réseau nécessaire. Prix : 2837,67 Description du produit Type de périphérique Type de châssis Capacité maximale Périphériques installés / Nombre de modules Lecteurs pris en charge Dimensions (LxPxH) Disque dur Alimentation Poids Alimentation redondante HPE Storage Works Disk Enclosure D2700 - boîtier de stockage Boîtier de stockage Montage en rack - 2U 15 To 0 (installé) / 25 (maximum) SATA-300 / SAS-2 45 cm x 56.7 cm x 8.8 cm 0 HDD - échangeable à chaud CA 120/230 V - 50/60 Hz 17.2KG Oui
c. DAS L appellation Direct-Attached Storage (DAS ou disque en attachement direct) décrit un type de périphérique de stockage relié directement à un ordinateur et non accessible à d autres ordinateurs. L exemple le plus typique d un stockage DAS est le disque dur interne d un ordinateur ou d un serveur. d. Serveur dédié Un serveur dédié est un ordinateur mis à disposition par un fournisseur. Le client dispose sur un serveur dédié de l ensemble de la machine. Un serveur dédié est localisé géographiquement dans un et dispose de connections au réseau internet qui lui permettent d échanger des données sur le web. Avantages : - Flexibilité ; - Evolutivité de l offre. Inconvénients : - Engendre un coût mensuel ; - La machine est située dans un Datacenter, pose des questions sur la confidentialité. Exemple : FS-30T Processeur : Intel Xeon D-1520-4 cœurs 2,4 GHz/2,7 GHz RAM: 32Go DDR4 ECC 2133 MHz SoftRaid 5x6To 500 Mbps bande passante vrack : 1 Gbp Un serveur pour l archivage, la sauvegarde, ou le stockage distribué. Réseau privé vrack, jusqu à 216 To d espace disque. Prix : 139,99 HT/mois
e. Cloud Technologie qui permet de mettre sur des serveurs localisés à distance des données de stockage ou des logiciels qui sont habituellement stockés sur l'ordinateur d'un utilisateur, voire sur des serveurs installés en réseau local au sein d'une entreprise. Avantages : - Gestion de l installation et de la configuration par un tiers ; - Evolutivité. Inconvénients : - Engendre un coût mensuel ; - Risque de fuite des données. Service gratuit Service payant Dropbox SkyDrive Google Drive Box Oui (2 à 18Go) Oui (7Go) Oui (5Go) Oui (5Go) 100Go (99$/an) 200Go (199$/an) 500Go (499$/an) +20Go (8 /an) +50Go (19 /an) +100Go (37 /an) Windows / MacOs / Linux / Windows / Mac OS Android / iphone / ipad / / Windows Phone / Disponibilité BlackBerry / Kindle Fire / iphone / ipad / Windows Phone Android 25Go (30$/an) 100Go (60$/an) 200Go (120$/an) 400Go (240$/an) Windows / Mac Os / Chrome OS / iphone / ipad / Android 25Go (8.50 /mois) 50Go (17 /mois) Windows / Mac Os / Web OS / Android / ipad / iphone / BlackBerry
III) Proposition de solution La solution retenue est le NAS car il est le plus adapté aux besoins de la M2L. Ses performances sont suffisantes, il peut être installé dans une DMZ, permet l utilisation d un RAID 5 s il comporte un minimum de 3 baies pour disque durs et est sécurisable car configuré en interne. Par ailleurs, son prix est bien moins élevé que les autres solutions existantes. Le montant du NAS sélectionné (Synology NAS DS416J) est de 319,99 auquel on ajoute trois disques durs afin de configurer un raid 5. Les disques Hitachi Ultrastar conviennent puisqu ils sont rapides avec 7400 tr/min et une connexion Sata 3 à 6Gb/s. Sa mémoire de 4To permet de conserver une grande quantité de fichiers. Leur prix à l unité est de 259,96. Enfin, nous décidons d ajouter un onduleur avec de réduire la résistance aux pannes. Onduleur 3 prises 600VA 59,95 Le montant total est donc de 1159,82.
IV) OBLIGATION JURIDIQUES : a. La finalité : définir les objectifs du fichier Avant toute collecte et utilisation de données personnelles, le responsable de traitement doit précisément annoncer aux personnes concernées ce à quoi elles vont lui servir. Ces objectifs, appelés "finalités", doivent respecter les droits et libertés des individus. Ils limitent la manière dont le responsable pourra utiliser ou réutiliser ces données dans le futur b. La pertinence : vérifier la pertinence des données Seules les données strictement nécessaires à la réalisation de l objectif peuvent être collectées : c est le principe de minimisation de la collecte. Le responsable de traitement ne doit donc pas collecter plus de données que ce dont il a vraiment besoin. Il doit également faire attention au caractère sensible de certaines données. c. La conservation : limiter la conservation des données Une fois que l objectif poursuivi par la collecte des données est atteint, il n y a plus lieu de les conserver et elles doivent être supprimées. Cette durée de conservation doit être définie au préalable par responsable du traitement, en tenant compte des éventuelles obligations à conserver certaines données. d. Les droits : respecter les droits des personnes Des données concernant des personnes peuvent être collectées à la condition essentielle qu elles aient été informées de cette opération. Ces personnes disposent également de certains droits qu elles peuvent exercer auprès de l organisme qui détient ces données le concernant : un droit d accéder à ces données, un droit de les rectifier et enfin un droit de s opposer à leur utilisation. e. La sécurité : sécuriser les données Le responsable de traitement doit prendre toutes les mesures nécessaires pour garantir la sécurité des données qu il a collectées mais aussi leur confidentialité, c'est-à-dire s assurer que seules les personnes autorisées y accèdent. Ces mesures pourront être déterminées en fonction des risques pesant sur ce fichier (sensibilité des données, objectif du traitement ).