Systèmes de fichiers répartis

Documents pareils
Gestion répartie de données - 1

Les applications Internet

Le modèle client-serveur

Service d'annuaire Active Directory

Services Réseaux - Couche Application. TODARO Cédric

Systèmes de gestion de code source

Sommaire. 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

Cours 13. RAID et SAN. 2004, Marc-André Léger

M1101a Cours 4. Réseaux IP, Travail à distance. Département Informatique IUT2, UPMF 2014/2015

Cisco Certified Network Associate

Solution Haute Disponibilité pour Linux

Pourquoi OneSolutions a choisi SyselCloud

NFS Maestro 8.0. Nouvelles fonctionnalités

EMC DATA DOMAIN OPERATING SYSTEM

«clustering» et «load balancing» avec Zope et ZEO

Nouvelles stratégies et technologies de sauvegarde

Plan du cours. Autres modèles pour les applications réparties Introduction. Mode de travail. Introduction

Serveur Appliance IPAM et Services Réseaux

Sauvegarde des données au LAAS

Système de Stockage Sécurisé et Distribué

Spécialiste Systèmes et Réseaux

EMC DATA DOMAIN HYPERMAX

Réplication des données

Chapitre 1 Windows Server

Solution de stockage et archivage de grands volumes de données fichiers.

Créer et partager des fichiers

Fonctions. Solution professionnelle pour le stockage de données, la synchronisation multi- plateformes et la collaboration

Ce document décrit une solution de single sign-on (SSO) sécurisée permettant d accéder à Microsoft Exchange avec des tablettes ou smartphones.

Comment déployer l'active Directory sur Windows Server 2008 R2. Microsoft France Division DPE

Informatique pour scientifiques hiver Plan général Systèmes d exploitation

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

DenyAll Detect. Documentation technique 27/07/2015

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Windows Internet Name Service (WINS)

Mise en œuvre des serveurs d application

Migration NT4 vers Windows 2003 Server

Backup Exec 2010 vs. BackupAssist V6

Projet «Evolution» Référentiel d activités et de compétences : Administrer un parc informatique. Objectifs pédagogiques :

Sécurité en MAC OS X [Nom du professeur]

NetCrunch 6. Superviser

Programmation parallèle et distribuée

EMC AVAMAR. Logiciel et système de sauvegarde avec déduplication

Systèmes et algorithmes répartis

Nouveautés Ignition v7.7

TP Réseau n 4 Common Internet File System (CIFS) et Network File System (NFS)

UE5A Administration Réseaux LP SIRI

Serveur de sauvegarde à moindre coût

Technologie de déduplication de Barracuda Backup. Livre blanc

CommandCenter Secure Gateway

JOSY VIRTUALISATION 9 ET 10 JUIN 2011 POSTE DE TRAVAIL ET VIRTUALISATION. Sébastien Geiger IPHC

Ubuntu Linux Création, configuration et gestion d'un réseau local d'entreprise (3ième édition)

NAS 109 Utiliser le NAS avec Linux

Authentification unifiée Unix/Windows

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

LINUX REDHAT, SERVICES RÉSEAUX/INTERNET

Un concept multi-centre de données traditionnel basé sur le DNS

Programmation parallèle et distribuée

Stockage Réseau. Le stockage s'échappe du système pour devenir une fonction réseau

Contrôle d accès Centralisé Multi-sites

Conception des systèmes répartis

NEXTDB Implémentation d un SGBD Open Source

TP redondance DHCP. Gillard Frédéric Page 1/17. Vue d ensemble du basculement DHCP

Tour d horizon des différents SSO disponibles

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Cours Bases de données

Atelier Le gestionnaire de fichier

2. MAQUETTAGE DES SOLUTIONS CONSTRUCTIVES. 2.2 Architecture fonctionnelle d un système communicant.

Une solution de stockage VDI unifiée, flexible et disponible pour vos utilisateurs

Outils de développement collaboratif

Hébergement MMI SEMESTRE 4

Guide de connexion Wi-Fi sur un hotspot ADP Télécom

Dr.Web Les Fonctionnalités

Mise en place Active Directory / DHCP / DNS

Expérience d un hébergeur public dans la sécurisation des sites Web, CCK. Hinda Feriani Ghariani Samedi 2 avril 2005 Hammamet

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Introduction à l informatique en BCPST

EX4C Systèmes d exploitation. Séance 14 Structure des stockages de masse

ClariLog - Asset View Suite

Service WEB, BDD MySQL, PHP et réplication Heartbeat. Conditions requises : Dans ce TP, il est nécessaire d'avoir une machine Debian sous ProxMox

Serveurs de noms Protocoles HTTP et FTP

Le Network File System de Sun (NFS)

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Programmation parallèle et distribuée (Master 1 Info )

Licence professionnelle Réseaux et Sécurité Projets tutorés

Etude des outils du Cloud Computing

Internet Information Services (versions 7 et 7.5) Installation, configuration et maintenance du serveur Web de Microsoft

La Continuité d Activité

Plateforme académique de partage de documents - owncloud

Itium XP. Guide Utilisateur

Les formations. Administrateur Systèmes et Réseaux. ENI Ecole Informatique

ERP Service Negoce. Pré-requis CEGID Business version sur Plate-forme Windows. Mise à jour Novembre 2009

Protection des données avec les solutions de stockage NETGEAR

FreeNAS Shere. Par THOREZ Nicolas

Configuration du nouveau Bureau Virtuel (BV) collaboratif de Lyon I

Virtualisation CITRIX, MICROSOFT, VMWARE OLIVIER D.

Veille Technologique. Cloud-Computing. Jérémy chevalier

Concepts et systèmes de stockage

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

Transcription:

Systèmes de fichiers répartis INF346 Samuel Tardieu sam@rfc1149.net Télécom ParisTech 16 mars 2012 Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 1 / 42

Introduction Pourquoi partager des fichiers? Travail en équipe (-) Projets à plusieurs développeurs Mise à jour d une base de données Travail personnel (+) Utilisation de machines banalisées Utilisation de machines différentes Ordinateur fixe avec un large disque et copie de sauvegarde Ordinateur portable Accès optimisé aux données (+) Répartition des données sur plusieurs machines (sharding) Redondance des informations Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 2 / 42

Introduction Ce problème n est pas récent En 1985, DEC fournit VAXClusters Partage de périphériques de mémoire de masse comme s ils étaient locaux Basé sur une politique de droits rigides (à la VMS) Au même moment, Sun Microsystems livre NFS Distinction entre fichier local et fichier distant Plus souple à administrer, plus orienté Unix NFS, avec quelques améliorations entre temps, est encore utilisé aujourd hui. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 3 / 42

Introduction Les besoins ont évolué Les développements se font à travers un système de gestion de version (VCS, version control system). Tous les VCS supportent un accès à distance. Les fichiers de l utilisateur peuvent être eux aussi versionnés. Les réseaux sont de plus en plus rapides. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 4 / 42

Introduction Plan du cours 1 Introduction 2 Accès partagé à distance NFS CIFS 3 Accès partagé avec redondance AFS Coda Intermezzo 4 Systèmes à haute disponibilité GoogleFS Hadoop 5 Autres systèmes 6 Conclusion Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 5 / 42

Accès partagé à distance NFS : initialement pour les clients sans disque NFS Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 6 / 42

Accès partagé à distance NFS NFS : système basique au départ Prévu pour ressembler au système de fichiers Unix Utilise les RPC de Sun Données codées selon le protocole XDR Utilisation d un service de portmapping Pas d état stocké sur le serveur Plus facile à mettre en œuvre Plus difficile à optimiser Pas ou peu de cache utilisé par le client Le cache n est utile que pour les gros fichiers La sémantique du cache est douteuse sans état sur le serveur Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 7 / 42

Accès partagé à distance NFS NFS : disponibilité Conçu à l origine par Sun Microsystems Disponible pour tous les Unix Disponible pour Windows et macos Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 8 / 42

Accès partagé à distance NFS NFS : opérations Opérations en lecture : getattr, lookup, readdir, read, readlink, statfs, mount,... Modifications de la hiérarchie de fichiers : mkdir, link, symlink, rename, unlink, rmdir,... Modification des fichiers : setattr, write Les opérations ont été choisies pour ressembler à celles d un système de fichier local. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 9 / 42

Accès partagé à distance NFS NFS : support des incidents NFS gère le scénario suivant : Le client charge un fichier dans son éditeur. Le fichier est demandé au serveur et récupéré à travers ses identifiants. La connexion au serveur est interrompue, ou le serveur redémarre. Le client modifie le fichier dans son éditeur. Il ne remarque pas la «disparition» du serveur. Le serveur redémarre. Le client sauve le fichier. Tout se passe bien, le serveur ne conserve pas d état, les identifiants restent valables. Par contre, il y aura un problème si la configuration du serveur change (NFS stale file handle). Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 10 / 42

Accès partagé à distance NFS NFS : sécurité Support de Kerberos, très contraignant Authentification basée sur les adresses IP La sécurité implique l intégrité du réseau et celle des administrateurs Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 11 / 42

Accès partagé à distance CIFS CIFS : Common Internet File System Développement Créé par IBM sous le nom Server Message Block (SMB) Repris et amélioré par Microsoft Renommé plus tard en CIFS Principes proches de NFS Supporte l authentification par utilsiateur Disponible sous Unix (samba) Permet de partager également les ressources (imprimantes par exemple) Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 12 / 42

Accès partagé avec redondance AFS AFS : utilisation d un cache local AFS : Andrew File System Utilisation d un cache côté client Stocke les fichiers Stocke les données de répertoire Utilisation d un système de callbacks Possibilité pour le client d utiliser sa copie locale, supposée valide Callback appelé par le serveur en cas d invalidation Le serveur maintient une connaissance de l état des caches des clients. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 13 / 42

Accès partagé avec redondance AFS : propriétés du cache AFS Cache persistant Résiste au redémarrage de la machine Stocke un numéro de version associé à chaque donnée Accès concurrents Accès en lecture : ne nécessite aucune opération réseau une fois le fichier dans le cache Accès en écriture : provoque une demande d invalidation de cache par le serveur à tous les clients pour les données modifiées Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 14 / 42

Accès partagé avec redondance AFS : organisation AFS Espace de nommage unique : /afs Domaine administratif : la cellule Un ou plusieurs serveurs Zéro ou plusieurs clients accédant aux données Chaque cellule exporte des volume montés sous /afs Administration du client minimale Le client contactera de lui-même la cellule pour trouver un serveur offrant le volume demandé Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 15 / 42

Accès partagé avec redondance AFS AFS : réplication La stratégie de réplication d AFS est simple et pessimiste : Un seul serveur autorise les écritures. Tous les autres agissent comme des esclaves fournissant les fichiers en lecture seule. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 16 / 42

AFS : protocole Accès partagé avec redondance AFS Du client vers le serveur Lecture et écriture des données Modification de la hiérarchie de fichiers Gestion des volumes Vivacité et sémantique Verrouillage Du serveur vers le client Invalidation du cache Avec de la sécurité Gestion de jetons par Kerberos ACL (Access Control List) fines par répertoire AFS ne cherche pas à imiter un système de fichiers local. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 17 / 42

Accès partagé avec redondance AFS AFS : disponibilité Premières implémentations développées par CMU (Carnegie Mellon University) Implémentation commerciale développée par TransArc, achetée par IBM, et libérée sous le nom d OpenAFS Implémentation libre : Arla Implémentation partielle par RedHat dans Linux depuis le noyau 2.6.10 N a jamais vraiment pris sauf dans certaines universités américaines (notamment CMU) Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 18 / 42

Accès partagé avec redondance Coda Coda : le successeur d AFS 2 Développé (encore) à CMU Stratégie de réplication optimiste (ou paresseuse) Plusieurs serveurs en lecture / écriture Cache local avec possibilité de préchargement (hoarding) Support des opérations en mode déconnecté Support des partitions du réseau de serveurs Adaptation à la bande passante disponible Priorisation des fichiers échangés Réconciliation en tâche de fond des changements non requis immédiatement Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 19 / 42

Accès partagé avec redondance Coda en une image Coda (Illustration de Gaich Muramatsu, http://www.coda.cs.cmu.edu/) Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 20 / 42

Accès partagé avec redondance Coda Coda : réintégration des changements Le client enregistre chaque changement fait dans un fichier de modifications (log) sauf s il est connecté par une liaison rapide (mode synchrone). Les changements successifs sont compactés. Il l envoie au serveur lorsqu il se connecte. Le serveur lui demande de lui envoyer les modifications effectuées dans chaque fichier modifié (backfetch). Le serveur gère les conflits provoqués par les modifications concurrentes. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 21 / 42

Accès partagé avec redondance Coda Coda : gestion des conflits de clients Dans les cas d écritures synchrones Chaque écriture est précédée d une demande de vérification de la version courante. Cette demande est réalisée auprès de tous les serveurs. Tous les réplicas effectutent les mêmes opérations. Dans le cas d écritures asynchrones : Coda essaie de résoudre les faux conflits. L utilisateur doit résoudre les autres conflits à la main. Coda ne prend jamais de décision sur une stratégie de réconciliation de changements concurrents. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 22 / 42

Accès partagé avec redondance Coda Coda : réplication des serveurs Modèle «write all, read one» VSG (Volume Storage Group) pour chaque volume VS (Version stamp) pour chaque répertoire VS comparés par un client auprès des serveurs atteignables avant de faire une écriture En cas d absence de serveurs, fichier de log stocké sur les serveurs joignables pour préparer la réconciliation Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 23 / 42

Accès partagé avec redondance Coda Coda : gestion des conflits de serveurs Résolution basique Identification éventuelle d un réplica dominant Permet surtout d importer un objet sur un réplica qui ne le connaît pas Résolution complexe Protocole en 5 étapes Élection d un coordinateur pour mener la réconciliation Demande d aide à l utilisateur en cas de conflits non solubles automatiquement Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 24 / 42

Accès partagé avec redondance Coda Coda : disponibilité Peu populaire notamment en raison du système de fichiers dédié Développement irrégulier mais toujours en cours Focus mis sur la robustesse de l implémentation pour en faire un produit commercial Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 25 / 42

Accès partagé avec redondance Intermezzo Intermezzo : l expérimentation ouverte Inspiré de Coda Travaille au dessus des systèmes de fichiers existants Développé à... CMU Séparation du protocole en deux composants Presto, dans le noyau, fait le lien entre le système de cache local et le composant de synchronisation Lento. Lento, hors du noyau, s occupe des opérations de synchronisation avec les autres réplicas. Lento peut être écrit dans n importe quel langage (première version en Perl). Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 26 / 42

Accès partagé avec redondance NFS NFS : une norme qui évolue La norme évolue NFS v4 : décembre 2000, avril 2003, influencé par AFS et CIFS NFS v4.1 : janvier 2012 Efficacité Regroupement des requêtes Système de cache avec invalidation possible TCP privilégie pour détecter les ruptures de connexion Délégation à des serveurs secondaires Accès aux fichiers en parallèle (striping) et notion de session Sécurité Simplification du modèle par rapport aux versions précédentes Possibilité de chiffrement Possibilité d imposer des contraintes sur le niveau de sécurité requis, côté client et côté serveur Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 27 / 42

Systèmes à haute disponibilité GoogleFS GoogleFS : les besoins Stockage de fichiers de taille importante Énorme volume de données Rétention des données à long terme Tolérance aux pannes des disques Utilisation des données dans plusieurs datacenters répartis sur plusieurs continents (moteur de recherche) Données proches de l utilisateur (gmail) Utilisation de matériel bon-marché, disponible partout et interchangeable Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 28 / 42

Systèmes à haute disponibilité GoogleFS GoogleFS : architecture Découpage des fichiers en chunks de 64Mo Chaque chunk est répliqué Au moins trois fois Parfois plus pour augmenter la sécurité et la disponibilité Un maître, seul serveur à haute disponibilité, pour gérer le catalogue et les permissions Un très grand nombre de noeuds de stockage à faible coût unitaire, équipé de composants standard, avec un taux de panne important Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 29 / 42

Systèmes à haute disponibilité GoogleFS GoogleFS : rôle du maître Connaît la localisation de chaque fichier Connaît l état de chaque esclave Gère le nombre de réplicas et lance les demandes de réplication Donne les permissions d écriture sur un chunk sous la forme d un jeton qui expire Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 30 / 42

Systèmes à haute disponibilité GoogleFS GoogleFS : rôle de l esclave Stocke les chunks sur le disque et utilise les données Obtient des permissions d écriture temporaires Se charge de répliquer les changements qu il est autorisé à effectuer S assure que tous les replicas sont à jour avant de considérer l écriture comme effectuée (atomicité) Peut-être mis hors-ligne à tout moment, volontairement ou en cas de panne (disque, secteur, réseau, etc.) Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 31 / 42

Systèmes à haute disponibilité GoogleFS GoogleFS : haute disponibilité La probabilité de perdre tous les réplicas au même moment est extrêmement faible. Le réplica le plus proche en terme de temps d accès peut être utilisé pour la consultation. Le nombre de réplicas peut être augmenté pour augmenter la redondance et diminuer le temps d accès. Localisation et proximité : les réplicas sont placés prioritairement près des utilisateurs qui en ont besoin. Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 32 / 42

Systèmes à haute disponibilité GoogleFS GoogleFS : map / reduce Accès aux données : fichiers potentiellement de taille énorme Algorithmes de type map / reduce qui travaillent sur des portions de données et rassemblent les résultats Possibilité de travailler sur des fichiers locaux aux machines qui effectuent les opérations Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 33 / 42

Systèmes à haute disponibilité GoogleFS GoogleFS : disponibilité Google a publié un article décrivant GoogleFS Pas de mise à disposition en logiciel libre Pas de commercialisation du système de fichier Alternative libre : Hadoop Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 34 / 42

Systèmes à haute disponibilité Hadoop HDFS : un GoogleFS libre Écrit en Java Disponible sur plusieurs supports : son propre système de fichiers serveurs FTP anonymes serveurs HTTP / HTTPS (lecture seule) Amazon S3... Point de faute unique (serveur de nom), sauf dans certaines versions propriétaires Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 35 / 42

Autres systèmes FUSE FUSE : systèmes de fichiers pour tous Filesystem in userspace Permet de créer facilement un nouveau programme (C, Python, etc.) se comportant comme un système de fichier de haut-niveau Offre donc la possibilité de créer également un système de fichiers répartis sans avoir besoin de privilèges importants Disponible sur Linux, FreeBSD, OpenSolaris et MacOS X Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 36 / 42

Autres systèmes FUSE FUSE : exemples SSHFS : accès par SSH (protocole SFTP) curlftpfs : accès par FTP GMailFS : stockage de fichiers comme attachements dans la messagerie gmail WikipediaFS : lire et éditer les articles de Wikipedia en éditant simplement des fichiers Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 37 / 42

Autres systèmes NASD NASD : périphériques intelligents Network-attached secure devices, ou disque actifs Principes Rendre les disques «intelligents» Relier directement les clients et les données Défis Conserver la sécurité des données Laisser les disques prendre des décisions cruciales pour l intégrité des données Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 38 / 42

Autres systèmes NASD NASD : idées fondatrices Permissions d accès Un serveur vérifie l identité du client. Le serveur donne au client des jetons lui donnant certains droits. Le client transmet les jetons au disque, qui peut les vérifier auprès du serveur. Transferts directs entre le client et le disque sans intervention du serveur Échange possible d information de vérification de droit d accès entre disques se faisant confiance Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 39 / 42

Autres systèmes NASD NASD : exemples d utilisation Exploitation de données gigantesques : recherche simultanée sur des milliers de disque Base de données à haute disponibilité : des milliers de moteurs transactionnels fonctionnant en parallèle pour équilibrer la charge Protection automatique des données : chaque disque sait quelles données doivent être répliquées, déplacées ou sauvegardées Sécurité automatique des données : un disque attaqué peut le signaler aux autres, demander des copies supplémentaires de ses données et se déclarer corrompu Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 40 / 42

Autres systèmes NASD NASD : exemples d utilisation Exploitation de données gigantesques : recherche simultanée sur des milliers de disque Base de données à haute disponibilité : des milliers de moteurs transactionnels fonctionnant en parallèle pour équilibrer la charge Protection automatique des données : chaque disque sait quelles données doivent être répliquées, déplacées ou sauvegardées Sécurité automatique des données : un disque attaqué peut le signaler aux autres, demander des copies supplémentaires de ses données et se déclarer corrompu Mais ce modèle n a jamais pris! Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 40 / 42

Autres systèmes Dans le cloud Mais encore... Amazon S3 : accessible à travers des interfaces REST, SOAP ou BitTorrent Dropbox : service de stockage par Internet support des OS mobiles officiellement confidentiel ouvertement non confidentiel Bitcasa : actuellement en phase de test, disponible pour Windows et MacOS uniquement aujourd hui, stockage réparti et officiellement sécurisé Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 41 / 42

Conclusion Conclusion Les systèmes de fichiers répartis sont utilisés depuis 25 ans. Les usages changent : du réseau local à l Internet, puis au cloud du modèle de confiance au modèle sécurisé du centralisé au réparti de l unique au répliqué Certains modèles ont été abandonnés avant même d être répandus (CODA / Intermezzo, NASD) Le modèle du disque dur est-il pérenne? Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 42 / 42

Conclusion Conclusion Les systèmes de fichiers répartis sont utilisés depuis 25 ans. Les usages changent : du réseau local à l Internet, puis au cloud du modèle de confiance au modèle sécurisé du centralisé au réparti de l unique au répliqué Certains modèles ont été abandonnés avant même d être répandus (CODA / Intermezzo, NASD) Le modèle du disque dur est-il pérenne? Ce sera probablement à vous d inventer les nouveaux usages! Samuel Tardieu (Télécom ParisTech) Fichiers répartis 16 mars 2012 42 / 42