Systèmes de fichiers distribués : comparaison de GlusterFS, MooseFS et Ceph avec déploiement sur la grille de calcul Grid 5000.



Documents pareils
Les applications Internet

L annuaire et le Service DNS

Systèmes de fichiers répartis

TP Réseau n 4 Common Internet File System (CIFS) et Network File System (NFS)

NFS Maestro 8.0. Nouvelles fonctionnalités

Gestion de clusters de calcul avec Rocks

Retour d expérience en Astrophysique : utilisation du Cloud IaaS pour le traitement de données des missions spatiales

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles

Configuration du driver SIP dans ALERT. V2

Bonjour. Yohan PARENT, Cyprien FORTINA, Maxime LEMAUX, Hyacinthe CARTIAUX

Le Network File System de Sun (NFS)

Solution Haute Disponibilité pour Linux

Compte Rendu. Projet Reseaux : Conception Implémentation d un Mini DataCenter

Consolidation Stockage.

Le modèle client-serveur

1 Configuration réseau des PC de la salle TP

Easy as NAS Supplément Entreprises. Guide des solutions

EMC Data Domain Boost for Oracle Recovery Manager (RMAN)

Spécialiste Systèmes et Réseaux

«clustering» et «load balancing» avec Zope et ZEO

Module : Virtualisation à l aide du rôle Hyper-V

Services Réseaux - Couche Application. TODARO Cédric

Chapitre 1 Windows Server

ClariLog - Asset View Suite

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Logiciel HP StorageWorks Enterprise Virtual Array (EVA) Fiche technique

Guide SQL Server 2008 pour HYSAS

Technologie SDS (Software-Defined Storage) de DataCore

WebSphere MQ & Haute Disponibilité

EJBCA PKI. Yannick Quenec'hdu Reponsable BU sécurité

ViSaGe. Virtualisation du Stockage dans les Grilles. Informatiques. RenPar 16, 6-8 Avril 2005 Thiebolt François

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

Retour d expérience sur Prelude

Architecture distribuée

Solutions libres de stockage. Patrice Langlois / Antoine Puechlong Service Informatique IGMM CRBM CPBS

Système de Stockage Sécurisé et Distribué

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

EMC AVAMAR. Logiciel et système de sauvegarde avec déduplication

LINUX - Sécurité. Déroulé de l'action. - 3 jours - Contenu de formation

Maintenance et gestion approfondie des Systèmes d exploitation Master 2 SILI. Année universitaire David Genest

vsphere 5 TP2 La virtualisation avec VMware CNFETP F. GANGNEUX technologie GANGNEUX F. 17/12/2012

M1101a Cours 4. Réseaux IP, Travail à distance. Département Informatique IUT2, UPMF 2014/2015

Présentation d HyperV

Firewall IDS Architecture. Assurer le contrôle des connexions au. Sécurité 1

Cours Linux. Cours en ligne Administrateur Systèmes Linux. Académie Libre

Windows Server 2012 R2 Failover de serveurs DHCP

Ubuntu Linux Création, configuration et gestion d'un réseau local d'entreprise (3ième édition)

Augmenter la disponibilité des applications JEE grâce au clustering : Le projet open source JShaft

Conseils et astuces pour un déploiement réussi de la solution VMware Mirage

Windows Server 2012 R2 Administration

Migration NT4 vers Windows 2003 Server

Le filtrage de niveau IP

NetCrunch 6. Superviser

//////////////////////////////////////////////////////////////////// Administration systèmes et réseaux

Axway SecureTransport

Eric Bertrand 08/11/06 Maître de conférence 1

Cisco Certified Network Associate

Artica Proxy Appliance Haute disponibilite

Plan du cours. Autres modèles pour les applications réparties Introduction. Mode de travail. Introduction

VMware vsphere 5 Préparation à la certification VMware Certified Professional 5 Data Center Virtualization (VCP5-DCV) - Examen VCP510

Les termes du cloud CUMULO NUMBIO 2015 O. COLLIN

Client Debian Squeeze et serveur SambaEdu3

Exchange Server 2013 Préparation à la certification MCSE Messaging - Examen

Table des matières. Chapitre 1 Les architectures TSE en entreprise

MANUEL D INSTALLATION DE WATCHDOC 2011 (EVALUATION)

TP redondance DHCP. Gillard Frédéric Page 1/17. Vue d ensemble du basculement DHCP

Intérêt du NAT (Network Address Translation) Administration Réseau Niveau routage. Exemple d Intranet. Principe NAT

La mémorisation des mots de passe dans les navigateurs web modernes

Systèmes de gestion de code source

Configuration Matérielle et Logicielle AGORA V2

et de suivi de la corpulence des enfants

La haute disponibilité

Manuel de System Monitor

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Sécurisation du réseau

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

Proxy et reverse proxy. Serveurs mandataires et relais inverses

Projet Evolution. Projet Evolution Fleury Plaideau Page 1

AOLbox. Partage de disque dur Guide d utilisation. Partage de disque dur Guide d utilisation 1

LINUX - ADMINISTRATION PROGRAMME DE FORMATION

EMC DATA DOMAIN OPERATING SYSTEM

SOLUTIONS EMC ISILON DE STOCKAGE DES RÉPERTOIRES PERSONNELS POUR LES ENVIRONNEMENTS NFS ET SMB

Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau

LIVRE BLANC PRODUIT. Evidian SafeKit. Logiciel de haute disponibilité pour le clustering d application

Sauvegarde des données au LAAS

et dépannage de PC Configuration Sophie Lange Guide de formation avec exercices pratiques Préparation à la certification A+

FORMATION CN01a CITRIX NETSCALER

Découvrez notre solution Alternative Citrix / TSE

Table des matières Page 1

Serveur FTP. 20 décembre. Windows Server 2008R2

INFO-F-309 Administration des Systèmes. TP7: NFS et NIS. Sébastien Collette Résumé

Système de fichiers distribué : comparaison de GlusterFS, MooseFS et Ceph avec déploiement sur la grille de calcul Grid 5000.

Hébergement de sites Web

<Insert Picture Here> Maintenir le cap avec Oracle WebLogic Server

Service WEB, BDD MySQL, PHP et réplication Heartbeat. Conditions requises : Dans ce TP, il est nécessaire d'avoir une machine Debian sous ProxMox

EMC DATA DOMAIN HYPERMAX

Mettre en place un accès sécurisé à travers Internet

2. MAQUETTAGE DES SOLUTIONS CONSTRUCTIVES. 2.2 Architecture fonctionnelle d un système communicant.

Installation / Sauvegarde Restauration / Mise à jour

Transcription:

: comparaison de, et avec déploiement sur la grille de calcul Grid 5000. JF. Garcia, F. Lévigne, M. Douheret, V. Claudel 30 mars 2011 1/34

Table des Matières 1 2 3 4 5 6 7 1/34

Présentation du sujet Présentation du sujet Le Grid 5000 de systèmes de fichiers distribués : Système de fichiers (FS) : façon de stocker, organiser des informations dans des fichiers sur une mémoire secondaire (CD-ROM, disque dur,...) Système de fichiers distribué : éclaté sur plusieurs serveurs disponible depuis plusieurs clients 2/34

Le Grid 5000 Présentation du sujet Le Grid 5000 Infrastructure distribuée dédiée à la recherche 11 sites, dont 9 en France Figure: Les sites français du Grid 5000 3/34

Travailler sur le Grid 5000 Présentation du sujet Le Grid 5000 Astuce : Connexion au «frontend» par SSH Réservation de nœuds, pour un certain temps Déploiement d image (OS) Possibilité d effectuer une réservation à l avance, suivit par l exécution d un script 4/34

Présentation de Présentation de Aspect technique Mise en place Network File System Développé par Sun Microsystem en 1984 Partager des données par le réseau Méthode standard de partage entre machines Unix 5/34

Aspect technique Présentation de Aspect technique Mise en place et le protocole non connecté UDP Depuis la version 3, possibilité d utiliser TCP Versions définies dans différentes RFC Ensemble du protocole repensé pour v4 : meilleur gestion de la sécurité meilleur gestion de la montée en charge système de maintenance simplifié support des protocoles TCP (par défaut) et RDMA 6/34

Mise en place Présentation de Aspect technique Mise en place Installation des paquets nfs-common et nfs-kernel-server Implémentation d un fichier exports dans /etc Montage du partage sur les clients à l aide de «mount» Pour v4 : Des options supplémentaires sont à définir dans /etc/exports et le type de protocole doit être spécifié lors du montage sur les clients. 7/34

Présentation de Présentation de Mise en place Difficultés rencontrées Licence GPLv3 Se base sur FUSE (Filesystem in UserSpacE) Capacité pouvant atteindre plusieurs petabytes (1000 To) Structure simple, deux éléments logiciels : serveur et client Supporte plusieurs protocoles de communications (TCP/IP, InfiniBand) 8/34

Mise en place Présentation de Mise en place Difficultés rencontrées Un serveur maitre : paquet glusterfs-server x serveurs «normaux» x clients : glusterfs-client Note : Les serveurs doivent avoir un répertoire dédié au partage 9/34

Mise en place (2) Présentation de Mise en place Difficultés rencontrées A partir du serveur maitre : génération des fichiers de configurations (commande prévue) envoie de fichiers aux serveurs, et aux clients Démarrage des serveurs Montage du volume par les clients 10/34

Difficultés rencontrées Présentation de Mise en place Difficultés rencontrées Droit d écriture des clients Utilisation d InfiniBand 11/34

Présentation de Architecture Fonctionnalités Processus de lecture Processus d écriture 12/34

Présentation de Présentation de Architecture Fonctionnalités Processus de lecture Processus d écriture (Moose File System) est un système de fichiers répartis à tolérance de panne, développé par Gemius SA. Licence GPLv3. Disponible pour Linux, FreeBSD, OpenSolaris et MacOS X. Respect de la norme Posix et l utilisation de Fuse en espace client. Sa simplicité d administration, de mise en œuvre et d utilisation. Poubelle par défaut. scalable 13/34

Architecture Présentation de Architecture Fonctionnalités Processus de lecture Processus d écriture est constitué de trois types de serveurs : Le Master Serveur Le Metalogger Serveur Le Chunck Serveur 14/34

Fonctionnalités Présentation de Architecture Fonctionnalités Processus de lecture Processus d écriture Tolérance aux pannes Le système est réparti Répartition de charge Sécurité 15/34

Présentation de Architecture Fonctionnalités Processus de lecture Processus d écriture 16/34

Présentation de Architecture Fonctionnalités Processus de lecture Processus d écriture 17/34

Présentation de Présentation Caractéristique Fonctionnement Difficultés Licence LGPL Créé par Sage Weill en 2007 Destiné aux très grands clusters But principal : compatible POSIX complètement distribué sans point de défaillance 18/34

Caractéristiques Présentation Caractéristique Fonctionnement Difficultés Robustesse Évolutivité transparente Déconseillé en production 19/34

Fonctionnement Présentation Caractéristique Fonctionnement Difficultés Trois types distincts de démons : Moniteur de cluster Serveurs de métadonnées Serveurs de données 20/34

Moniteur Présentation Caractéristique Fonctionnement Difficultés Configuration État du cluster Gestion des clients 21/34

Serveurs de métadonnées Présentation Caractéristique Fonctionnement Difficultés Cache cohérent et distribué Plusieurs serveurs = équilibrage de charge 22/34

Serveurs de données Présentation Caractéristique Fonctionnement Difficultés Découpage des données Réplication = tolérance aux pannes 23/34

Echanges de données Présentation Caractéristique Fonctionnement Difficultés 24/34

Difficultés rencontrées Présentation Caractéristique Fonctionnement Difficultés Documentation minimaliste Fichier authentification 25/34

Benchmark Benchmark Graphiques Tableau comparatif Actions simultanées sur plusieurs clients : Écriture de petits fichiers Écriture de gros fichiers Lecture de petits fichiers Lecture de gros fichiers 26/34

Benchmark Graphiques Tableau comparatif 27/34

Benchmark Graphiques Tableau comparatif 28/34

Benchmark Graphiques Tableau comparatif 29/34

Benchmark Graphiques Tableau comparatif 30/34

Tableau comparatif Benchmark Graphiques Tableau comparatif Gluster Moose Facilité de mise en place ++ + + ++ Fiabilité ++ ++ - ++ Sécurité, disponibilité des données + ++ ++ - - Évolutivité + ++ ++ - - Économe en taille disque ++ - - ++ 31/34

Difficultés rencontrées Difficultés rencontrées Travail accompli Expérience enrichissante Prise en main du Grid 5000 Partage du cluster Erreurs ponctuelles lors de déploiements Scripts de déploiements, benchmark : automatisation totale 32/34

Travail accompli Difficultés rencontrées Travail accompli Expérience enrichissante Mise en place de systèmes de fichiers distribués Création de scripts de déploiements, et de benchmark de ces systèmes 33/34

Expérience enrichissante Difficultés rencontrées Travail accompli Expérience enrichissante Travail sur un cluster Niveau de technique important Documentations en anglais 34/34