Systèmes et algorithmes répartis



Documents pareils
Tolérance aux fautes - 1 Introduction, techniques de base

Tolérance aux fautes-2 Serveurs à haute disponibilité

MEAD : temps réel et tolérance aux pannes pour CORBA

CEG4566/CSI4541 Conception de systèmes temps réel

Un concept multi-centre de données traditionnel basé sur le DNS

Conception des systèmes répartis

ITIL Gestion de la continuité des services informatiques

s é c u r i t é Conférence animée par Christophe Blanchot

Nouvelle configuration du réseau local Miniplan Claude-Éric Desguin

Disponibilité et fiabilité des services et des systèmes

Haute Disponibilité High-Availability : HA. Les enjeux

Livre blanc Haute disponibilité sous Linux

La Continuité d Activité

Réplication des données

Master Informatique et Systèmes. Architecture des Systèmes d Information. 03 Architecture Logicielle et Technique

Tolérance aux Fautes des Grappes d Applications J2EE. Applications Internet dynamiques

Gestion des sauvegardes

Multicast & IGMP Snooping

Sauvegarde collaborative en pair-à-pair

Plan du cours. Autres modèles pour les applications réparties Introduction. Mode de travail. Introduction

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration

Cours 13. RAID et SAN. 2004, Marc-André Léger

Windows 2000: W2K: Architecture. Introduction. W2K: amélioration du noyau. Gamme windows W2K pro: configuration.

«clustering» et «load balancing» avec Zope et ZEO

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Algorithmique répartie

Gestion répartie de données - 1

Le Multicast. A Guyancourt le

Espace de stockage intermédiaire. Compte de Messagerie. Communication «Asynchrone» «Compte de Messagerie»

TP redondance DHCP. Gillard Frédéric Page 1/17. Vue d ensemble du basculement DHCP

Eléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm)

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

TD n o 8 - Domain Name System (DNS)

Gestion de mémoire secondaire F. Boyer, Laboratoire Sardes

PLAN. Industrialisateur Open Source LANS DE SECOURS INFORMATIQUES PRINCIPES GENERAUX ETAT DE L ART SELON BV ASSOCIATES

«Commande» se rapporte à un bon de commande ou à une commande créée sur un site Internet Interoute.

La haute disponibilité de la CHAINE DE

EX4C Systèmes d exploitation. Séance 14 Structure des stockages de masse

Cours Bases de données

LIVRE BLANC PRODUIT. Evidian SafeKit. Logiciel de haute disponibilité pour le clustering d application

Consolidation de stockage

Windows Internet Name Service (WINS)

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

Cours n 12. Technologies WAN 2nd partie

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Micro ordinateur & Périphériques Mémoire de masse Disque dur (SOLUTION)

PARAGON SYSTEM BACKUP 2010

Cours de Base de Données Cours n.12

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

ITIL V2. La gestion de la disponibilité

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Données Réparties. Thibault BERNARD.

La sécurité informatique d'un centre d imagerie médicale Les conseils de la CNIL. Dr Hervé LECLET. Santopta

Introduction aux algorithmes répartis

Fiche de l'awt La sécurité informatique

CONDITIONS GENERALES D UTILISATION

FAMILLE EMC RECOVERPOINT

Principes de DHCP. Le mécanisme de délivrance d'une adresse IP à un client DHCP s'effectue en 4 étapes : COMMUTATEUR 1. DHCP DISCOVER 2.

Les sauvegardes de l ordinateur

Principe et règles d audit

Continuité d activité : le choix des armes

Agenda de l introduction à la résilience

Guide pour l Installation des Disques Durs SATA et la Configuration RAID

Techniques de stockage. Techniques de stockage, P. Rigaux p.1/43

Externaliser le système d information : un gain d efficacité et de moyens. Frédéric ELIEN

Livre blanc. Au cœur de Diskeeper 2010 avec IntelliWrite

EMC DATA DOMAIN HYPERMAX

Disponibilité 24-7/365

Créer et partager des fichiers

Fonctions Réseau et Télécom. Haute Disponibilité

Gé nié Logiciél Livré Blanc

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

La sécurité dans les grilles

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

Groupe Eyrolles, 2006, ISBN :

Le stockage. 1. Architecture de stockage disponible. a. Stockage local ou centralisé. b. Différences entre les architectures

Oracle Maximum Availability Architecture

Technologie de déduplication de Barracuda Backup. Livre blanc

Guide de l abonné KX-TVM50 KX-TVM200. Système de Messagerie vocale. Nº de modèle. Version du document /07

Conception et réalisation d uned architecture tolérant les intrusions pour des serveurs Internet

Guide Utilisateur ACQUIT : Anomalies issues du Guichet XML

Conception et contrôle des SMA tolérants aux fautes

Pour une visibilité optimale de vos investissements, PRO-MEGA vous présentent la solution Serverscheck dédiée aux installations BTS!

Distinguer entre «Enregistrer» et «Sauvegarder»

TP01: Installation de Windows Server 2012

La haute disponibilité

Le cluster à basculement

VRM Monitor. Aide en ligne

Accord Optionnel de Niveau de Service. Pour Plateforme SMS (SLA) Version /05/2011

Cours de Génie Logiciel

Palo Alto Networks Guide de l administrateur Panorama. Panorama 5.1

CA ARCserve Backup r12

Temps Réel. Jérôme Pouiller Septembre 2011

Jean-Marie RENARD Université Lille2 - octobre 2007

L exclusion mutuelle distribuée

Architecture des ordinateurs. Environnement Windows : sauvegarde

Le Ro le Hyper V Troisie me Partie Haute disponibilite des machines virtuelles

Systèmes à haute disponibilité :

SYSTEMES DE TRANSFERT STATIQUE: CEI 62310, UNE NOUVELLE NORME POUR GARANTIR LES PERFORMANCES ET LA SÉCURITÉ

Transcription:

Systèmes et algorithmes répartis Tolérance aux fautes Philippe Quéinnec Département Informatique et Mathématiques Appliquées ENSEEIHT 4 novembre 2014 Systèmes et algorithmes répartis V 1 / 45

plan 1 Sûreté de fonctionnement Vocabulaire Les moyens Principes 2 3 Techniques logicielles Techniques matérielles Systèmes et algorithmes répartis V 2 / 45

Plan Sûreté de fonctionnement Vocabulaire Les moyens Principes 1 Sûreté de fonctionnement Vocabulaire Les moyens Principes 2 3 Techniques logicielles Techniques matérielles Systèmes et algorithmes répartis V 3 / 45

Sûreté de fonctionnement Vocabulaire Les moyens Principes Availability, disponibilité : capacité à être prêt à délivrer un service Reliability, fiabilité : continuité de service Safety, sécurité/sûreté : absence d effets catastrophiques sur l environnement Security, sécurité : préservation de la confidentialité et de l intégrité des informations Repairability, maintenabilité : capacité à restaurer un service correct après une défaillance Systèmes et algorithmes répartis V 4 / 45

Mesures de fiabilité et disponibilité Vocabulaire Les moyens Principes Fiabilité MTTF (mean time to failure) : temps moyen jusqu à la prochaine panne MTTR (mean time to repair) : temps moyen de réparation MTBF (mean time between failure) = MTTF + MTTR Disponibilité Disponibilité moyenne = fraction du temps où le système est disponible Pannes franches : dispo moyenne = MTTF/(MTTF+MTTR) 99.99% (4 nines) indisponible 50 min / an 99.999% (5 nines) indisponible 5 min / an Systèmes et algorithmes répartis V 5 / 45

Vocabulaire Les moyens Principes Différence entre fiabilité et disponibilité Indisponibilité = 1 - disponibilité = MTTR/(MTTF + MTTR) MTTR/MTTF (si MTTR MTTF ) diviser MTTR par 2 = doubler MTTF Différence entre fiabilité (MTTF) et disponibilité (a) (dessin : S. Krakowiak) Systèmes et algorithmes répartis V 6 / 45

Le vocabulaire Sûreté de fonctionnement Vocabulaire Les moyens Principes Défaillance (failure) Déviation par rapport à la spécification. Manifestation d une erreur vis-à-vis du service. Erreur (error) Partie de l état du système entraînant la défaillance. Manifestation d une faute vis-à-vis du système. Note : une erreur est susceptible de causer une défaillance mais pas nécessairement (erreur latente, erreur compensée... ) Faute (fault) Cause de l erreur. Ex : faute de programmation division par 0 arrêt du service Systèmes et algorithmes répartis V 7 / 45

Cascade/Propagation Vocabulaire Les moyens Principes client de A défaillance A erreur faute défaillance B erreur faute Le bon fonctionnement de A dépend du bon fonctionnement de B Une défaillance de B constitue une faute pour A Cette faute peut à son tour provoquer une erreur interne de A, causant une défaillance de A Systèmes et algorithmes répartis V 8 / 45

Classification informelle des fautes Vocabulaire Les moyens Principes Point de vue nature : accidentelle ou intentionnelle origine : matérielle ou humaine création : conception ou opération persistance : permanente ou temporaire faute physique : accidentelle, matérielle, opération, permanente faute transitoire : accidentelle, matérielle, opération, temporaire faute intermittente : accidentelle, matérielle ou humaine, conception, temporaire faute de conception : accidentelle, humaine, conception, permanente faute d interaction : accidentelle, humaine, opération, temporaire attaques, intrusions : intentionnelle, humaine, conception ou opération Systèmes et algorithmes répartis V 9 / 45

Classification des défaillances Vocabulaire Les moyens Principes Un serveur doit rendre un service correctement, i.e. conformément à une spécification (valeur, transition, vitesse... ). défaillance d omission : le service ignore une requête défaillance temporelle : la réponse est fonctionnellement correcte mais pas au bon moment défaillance temporelle d avance : réponse trop tôt défaillance temporelle de retard : réponse trop tard (défaillance de performance) défaillance de réponse : réaction inadaptée à la requête défaillance de valeur : valeur renvoyée erronée défaillance de transition : transition interne erronée défaillance arbitraire ou byzantine Systèmes et algorithmes répartis V 10 / 45

Défaillance d arrêt Vocabulaire Les moyens Principes Si, suite à une première omission, le serveur ignore toutes les requêtes jusqu à ce qu il soit redémarré, on parle de panne franche, défaillance d arrêt, crash failure ou fail stop. Redémarrage amnesia-crash : état initial indépendant de l état avant crash pause-crash : état identique à l état avant crash halting-crash : pas de redémarrage (crash définitif) Défaillance d arrêt = cas le plus simple, auquel on essaie de se ramener (arrêt forcé sur tout type de défaillance) Note : un client ne peut pas distinguer entre un serveur planté, un serveur lent ou une défaillance du réseau. Systèmes et algorithmes répartis V 11 / 45

Vocabulaire Les moyens Principes Les moyens de la sûreté de fonctionnement Construction Prévention des fautes : comment empêcher par construction, l occurrence ou l introduction de fautes Tolérance aux fautes : comment fournir un service conforme à la spécification, en dépit de fautes Validation Élimination des fautes : comment réduire, par vérification et tests, la présence de fautes Prévision des fautes : comment estimer, par évaluation, la présence et l apparition de fautes Systèmes et algorithmes répartis V 12 / 45

Exemples Sûreté de fonctionnement Vocabulaire Les moyens Principes Écrire un programme sans (trop de) bugs = prévention (méthodologie de développement) + élimination (vérification de types, preuves, tests... ) S adapter à un environnement hostile = prévision (à quoi faut-il s attendre?) + tolérance (que faut-il faire?) Empêcher le piratage = prévision (quelles attaques?) + prévention (cryptographie... ) Systèmes et algorithmes répartis V 13 / 45

Vocabulaire Les moyens Principes Principes de la tolérance aux fautes Traiter les erreurs Détecter l existence d un état incorrect (erreur) Remplacer l état incorrect par un état correct Traiter les fautes Composants multiples, pour réduire la probabilité qu une faute dans l un d entre eux conduise à une défaillance de l ensemble Traitements multiples Principe : la redondance Redondance d information (détection d erreur) Redondance temporelle (traitements multiples) Redondance architecturale (composants multiples) Systèmes et algorithmes répartis V 14 / 45

Méfiance Sûreté de fonctionnement Vocabulaire Les moyens Principes Nombreux pièges : Mauvaise analyse des fautes possibles Réaction inappropriée due à des hypothèses mal formulées : le remède aggrave la situation Redondance mal conçue : Éléments redondants ayant des modes de défaillance identiques Faux sentiment de sécurité Il n existe pas de méthodes de tolérance aux fautes valables dans l absolu, seulement des méthodes adaptées à des hypothèses particulières d occurrence de fautes. Ces hypothèses doivent donc être explicitement formulées, après analyse soigneuse. S.Krakowiak Systèmes et algorithmes répartis V 15 / 45

Vocabulaire Les moyens Principes Recouvrement (error recovery) Remplacer l état incorrect par un état correct Détecter l erreur explicitement (vérifier des propriétés spécifiques à l état) implicitement (observation d anomalies : délai de garde, protection mémoire... ) Deux techniques de recouvrement : Reprise (backward recovery) Poursuite (forward recovery) Compensation (error masking) L état possède une redondance interne suffisante pour détecter et corriger l erreur Totalement transparent pour l utilisateur Par exemple : vote majoritaire interne Systèmes et algorithmes répartis V 16 / 45

Recouvrement Sûreté de fonctionnement Vocabulaire Les moyens Principes Reprise (backward recovery) Retour en arrière vers un état antérieur dont on sait qu il est correct Nécessite la capture et la sauvegarde de l état Technique générale Coûteuse en temps et place Poursuite (forward recovery) Reconstruction d un état correct, sans retour en arrière Reconstruction souvent partielle, service dégradé Technique spécifique à l application et aux types d erreurs possibles Systèmes et algorithmes répartis V 17 / 45

Reprise Sûreté de fonctionnement Vocabulaire Les moyens Principes Reprise Le système est remis dans un état précédant l occurrence de l erreur points de reprise pour sauvegarder l état (périodiquement, ou sur transition importante) La sauvegarde et la restauration doivent être atomique (pas d interférences) L état des points de reprise doit lui-même être protégé contre les fautes Systèmes et algorithmes répartis V 18 / 45

Points de reprise en réparti Vocabulaire Les moyens Principes Soit prise de clichés ( état cohérent possible) Soit des points de reprise individuels + construction d un état global cohérent risque d effet domino 4 1 P1 Point de reprise 5 envoi 2 x Erreur détectée P2 6 3 réception P3 État global cohérent Systèmes et algorithmes répartis V 19 / 45

Compensation Exemple : vote majoritaire Sûreté de fonctionnement Vocabulaire Les moyens Principes Résiste à la défaillance d un composant de traitement et d un voteur par étape (dessin : S. Krakowiak) Systèmes et algorithmes répartis V 20 / 45

Plan Sûreté de fonctionnement 1 Sûreté de fonctionnement Vocabulaire Les moyens Principes 2 3 Techniques logicielles Techniques matérielles Systèmes et algorithmes répartis V 21 / 45

Serveur tolérant aux fautes Redondance : N serveurs pour résister N 1 pannes franches (reprise) Points de reprise Serveurs de secours prêts à démarrer (poursuite) Serveur de primaire serveurs de secours Un seul serveur (le primaire) exécute les requêtes des clients La panne du primaire est visible des clients (compensation) N serveurs symétriques exécutant toutes les requêtes La panne d un serveur est invisible aux clients (tant qu il reste un serveur!) Systèmes et algorithmes répartis V 22 / 45

Serveur primaire secours froids client serveur de secours requête serveur primaire point de reprise (en attente) traitement réponse restauration de l'état Panne visible par le client Points de reprise : périodiquement, ou à chaque transition importante Simple mais latence de reprise Retour en arrière requêtes traitées mais oubliées Systèmes et algorithmes répartis V 23 / 45

Serveur primaire serveurs de secours client requête (en attente) réponse serveur primaire secours 1 traitement nouvel état + réponse ack ack secours 2 Diffusion fiable (pas de diffusion partielle) Cohérence : quand le primaire répond, tous les serveurs non en panne sont dans le même état Poursuite : tout serveur de secours peut remplacer le primaire en cas de panne Systèmes et algorithmes répartis V 24 / 45

Défaillance du serveur primaire client serveur primaire requêt (en attente) délai de garde 1 2 requête répétée secours 1 secours 2 Détection de la défaillance par le client et par les secours Le client renvoie sa requête au secours devenu primaire (élection ou ordre défini à l avance) Diffusion fiable tous les serveurs sont à jour, ou aucun : Si la panne est arrivée en 1 (aucun serveur à jour) comme une nouvelle requête Si la panne est arrivée en 2 (tous les serveurs à jour) renvoie de la réponse déjà calculée Les requêtes ont un identifiant unique, pour distinguer 1 et 2. Systèmes et algorithmes répartis V 25 / 45

Cas particulier : 1 seul secours (Alsberg & Day) client serveur primaire secours requête traitement (en attente) nouvel état + réponse réponse ack Protocole plus simple (pas besoin de diffusion fiable) Réponse envoyée par le secours Systèmes et algorithmes répartis V 26 / 45

client serveur requête (en attente) traitement réponses serveur traitement serveur traitement Tous les serveurs sont équivalents et exécutent le même traitement Le client choisit la première réponse (panne d arrêt), ou la réponse majoritaire (panne arbitraire) Diffusion fiable et totalement ordonnée (atomique) : Message délivré par tous les destinataires ou aucun Deux messages différents sont délivrés dans le même ordre sur tous les destinataires communs Systèmes et algorithmes répartis V 27 / 45

Nécessité de la diffusion atomique client requête 1 client serveur requête 2 T2 T1 serveur T1 T2 serveur T1 Le serveur 1 traite la requête 2 avant la 1, alors que les serveurs 2 et 3 traitent 1 puis 2 état incohérent si les traitements modifient l état des serveurs (traitements non commutatifs) T2 Systèmes et algorithmes répartis V 28 / 45

Comparaison redondance froide/passive/active Mécanismes nécessaires : Diffusion fiable pour passive, fiable-atomique pour active Coordination des départs/arrivées (notion de vue, à suivre) Ressources : Serveur froid : éteint ; reprise longue Serveur primaire : serveurs de secours non utilisés gratuits / utilisés pour autre chose ; reprise non immédiate : exécutions superflues ; reprise immédiate Transparence pour le client : uniquement en redondance active Sensibilité aux bugs logiciels : même état + même entrée même bug tous se plantent... (redondance froide moins sensible : retour en arrière) Système critique : combinaison des trois techniques compensation/poursuite/reprise : 2 serveurs actifs + 1 secours passif + 1 secours froid avec points de reprise Systèmes et algorithmes répartis V 29 / 45

Groupes de processus Travaux de Kenneth P. Birman (Cornell University) Protocoles de groupes Gestion d un ensemble de processus avec des opérations pour l appartenance : évolution de la composition du groupe, connaissance de la composition du groupe la diffusion : communication vers un ensemble de processus Motivations : ensemble de processus se comportant comme un processus unique, avec tolérance aux fautes (réplication) travail coopératif, partage d information Groupe de pairs Groupe client-serveur groupe de diffusion groupe hiérarchique Systèmes et algorithmes répartis V 30 / 45

Service de groupes : interface diffuser(p,m) : le processus p diffuse le message m au groupe délivrer(p,m) : le message m est délivré à p changement-de-vue(p,id,v) : une nouvelle vue V (= ensemble de processus) identifiée par id est délivrée au processus p La diffusion se fait toujours dans la vue courante Groupe diffuser délivrer service de groupe envoyer Processus recevoir système de communication changement de vue Systèmes et algorithmes répartis V 31 / 45

Diffusion Sûreté de fonctionnement Envoi d un message à un ensemble de destinataires Diffusion générale (broadcast) Les destinataires sont tous les processus d un ensemble défini implicitement (p.e. tous les processus du système). L émetteur est généralement aussi destinataire. broadcast(émetteur, message) Diffusion de groupe (multicast) Les destinataires sont un ou plusieurs groupes spécifiés. L émetteur peut ne pas appartenir aux groupes destinataires. Les groupes peuvent ne pas être disjoints. multicast(émetteur, message, {groupe1, groupe2...}) Systèmes et algorithmes répartis V 32 / 45

Propriétés indépendantes de l ordre d émission Diffusion fiable Un message est délivré à tous les destinataires corrects ou à aucun. Diffusion totalement ordonnée (dite atomique) La diffusion est fiable et les messages sont délivrés dans le même ordre sur tous leurs destinataires. P1 t2 t2 P2 t1 t1 G1 G2 L ordre total peut (ou non) être compatible avec la causalité Systèmes et algorithmes répartis V 33 / 45

Uniformité Sûreté de fonctionnement Diffusion fiable uniforme Si un message est délivré à un processus (correct ou défaillant), il sera délivré à tous les processus corrects avec diffusion fiable : délivrance à tous les processus corrects ou aucun, on ne se préoccupe pas des processus défaillants. P1 P2 P3 P4 Non uniforme (mais fiable) Uniforme Nécessaire si un processus défaillant peut (avant sa défaillance) exécuter des actions irréversibles, notamment vis-à-vis de l extérieur. Systèmes et algorithmes répartis V 34 / 45

Propriétés liées à l ordre d émission Diffusion FIFO Deux messages d un même émetteur sont délivrés dans l ordre de leur émission. P1 m1 m2 m1 m2 P2 Diffusion causale L ordre de délivrance respecte la causalité de l ordre (causal) d émission. P1 P2 G1 G2 c1 m c2 Systèmes et algorithmes répartis V 35 / 45 c1 m c2

Classes de propriétés fiable atomique fiable FIFO atomique FIFO fiable causale atomique causale Systèmes et algorithmes répartis V 36 / 45

Protocoles de groupe : l appartenance Le service d appartenance (membership) vise à fournir à tout instant à chaque membre du groupe une vue de la composition courante du groupe. Partition primaire : la suite des vues fournies aux membres est totalement ordonnée. Il n y a pas de partition, ou de manière équivalente, un unique primaire. Partition multiple : la suite des vues fournies aux membres est partiellement ordonnées. Il peut y avoir simultanément plusieurs vues disjointes. Systèmes et algorithmes répartis V 37 / 45

Diffusion anarchique C1 C2 S1 S2 S3 m1 m2 Ordre causal? Ordre total? Atomicité? Arrêt/Reprise? m4 m3 crash m5 état Systèmes et algorithmes répartis V 38 / 45

groupe avec synchronisme fort C1 C2 S1 S2 S3 m1 m2 m3 crash m4 m5 Systèmes et algorithmes répartis V 39 / 45

groupe avec synchronisme virtuel C1 C2 S1 S2 S3 m1 m2 m3 m4 crash S4 m5 Systèmes et algorithmes répartis V 40 / 45

Le synchronisme virtuel Une vue = état d un groupe (ensemble des membres) Garantir qu une diffusion est délivrée dans la vue où elle a été émise Garantir que, entre deux changements de vue, tous les membres reçoivent les mêmes messages Garantir que tous les membres voient la même séquence de changements de vue Progression limitée à la partition majoritaire Systèmes et algorithmes répartis V 41 / 45

Impossibilités Sûreté de fonctionnement Impossibilité du service d appartenance Un service d appartenance minimal (spécifications peu contraignantes) est impossible dans un système asynchrone avec une seule défaillance d arrêt. Résultat similaire à Fischer, Lynch, Paterson (cf partie consensus ). Le consensus est réductible à l appartenance. Impossibilité de la diffusion atomique La diffusion atomique (= totalement ordonnée) est impossible dans un système asynchrone avec une seule défaillance d arrêt. Solutions (cf partie consensus ) : supposer du synchronisme et/ou les détecteurs de fautes Systèmes et algorithmes répartis V 42 / 45

Techniques logicielles Techniques matérielles Plan 1 Sûreté de fonctionnement Vocabulaire Les moyens Principes 2 3 Techniques logicielles Techniques matérielles Systèmes et algorithmes répartis V 43 / 45

Techniques logicielles Techniques matérielles Techniques logicielles Cf cours suivant (réplication des données) Systèmes et algorithmes répartis V 44 / 45

Techniques logicielles Techniques matérielles RAID Redundant Array of Inexpensive/Independent Disks Plusieurs disques sur lesquels on partitionne et duplique les données meilleure performance (accès parallèle) meilleure disponibilité (redondance) Multiples configurations selon besoins (non développé : contrôle centralisé) Systèmes et algorithmes répartis V 45 / 45