Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène Corine Marchand - Jean-Marc Vincent Projet Apache-INRIA Soutenu par : France Télécom R&D CRE MIRRA Laboratoire ID-IMAG http://www-id.imag.fr {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 1
Problématique Construction d une infrastructure logicielle résiliente pour réseaux sans fil ad-hoc {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 2
Problématique Construction d une infrastructure logicielle résiliente pour réseaux sans fil ad-hoc Objectif : Prise de décisions cohérentes dans cet environnement {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 3
Plan 1. Contexte Industriel 2. Contexte Expérimental 3. Décision en environnement réparti 4. Détecteurs de défaillances Architecture Implémentations Qualité 5. Expérimentation {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 4
Contexte Industriel (1) Projet RNRT SIDRAH : (Services d Infrastructure Dynamique sur Réseau local Ad-Hoc) Partenaires : Kelua: Middleware (Jonathan) France Télécom R&D: Services d infrastructure dynamique HP-Labs: Couche transport de l infrastructure ID-Imag: Résilience {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 5
Contexte Industriel (2) SIDRAH : (Services d Infrastructure Dynamique sur Réseau local Ad-Hoc) Spontanéité de la mise en réseau (configuration automatique) Interopérabilité des technologies (WIFI + BT) Fiabilité (résistance aux fréquentes déconnexions) Hétérogénéité des entités {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 6
Contexte Industriel (3) MIRRA : (Maintien d Infrastructure Répartie sur des Réseaux Ambiants) Contrat de collaboration de recherche (INRIA - France Télécom R&D) Conception et mise au point d algorithmes répartis Analyse d algorithmes et implémentation Expérimentation Plans d expérience Construction de modèles statistiques de comportement (analyse quantitative) Protocoles de tuning {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 7
Plan 1. Contexte Industriel 2. Contexte Expérimental 3. Décision en environnement réparti 4. Détecteurs de défaillances Architecture Implémentations Qualité 5. Expérimentation {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 8
Contexte Expérimental (1) Hétérogénéité des machines Variabilité de l interconnexion : Réseau WIFI (802.11b) en mode Ad-Hoc Topologie dynamique : Mobilité Connexions / Déconnexions fréquentes Rmq : 2 types de déconnexions Paramètres quantitatifs : Latence - Débit - pertes {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 9
Contexte Expérimental - Latences (2) Pocket PCs en mode ad-hoc 1400 sans economie d energie economie d energie 1200 1000 800 600 Taille échantillon : 5000 mesures ping (délai : 1 s) 400 200 0 0 50 100 150 200 250 300 350 400 450 500 latence en ms {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 10
Contexte Expérimental - Latences (3) Facteurs retenus : influents Distance Nb obstacles Grand nombre de paramètres Nb entités Charge réseau Type émetteur Type récepteur Economie NRJ {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 11
Contexte Expérimental - Latences (3) Facteurs retenus : influents Grand nombre de paramètres Plan d expérience : Méthode de Taguchi (à 2 niveaux) Distance Nb obstacles Nb entités Charge réseau Type émetteur Type récepteur Economie NRJ {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 12
Contexte Expérimental - Latences (3) Facteurs retenus : influents Distance Nb obstacles Nb entités Charge réseau Type émetteur Type récepteur Economie NRJ {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 13
Contexte Expérimental - Latences (3) Facteurs prépondérants: Type récepteur Charge réseau Economie NRJ Type émetteur Interactions {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 14
Remarques : taux de perte Conditions normales : taux de perte < 1% Désynchronisation : taux de perte : environ 80 % Cas de distances élevées : récepteur + sensible aux perturbations échecs de transmissions Pb : Identification du passage en régime chaotique {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 15
Débits : UDP vs TCP 7 Portable vers Portable (TCP) Portable vers Portable (UDP) 6 5 Debit en Mbitss 4 3 2 1 0 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Taille des paquets en octects Débits moyens pour les ordinateurs portables Courbe en mode UDP : décrochage tous les 1470 octets dues au MTU (Maximum Transmission Unit).Coût de l utilisation de TCP :le débit chute de 0.5Mbits/s par rapport à UDP. {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 16
Débits moyens pour PPC Mode Taille packets Débit UDP Débit TCP octets Mbits/s Mbits/s ad hoc 1000 1.60 1.28 ad hoc 4000 1.8 1.54 ad hoc 8000 1.82 1.65 infrastructure 1000 1.56 1.26 infrastructure 4000 1.71 1.56 infrastructure 8000 1.74 1.69 L augmentation de la taille des paquets engendre l augmentation du débit. Cependant, pour des distances plus élevées, les débits chutent lorsque l on utilise des paquets de grandes tailles. {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 17
Plan 1. Contexte Industriel 2. Contexte Expérimental 3. Décision en environnement réparti 4. Détecteurs de défaillances Architecture Implémentations Qualité 5. Expérimentation {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 18
Décision en environnement réparti Exemples de problèmes de "cohérence" posés : Gestion de groupe Continuité de service Gestion des ressources {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 19
Décision en environnement réparti Exemples de problèmes de "cohérence" posés : Gestion de groupe Continuité de service Gestion des ressources Classes d algorithmes : Election Consensus Diffusion atomique... {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 20
Décision en environnement réparti Exemples de problèmes de "cohérence" posés : Gestion de groupe Continuité de service Gestion des ressources Classes d algorithmes : Election Consensus Diffusion atomique... Modèle de base : Consensus {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 21
Exemple de problème Groupe Sidrah Service communication sécurisée Réseau filaire {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 22
Exemple de problème Groupe Sidrah Service communication sécurisée Réseau filaire {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 23
Exemple de problème Groupe Sidrah Election d un nouveau service {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 24
Exemple de problème Groupe Sidrah {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 25
Environnement non fiable Rappel du contexte : Système distribué Relativement peu d entités (< 50) Pas de mémoire partagée, pas de mémoire stable Environnement asynchrone (communications non bornées) Environnement non fiable (crash de processus + pertes de messages) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 26
Environnement non fiable Rappel du contexte : Système distribué Relativement peu d entités (< 50) Pas de mémoire partagée, pas de mémoire stable Environnement asynchrone (communications non bornées) Environnement non fiable (crash de processus + pertes de messages) Résultat d impossibilité [Fischer, Lynch & Paterson] {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 27
Environnement non fiable Rappel du contexte : Système distribué Relativement peu d entités (< 50) Pas de mémoire partagée, pas de mémoire stable Environnement asynchrone (communications non bornées) Environnement non fiable (crash de processus + pertes de messages) Résultat d impossibilité [Fischer, Lynch & Paterson] Quelles approches? Auto-stabilisante Probabiliste Synchrone Partiellement Synchrone (Détecteurs de Défaillances) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 28
Intérêt des Détecteurs de Défaillances Concentrer l analyse de la variabilité de l environnement dans un seul composant Facilité de programmation / utilisation / portabilité {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 29
Intérêt des Détecteurs de Défaillances? Concentrer l analyse de la variabilité de l environnement dans un seul composant Facilité de programmation / utilisation / portabilité Utilisation des Détecteurs de Défaillances [Chandra & Toueg] Tout processus incorrect finira par être suspecté par tous les processus corrects (complétude) Après un temps t, au moins un processus correct ne sera plus suspecté (exactitude) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 30
Intérêt des Détecteurs de Défaillances? Concentrer l analyse de la variabilité de l environnement dans un seul composant Facilité de programmation / utilisation / portabilité Utilisation des Détecteurs de Défaillances [Chandra & Toueg] Tout processus incorrect finira par être suspecté par tous les processus corrects (complétude) Après un temps t, au moins un processus correct ne sera plus suspecté (exactitude) Extension : modèles de type "arrêt/rétablissement" {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 31
Architecture proposée Infrastructure d un site APPLICATION SERVICES SIDRAH S1 S2 S3 Service de consensus élection groupes, diffusion,... Détecteur de défaillances ARCHITECTURE DISTRIBUEE fournie à l initialisation via une capacité Préservation de la flexibilité Séparation des modules {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 32
Détecteur : Import Liste à interroger Liste des suspects Interface Middleware Interface consensus Controle MW ( politique et parametres ) Import module Interface réseau Requete suspicion Information {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 33
Détecteur : Export Publication d info Consultation Interface Middleware Export module Controle MW ( politique et parametres ) Interface réseau Requete suspicion Information {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 34
Plan 1. Contexte Industriel 2. Contexte Expérimental 3. Décision en environnement réparti 4. Détecteurs de défaillances Architecture Implémentations Qualité 5. Expérimentation {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 35
Module Détecteurs de Défaillances Principe de fonctionnement : Type de requêtes sur le détecteur : Liste de membres (liste d identificateurs) Type de réponses du détecteur : Pour chacun des membres : Présence ou Suspicion + Notion de qualité (degré de suspicion) L info est une vue locale du DD peut être erronée. {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 36
Architecture interne (3) Interaction module d importation / module d exportation ORB JVM Module Exportation Consensus Module Importation ORB Module Exportation JVM Consensus Module Importation Réseau Ad Hoc Réseau Ad Hoc Module d importation : Diffusion d information (à la demande, par anticipation) Module d exportation : Collecteur d information Implémentation d un modèle de suspicion {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 37
Implémentation des Détecteurs de Défaillances Heartbeat DDExport processus q Di Di Di DDImport processus p Dinit Dt Dt Dt p suspect q Requête DDExport processus q??? ack ack ack DDImport processus p Dt Dt Dt Di Di P suspecte q {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 38
Implémentation des Détecteurs de Défaillances Heartbeat seuil dépend : fréquence d émission DDExport processus q Di Di Di type d émetteur charge réseau DDImport processus p Dinit Dt Dt Dt p suspect q Requête DDExport processus q seuil dépend : charge réseau ack ack??? ack type d émetteur DDImport processus p Dt Dt Dt Di Di P suspecte q {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 39
Impact du contexte (1) Réseaux ambiants : environnement fortement variable Variabilité des communications limiter le nb de messages en transit : + technique "Heartbeat" utilisation de tout message reçu diffusion des connaissances technique "Requête" : vérification suspicion {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 40
Impact du contexte (2) Modèle d implémentation spécifique : Compromis : quantité de messages / réactivité Compromis : fiabilité / réactivité Objectif : réglage dynamique des paramètres en fonction de l évolution de l environnement paramétrage dépend de la qualité de service requise au détecteur de défaillances efficacité du détecteur de défaillances dépend du paramétrage {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 41
Qualité Compromis : vitesse détection / nb fausses suspicions Vitesse de détection d une défaillance (T D ) : tps entre le crash de p i et sa détection par p j. Qualité de précision : Délai entre 2 erreurs : tps entre 2 fausses détections successives. Durée des erreurs : durée moyenne des fausses détections (tps mis par le DD pour rectifier ses erreurs) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 42
Modèles (1) Prise en compte de la variabilité du réseau de communications Dimensionnement des temporisations Temporisation fixe (statique) : θ p suspecte q si la dernière info reçue en provenance de q > θ Taux de suspicion à tort : φ I (θ) θ θ θ θ θ θ Arrivée des "beats" Temps Zone de suspicion Temporisation {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 43
Modèles (2) Fréquence de réception des "beats" : µ intervalle de tps moyen entre 2 réceptions : 1 µ µ = µ 0 (1 p) où µ 0 : fréquence d émission initiale et p : taux de perte des messages Soit {X n } n N la suite des intervalles de tps processus stationnaire ergodique dont la loi stationnaire est connue 1 ere approximation : durées entre 2 réceptions sont iid {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 44
Modèles (3) Modélisation des lois d inter-arrivées Déduction de la qualité 1 Distribution inter réception de "beats" (fréquence 1) 1 Qualité de service fonction de la durée de temporisation 0.8 Distribution exponentielle 0.1 Distribution exponentielle 0.6 0.01 0.001 0.4 0.2 Distribution d Erlang(2) 0.0001 1e 05 Distribution d Erlang(2) 0 0 1 2 3 4 5 6 7 Temps 1e 06 0 1 2 3 4 5 6 7 θ Loi Exponentielle (µ) : φ I (θ) = e µθ Loi d Erlang (2, 2µ) : φ I (θ) = e 2µθ (1 + θ) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 45
Modèles (4) Démarche : Observation du système Histogramme des inter-arrivées de "beats" Génération de la nouvelle valeur de temporisation en fonction de la qualité souhaitée {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 46
Modèles (4) Démarche : Observation du système Histogramme des inter-arrivées de "beats" Génération de la nouvelle valeur de temporisation en fonction de la qualité souhaitée Inconvénients : Non prise en compte des changements de mode imprévus du système Indépendance des variables (corrélation temporelle) Idée : Technique d amortissement (auto-adaptation des paramètres) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 47
Plan 1. Contexte Industriel 2. Contexte Expérimental 3. Décision en environnement réparti 4. Détecteurs de défaillances Architecture Implémentations Qualité 5. Expérimentation {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 48
Expérimentations (1) Détecteurs de défaillances type "Heartbeat" Objectif : Etude du délai de mise à jour Conditions : 4 entités (2 PCs + 2 PDA) broadcast sur réseau ad-hoc 802.11b Rythme d émission : 100 ms et 500 ms Durée : 15 min (10000 mesures par échantillon) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 49
Expérimentations (2) Probabilité 0.009 0.008 0.007 0.006 0.005 0.004 0.003 0.002 0.001 0 émetteur : laptop1 récepteur : PDA2 0 200 400 600 800 1000 Délais entre 2 réceptions Système "stressé" (carte réseau PDA) Probabilité 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 Réactivité de l ordre de la seconde Taux de perte important émetteur : laptop1 récepteur : laptop2 0 0 50 100 150 200 Délais entre 2 réceptions {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 50
Expérimentations (3) Probabilité 0.14 0.12 0.1 0.08 0.06 0.04 0.02 émetteur : laptop1 récepteur : laptop2 émetteur : laptop1 récepteur : pda2 émetteur : pda1 récepteur : laptop2 émetteur : pda1 récepteur : pda2 période de pulsation : 500 ms diminution de la variabilité 0 400 450 500 550 600 Délais entre 2 réceptions Si temporisation = 2 (période de pulsation) : taux de suspicion : 10 3 pour PCs récepteurs et 10 2 pour PDAs récepteurs {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 51
Bilan Bilan des expériences : Dissymétrie des comportements Qualité de service dépendante du type de machine Réglage des temporisations est donc fonction du type d émetteurs et du type de récepteurs {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 52
Bilan Bilan des expériences : Dissymétrie des comportements Qualité de service dépendante du type de machine Réglage des temporisations est donc fonction du type d émetteurs et du type de récepteurs 1 eres formules pour le réglage des temporisations (étude des temporisation) Identification des facteurs influents sur les temporisations {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 53
Conclusions et Perspectives Concentration de la gestion des temporisations au sein des détecteurs de défaillances et leur fonction d estimation Construction d un module de consensus (sans timers) Définition de la QoS du consensus Etude de la relation entre QoS des détecteurs de défaillances et QoS du consensus {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 54
Consensus: conditions expérimentales - 6 entités participant aux elections : 4 PDAs (ipaqid1, ipaqid2, ipaqid3, bob), 1 laptop (tao),1 PC (atakapa) - 1 senseur : 1 laptop (chippewa -> 192.168.252.10) - Ordre de la liste pour le consensus : - atakapa (192.168.252.20) - ipaqid1 (192.168.252.1) - ipaqid2 (192.168.252.2) - ipaqid3 (192.168.252.3) - bob (192.168.252.4) - tao (192.168.252.5) {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 55
Consensus: conditions expérimentales Expérience 1 - Paramètres : - heartbeat period : 500 ms - heartbeat interval : 1500 ms - consensus polling : 2000 ms Cette experience est réalisée dans les meilleures conditions possibles, a savoir aucun carsh (ou crash/recovery) de machines. {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 56
Trace 1 : tout va bien PC 0 PC 5 PDA 1 PDA 2 PDA 3 PDA 4 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 ESTIMATE Phase DECISION Phase PROPOSITION Phase NACK message 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 105 110 115 120 125 130 PC 0 PC 5 PDA 1 PDA 2 PDA 3 PDA 4 ESTIMATION Phase Round 1 DECISION Phase Round 1 PROPOSITION Phase Round 1 ESTIMATION Phase Round 2 {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 57
Trace 1 : tout va bien {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 58
Trace 2 : crash coordinateur {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 59
Trace 3 : Crash + retour {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 60
Trace Crash successifs {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 61
Bilan consensus Bilan des expériences : Datation des événements (horloges de mauvaise qualité) Trace non intrusive Synchronisation post-mortem (causalité +estimation) Pajé : un environnement de visualisation de traces d applications distribuées Identification de motifs A faire : statistiques temporelles QoS du consensus {Corine.Marchand, Jean-Marc.Vincent}@imag.fr AS algorithmique répartie Détecteurs de Défaillances et Qualité de Service dans un Réseau Ad-Hoc Hétérogène 62