Contribution à l allocation dynamique de ressources pour les composants expressifs dans les systèmes répartis

Documents pareils

CORBA. (Common Request Broker Architecture)

NFP111 Systèmes et Applications Réparties

CORBA haute performance

Module BD et sites WEB

Systèmes répartis. Fabrice Rossi Université Paris-IX Dauphine. Systèmes répartis p.1/49

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Le modèle client-serveur

Institut Supérieure Aux Etudes Technologiques De Nabeul. Département Informatique

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

24/11/2011. Cours EJB/J2EE Copyright Michel Buffa. Plan du cours. EJB : les fondamentaux. Enterprise Java Bean. Enterprise Java Bean.

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Introduction aux intergiciels

GEI 465 : Systèmes répartis

Conception des systèmes répartis

Composants Logiciels. Le modèle de composant de CORBA. Plan

Principes. 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA. Programmation en Corba. Stéphane Vialle

Architectures web/bases de données

Mise en œuvre des serveurs d application

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration

Software Engineering and Middleware A Roadmap

Patrons de Conception (Design Patterns)

Plan du cours. Autres modèles pour les applications réparties Introduction. Mode de travail. Introduction

MEAD : temps réel et tolérance aux pannes pour CORBA

Architectures n-tiers Intergiciels à objets et services web

IBM Business Process Manager

Urbanisme du Système d Information et EAI

Le passage à l échelle de serveur J2EE : le cas des EJB

1 Introduction à l infrastructure Active Directory et réseau

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Urbanisation des SI. Des composants technologiques disponibles. Urbanisation des Systèmes d'information Henry Boccon Gibod 1

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information.

Introduction à la conception de systèmes d information

Cloud Computing et SaaS

Intergiciels pour la répartition CORBA : Common Object Request Broker. Patrice Torguet torguet@irit.fr Université Paul Sabatier

2 Chapitre 1 Introduction

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Les Architectures Orientées Services (SOA)

Cours Bases de données

Prise en compte des ressources dans les composants logiciels parallèles

Bien architecturer une application REST

Chapitre 2 - Architecture logicielle et construction d applications client-serveur

Solutions de gestion de la sécurité Livre blanc

Fiche technique RDS 2012

Meta Object Facility. Plan

Sécurisation des architectures traditionnelles et des SOA

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

C-JDBC. Emmanuel Cecchet INRIA, Projet Sardes.

Évaluation et implémentation des langages

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Plan du Travail. 2014/2015 Cours TIC - 1ère année MI 30

NOTIONS DE RESEAUX INFORMATIQUES

Augmenter la disponibilité des applications JEE grâce au clustering : Le projet open source JShaft

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

Le cadre des Web Services Partie 1 : Introduction

1. Introduction à la distribution des traitements et des données

Groupe Eyrolles, 2004 ISBN :

Intergiciel - concepts de base

Oracle 8i sous Linux

CQP Développeur Nouvelles Technologies (DNT)

INDUSTRIALISATION ET RATIONALISATION

Eric Bertrand 08/11/06 Maître de conférence 1

La continuité de service

Placement dynamique dans les systèmes répartis à objets.

«clustering» et «load balancing» avec Zope et ZEO

1.2 Genèse. 1.3 Version de Designer utilisée

GÉREZ VOTRE RELATION CLIENT SANS QUITTER MICRO SOFT OUTLOOK

ASP 3.0 Professionnel

Etude critique de mécanismes de sécurité pour l architecture Jini

Analyse,, Conception des Systèmes Informatiques

Administration de systèmes

Cisco Certified Network Associate

10 tâches d administration simplifiées grâce à Windows Server 2008 R2. 1. Migration des systèmes virtuels sans interruption de service

Introduction à Sign&go Guide d architecture

Conception et réalisation d un système d instrumentation distribuée basé sur l architecture Jini

//////////////////////////////////////////////////////////////////// Administration systèmes et réseaux

CCNA Discovery Travailler dans une PME ou chez un fournisseur de services Internet

Remote Method Invocation (RMI)

Environnements de Développement

Cours des réseaux Informatiques ( )

Chapitre I Notions de base et outils de travail

RAPPORT DE CONCEPTION UML :

Définition. Caractéristiques. - Du partage des ressources : espace de stockage, imprimantes, lignes de communication.

RTDS G3. Emmanuel Gaudin

Présentation Internet

UE 8 Systèmes d information de gestion Le programme

OPC Factory Server- Réglage des paramètres de communication

Windows Internet Name Service (WINS)

DotNet. Plan. Les outils de développement

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Urbanisation des Systèmes d'information

RMI le langage Java XII-1 JMF

Compte Rendu d intégration d application

Planifier la migration des applications d entreprise dans le nuage

Conception, architecture et urbanisation des systèmes d information

Installation d un serveur HTTP (Hypertext Transfer Protocol) sous Débian 6

1. Des chartes graphiques homogènes, élégantes, créatives

SÉCURISATION DES CONNEXIONS À DISTANCE SUR LES RÉSEAUX DE CONTRÔLE

Hébergement de sites Web

Glossaire. ( themanualpage.org) soumises à la licence GNU FDL.

Transcription:

Numéro d ordre : 988 THÈSE présentée à L U.F.R DES SCIENCES ET TECHNIQUES DE L UNIVERSITÉ DE FRANCHE-COMTÉ pour obtenir le GRADE DE DOCTEUR DE L UNIVERSITÉ DE FRANCHE-COMTÉ Spécialité Automatique et Informatique Contribution à l allocation dynamique de ressources pour les composants expressifs dans les systèmes répartis par Vincent PORTIGLIATTI Soutenue le 2 décembre 2003 devant la Commission d Examen : Guy Bernard Professeur, Institut National des Télécommunications Rapporteur Daniel Hagimont HDR Chargé de recherche, INRIA Rhône-Alpes Rapporteur Laurent Philippe Professeur, LIFC Université de Franche-Comté Directeur Hervé Guyennet Professeur, LIFC Université de Franche-Comté Examinateur Emmanuel Cecchet Chargé de recherches, INRIA Rhône-Alpes Examinateur

2

Remerciements Le travail que j ai réalisé au cours de ma thèse n aurait certainement pas été possible sans la bienveillance et l aide de nombreuses personnes. Je tiens à les en remercier de tout cœur. Je remercie l ensemble des membres du jury, à savoir : M. Guyennet Hervé, Professeur à l Université de Franche-Comté au LIFC. M. Philippe Laurent, Professeur à l Université de Franche-Comté au LIFC. M. Guy Bernard, Professeur à l Institut National des Télécommunications d Evry M. Daniel Hagimont, HDR Chargé de recherche à l INRIA Rhône-Alpes M. Emmanuel Cecchet, Chargé de recherches à l INRIA Rhône-Alpes Je remercie Guy Bernard, Daniel Hagimont et Emmnuel Cecchet pour avoir accepté d être mes rapporteurs, pour les bons conseils et les remarques pertinentes qu ils ont émis sur mon travail. Je remercie Hervé Guyennet pour avoir présidé le jury de cette thèse. Je remercie chaleureusement Laurent Philippe, mon directeur de thèse pour le soutien, la bonne humeur, le jazz, la musique tzigane et la goutte, ainsi que les conseils avisés qu il m a prodigué lors de cette grande épopée. J espère ne pas l avoir déçu. Je remercie Bénédicte Herrmann et Sylvie Damy et pour leur gentillesse et leur bienveillance lors de ces longues années. Je fais de même pour Isabelle Jacques et Christine Chevallier, pour nos discussions intimes. ;-) Je remercie toutes les autres personnes qui ont participé de loin ou de près à cette grande aventure comme JM Nicod, Michel Lacroix et tous les autres membres de l équipe Trader. Sans oublier Frédéric Lombard, Célina Charlet, JC Voisinet, Bruno DelFabbro (encore plus vieux que moi, c est pas peu dire!!) mes compagnons de galères (parler de RAM pour un informaticien c est normal!). Je remercie l ensemble des membres du LIFC au sein duquel j ai effectué cette thèse et où je me sent comme chez moi! ;) Je remercie l ensemble des personnes de la SMER avec lesquelles j ai eu des moments inoubliables (Merci Benoit, ou bien? sinon?) Je remercie tous mes amis externes, mes compagnons de comptoir aux heures de détentes : Mister-Noug et Marycoton, Chinchin, Amal, Bip-Bip, Phil W., Jer mon colloc, Steph, Maud et Lozza, Maud et Tchonguy, Glou, Freddys, Fanny, Céline, Emilie, Pan, Le gibus, Kors, Elise, Angéline, Caroline (ma copine...la la la) et je vais arrêter là car ils sont trop nombreux et j ai la mémoire qui flanche, j me souviens plus très bien (vous connaissez la chanson (Resnay style TM)). Je remercie tout spécialement M. Berthet et Mme Georgeon pour avoir mis tous leurs espoirs en moi et m avoir pousser à aller là ou je suis maintenant. ;-) 3

4 J espère que ceux que j ai oubliés dans cette immense liste voudront bien pardonner cet oubli. Par conséquent, je remercie également tout ceux que je n ai pas cités et que j ai oublié volontairement! ;-) Finalement, je remercie l ensemble de ma famille, mes proches pour leur amour, leurs confiances, leurs constances et leurs aides, aux heures où, seul, je n y serais pas parvenu. Je dédie cette thèse à ceux que j aime et qui m ont fait l honneur de croire en moi.

Table des matières Introduction 15 1 Contexte et problématique 19 1.1 Le contexte matériel................................ 19 1.1.1 Les réseaux locaux et d interconnexions................. 20 1.1.2 L hétérogénéité dans les réseaux..................... 21 1.1.3 Le modèle matériel............................. 21 1.2 Le contexte système................................ 22 1.2.1 Le modèle de référence RM-ODP..................... 22 1.2.2 La norme CORBA............................. 23 1.2.3 La norme RM-ODP et la norme CORBA................ 24 1.2.4 DCOM................................... 25 1.2.5 Java RMI.................................. 26 1.2.6 Synthèse................................... 27 1.2.7 Le modèle système............................. 27 1.3 Le contexte applicatif............................... 28 1.3.1 Les évolutions de l applicatif....................... 28 1.3.2 Le modèle applicatif............................ 28 1.4 Problématique................................... 29 1.4.1 La gestion des ressources......................... 30 1.4.2 L expression des besoins.......................... 30 1.4.3 Les contraintes et les préférences..................... 30 1.4.4 La prise de décision............................ 31 1.5 Conclusion..................................... 31 2 Les composants 33 2.1 Introduction aux composants........................... 33 2.2 Les composants................................... 33 2.2.1 Les interfaces et les services........................ 34 2.2.2 Les spécifications et les contrats..................... 34 2.2.3 Les connecteurs............................... 35 2.3 Les différentes catégories de composants..................... 36 2.4 Les langages de description d architecture.................... 36 2.4.1 Les concepts des ADL........................... 37 2.4.2 Les principaux ADL............................ 37 2.4.3 Le langage de coordination........................ 38 5

6 TABLE DES MATIÈRES 2.4.4 Les principaux types de langage de coordination............ 38 2.5 Les standards.................................... 39 2.5.1 Le modèle de composant d UML 2.................... 40 2.5.2 Les Enterprise Java Beans......................... 41 2.5.3 Le Corba Component Model....................... 43 2.5.4 Microsoft.NET............................... 45 2.6 Conclusion..................................... 46 3 La gestion de ressources dans les systèmes répartis 47 3.1 Les propriétés de la gestion de ressources.................... 47 3.2 Les algorithmes et leurs principes......................... 48 3.2.1 Les composantes de l équilibrage de charge............... 49 3.2.2 Les politiques de gestion de charge.................... 49 3.2.3 La politique d information......................... 50 3.2.4 La distribution des informations..................... 51 3.2.5 La politique de localisation........................ 51 3.3 L administration.................................. 52 3.3.1 L administration d infrastructure..................... 52 3.3.2 L administration d exécution....................... 53 3.4 La mobilité des objets............................... 53 3.4.1 Le placement................................ 54 3.4.2 La migration................................ 54 3.4.3 La duplication............................... 55 3.5 Des exemples de systèmes de gestion de ressources............... 56 3.5.1 ANTS Load Balancing System...................... 56 3.5.2 CATScan.................................. 56 3.5.3 FarGo.................................... 56 3.5.4 YALB (Yet Another Loadbalancing System)............... 57 3.5.5 Condor flock................................ 57 3.5.6 Utopia multi clusters............................ 57 3.5.7 Bellerophon................................ 58 3.5.8 Computational Field Model (CFM)................... 59 3.6 Conclusion..................................... 59 4 La modélisation par graphes 61 4.1 Les graphes appliqués aux systèmes distribués.................. 61 4.1.1 Pourquoi optimiser?............................ 61 4.1.2 Préambule sur les graphes......................... 62 4.2 Définition et notations............................... 63 4.2.1 Définitions de base............................. 63 4.2.2 Partitionnements de graphes....................... 64 4.3 La modélisation du problème........................... 65 4.4 La caractérisation du modèle........................... 67 4.4.1 Caractérisation............................... 67 4.4.2 Définition d une application ou logiciel.................. 68 4.4.3 Définition du matériel ou hardware.................. 68 4.4.4 Le graphe d application.......................... 69

TABLE DES MATIÈRES 7 4.4.5 Le graphe matériel............................. 70 4.5 La recherche d une fonction de coût....................... 71 4.5.1 Le but de la fonction de coût....................... 72 4.5.2 Conclusion partielle............................ 75 4.6 Les propriétés des fonctions de coût....................... 75 4.6.1 Les différentes consommations...................... 76 4.6.2 La consommation mémoire........................ 76 4.6.3 La consommation d entrée/sortie..................... 76 4.6.4 La consommation de contraintes..................... 76 4.6.5 La consommation de préférences..................... 77 4.6.6 La consommation réseau.......................... 77 4.6.7 La consommation processeur....................... 77 4.7 Activité réseau, processeur et besoins applicatifs................ 78 4.7.1 Optimisation des différentes activités................... 78 4.7.2 Les autres solutions............................ 79 4.7.3 Discussion sur un algorithme....................... 80 4.8 L algorithme.................................... 82 4.8.1 L algorithme de placement......................... 82 4.8.2 Les hypothèses............................... 82 4.8.3 Les principes................................ 83 4.8.4 Les résultats................................ 84 4.9 Conclusion..................................... 84 5 La prise de décision 87 5.1 Préambule sur l aide multicritère......................... 87 5.1.1 La formulation multicritère d un problème de décision......... 89 5.1.2 Les méthodes multicritères........................ 90 5.2 Les critères et leur propriétés........................... 90 5.2.1 L expression d un critère.......................... 91 5.2.2 Les différents types de critères...................... 91 5.3 L agrégation multicritère.............................. 92 5.3.1 Les différentes procédures multicritères.................. 93 5.3.2 La procédure sommative.......................... 93 5.3.3 La procédure multiplicative........................ 93 5.3.4 La procédure lexicographique....................... 93 5.3.5 L analyse de la concordance........................ 94 5.3.6 L analyse de la discordance........................ 94 5.3.7 Résumé................................... 94 5.4 Exemples de méthodes............................... 94 5.4.1 La méthode ELECTRE I......................... 94 5.4.2 La méthode ELECTRE II......................... 95 5.4.3 La méthode ELECTRE III........................ 95 5.4.4 La méthode ELECTRE IV........................ 96 5.5 Les files d attente.................................. 96 5.5.1 La prise de décision............................ 96 5.5.2 Le placement statique........................... 96 5.5.3 L évaluation d algorithmes......................... 97

8 TABLE DES MATIÈRES 5.5.4 Résumé................................... 97 5.6 La décision logique................................. 97 5.6.1 Le problème de décision.......................... 98 5.6.2 Quelques critères classiques pour la décision............... 98 5.7 Conclusion..................................... 99 6 Un gestionnaire de placement à composants expressifs 101 6.1 Un modèle d administration............................ 101 6.2 Les bases fondamentales.............................. 102 6.2.1 La réflexion au niveau des applications.................. 102 6.2.2 Une allocation automatique de ressources................ 103 6.3 Les ressources et leurs optimisations....................... 105 6.3.1 Les ressources d un réseau local...................... 105 6.3.2 L optimisation d un réseau local..................... 106 6.4 Les objectifs..................................... 108 6.4.1 Le cadre de l étude............................. 109 6.4.2 Les limitations............................... 109 6.4.3 L ensemble des informations........................ 110 6.5 Le service de placement GO............................ 111 6.5.1 Le modèle du placement du GO..................... 112 6.5.2 Les traitements des gestionnaires..................... 113 6.5.3 Les différentes stratégies de placement.................. 115 6.6 L implémentation du placement.......................... 116 6.6.1 La procédure de décision logique..................... 116 6.6.2 Résumé................................... 117 6.7 Le gestionnaire ORM................................ 117 6.7.1 Les interfaces du module ORM...................... 117 6.7.2 La définition des propriétés........................ 118 6.7.3 Le langage de contraintes......................... 118 6.7.4 Le calcul des contraintes.......................... 121 6.7.5 Le calcul des préférences.......................... 122 6.7.6 L agrégation des critères.......................... 122 6.8 Conclusion..................................... 123 7 Les tests 125 7.1 La plateforme de tests............................... 125 7.1.1 Le simulateur d applications........................ 126 7.1.2 Un exemple de paramétrage d une application.............. 127 7.1.3 Le serveur.................................. 130 7.1.4 Le client................................... 130 7.1.5 Le client/serveur.............................. 131 7.2 Les paramètres des applications.......................... 132 7.3 Les différents tests de performances........................ 133 7.4 Les tests sans prise en compte des besoins applicatifs.............. 135 7.4.1 Le test 1 serveur et 2 clients........................ 135 7.4.2 Le test 2 serveurs et 2 clients....................... 137 7.4.3 Le test 2 serveurs, 1 client/serveur et 8 clients.............. 138

TABLE DES MATIÈRES 9 7.4.4 Synthèse................................... 140 7.5 Les tests avec prise en compte des besoins applicatifs.............. 140 7.5.1 Le test 2 serveurs et 2 clients....................... 140 7.5.2 Le test 4 serveurs et 4 clients....................... 142 7.5.3 Le test 7 serveurs 3 clients/serveurs et 10 clients............ 143 7.5.4 Synthèse................................... 145 7.6 L analyse des paramètres pour l optimisation.................. 145 7.7 Conclusion..................................... 146 8 Conclusion et perspectives 149 8.1 Conclusion..................................... 149 8.2 Perspectives..................................... 150 8.2.1 Les contrats de composants........................ 150 8.2.2 L utilisation du langage XML....................... 150 8.2.3 Le service de courtage........................... 151 A Définition XML : MACHINE 153 B Définition XML : COMPONENT 157

10 TABLE DES MATIÈRES

Table des figures 1.1 L architecture CORBA OMA........................... 24 4.1 Exemple de partitionnement d un graphe complet................... 65 4.2 Les trois types d arêtes................................ 65 4.3 Exemple de partitionnement du graphe applicatif................... 66 4.4 Exemple de plongement du graphe applicatif sur le graphe matériel......... 66 4.5 Découpage du graphe en fonction de la densité de communication.......... 81 4.6 Découpage du graphe en fonction de la charge.................... 81 6.1 Architecture du GO-Domain........................... 112 6.2 Architecture du GO-Site.............................. 114 7.1 Architecture des différents services........................ 127 7.2 Coût du système GO par rapport au nombre d objets............. 134 7.3 La mobilité du serveur pour optimiser les communications.......... 136 7.4 Les résultats de l ancien test 1s2c de HY Chan................. 137 7.5 La mobilité des serveurs pour optimiser les communications.......... 138 7.6 La mobilité des serveurs en fonction de la charge et des communications... 139 7.7 Configuration du test 2 serveurs et 2 clients : placement initial........ 141 7.8 Configuration du test 2 serveurs et 2 clients après déplacements........ 141 7.9 Mobilité en fonction de la charge, des communications et des contraintes... 142 7.10 Mobilité en fonction de la charge, des communications et des préférences... 143 7.11 Mobilité en fonction de la charge, des communications et des besoins applicatifs 144 11

12 TABLE DES FIGURES

Liste des tableaux 6.1 Opérateurs et évaluations associées des contraintes............... 122 7.1 Caractéristiques des machines de test....................... 126 7.2 Le plan d expériences............................... 132 13

14 LISTE DES TABLEAUX

Introduction Il est incontestable que l outil informatique est devenu depuis une vingtaine d années, un élément essentiel de la vie et du travail de millions de personnes, qu ils soient programmeurs, administrateurs ou simples utilisateurs. L informatique, réservée autrefois aux initiés, s est banalisée par sa présence indispensable dans de nombreux domaines ainsi que par les différentes avancées technologiques. Ces avancées ont permis l émergence de réseaux permettant de connecter les systèmes informatiques entre eux. Le but avoué est de partager des ressources autant matérielles que logicielles et de répondre aux besoins des différents intervenants. Les systèmes informatiques répartis et distribués sont nés de ce concept. Ils ont permis aux différentes informations et aux diverses ressources de se soustraire au modèle centralisé par la distribution et la répartition sur un ensemble plus ou moins important d ordinateurs inter-connectés non forcément homogènes. Cependant, le partage simple des ressources et des informations n est plus une approche, ni une réponse suffisante pour utiliser et gèrer les applications de plus en plus complexes et dynamiques. De plus, le logiciel est soumis à des contraintes fortes telles que la réduction des coûts de développement et de maintenance des applications ainsi qu à la perpétuelle course à l ergonomie et à l adaptabilité. Nombreuses sont les réponses qui sont apportées à ce problème. La plus récente, et la plus communément admise, est l approche par composants issue directement de la technologie objet. Véritables briques logicielles, les composants permettent de concevoir et de construire par assemblage des applications. L un des intérêts de cette technologie est de permettre aux applications de tirer aisément partie d un environnement matériel intrinsèquement distribué puisque basé sur l Internet. Il s agit alors, pour construire une application, de développer et d assembler des composants dont les interactions avec les autres composants sont réalisées par des invocations permettant de proposer différents services. L exécution peut se faire facilement dans un environnement distribué en utilisant des supports d exécution qui offrent une transparence des invocations distantes. Dans ce cadre, l administration de l exécution et le déploiement de composants devient une phase critique de l exécution. Il est nécessaire, pour obtenir de bonnes performances, de savoir gérer de façon dynamique le placement de chacun des composants en tenant compte de leurs besoins propres. Ces besoins peuvent être de natures diverses et variées comme par exemple les propriétés matérielles ou des ressources logicielles nécessaires à l exécution correcte du composant. La thèse que nous défendons est que le déploiement des composants ainsi que la gestion de ressources doit utiliser des informations dynamiques traduisant l état de l environnement ainsi que celui des desideratas des composants applicatifs. Pour réaliser le déploiement, ces informations nécessitent un traitement dynamique lors de la prise de décision. Cette dernière doit être également dynamique, ce qui implique l émergence de nouveaux problèmes lors de la création et de l exécution d une décision de déploiement et/ou de placement en regard de notre contexte d allocation de ressources. Par conséquent, notre objectif est de permettre une 15

16 Introduction gestion dynamique pour optimiser et rationnaliser, d une part, les performances d exécution des composants et, d autre part, les ressources des systèmes dans lesquels cette exécution a lieu par l utilisation de décisions sur le placement de ces composants. L intérêt de la gestion dynamique du placement pour les composants vient du couplage fort entre l application et le système : il est possible d obtenir, au plan du système, des informations sur la structure de l application et ses composants par l utilisation, par exemple, de fichiers de configuration. Nous travaillons dans un contexte distribué, ce qui nous permet, entres autres, de nous appuyer sur des techniques existantes de gestion de charge des machines ainsi que sur les interactions de communications entre composants pour asseoir notre étude. Nous utilisons plusieurs techniques de mobilité. Ces techniques sont : le placement et la migration. Ces différentes méthodes nous permettent de distribuer la charge des machines, d optimiser les performances des applications au point de vue communication et, par conséquent, d obtenir une exécution plus efficace. Par exemple, la mobilité inhérente aux composants peut être utilisée pour les placer au plus près des ressources qu ils utilisent, sur les sites les plus disponibles ou bien sur ceux désirés en accord avec leurs besoins. En plaçant les composants au plus près de ce qu ils utilisent, il est possible de réduire les temps d accès et l utilisation des ressources. De la même manière, en plaçant les composants sur les sites dont les ressources sont les plus disponibles, l utilisation des ressources est mieux répartie. Cependant, nous pensons qu il est très difficile de proposer une solution générale qui répondrait aux problèmes de l ensemble des composants et constructions possibles d applications. Cette grande difficulté est imposée par l incertitude du comportement des applications. Cette incertitude a une forte incidence sur les paramètres à prendre en compte lors des décisions du placement des applications et/ou des composants. Nous affirmons que l expression des besoins par l application peut lever certaines de ces incertitudes car il est possible d obtenir une plus grande connaissance sur cette application et son comportement. Ceci va également dans le sens des descripteurs de déploiement des composants qui autorisent la modification du comportement des composants sans recompilation. De ce constat, nous devons donc choisir une approche similaire qui favorise l évolution des besoins applicatifs et de leurs paramètres, mais aussi l ensemble des autres habituellement utilisés (charge, communication, etc). Cela nous permettra de nous rapprocher d une solution générale pour répondre à notre problématique. Par conséquent, il est nécessaire d observer en permanence le système et ses performances d exécution afin de détecter tout changement pour pouvoir, le cas échéant, satisfaire de nouveaux besoins et/ou ré-équilibrer le système en fonction des débits de communications et de la charge des machines. D autre part, pour mesurer la qualité d un déploiement, il est important d étalir une évaluation des gains obtenus. Ces évaluations seront la validation de notre modèle qui comprend un système gérant les besoins applicatifs et permet une administration automatique par rapport à l environnement matériel, système et logiciel. Le plan de la Thèse Nous présentons, dans le chapitre 1, un modèle de gestion et d allocation de ressources expressive au sein d un système réparti à composants et nous introduisons le contexte de notre étude. Nous décrivons le support fourni par le système matériel, le contexte système ainsi que le contexte applicatif. Nous en déduisons notre problématique et posons nos premières hypothèses de travail.

Introduction 17 Le chapitre 2 présente l état de l art au niveau des composants. Nous présentons différents concepts utilisés pour concevoir, déployer et administrer les composants. Nous présentons également les différents standards que sont UML 2, les Enterprise Java Beans, le Corba Component Model et.net. Le chapitre 3 expose l état de l art des recherches dans le domaine de l allocation de ressource dans les systèmes répartis. Nous décrivons quelques travaux réalisés pour les systèmes répartis «traditionnels» et ceux traitant des systèmes répartis à objets et à composants. Le chapitre 4 est dédié à la modélisation de notre problématique par l utilisation de la théorie des graphes. Nous spécifions notre problématique et particulièrement le partitionnement et le placement par rapport aux différentes informations que nous utilisons comme la charge, le débit, les besoins applicatifs et les propriétés matérielles. Nous recherchons également une fonction de coût. Nous présentons ensuite un algorithme pour le placement des composants dans notre système. Dans le chapitre 5 nous présentons une partie des bases de notre étude. Nous définissons et décrivons certains concepts théoriques servant de base à notre travail. Nous introduisons les notions de décisions, d agrégations multicritères, de files d attentes ainsi que certains modes de décisions logiques. Le chapitre 6 explicite la mise en œuvre de notre modèle répondant à notre problématique. Nous présentons plus particulièrement le placement au sein d un système de placement à objets expressifs, prenant en compte les besoins applicatifs. Nous présentons notre solution en détaillant l architecture et les différents mécanismes utilisés et précisons la portée et les limites de ce système. Nous présentons dans le chapitre 7, les résultats les plus significatifs que nous avons obtenus grâce à l implantation de notre système. Nous validons notre système par la réalisation de plans d expériences pour analyser les performances des différents tests effectués. Nous prenons en compte les différents paramètres de notre problématique ainsi que d autres variables essentielles à notre modèle et nous exposons les résultats obtenus. Enfin, dans le chapitre 8, nous concluons cette thèse en rappelant nos objectifs, nos principaux résultats ainsi que les perspectives de recherches et d améliorations futures de notre système.

18 Introduction

Chapitre 1 Contexte et problématique Les notions de Composant, Internet, Intranet, Corba, Java et Web sont aujourd hui banalisées. Ces notions autorisent et participent à la création ainsi qu à l exécution d applications au sein d environnements distribués sur des réseaux à plus ou moins grande échelle. Les applications sont devenues encore plus dynamiques et plus mobiles par l utilisation du concept de composant. La notion de composant, intrinsèquement distribué est également lié fortement à la notion d applications et de ressources matérielles grâce à l Internet. L évolution des applications et, dans une moindre mesure, celle des ressources matérielles par mise-à-jour, ajout, modification et suppression peut entraîner des variations de comportements plus ou moins significatives. Cette dynamicité plus ou moins grande nécessite une prise en charge adéquate par une gestion et une administration efficace. Se pose alors le problème de l optimisation de l utilisation des ressources et des applications, ainsi que la gestion de leurs accès. Notre travail s inscrit sur cet axe. Les ressources dont nous désirons optimiser, gèrer l exécution ainsi que l accès peuvent être divisés et séparés en trois notions. Nous introduisons la notion de contexte matériel qui correspond aux ressources physiques puis celle du contexte système qui correspond aux différents modèles et supports logiciels possibles et enfin celle de contexte applicatifs qui correspond aux types d applications que nous désirons prendre en compte. Dans notre cas, ces applications sont d une granularité fine ou moyenne, c est à dire qu elles sont dynamiques et n ont pas une durée de vie trop longue. Nous développons dans ce chapitre ces différentes notions pour en extraire leurs problématiques et ainsi expliciter et mieux cerner notre propre problématique de travail. 1.1 Le contexte matériel Le contexte matériel est la base des applications. Il représente les ressources matérielles sur lesquelles elles s exécutent. Ces ressources sont de natures diverses. Par exemple, une ressource matérielle peut être un processeur, une mémoire, une unité de stockage, une connexion réseau, etc. Si l on se place dans le contexte des systèmes distribués, le réseau est habituellement l un des critères majeurs qui caractérise le contexte matériel car il permet de communiquer, d échanger et de transférer des données et/ou des applications. Ceci est d autant plus vrai que certains concepts, comme les composants, mettent la notion de réseau au centre de leur fonctionnement et de leur déploiement. Ces réseaux peuvent être soit locaux, soit d interconnexion. Nous détaillons ci-après ces deux concepts. 19

20 CHAPITRE 1. CONTEXTE ET PROBLÉMATIQUE 1.1.1 Les réseaux locaux et d interconnexions Les réseaux locaux sont constitués de machines reliées entre elles. Les liaisons ou connexions peuvent prendre différentes formes (Ethernet, 802.11b, Firewire, USB, etc). Les différentes solutions existantes offrent généralement des services d adressage direct entre les machines, limitant ainsi l incidence de la topologie (bus, anneau, bus logique, etc) sur les propriétés intrinsèques. On considère les réseaux locaux comme des réseaux privés, bien qu avec l Internet cette notion soit un peu faussée et restrictive, ainsi au plan de la sécurité car l augmentation de leur taille induit un travail colossal pour l administration et la surveillance du parc de machines. L interconnexion des réseaux locaux permet d étendre l offre de services disponibles en autorisant les invocations clientes de trouver un service sur d autres réseaux distants lorsque celui-ci n est pas disponible localement. Plusieurs différences existent entre les réseaux locaux et les réseaux d interconnexions. Nous pouvons citer, par exemple, le coût des communications, une hétérogénéité fortement probable ainsi qu une sécurité inférieure ou non existante. La sécurité est un problème vaste [Des90] qui peut être résolu de différentes manières. Il est possible de crypter les informations en utilisant diverses méthodes comme par exemple Kerberos [NAM97] pour les utilisateurs et DCE [OSF97] pour les invocations à distantes ou celles utilisées par le langage JAVA pour les applets. Ces problèmes de sécurité peuvent jouer un rôle important lors de la répartition de charge, ne serait-ce que, par exemple, pour les droits d accès à certaines ressources matérielles sensibles. La notion de réseau est définie comme un critère qui étend et s appuie sur les concepts de groupe et de domaine issus de la norme RM-ODP (Reference Model Open Distributed Processing). Dans cette norme, un réseau est un point d attache où les différents clients et/ou machines se connectent, permettant ainsi d invoquer des serveurs et d échanger des informations localement ou à distance. Un service ou une information peut être utilisée si, et seulement si, le client ou la machine est rattachée au domaine adéquat. La norme différencie la notion de domaine de celle de groupe qui sont parfois confondues. Un groupe < X > correspond à un ensemble d objets avec une relation de caractérisation particulière < X >. La relation < X > caractérise soit la relation structurelle entre les objets, soit un comportement commun et attendu des objets. La notion de groupe peut s appliquer à tout type de ressources : processeur [ZWZD93, EB94], périphériques, fichiers, processus, etc. Un message pourra alors être envoyé au groupe sans connaître l adresse des membres (Amoeba [KTV93], Isis [Bir93], PVM [GBa94], MPI [Gro94]). Un groupe peut également être défini dans les applications coopératives [GL99] ou toutes autres formes dans lesquelles la notion de groupe est présente. Un domaine < X > est un ensemble d objets, chacun de ces objets étant relié à un objet contrôleur par une relation caractéristique < X >. Il existe un objet contrôleur associé à chaque domaine. Un domaine peut être un ensemble de machines reliées par un réseau local. La notion de domaine est également présente dans la norme CORBA [Sie96, HC97]. D après cette norme, un domaine est une partie indépendante où les composants possèdent des caractéristiques communes et respectent des règles communes. Ces définitions peuvent distinguer, même si elles sont souvent confondues, certaines ressources comme les réseaux qui interconnectent des types de machines disposant de ressources homogènes et/ou hétérogènes. Le fort couplage entre les composants d une application distribuée induit une hétérogénéité plus importante.