Sélection darwinienne et systèmes multi-agents



Documents pareils
Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Resolution limit in community detection

Intelligence Artificielle et Robotique

Les apports de l informatique. Aux autres disciplines

Conception et contrôle des SMA tolérants aux fautes

Modélisation multi-agents - Agents réactifs

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB Olivier Augereau Formation UML

Université de Bangui. Modélisons en UML

Apprentissage Automatique

L apprentissage automatique

données en connaissance et en actions?

Conception des systèmes répartis

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

IFT2255 : Génie logiciel

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Évaluation et implémentation des langages

SFERES : Un framework pour la conception de systèmes multi-agents adaptatifs

EXAMEN CRITIQUE D UN DOSSIER TECHNIQUE

Mesure agnostique de la qualité des images.

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION


PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?

Cours de Master Recherche

Chapitre 1 : Introduction aux bases de données

Introduction au datamining

Création intuitive des éléments d un paysage

Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière

MIS 102 Initiation à l Informatique

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

!-.!#- $'( 1&) &) (,' &*- %,!

Intelligence Artificielle Planification

Rapport d activité. Mathieu Souchaud Juin 2007

Programmation d'agents intelligents Vers une refonte des fils de raisonnement. Stage de fin d'études Master IAD 2006

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

Générer du code à partir d une description de haut niveau

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Développement spécifique d'un système d information

Identification de nouveaux membres dans des familles d'interleukines

Pourquoi l apprentissage?

Système à enseigner : Robot M.I.M.I. MultipodeIntelligent à Mobilité Interactive. Version 1.0

Modèles et simulations informatiques des problèmes de coopération entre agents

Cours 1 : Qu est-ce que la programmation?

Parcours en deuxième année

Construire un tableau de bord par Marc Maisonneuve

La plate-forme DIMA. Master 1 IMA COLI23 - Université de La Rochelle

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

Complexité et auto-organisation chez les insectes sociaux. Complexité et auto-organisation chez les insectes sociaux

Suivant les langages de programmation, modules plus avancés : modules imbriqués modules paramétrés par des modules (foncteurs)

Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

quelles sont les spécificités du système de gouvernance des PME - PMI?

Grammaires d unification

Rappels sur les suites - Algorithme

L E C O U T E P r i n c i p e s, t e c h n i q u e s e t a t t i t u d e s

Information utiles. webpage : Google+ : digiusto/

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Architecture distribuée

Les diagrammes de modélisation

Sillage Météo. Notion de sillage

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

L intelligence artificielle distribuée appliquée aux jeux d équipe situés dans un milieu dynamique : l exemple de la RoboCup

Semestre 1. Objectifs Approfondissement de l environnement Java et de son interface de programmation d applications : réseaux, et processus.

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

Exemple de réalisation dans le cas de projets pilotes Smart Grids. sociétaux» 13 juin, Laas-CNRS Toulouse Jean Wild

Limitations of the Playstation 3 for High Performance Cluster Computing

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

Modélisation et Simulation

MABioVis. Bio-informatique et la

Agrégation de liens xdsl sur un réseau radio

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

Chapitre VI- La validation de la composition.

Génie Industriel et Maintenance

Contexte et motivations Les techniques envisagées Evolution des processus Conclusion

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

Table des matières. CHAPITRE 1 Le conseil en organisation : bilan et perspectives... 15

Les attentes du marché

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

Synthèse du «Schéma Directeur des Espaces Numériques de Travail» A l attention du Premier degré (doc réalisé par Les MATICE 76)

Gènes Diffusion - EPIC 2010

SECTION 5 BANQUE DE PROJETS

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Machines virtuelles Cours 1 : Introduction

La classification automatique de données quantitatives

Synthèse «Le Plus Grand Produit»

Eléments constitutifs et synthèse des convertisseurs statiques. Convertisseur statique CVS. K à séquences convenables. Source d'entrée S1

Informatique et mathématiques

TP N 57. Déploiement et renouvellement d une constellation de satellites

Vérifier la qualité de vos applications logicielle de manière continue

Cloud Computing et SaaS

Formula Negator, Outil de négation de formule.

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Retour d expériences avec UML

LE PLAISIR D APPRENDRE POUR APPRENDRE

Christophe Le Page CIRAD - UPR Green

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

Transcription:

Sélection darwinienne et systèmes multi-agents Samuel Landau Miriad - OASIS - LIP6

Objectifs Objectifs Conception de systèmes distribués adaptatifs Apprentissage distribué en ligne Exemples d application: services et réseaux informatiques contrôle d un robot simulations distribuées (biologiques ou sociales) insuffisamment spécifiées, par exemple : évaluation de paramètres libres, évolution de comportements, émission ou validation d hypothèses organisationnelles Samuel Landau 06/06/2003 Présentation INRA - Toulouse 2

Contraintes et problèmes Contraintes Descriptions des comportements évolués des entités : Appréhendables par les concepteurs par exemple assimilable à un ensemble de règles Pouvant disposer d états internes si nécessaire Problèmes Théorique: dans tout modèle d apprentissage distribué se pose le problème de Credit assignment [Minsky 1963] Pratique: comparaison des méthodes d apprentissage utilisées Samuel Landau 06/06/2003 Présentation INRA - Toulouse 3

Choix Capacités adaptatives obtenue par un processus de sélection darwinienne (évolution artificielle) Généricité, parallélisme Peu de prérequis sur l espace de recherche Apporte une réponse au Credit assignment Description des comportements par des structures intelligibles (architectures symboliques) Concevoir un cadre applicatif liant évolution artificielle et simulation multi-agent, et l implémenter en une plate-forme Samuel Landau 06/06/2003 Présentation INRA - Toulouse 4

SFERES [Landau, Doncieux et al 2001] Cadre applicatif d évolution artificielle et de simulation multi-agent travaux d abstraction sur les concepts des techniques évolutionnistes (dont les algorithmes évolutionnistes) Expérimenter plusieurs techniques évolutionnistes sur la même expérience Réutiliser une technique évolutionniste dans plusieurs expériences Plate-forme implantée en C++ sur Linux et sur les BSD libres Echéancier discret, interface avec un moteur de simulation 3D physique-réaliste, gestion fine des statistiques Environ 80 classes abstraites/80 000 lignes de code, et 400 classes dérivées/400 000 ldc Les principaux algorithmes évolutionnistes et architectures évoluables d agent sont implantées Samuel Landau 06/06/2003 Présentation INRA - Toulouse 5

Sélection darwinienne Principes [Darwin 1859] Individus en compétition pour des ressources limitées Sélection Ressemblance entre parents et enfants (hérédité) Variation Hypothèse d indépendance entre les causes de variations et celles de sélections Variations «aléatoires» Modèle «hasard - sélection» Gradualisme Darwinisme synthétique [Huxley/Wright 1942] Introduction de la génétique Samuel Landau 06/06/2003 Présentation INRA - Toulouse 6

Algorithmes évolutionnistes Méthodes d optimisation inspirées du modèle darwinien synthétique Sélection suivant la valeur d une fonction d évaluation (fitness) + Le génome peut coder pour des structures + Peu de prérequis sur l espace de recherche - Évolution hors ligne - Pas de solution générique pour le credit assignment - Coût élevé en nombre de présentation d exemples ( temps de calcul) Samuel Landau 06/06/2003 Présentation INRA - Toulouse 7

Modèles ontophylogénétiques tiques [Landau et Picault 2001, Landau 2003] Dualité organisme / écosystème Population en croissance et compétition sur les ressources Processus de sélection s darwinienne Les renforcements distribués s au système influent sur la disponibilité des ressources Pression sélective s induite renforcements comme pression sélective externe Organisme en développement (population d individus qui croit) ontogenèse Écosystème (composé d individus qui évoluent) phylogenèse Métaphore biologique de «l ontophylogenèse» [Kupiec 1981] Samuel Landau 06/06/2003 Présentation INRA - Toulouse 8

Modèles ontophylogénétiques tiques Comparaison avec les algorithmes évolutionnistes Algorithmes Évolutionnistes 1. Centralisé 2. Évaluation «statique» 3. Phylogenèse Modèles ontophylogénétiques 1. Distribué 2. Évaluation «dynamique» 3. Ontogenèse + phylogenèse (échelle inf.) 4. Fitness explicite 5. Hors ligne 6. Cycle exploration/exploitation 4. Fitness implicite 5. En ligne 6. Exploration et exploitation Samuel Landau 06/06/2003 Présentation INRA - Toulouse 9

Modèles ontophylogénétiques tiques Cas particuliers Systèmes de classeur (LCS) «Michigan style» Les individus sont les classeurs du système Nombre de classeurs et d états internes (le cas echéant) fixé à l avance Systèmes immunitaires artificiels (AIS) Les individus sont des vecteurs («anticorps») Les ressources constituent les renforcements Samuel Landau 06/06/2003 Présentation INRA - Toulouse 10

Modèles ontophylogénétiques tiques Propriétés Moins de présentations d exemples nécessaires Possibilité de distribuer les critères d évaluation sur la population Credit assignment implicite (via la sélection darwinienne) Extension et unification de l apprentissage par renforcement et de l évolution artificielle pour un système distribué Avec des structures : Plus souples que les LCS et AIS à l échelle individuelle (par ex. nombre de règles / d états internes non fixé a priori) Plus souples que les LCS et AIS à l échelle collective (par ex. populations non-homogènes / interactions plus riches) Samuel Landau 06/06/2003 Présentation INRA - Toulouse 11

Puissance d expression Évolution des structures Propriétés recherchées «Quasi continuité» du code génétique cadre gradualiste de la sélection darwinienne de petites variations du génotype doivent induire la plupart du temps des petites variations de la structure Neutralité [Kimura 1983] Redondance Épistasie faible Pouvoir générer des structures appréhendables pour faciliter l analyse, les manipulations et l amorçage Les codes génétiques existants ne vérifient pas toutes ces propriétés simultanément Samuel Landau 06/06/2003 Présentation INRA - Toulouse 12

Codes génétiquesg directs Le génotype est la structure Principales instances: Programmation génétique [Koza 1992] arbres Programmation évolutionniste [Fogel et al 1966 ] machines à états finis, réseaux de neurones, graphes, + Puissance d expression + Structures appréhendables Pas de redondance Épistasie forte Neutralité faible Nécessité de biaiser fortement les opérateurs génétiques Samuel Landau 06/06/2003 Présentation INRA - Toulouse 13

Codes génétiquesg indirects Construction de la structure à partir du «programme» génétique langages de construction, basés pour la plupart sur : une grammaires non contextuelle ou des règles de réécriture de type L-systems réseaux de neurones, circuits électroniques + Puissance d expression + Structures appréhendables o Redondance et neutralité suivant grammaire Épistasie hiérarchique liée à l application des règles de grammaire Nécessité pour les opérateurs génétiques de respecter les règles grammaticales La sémantique (structure produite) est encore très fortement liée à la syntaxe du génotype Samuel Landau 06/06/2003 Présentation INRA - Toulouse 14

Stack-Based Gene Expression [Landau et Picault 2001] Code indirect basé sur un langage à pile Samuel Landau 06/06/2003 Présentation INRA - Toulouse 15

Stack-Based Gene Expression Principes Les variations affectent le contenu et la taille de la chaîne Samuel Landau 06/06/2003 Présentation INRA - Toulouse 16

Stack-Based Gene Expression Propriétés Opérateurs classiques des AG, et même plus (insertion/déletion) car Toute chaîne est interprétable Pas de biais nécessaire sur les opérateurs génétiques Neutralité et redondance du code génétique (surjection) à l interprétation par ex.: l ordre peut ne pas importer pour certaines instructions plusieurs façon de coder les mêmes sous-structures structures différentes mais mêmes sémantique (dépend de l environnement) Épistasie Localité des instructions de la pile Grammaire contextuelle, «distribuée» sur les lexèmes Samuel Landau 06/06/2003 Présentation INRA - Toulouse 17

Stack-Based Gene Expression Inspiration biologique Métaphore de la synthèse de protéines Samuel Landau 06/06/2003 Présentation INRA - Toulouse 18

ATNoSFERES SBGE appliqué à l évolution d ATN connect dupnode c1? a1! node interprète ATN <vide> Samuel Landau 06/06/2003 Présentation INRA - Toulouse 19

ATNoSFERES SBGE appliqué à l évolution d ATN interprète connect dupnode c1? a1! 1 ATN 1 Samuel Landau 06/06/2003 Présentation INRA - Toulouse 20

ATNoSFERES SBGE appliqué à l évolution d ATN c1? interprète connect dupnode a1! 1 ATN 1 Samuel Landau 06/06/2003 Présentation INRA - Toulouse 21

ATNoSFERES SBGE appliqué à l évolution d ATN 1 c1? interprète connect a1! 1 ATN 1 Samuel Landau 06/06/2003 Présentation INRA - Toulouse 22

ATNoSFERES SBGE appliqué à l évolution d ATN 1 interprète 1 ATN c1? a1! 1 Samuel Landau 06/06/2003 Présentation INRA - Toulouse 23

ATNoSFERES SBGE appliqué à l évolution d ATN interprète ATN c1? Start a1! 1 End Samuel Landau 06/06/2003 Présentation INRA - Toulouse 24

Expérimentations individuelles Fonctionnement Conditions: N?/~N?, NE?/~NE?, Actions : N!, NE!, Samuel Landau 06/06/2003 Présentation INRA - Toulouse 25

Comparaison avec les LCS sur des problèmes non-markoviens Dans les modèles distribués, la localité des perceptions et actions des agents induisent souvent de devoir résoudre individuellement des POMDP ATNoSFERES peut résoudre individuellement des problèmes markoviens (expériences non décrites), mais de façon beaucoup moins efficace que les LCS (du fait de l algorithme génétique) Si on ne sait pas à l avance si le problème individuel sera markovien ou non, ATNoSFERES présente a priori l avantage de ne pas nécessiter plus d hypothèses Comparaisons sur des bancs d essais non-markoviens avec les principaux LCS permettant d attaquer des problèmes nonmarkoviens : XCSM (LCS à registres) et ACS (LCS pouvant exécuter des «chaînes comportementales») Samuel Landau 06/06/2003 Présentation INRA - Toulouse 26

Comparaison avec les LCS Fonctionnement de XCSM Samuel Landau 06/06/2003 Présentation INRA - Toulouse 27

Comparaison avec les LCS Équivalence formelle avec XCSM Étiquettes de condition / action sur les arcs (en limitant le nombre d actions) conditions / actions externes dans les règles Noeud état interne Origine d un arc condition interne Extrémité d un arc action interne ATN XCSM c1 c3? 0 1 a2! conditions actions externe interne externe interne c1 c2 c3 s1 a1 a2 g1 1 # 0 0 0 1 1 Samuel Landau 06/06/2003 Présentation INRA - Toulouse 28

Environnement Maze10 [Lanzi 1998] environnement non-markovien : 13 cases présentant des alias perceptuels 5 cases non ambiguës ; 1 case «food» (sortie), perçue Samuel Landau 06/06/2003 Présentation INRA - Toulouse 29

Comparaison résultats Maze10 7 6 5 4 3 2 XCSMH ATNoSFERES optimum 1 0 nombre de pas moyen XCSMH : version de XCSM «hiérarchique» optimisée pour gérer plus efficacement les états internes Les résultats pour XCSM (15,1) n ont pas été portés pour ne pas «écraser» les histogrammes Samuel Landau 06/06/2003 Présentation INRA - Toulouse 30

Environnement E1 [Métivier et Lattaud 2002] environnement non-markovien : 20 cases présentant des alias perceptuels 24 cases non ambiguës ; 1 case «food» (sortie), perçue Samuel Landau 06/06/2003 Présentation INRA - Toulouse 31

Comparaison résultats E1 4 3,5 3 2,5 2 1,5 1 0,5 0 nombre de pas moyen ACS (2) ACS (3) ATNoSFERES optimum ACS nécessite de fixer au préalable le longueur maximale des «chaînes comportementales» (paramètre BS max), qui influe beaucoup sur la vitesse d apprentissage du modèle du monde Plus d améliorations au-delà de BS max=3 Samuel Landau 06/06/2003 Présentation INRA - Toulouse 32

Environnement E2 [Métivier et Lattaud 2002] environnement non-markovien : 36 cases présentant des alias perceptuels 22 cases non ambiguës ; 1 case «food» (sortie), perçue Samuel Landau 06/06/2003 Présentation INRA - Toulouse 33

Comparaison résultats E2 7 6 5 4 3 2 ACS ATNoSFERES optimum 1 0 nombre de pas moyen Métivier et Lattaud rapportent que faire varier BS max ne change pas grand-chose aux performances du système Samuel Landau 06/06/2003 Présentation INRA - Toulouse 34

Première expérimentation collective Enseigner un comportement à un robot pas dé démonstration traitement démonstrations réalisation Modèle naïf : un SMA contrôle le robot. Chaque agent perçoit la couleur d un pixel de l image captée par la caméra du robot, et fait une proposition d action. Les actions sont agrégées par un système de vote, et l action résultante est exécutée par le robot. L utilisateur distribue le renforcement au système soit explicitement, soit implicitement en pilotant le robot. Samuel Landau 06/06/2003 Présentation INRA - Toulouse 35

Première expérimentation collective Résultat : échec Problème trop complexe pour des études préliminaires de système ontophylogenétiques : modèle asynchrone pour ce qui est du développement / la robotique en environnement réel implique des perceptions bruitées et le traitement des perceptions visuelles est un problème vaste en soi A cependant permis de soulever des questions : celle du synchronisme des agents, qui ne se pose pas pour les LCS/AIS celle de la régulation du développement et de la pression sélective Les prochaines expériences sont en simulation, en substituant à ATNoSFERES et à l algorithme génétique un modèle distribué sur des automates, apprenant par renforcement Samuel Landau 06/06/2003 Présentation INRA - Toulouse 36

Conclusion Résultats SFERES validé (plusieurs techniques/expériences implantées) SBGE et ATNoSFERES validés dans le cadre individuel Observations expérimentales : parcimonie, régulations implicites Travaux actuels Étude du modèle de contrôle distribué en simulation Perspectives Apprentissage multicritère, distribué sur une population d automates possiblement non-homogène Auto-observation et capacité du système à agir sur sa propre activité, afin de créer des bassins d attraction le long du front de Pareto Application dans des modèles sociaux et naturels (CAS) Retour à la robotique quand le modèle sera dominé en simulation Samuel Landau 06/06/2003 Présentation INRA - Toulouse 37