Motivations. Introduction aux systèmes multi-agent (SMA) Agent: définition (Ferber 91) Sources du Cours. Situé ou Communiquant (1)

Documents pareils
Modélisation multi-agents - Agents réactifs


Intelligence des essaims (Swarm Intelligence)

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet.

L intelligence collective des fourmis

Deux stratégies parallèles de l'optimisation par colonie de fourmis

Complexité et auto-organisation chez les insectes sociaux. Complexité et auto-organisation chez les insectes sociaux

Jean-Philippe Préaux

Systèmes Multi-Agents : Modélisation et simulation informatique de comportements collectifs. Chapitre III

Comportements Individuels Adaptatifs dans un Environnement Dynamique pour l'exploitation Collective de Ressource

Une Approche Bio-mimétique pour la Segmentation d'images. Inspiration des Araignées Sociales

DES FOURMIS POUR LIVRER DU MAZOUT

Sommaire. Introduction. I. Notions de routage a) Technologies actuelles b) Avantages et désavantages

Les colonies de fourmis : apprentissage coopératif pour le problème du voyageur de commerce

Nicolas DEPRUGNEY Julien CARTON 1 SA TPE 1 S. Les Phéromones de la Fourmi

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

L apprentissage automatique

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Des fourmis réelles aux fourmis artificielles

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Modélisation aléatoire en fiabilité des logiciels

Cours des Méthodes de Résolution Exactes Heuristiques et Métaheuristiques

EN QUÊTE DU MONDE. Les nids de fourmis rousses. Présentation de la vidéo... 2 Générique... 2 description... 2 Principaux thèmes abordés...

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Laboratoire d Automatique et Productique Université de Batna, Algérie

Reconnaissance automatique de la parole à l aide de colonies de fourmis

Ebauche Rapport finale

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Vers une Optimisation de l Algorithme AntTreeStoch

THESE. Application des algorithmes de colonies de fourmis pour l optimisation et la classification des images

Programmation orientée agents #1. v 1.3. M1 S2 - Université de Montpellier II"

Conception de réseaux de télécommunications : optimisation et expérimentations

La plate-forme DIMA. Master 1 IMA COLI23 - Université de La Rochelle

Big Data et Graphes : Quelques pistes de recherche

Introduction au maillage pour le calcul scientifique

100 % 80 % 60 % 40 % 20 % 10 % 5 % 100 % 80 % 60 % 40 % 20 % 10 % 5 % 100 % 80 % 60 % 40 % 20 % 10 % 5 %

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Big Data et Graphes : Quelques pistes de recherche

Introduction à la théorie des graphes. Solutions des exercices

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Introduction à la Théorie des Jeux p.1/77

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Ordonnancement temps réel

Intelligence Artificielle Planification

Optimisation multi-objectif par colonies de fourmis : cas des problèmes de sac à dos

Robotique Collective : Implémentation d un comportement d agrégation stratégique inspiré de comportement des Cafards

De la fourmi réelle à la fourmi artificielle

Sommaire. Introduction Définition Historique Domaine d application.2. 4.Les Travaux réalisés sur les domaines d application.

Diverses techniques d'optimisation inspirées de la théorie de l'auto-organisation dans les systèmes biologiques

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Programmation Par Contraintes

Chapitre 1 : Introduction aux bases de données

Système immunitaire artificiel

Analyse de performance, monitoring

Annexe 6. Notions d ordonnancement.

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Présenta)on des ac)vités de recherche de l équipe PR du laboratorie MIS

Routage Statique. Protocoles de Routage et Concepts. Version Cisco Systems, Inc. All rights reserved. Cisco Public 1

2 e partie de la composante majeure (8 points) Les questions prennent appui sur six documents A, B, C, D, E, F (voir pages suivantes).

Apprentissage Automatique

Sujet Solution de sauvegarde de serveurs et postes de travail avec BackupPC et Bacula. par ALIXEN

LES MÉTA-HEURISTIQUES : quelques conseils pour en faire bon usage

Pourquoi l apprentissage?

La Programmation Orientée Agent Les Agents Réactifs

Introduction à la Programmation par Contraintes (PPC) Ruslan Sadykov LIX, École Polytechnique

INF6304 Interfaces Intelligentes

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

THÈSE DE DOCTORAT DE L UNIVERSITÉ PARIS 12-VAL DE MARNE UFR de Sciences et Technologie. par. Walid TFAILI. pour obtenir le grade de

Première expérience?

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Théorie des Jeux Et ses Applications

Annexe 1 au règlement Sporttip

Simulation de variables aléatoires

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Parallélisme et Répartition

POLITIQUE DE BIOSÉCURITÉ

Diffusion d informations dans un réseau pair à pair par des fourmis artificielles

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

TITRE DE L ACTIVITÉ : Vivre en groupe chez les animaux. DISCIPLINES ET DOMAINES D ACTIVITÉ de la discipline

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

Algorithmes d'apprentissage

Chaînes de Markov au lycée

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration

Le taux d'actualisation en assurance

Algorithmes de recherche

Couplage efficace entre Optimisation et Simulation stochastique Application à la maintenance optimale d une constellation de satellites

Unity Real Time 2.0 Service Pack 2 update

Jeux mathématiques en maternelle. Activités clés. Jeu des maisons et des jardins (Yvette Denny PEMF)

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

OPEN DAYS. sous le theme : Ia ville intelligente» lnstitut National des Pastes et Telecommunications,

Bibliographie. Gestion des risques

- Le Diagramme de Gantt. - Le Diagramme de Pert - La Méthode QQCQCCP - La Méthode MOSI - Cahier des charges fonctionnel

ARRÊTÉ du. Projet d arrêté fixant le programme d'enseignement de santé et social en classe de seconde générale et technologique

6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses

Transcription:

Motivations Introduction aux systèmes multi-agent (SMA) Première définition SMA: un système dans lesquels des agents artificiels opèrent collectivement et de façon décentralisée pour accomplir une tâche. Joël Quinqueton LIRMM et CERIC Montpellier, France 12/01/05 DESS Multimedia 2 Sources du Cours Réf: J. Ferber, "Les systèmes multi agents", InterEditions, 1995 d'après Tutorial Ferber & Gasser, Avignon 91 d'après cours en ligne Alexis Drogoul, LIP6 http://www-poleia.lip6.fr/~drogoul/ D après le cours de Catherine Garbay (TIMC-IMAG), avec son aimable autorisation 12/01/05 DESS Multimedia 3 Agent: définition (Ferber 91) Entité physique ou virtuelle mue par un ensemble de tendances (objectifs individuels, fonction de satisfaction ou de survie à optimiser) possède des ressources propres ne dispose que d'une représentation partielle (éventuellement aucune) de son environnement comportement tendant à satisfaire ses objectifs, en tenant compte de ses ressources et de ses compétences, et en fonction de sa perception, ses représentations et ses communications 12/01/05 DESS Multimedia 4 Plusieurs types d agents Selon qu ils peuvent, ou non: communiquer directement avec d'autres agents agir dans un environnement percevoir (éventuellement de manière limitée) son environnement se reproduire posséder des compétences et offrir des services Agents situés vs communiquants Agents cognitifs vs réactifs 12/01/05 DESS Multimedia 5 Situé ou Communiquant (1) Agent purement situé: l'environnement possède une métrique, les agents sont situés à une position dans l'environnement qui détermine ce qu'ils perçoivent; ils peuvent se déplacer; il n'y a pas communications directes entre agents, elle se font via l'environnement 12/01/05 DESS Multimedia 6 1

Situé ou Communiquant (2) Situé ou Communiquant (3) Agent purement communiquant: il n'y a pas d'environnement au sens physique du terme, les agents n'ont pas d'ancrage physique, ils communiquent via des informations qui circulent entre les agents Société de Fourmis La résolution du problème s'inscrit dans l'environnement physique et dans l'organisation physique trouvée par les agents Réseau de décideurs la résolution du problème s'inscrit dans une structure conceptuelle et dans les modes de coopération entre agents " # #!! 12/01/05 DESS Multimedia 7 12/01/05 DESS Multimedia 8 Cognitifs ou Réactifs (1) Agent cognitif: représentation explicite de l'environnement et des autres agents peut tenir compte de son passé et dispose d'un but explicite mode "social" d'organisation (planification, engagement) petit nombre d'agents (10/20), hétérogènes à gros grain Les relations entre agents s'établissent en fonction des collaborations nécessaires à la résolution du problème 12/01/05 DESS Multimedia 9 Auteur du document MLT Agent de l auteur Agents cognitifs RDF annotations Document MLT Agent du groupe d intérêts Indexation Agent de l utilisateur Mémoire d entreprise Syst. Multi-Agent Modèle de Connaissance: Annotations - Modèle d Entreprise - Modèles d utilisateurs Document ontologie RDF Auteur Employé 12/01/05 d ontologie DESS Multimedia 10 MLT Cognitifs ou Réactifs (2) Agent réactif: pas de représentation explicite de l'environnement pas de mémoire de son histoire, ni de but explicite comportement de type stimulus réponse mode "biologique "d'organisation grand nombre d'agents (>100), homogènes à grain fin La structure du système émerge des comportements et non d'une volonté d'organisation Agents Réactifs (exemple) Problème: un ensemble de robots doivent trouver du minerai et le rapporter à la base 12/01/05 DESS Multimedia 11 12/01/05 DESS Multimedia 12 2

Règles de comportement Caractéristiques d un SMA Explorer Suivre Marque Trouver Rapporter Déposer je ne porte rien et je ne perçois aucun minerai et je ne perçois aucune marque je ne porte rien et je ne perçois aucun minerai et je perçois une marque je ne porte rien et je perçois du minerai je porte du minerai et je ne suis pas à la base je porte du minerai et je suis à la base explorer de manière aléatoire se diriger vers cette marque prendre un échantillon de minerai retourner à la base et déposer une marque déposer le minerai Un SMA peut-être : ouvert : les agents y entrent et en sortent librement (ex: un café) fermé : l'ensemble d'agents reste le même (ex: un match de football) homogène : tous les agents sont construits sur le même modèle (ex: une colonie de fourmis) hétérogène : des agents de modèles différents, de granularité différentes (ex: l'organisation d une entreprise) 12/01/05 DESS Multimedia 13 12/01/05 DESS Multimedia 14 Modes d'organisations Organisation: Façon dont le groupe est constitué pour pouvoir travailler (pas de définition unifiée) Décrit l'ensemble des composants, leur nature, leurs responsabilités, leurs besoins en ressource (processeurs) et leurs liens de communication ou d'arrangement un ensemble de données à traiter (l'environnement) un ensemble de tâches à réaliser Propriétés définit un cadre pour l'interaction produite par l'interaction entre les agents peut être statique ou dynamique 12/01/05 DESS Multimedia 15 L intelligence de l essaim Swarm intelligence Quand l intelligence vient du collectif 12/01/05 DESS Multimedia 16 Les coactones Toute substance chimique responsable d une interaction entre deux organismes (Florkin) Phérormone, du grec pherein (transporter) et hormân (exciter) En Anglais pheromone Substance spécifique d une espèce. Se trouve chez les insectes et les vertébrés Les phérormones des insectes Sexuelles: papillon femelle bombyx mori (quelques molécules suffisent) Papillon Porthetria dispar (capture des mâles) Blatte Periplaneta americana (10-14 µg) Reine des abeilles: la «substance royale» transmise par échange de nourriture attire les bourdons inhibe l ovogénèse chez les ouvrières Alarme et défense Abeilles: acétate d isoamyle Fourmis: nombreuses substances 12/01/05 DESS Multimedia 17 12/01/05 DESS Multimedia 18 3

Les phérormones des vertébrés Marquage de territoire, reconnaissance de l espèce, accouplement Glandes à parfum du chevrotain porte musc Civettone de la civette, du rat d Amérique, chez des canards, certaines tortues et des alligators Daim, souris mâle Chez les primates: lié à l odorat, en débat actuellement Notion de Stigmergie Les échanges d'informations passent par une modification de l'environnement concentrations locales de phéromones baptisé Stigmergie par P.P. Grassé en 1959 «La théorie de la Stigmergie : Essai d'interprétation du comportement des termites constructeurs.», Insectes Sociaux, 6, 1959, p. 41-80. stigma = piqûre ergon = travail, œuvre oeuvre stimulante: L'ouvrier ne dirige pas son travail, il est guidé par lui. 12/01/05 DESS Multimedia 19 12/01/05 DESS Multimedia 20 Le comportement Regroupement des cadavres Similaire au regroupement des copeaux chez les termites Pas de dépôt de phérormone nécessaire Vision locale: on obtient plusieurs tas Recherche de nourriture Ramener le plus efficacement possible de la nourriture au nid Dépôt de phérormone Les araignées sociales ~15 espèces d araignées sociales sur quelques milliers Anelosimus eximius (Guyane française) Partagent la même toile Coopèrent pour élevage des petits, capture et transport des proies Détection de régions dans des images Construction collective de la toile 12/01/05 DESS Multimedia 21 12/01/05 DESS Multimedia 22 Une recherche du plus court chemin Plus de phéromone sur le plus court chemin S adapter aux changements 12/01/05 DESS Multimedia 23 12/01/05 DESS Multimedia 24 4

Application en intelligence artificielle Inspiré du comportement des fourmis réelles Travaux de Marco Dorigo depuis 1992: les Ant algorithms Les fourmis suivent de préférence les chemins riches en phéromone Retrouvent le plus court chemin en cas d obstacle 12/01/05 DESS Multimedia 25 d" is dt Modèle stochastique de Deneubourg et Goss (1989) 2 branches (s et l) et deux points de décision (1 et 2). Probabilité P is (t) de choisir la branche s au point i à l instant t en fonction de la phéromone. La phéromone est fonction du flux de fourmis (t p is (t) = s +" is (t)) # (t s +" is (t)) # + (t s +" il (t)) # = Np js (t # t s ) + Np is (t) d" il dt = Np jl (t # r.t s ) + Np il (t) 12/01/05 DESS Multimedia 26 Généralisation Feedback positif (auto catalytique) La piste de phéromone est plus vite reconstituée sur le plus court chemin Toutes les fourmis vont approximativement à la même vitesse Le problème du voyageur de commerce Trouver le chemin le plus court passant une fois et une seule dans chaque ville N villes: N! chemins possibles (3 millions pour 10 villes!) 12/01/05 DESS Multimedia 27 12/01/05 DESS Multimedia 28 Voyageur de commerce Chaque fourmi est un agent Doté d une mémoire de travail (liste des villes déjà visitées) Se promène d une ville à une autre Choisit la ville suivante en fonction De la quantité de phéromone D une fonction décroissante de la distance Choix non déterministe Chaque fourmi est autonome Elle part d un sommet choisi au hasard 12/01/05 DESS Multimedia 29 Déroulement Au début: pas de phéromone Chaque fourmi va probablement vers le plus proche voisin Après un cycle Chaque fourmi a trouvé un chemin Mise à jour de la phéromone le long du chemin Inverse de la longueur du chemin Les aretes composant les chemins courts selon choisies plus souvent en moyenne au cycle suivant Apprentissage par renforcement 12/01/05 DESS Multimedia 30 5

La phéromone A chaque passage sur une arête a: f(a) := (1-p)*f(a) + p*f 0 p et f 0 sont des paramètres Quand la fourmi a terminé le tour: Évaporation de la phéromone soit c le chemin trouvé pour tout a dans c: f(a) := (1-p)*f(a) + p/ c, Point fixe S il n y a de la phéromone que sur un chemin: il n y en aura jamais plus ailleurs Choix déterministe: l arête optimise f(a)p(a) car c est la seule avec f(a) > 0 Choix probabiliste: l arête est choisie avec une probabilité 1 Donc convergence dès que toutes les fourmis choisissent le même chemin Le système peut être arrêté 12/01/05 DESS Multimedia 31 12/01/05 DESS Multimedia 32 Expérimentation Résultats 40 villes 400 fourmis Exposant b = 3 Evaporation p = 25% Probabilité q = 25% Phéromone f 0 = 1. 6000 5000 4000 3000 2000 1000 Série1 Série2 Série3 Série4 Série5 Série6 12/01/05 DESS Multimedia 33 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 12/01/05 DESS Multimedia 34 Vers une méta heuristique État interne d une fourmi: De quoi représenter une éventuelle solution (même mauvaise) Dépôt de phéromone: Une fois qu une solution candidate est trouvée Fonction de la qualité de la solution Problèmes statiques Voyageur de commerce Quadratic assignment: placer des installations on donne des flots entre installations: min flot total Affectation de tâches vehicle routing Visite de tous les clients par une flotte de véhicules de livraison Plus petite surséquence commune (L = {bcab, bccb, baab, acca} => baccab). Coloration de graphe Ordre séquentiel circuit hamiltonien de poids minimal sur un graphe orienté 12/01/05 DESS Multimedia 35 12/01/05 DESS Multimedia 36 6

Problèmes dynamiques Routage (orienté par les connections) dans les réseaux Routage sans connection (connectionless) D après Marco Dorigo Gianni Di Caro and Luca M. Gambardella, Ant Algorithms for Discrete Optimization, Artificial Life, Vol.5, No.3, pp. 137-172, 1999. Théorie des jeux Le besoin de communication Le dilemme du prisonnier chaque prisonnier peut avouer ou non si aucun n avoue : 2 ans si les 2 avouent: 4 ans si un seul avoue: il est libre et l autre a 5 ans 12/01/05 DESS Multimedia 37 12/01/05 DESS Multimedia 38 Jeux à 2 joueurs Dilemme des prisonniers x,x u,v -2,-2-5,0 v,u y,y 0,-5-4,-4 Jeux symétriques Jeu d accord social ssi: x ou y >0 et, si x et y >0, alors x=y u ou v négatif 12/01/05 DESS Multimedia 39 x = -2, y = -4 u = -5, v = 0 Ce n est pas un jeu d accord social 12/01/05 DESS Multimedia 40 Jeu de coordination Jeu de coopération 1,1-1,-1 1,1-3,3-1,-1 1,1 3,-3-2,-2 x = y = 1 u = v = -1 C est un jeu d accord social 12/01/05 DESS Multimedia 41 x = 1, y = -2 u = -3, v = 3 C est un jeu d accord social 12/01/05 DESS Multimedia 42 7

Equilibre de Nash Un jeu non coopératif décrit un cadre institutionnel dans lequel chaque joueur arrête seul ses choix sans consulter les autres joueurs. L'équilibre de Nash décrit une issue d un jeu non coopératif dans lequel aucun joueur n a intérêt à modifier sa stratégie, compte tenu des stratégies des autres joueurs. Définition Soit un jeu non-coopératif à n joueurs, et s*= (s* 1,...,s* n ) une combinaison de choix stratégiques de ces n joueurs s* i est le choix stratégique du joueur i s* i S i, l ensemble des stratégies praticables par le joueur i. u i (s* 1,...,s* n ) est le gain du joueur i lorsque s* est sélectionné. s i S i u i (s* 1, s* i, s* n ) > u i (s* 1, s i, s* n ) 12/01/05 DESS Multimedia 43 12/01/05 DESS Multimedia 44 Optimum de Pareto Préférence au sens de Pareto > P : Entre les états des agents d un jeu (u 1, u i, u n ) > P (u 1, u i, u n ) ssi i [1,n], u i u i Optimum de Pareto: maximum de cette relation on ne peut augmenter le gain d un agent sans diminuer celui d un autre 12/01/05 DESS Multimedia 45 Dilemme des prisonniers -2,-2 0,-5-5,0-4,-4 équilibre de Nash: (d2,d2) optimum de Pareto: (d1,d1) Pour l atteindre: suite de coups avec mémoire 12/01/05 DESS Multimedia 46 Stratégies sur des suites (1) Stratégies sur des suites (2) Donnant-donnant : coopération au premier tour, puis stratégie précédente du partenaire. Majorité mou : choix majoritaire de l'adversaire, coopération si égalité et au premier tour. Rancunière : coopération, puis défection permanente si le partenaire fait une fois défection Donnant-donnant dur : coopération, sauf si le partenaire a trahi une des 2 fois précédentes Gentille : toujours coopérer Périodique gentille : séquence cyclique de deux coopération, puis une défection Sondeur : séquence trahir, coopérer, coopérer Lunatique : défection une fois sur deux en moyenne (séquences aléatoires) Méfiante : défection au premier tour, puis stratégie précédente du partenaire Majorité dur: choix majoritaire de l'adversaire, défection si égalité et au premier tour. Méchante : toujours faire défection Périodique méchante : séquence cyclique de deux défections, puis une coopération 12/01/05 DESS Multimedia 47 12/01/05 DESS Multimedia 48 8

Comparaison Tournoi du 50e anniversaire Chaque équipe pouvait soumettre plusieurs programmes Équipe Nick Jennings (Southampton) Stratégie = séquence de 10 coups pour se reconnaître Donnant-donnant Majorité-mou Rancunière Donnant-donnant-dur Si oui: stratégie maitre esclave Gentille Périodique-gentille Si non: stratégie méchante Sondeur Lunatique Méfiante Majorité-dur Méchante 12/01/05 Périodique-méchante DESS Multimedia 49 12/01/05 DESS Multimedia 50 Perspective: satisfaction de contraintes Les jeux de coordination permettent d exprimer des contraintes entre valeurs de variables Il n y a souvent pas d équilibre de Nash (toutes les décisions se valent) Ce sont des jeux d accord social Une solution représente une loi sociale (chaque joueur n a plus qu un choix) 12/01/05 DESS Multimedia 51 Pour en savoir plus Numéro spécial de «pour la science» N 314, Décembre 2003 Sur les phénomènes d émergence «Intelligence Collective» de E. Bonabeau, G. Théraulaz, Editions Hermès, 1994 «Swarm Intelligence», de E. Bonabeau, M. Dorigo, G. Théraulaz, Oxford University Press, 1999 En Anglais «Ant Colony Optimization» M. Dorigo, T Stützle MIT Press, 2004 12/01/05 DESS Multimedia 52 Sites Internet Site Starlogo: http://education.mit.edu/starlogo/ Site Madkit: http://www.madkit.org/ Mon mél jq@lirmm.fr 12/01/05 DESS Multimedia 53 9