Description des activités de recherche



Documents pareils
Une Approche Bio-mimétique pour la Segmentation d'images. Inspiration des Araignées Sociales

Modélisation multi-agents - Agents réactifs

Systèmes Multi-Agents : Modélisation et simulation informatique de comportements collectifs. Chapitre III

L apprentissage automatique

Modèle multi-agents de prise de décision éthique

Master Informatique Aix-Marseille Université

Rapport d évaluation du master

Les apports de l informatique. Aux autres disciplines

Master Audit Contrôle Finance d Entreprise en apprentissage. Organisation de la formation

Mastère spécialisé MS : «Ingénierie de l innovation et du produit nouveau

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Comportements Individuels Adaptatifs dans un Environnement Dynamique pour l'exploitation Collective de Ressource

Livret du Stagiaire en Informatique

Partenaires: w w w. c o g m a s t e r. n e t

Rapport d évaluation du master

Formations et diplômes. Rapport d'évaluation. Master Finance. Université Jean Monnet Saint-Etienne - UJM. Campagne d évaluation (Vague A)

Rapport d évaluation du master

Audition pour le poste de Maître de conférence INSA Lyon distributed Robotics avec aectation au CITI. Guillaume Lozenguez.

UNIVERSITÉ DE LORRAINE Master MIAGE (Méthodes Informatiques Appliquées à la Gestion des Entreprises)

#donnezdusensàvotre. taxed apprentissage2015 ALL DIGITAL!

Ouverture 2 Bertrand HEBERT, Directeur général adjoint de l'apec. Présentation de l étude 3

Licence professionnelle Radioprotection, démantèlement et déchets nucléaires : chargé de projets

Avis n 2010/04-05 relatif à l habilitation de l Université de Technologie de Troyes (UTT) à délivrer des titres d ingénieur diplômé

PRÉSENTATION GÉNÉRALE

Etudier l informatique

Sujet de thèse CIFRE RESULIS / LGI2P

Introduction au datamining

Le Master Mathématiques et Applications

Mon métier, mon parcours

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

Complexité et auto-organisation chez les insectes sociaux. Complexité et auto-organisation chez les insectes sociaux

CURRICULUM VITAE. Informations Personnelles

Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Site(s) (lieux où la formation est dispensée, y compris pour les diplômes délocalisés) :

Rapport d évaluation du master

Cécile MAUNIER. Maître de Conférences Sciences de Gestion Responsable pédagogique - Master 1 Marketing, Vente TITRES UNIVERSITAIRES

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

4.2 Unités d enseignement du M1

Université Paris-Dauphine

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE)

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

Enseignements d exploration de seconde. Sciences de l Ingénieur. Création et Innovation Technologiques

SUPPLEMENT AU DIPLOME

ENSEIGNEMENT DES SCIENCES ET DE LA TECHNOLOGIE A L ECOLE PRIMAIRE : QUELLE DEMARCHE?

Dossier justificatif des travaux de R&D déclarés au titre du CIR

29 écoles d Ingénieurs publiques post bac

Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique

Objectifs Contenu de la formation M1 et M2 Organisation de la formation

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet.

Chapitre 1 : Introduction au contrôle de gestion. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 1

SCIENCES DE L ÉDUCATION

Rapport d évaluation des masters réservés aux établissements habilités à délivrer le titre d'ingénieur diplômé

GUIDE DE CONSTITUTION DE DOSSIER EN VUE DE LA RECONNAISSANCE ET/OU DE L EQUIVALENCE DES DIPLOMES, TITRES ET GRADES DE L ENSEIGNEMENT SUPERIEUR

PLM PRODUCT LIFECYCLE MANAGEMENT MASTÈRE SPÉCIALISÉ

Université de Haute Alsace. Domaine. Sciences Humaines et Sociales. MASTER Mention Éducation, Formation, Communication UHA, ULP, Nancy 2

MASTER LPL : LANGUE ET INFORMATIQUE (P)

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Mon métier, mon parcours

Cursus de Master en Ingénierie de la Production Alimentaire. Une autre façon d accéder au métier d ingénieur

Vendredi 6 mars 2015

TP N 57. Déploiement et renouvellement d une constellation de satellites

PROGRAMME DE CRÉATION ET INNOVATION TECHNOLOGIQUES EN CLASSE DE SECONDE GÉNÉRALE ET TECHNOLOGIQUE Enseignement d exploration

RESUME DESCRIPTIF DE LA CERTIFICATION (FICHE OPERATIONNELLE METIERS)

Prix AEF - 5 ème édition Universités - Entreprises "Les meilleures initiatives partagées"

Master CST. Culture Scientifique et Technologique. IUFM «Célestin Freinet Académie de Nice» Service Communication - IUFM

Executive Education. Afrique Océan Indien

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

Rapport d évaluation du master

Méthodologie de conception des Systèmes d Aide à l Exploitation des Simulateurs d Entraînement

La Commission des Titres d ingénieur a adopté le présent avis

Convergence des programmes qualité Qualitéet Recherche UMR 6284 CNRS ISIT JEAN-YVES BOIRE

Apprentissage Automatique

DiFiQ. Diplôme Finance Quantitative. Une formation en partenariat. Ensae Dauphine Bärchen

LE METIER DE CONSEIL EN ERGONOMIE OU D ERGONOME-

Simulation de graphes de tâches

Les indices à surplus constant

MASTER MANAGEMENT STRATEGIE, SPECIALITE CONSULTANT EN MANAGEMENT, ORGANISATION, STRATÉGIE

Master professionnel Urbanisme : stratégie, projets, maîtrise d ouvrage (USPMO)

avec le soutien de Master professionnel Management de la Chaîne Logistique

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Présenta)on des ac)vités de recherche de l équipe PR du laboratorie MIS

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Rapport d évaluation du master

Filière MMIS. Modélisation Mathématique, Images et Simulation. Responsables : Stefanie Hahmann, Valérie Perrier, Zoltan Szigeti

L IDEX DE TOULOUSE EN BREF

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Joint AAL Information and Networking Day. 21 mars 2012

Table des matières CID CID CID CID CID

Rapport d évaluation du master

Rapport d évaluation de la licence professionnelle

Synthèse «Le Plus Grand Produit»

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Intelligence des essaims (Swarm Intelligence)

Transcription:

Description des activités de recherche Vincent Thomas LORIA (MAIA) Campus Scientifique, BP 239 54506 Vandœuvre-lès-Nancy

Table des matières 1 Présentation 3 2 Stages de recherche 3 2.1 Stage École Centrale Paris.................................... 3 2.2 Stage de DEA........................................... 3 3 Travaux de thèse 4 3.1 Informations administratives.................................. 4 3.2 Problématique.......................................... 5 3.3 Résumé du travail effectué.................................... 5 3.3.1 UNE SIMULATION MULTI-AGENT : Le système Hamelin............. 5 3.3.2 UN FORMALISME ORIGINAL : Interac-DEC-POMDP.............. 7 3.4 Contributions de la thèse.................................... 8 4 Insertion dans le monde de la recherche 8 4.1 Disciplines abordées....................................... 8 4.2 Collaborations scientifiques................................... 9 4.3 Animation de la recherche.................................... 9 2

1 Présentation Depuis l année 2000, je me suis intéressé aux systèmes multi-agents et à la prise de décision dans l incertain. J ai réalisé mes différents travaux de recherche au sein de l équipe MAIA (MAchines intelligentes Autonomes) dont François Charpillet est le responsable. L équipe MAIA s intéresse à la notion d agent. Un agent est une entité physique ou logicielle dotée de capteurs et d effecteurs capable de percevoir son environnement, d agir sur celui-ci et de prendre des décision de manière autonome. L équipe MAIA s intéresse ainsi à la modélisation, la construction et la simulation de systèmes constitués d un ou plusieurs agents. Mes travaux au sein de l équipe peuvent alors se décomposer en deux parties. J ai abordé au cours de stages plusieurs thématiques de l équipe puis ma thèse a proposé un nouveau formalisme original pour représenter et construire des systèmes multi-agents à partir d extensions de processus de prise de décision markovien. 2 Stages de recherche Au cours de deux stages, j ai eu l occasion d aborder certains aspects des problématiques de l équipe MAIA. Le premier aspect touche au problème de prise de décision en milieu incertain à partir d informations incomplètes, le second au problème de réutilisation d un modèle multi-agents pour la résolution collective de problème. 2.1 Stage École Centrale Paris En vue de l obtention de mon diplôme d ingénieur, j ai effectué un stage de fin d études de cinq mois au sein de l équipe MAIA. Ce stage était intitulé Mise en place d un système de navigation sur un robot mobile autonome et a été encadré par Franck Gechter 1 et Francois Charpillet 2. Objectif du stage L objectif du stage était d introduire une couche logicielle dans un robot développé intégralement par l équipe. Il s agissait d utiliser des informations obtenues à partir d une caméra embarquée et de l historique des actions pour situer au mieux le robot et l empêcher de dériver. Pour ce faire, j ai modélisé le problème à l aide d un modèle stochastique partiellement observable (POMDP). L objectif a alors consisté à déterminer, à partir d un modèle du monde connu et d une base d images de l environnement, la position réelle du robot. Contributions et résultats La solution proposée a consisté à coupler un module d analyse d images en composantes principales à une approche basée sur la programmation dynamique. Ce système de navigation a ensuite été testé sur une simulation que j ai développée. Le robot parvient effectivement à se repositionner à l exécution et à retrouver sa position même lorsqu il est initialement totalement perdu. Ce premier stage a été à l origine d une publication internationale [GTC01] et d une publication nationale [GTC01] et m a permis d acquérir un certain nombre de connaissances sur la modélisation stochastique et les modèles fréquemment utilisés dans l équipe. 2.2 Stage de DEA Point de départ Le stage de DEA sur lequel je me suis penché reposait sur un modèle de construction collective de toile. Ce modèle s inspire du comportement collectif des groupes d araignées sociales anole- 1 désormais maître de conférence à l UTBM 2 responsable de l équipe MAIA, Directeur de recherche INRIA 3

simus eximius. Il a été développé initialement par Vincent Chevrier 3 et Christine Bourjot 4 dans l équipe MAIA en collaboration avec le laboratoire de neurosciences comportementale de Nancy 1 dirigé par le professeur Krafft. Les éthologues souhaitaient vérifier s il était possible d expliquer l aspect social de cette espèce à partir des comportements d individus solitaires et d une tolérance mutuelle entre les individus. Le modèle est constitué d agents très simples basés sur des règles stochastiques de type stimulus réponse et d un environnement qui regroupe l ensemble des fils tissés par la collectivité. Il est fondé sur le mécanisme de stigmergie : les agents posent des fils de soie dans l environnement et en retour ces fils de soie attirent les agents les ayant tissés. Cette corrélation entre les actions des agents permet d aboutir à la construction d une structure cohérente proche des structures soyeuses observées. Ce modèle montre ainsi que ces arthropodes n ont pas nécessairement besoin de représentation explicite des autres individus pour se coordonner et que l agencement de comportements individuels simples suffit. Objectif du stage de DEA Le modèle de simulation est un modèle intéressant à étudier tout d abord car il permet à des agents de s organiser pour effectuer une tâche collective sans avoir besoin de représentation complexe des autres agents et car, de plus, le processus de construction est guidé par la structure elle-même. Cette dernière propriété permet d avoir un processus robuste pour lequel il est possible d introduire à l exécution de nouveaux agents s adaptant automatiquement à l état d avancement de la tâche. Le coeur du stage du DEA a été de réutiliser un tel modèle dans un cadre applicatif pour tirer parti de ses propriétés. Contributions et résultats Le domaine choisi a été le domaine de l imagerie et le problème sur lequel nous nous sommes penchés a été l extraction de régions homogènes dans une image. Des araignées virtuelles sont déposées sur une image. Elles se déplacent sur les pixels de cet image, se comportent conformément au modèle de simulation précédent et posent des fils de soie en fonction des niveaux de gris des pixels qu elles parcourent. Les fils attirent les araignées de la même espèce qui construisent alors collectivement des toiles représentant les régions de niveau de gris homogène. Au cours de ce stage, j ai pu développer une application basée sur ce modèle et évaluer les résultats obtenus par rapport à d autres techniques dynamiques adaptatives. Ce travail a conduit à une revue [BCT03], une publication internationale [BCT02] et m a permis de prendre conscience de la difficulté liée à l utilisation de système multi-agents. On dispose en effet de dynamiques collectives produites à partir de comportements individuels mais le lien entre ces deux niveaux de description (collectif et individuel) échappe à toute analyse mathématique et nécessite la présence d un observateur validant expérimentalement la pertinence des solutions obtenues. 3 Travaux de thèse 3.1 Informations administratives titre Proposition d un formalisme pour la construction automatique d interactions dans les systèmes multi-agents réactifs Date de soutenance le 18 Novembre 2005 Université Université Henri Poincaré Nancy 1 Mention UHP Nancy 1 n en attribue plus Président du jury Didier Galmiche, professeur UHP Nancy 1 Rapporteurs Joël Quinqueton, professeur université Paul Valéry, Montpellier Philippe Mathieu, professeur université de Lille 1 Examinateur Olivier Sigaud, professeur université Paris 6 Directeurs de thèse Vincent Chevrier, maître de conférences UHP Nancy 1 Christine Bourjot, maître de conférences Nancy 2 3 maître de conférences à l ESSTIN 4 maître de conférences à l université Nancy 2 4

3.2 Problématique Le sujet de ma thèse s inscrit dans le domaine de l Intelligence Artificielle Distribuée (IAD) plus précisément, elle touche à deux thématiques particulières découvertes dans les stages que j ai pu effectuer précédemment : les Systèmes Multi-Agents et les Processus Décisionnels de Markov (PDM). Il s agit de résoudre des problèmes à l aide d agents simples, en interaction et évoluant dans un environnement incertain. Les capacités nécessaires à la résolution de la tâche et la fonction de prise de décision du système sont distribuées au sein des agents. Il s agit alors de déterminer l ensemble des comportements réactifs des agents constituant le système pour que celui-ci se comporte comme un tout cohérent et parvienne à résoudre le problème au vu d un critère global défini a priori. Plus précisément, ma thèse s intéresse à la construction décentralisée des comportements individuels. Il s agit de construire les comportements individuels localement au niveau de chaque agent en ne disposant que d informations partielles. Une telle approche doit faire face à un certain nombre de problèmes dont : le problème de credit assignement consistant à attribuer au bon agent et à la bonne action le mérite associé à l avancement de la tâche en cours. le problème de co-évolution des agents : lors de la construction des comportements, chaque agent peut être influencé par les autres agents dont le comportement évolue en parallèle. Ceci remet profondément en cause les propriétés de convergence des algorithmes existants et nécessite d introduire de nouveaux mécanismes de coordination et d échange d informations. Des extensions des PDM, les DEC-POMDP ( DECentralized Partially Observable Markov Decision Process ), ont été proposées pour formaliser cette problématique et constituent un cadre mathématique prometteur pour la construction automatique de dynamique collective. Cependant, la notion d interaction entre les agents qui fait l intérêt des Systèmes Multi-Agents n est pas représentée explicitement dans ces formalismes, ce qui fait qu un agent n a pas de vision à long terme des conséquences de ses actions. Des approches tentent de répondre aux problématiques qui y sont liées en introduisant un apprentissage progressif des agents, des mécanismes cognitifs plus développés comme l empathie, de la communication ou une structuration initiale du problème. L objectif de mon travail a été de développer un cadre formel dans lequel il est possible d introduire la notion d interaction, définie comme des influences mutuelles réciproques entre les agents, comme concept de premier ordre. L objectif de ce cadre formel est de donner la possibilité aux agents de manipuler ces interactions pour prendre des décisions à un niveau semi-global et en tirer parti pour construire des comportements collectifs. 3.3 Résumé du travail effectué Ce travail de thèse peut alors se décomposer en deux parties : Dans la première, je me suis intéressé à la modélisation d un phénomène collectif de spécialisation observé dans des groupes de rats. L objectif de cette étude était de mettre en évidence (par l intermédiaire d une simulation nommée Hamelin) des formes d interaction permettant à des agents de s organiser pour résoudre un problème posé à la collectivité. Dans un second temps, je me suis concentré sur la réutilisation générique des mécanismes mis en évidence par Hamelin pour construire un nouveau formalisme : l interac-dec-pomdp à partir du DEC-POMDP. L objectif de cette seconde étape était de pouvoir représenter dans un formalisme mathématique ces interactions de manière générique et pouvoir en tirer parti de manière automatique. Ces deux étapes vont être décrites dans les paragraphes suivants. 3.3.1 UNE SIMULATION MULTI-AGENT : Le système Hamelin Objectif de la démarche En développant une simulation, l objectif poursuivi a été de mettre en évidence un concept d interaction permettant aux agents de considérer la présence d autres agents du 5

système pour adopter des comportements sociaux afin d en faire un principe de résolution générique par la suite. Origine du modèle Ce travail s est fait en collaboration avec Didier Desor 5 et Henri Schroeder 6 du laboratoire de neurosciences comportementales de Nancy 1. Il s agissait de modéliser le comportement collectif d un groupe de rats introduits dans un dispositif expérimental spécialement conçu et soumis à des contraintes environnementales d accès à la nourriture. Dans ces expériences, après quelques semaines, le groupe de rats se spécialise en deux profils comportementaux : certains rats (les ravitailleurs) vont chercher de la nourriture tandis que d autres (les non transporteurs) restent dans la cage et profitent de cet apport. Tous les rats parviennent à subvenir à leurs besoins, les rats transporteurs peuvent se nourrir lorsque tous les rats non transporteurs sont repus. Ce phénomène de différenciation sociale reconnu en éthologie a pu être observé sur plusieurs dizaines d expériences avec différentes espèces de rats. Modèle Développé Un modèle original, nommé Hamelin, a été développé afin de reproduire l essence de ce phénomène collectif. L objectif de ce modèle pour les éthologues était de vérifier sous quelles conditions une spécialisation pouvait apparaître parmi la population. Nous avons ainsi souhaité vérifier si cette spécialisation nécessitait une représentation sociale complexe des individus mis en présence. Pour ce faire, j ai conçu un modèle multi-agent basé sur le principe de parcimonie consistant à se limiter aux hypothèses les plus simples possibles. Chaque agent représente un rat et est régi par des règles stochastiques de type stimulus-réponse. La dynamique du système est la conséquence du couplage de deux modèles de renforcement existants proposés dans la littérature. Résultats de la simulation L exécution du modèle Hamelin permet effectivement d observer des comportements collectifs proches de ceux observés dans le dispositif expérimental. On observe l émergence d une différenciation comportementale. Celle-ci est caractérisée par deux profils comportementaux identiques à ceux observés dans les expériences biologiques. Une analyse plus fine met en évidence d autres caractéristiques communes à la simulation et aux observations réelles (comme la taille des groupes et les sous-catégories obtenues). Bilan Le modèle Hamelin constitue un outil de validation et d invalidation d hypothèses biologiques : il a montré qu il n était pas nécessaire pour les animaux de disposer d une représentation complexe des autres pour qu un tel comportement collectif émerge dans la collectivité. Il a permis en outre de mettre en cause un certain nombre d hypothèses émises par les éthologues et a soulevé des questions pertinentes sur d autres observations qu ils ont pu faire [TBCD02]. Pour la communauté informatique, ce modèle de simulation constitue surtout un système multi-agent original doté de propriétés de robustesse, d adaptabilité et de mise à l échelle particulièrement intéressants pour la résolution collective de problème. [TBCD04] présente quelques unes de ces propriétés. Exploitation du modèle Le modèle Hamelin a donné lieu à des stages dans le passé (stage de maîtrise de sciences cognitives, stage de maîtrise en informatique, stage de MIAGE, et un stage de DEA). Le stage de maîtrise MIAGE a permis d introduire explicitement l aspect temporel dans le modèle en construisant une simulation à événements discrets. Le stage de DEA a étudié la réutilisation de ce modèle dans un premier cadre applicatif prometteur : la distribution de tâches dans des réseaux peer-topeer. D autres travaux sont envisagés dans cette direction. Ce modèle est aussi à l origine d une action intitulée Méthode d inspiration biologique pour l organisation de communauté d assistants, du contrat de plan état-région, thème Téléopération et Assistants Intelligents. Le travail proposé consiste à étudier et à concevoir des méthodes permettant à une communauté d agents de s organiser dynamiquement de manière décentralisée. Il est le fruit de la collaboration avec les éthologues du laboratoire de neurosciences comportementales et les implique avec l équipe MAIA. 5 professeur de biologie à l UHP Nancy 1 6 maitre de conférence en biologie à l UHP Nancy 1 6

3.3.2 UN FORMALISME ORIGINAL : Interac-DEC-POMDP Lien avec le modèle Hamelin Dans le système Hamelin, les agents parviennent à s organiser pour distribuer les tâches entre les agents. Cette organisation est la conséquence des interactions qui ont lieu dans la cage lors des échanges de nourriture. Cette brique d interaction nous semblait pertinente car elle permet à la collectivité de tirer parti de mécanismes individuels d adaptation. Nous avons souhaité construire un cadre formel permettant de la réutiliser. Formalisme Interac-DEC-POMDP Ce formalisme est une extension des DEC-POMDP. Dans ceuxci, les agents agissent simultanément pour résoudre des problèmes posés à la collectivité. J y ai explicitement ajouté des couplages entre les comportements individuels inspirés des interactions observées dans le système Hamelin. Ce mécanisme permet à chaque agent d interagir avec un autre agent et de raisonner sur ces interactions. Pour cela, on définit dans un premier temps les différentes interactions possibles entre les agents et leurs résultats éventuels. Exécution Un cycle d exécution est constitué d une phase d action suivie par une phase d interaction. Durant la phase d action, les agents décident individuellement et simultanément des actions qu ils souhaitent entreprendre conformément au modèle DEC-POMDP. Au cours de la phase d interaction, chaque agent décide comment (quelle interaction utiliser) et avec quel agent interagir. Une fois une interaction choisie, les deux agents impliqués décident ensemble du résultat d interaction. Ce formalisme permet ainsi des prises de décisions collectives et non plus uniquement égoïstes. Il permet notamment l apparition de comportements altruistes si cela conduit le système à être plus performant par rapport à un critère collectif évalué localement. Ce formalisme décrit dans [Tho04] et [TBC06] possède l avantage de représenter dans le même cadre des actions et des interactions et ne présente aucune contrainte quant aux interactions possibles et aux mécanismes de prise de décision. Bilan du formalisme Ce formalisme peut ainsi être compris comme un formalisme opératoire pour l exécution de comportements collectifs basé sur des interactions et des comportements donnés a priori (il est par exemple possible de représenter et d exécuter le modèle Hamelin dans ce formalisme). Il peut aussi être compris comme un formalisme permettant de représenter de nouvelles catégories de problèmes dans lesquels des agents peuvent interagir directement entre eux, ce qui n était pas possible jusqu a présent. Dans ce dernier cas de figure, il reste à développer de nouveaux algorithmes pour construire au mieux les comportements permettant de résoudre un problème exprimé dans ce formalisme et de tirer parti des interactions. Méthodes de résolution En m inspirant du modèle Hamelin, j ai proposé un certain nombre d heuristiques (cf [TBC06]). L originalité de ma proposition est de décider collectivement du résultat de l interaction en fonction de la somme des satisfactions individuelles des agents impliqués dans l interaction considérée. Ceci permet de construire des prises de décisions collectives basées sur des apprentissages individuels. Je me suis intéressé à une tâche complexe impliquant plusieurs d agents intitulée le problème des pompiers : des agents transportent des seaux, doivent les remplir pour éteindre des feux repartis dans l environnement et peuvent interagir localement en se les échangeant. Simplement seuls certains agents peuvent atteindre les sources d eau ou le feu. De plus, les agents n ont pas de vue globale sur le système et ne peuvent pas tous savoir si leurs action sont utiles. Les interactions, leur apprentissage et les transferts de récompense permis par la représentation explicite des interactions permettent néanmoins de répartir la tâche entre les agents et conduit à l apparition de structures collectives complexes (chaînage d agents) sans que les agents n ait de vue globale du système ni qu a aucun moment cette structure ne soit représentée. Bilan Ce modèle a montré qu il est possible, à partir d interactions locales définies a priori de générer par apprentissage et de manière automatique des organisations utiles à la résolution collective de la tâche sans utiliser de représentation complexe des autres agents ni de la tâche collective à résoudre. Ces 7

apprentissages semblent constituer un bon point de départ pour proposer des techniques d apprentissages collectifs décentralisés. 3.4 Contributions de la thèse La thèse a donc proposé trois contributions principales au domaine des systèmes multi-agents et des modèles markoviens : un nouveau type de système multi-agents dynamique correspondant à la simulation HAMELIN le formalisme Interac-DEC-POMDP, une alternative aux modèles actuels pour représenter des problèmes de prises de décision multi-agents et intégrant explicitement la notion d interaction directe comme élément de premier ordre. des heuristiques permettant de construire de manière décentralisée des comportements d agents sociaux tirant parti d interactions directes locales et des techniques d apprentissage par renforcement monoagent. 4 Insertion dans le monde de la recherche 4.1 Disciplines abordées Au cours de mes années de thèse, j ai eu l occasion de participer à un certain nombre d activités liées à mes activités de recherche. Domaines de recherche En plus des conférences dans lesquelles j ai pu publier, j ai pu assister à d autres rencontres sur mes domaines de recherche et m impliquer dans le domaine des systèmes multi-agents : J ai été impliqué dans les réunions organisées par MFI (Modèles Formels de l Interaction) à plusieurs reprises au niveau de l organisation et des discussions, dans les réunions COLLINE (COLLectif, INteraction, Emergence), groupe de travail de l AFIA (Association Française pour l Intelligence Artificielle) centré sur les systèmes multi-agents (GDRI3). des modèles markoviens : J ai eu l occasion d être présent aux journées PDMIA (Processus Décisionnel de Markov et Intelligence Artificielle) qui réunit la communauté francophone travaillant sur les modèles markoviens dans le cadre de l intelligence artificielle et j y ai présenté mes travaux à deux reprises. Pluridisciplinarité De plus, ma thèse étant connexe à plusieurs domaines, j ai pu développer un cursus pluri-disciplinaire et m impliquer dans les sciences cognitives : J ai assisté à des réunions organisées par le réseau CogniEst. Certains de nos travaux ont été publiés dans les congrés jeunes chercheurs en science cognitives en collaboration avec le laboratoire de neurosciences comportementales de Nancy 1. l éthologie : Ces mêmes collaborations m ont permis d aborder des problématiques liées à la modélisation de comportements animaux et m ont conduit à participer à des workshops internationaux ( Self- Organisation and Evolution of Social Behaviour à Monteverita) et à assister à des conférences sur les comportements animaux ( Adaptation et auto-organisation Strasbourg 2002) et leur modélisation ( Agent Based Simulation 2003). les systèmes complexes : J ai participé en tant qu étudiant à une école d été d une semaine organisée par le COSI (Complexity in Social sciences) en Juillet 2002 en Crete. Le Cosi est un réseau fondé par la commission européenne qui s intéresse aux systèmes complexes dans différentes contextes (sociologie, biologie, mathématique, informatique). Cette école a été financée par CogniEst et a conduit à l élaboration d un compte-rendu d une trentaine de pages. Cette école d été m a permis de participer à des réunions interdisciplinaires et de prendre connaissance des points de vue de différents domaines (mathématiques, sociologie, etc...) sur la thématique de la complexité que l on aborde dans les systèmes multi-agents. 8

4.2 Collaborations scientifiques Avec mes directeurs de thèse, j ai eu l occasion d établir une collaboration solide avec les éthologues du laboratoire de neurosciences comportementales de Nancy 1. Ces collaborations ont conduit à des modèles originaux pertinents (modèle de construction collective de toiles, modèle Hamelin) aussi bien pour l étude des comportements animaux collectifs que pour la construction de système multi-agents dans un cadre applicatif. Ces collaborations ont en outre été concrétisées par des publications dans des workshops [TBCD02], des conférences internationales [TBCD04] et une action en cours du plan état région Téléopération et Assistants Intelligents. Des collaborations internationales ont pu être établies avec d autres scientifiques ayant des activités proches de nos problématiques, comme Jean Louis Deneubourg du CENOLI (Center for Nonlinear Phenomena and Complex Systems) et Charlotte Hemelrijk de l IFI (Institut für Informatik der Universität Zürich). Des rencontres ont été organisées et ont permis des échanges fructueux. Les discussions que j ai pu avoir avec l ensemble de ces intervenants m ont convaincu de l intérêt d approches pluri-disciplinaire et ont guidé en grande partie mon travail de thèse. 4.3 Animation de la recherche Au sein de l équipe reprises. Au sein de l équipe MAIA, j ai aussi eu l occasion de m investir à différentes J ai participé et animé plusieurs séminaires au sein de l équipe sur mes travaux de recherche et sur des travaux connexes : 23 Juin 2004, Towards the formalisation and the use and of interactions in Markov Decision Process, séminaire équipe associée UMASS, [TWorkshop04b] 23 Janvier 2004, Répétition Comité de thèse 22 avril 2003, Présentation de trois articles publiés en 2002 25 Juin 2002, Rats et systèmes multi-agents 4 Juillet 2001, Résolution collective de problèmes Etude de modèles d inspiration biologique 20 Avril 2001, Méthodes d évaluation pour les Systèmes Multi-Agent d inspiration biologique 7 Juillet 2000, Système de Navigation pour le robot utilisant la vision J ai mis en place et animé un groupe de travail PPB («Plein de Petites bestioles») focalisé sur les systèmes multi-agents réactifs d inspiration biologique. J y ai présenté plusieurs travaux récents comme les derniers résultats obtenus par les algorithmes fourmis. J ai en outre animé des discussions sur les travaux proches de ma thèse (comme la thèse de Guestrin) dans le cadre de réunion avec certains membres de l équipe travaillant sur des sujets connexes. Je me suis investi dans plusieurs groupes de travail de l équipe MAIA : le groupe de travail sur les modèles stochastiques (GTMS) dont l objectif est de partager des connaissances sur les modèles markoviens entre les membres de l équipe, le groupe de travail sur l auto-organisation mis en place récemment avec des membres de l équipe CORTEX et cherchant à étudier les travaux récents dans ce domaine. Je me suis investi dans l action MIBOCA (Méthodes d inspiration biologique pour l Organisation de Communautés d Assistants) du contrat de plan état-région «Teleoperation et Agents Intelligents» auquel l équipe MAIA participe. Cette action se fonde sur le modèle Hamelin que j ai pu développer au cours de ma thèse et vise à appliquer celui-ci à l organisation automatique et décentralisée d assistants intelligents. J ai encadré en outre des stagiaires sur des activités proches de mes travaux de recherche : J ai encadré Stéphanie Biquillon entre Mai et Juillet 2002 au cours de son stage de maîtrise de sciences cognitives sur des problématiques de modélisation de phénomènes d inspiration biologique en collaboration avec les éthologues du laboratoire de neurosciences comportementales de Nancy 1. 9

J ai participé à l encadrement de Sophie Schumacher entre Avril et Juillet 2004 au cours d un stage effectué à la MIAge concernant le développement d un laboratoire virtuel destiné à étudier des simulations informatiques de phénomènes biologiques. J ai encadré Paul Chapron, au cours de son stage de Deuxième année d ESIAL entre Juin 2005 et Septembre 2005 sur l application des modèles markoviens et des systèmes multi-agents réactifs aux problèmes de manufacturing control. Enfin, j ai participé activement à l animation de la recherche. J ai ainsi effectué des démonstrations des différentes applications robotiques des travaux de l équipe au cours de la fête de la science en Novembre 2003. Au cours de la fête de la science en Novembre 2005, j ai tenu un stand avec Didier Desor et Henri Schroeder, éthologues au laboratoire de neurosciences comportementales. Ce stand présentait en parallèle les expériences biologiques menées sur des vrais rats et notre simulation informatique. Enfin, j ai participé à la préparation et aux démonstrations ayant lieu en public à Nancy dans le cadre de l évaluation à miparcours du projet MOBIVIP sur les véhicules autonomes intelligents le 17 et 18 Juin 2005. vis à vis de l extérieur J ai participé à l organisation sur Nancy des deuxièmes assises du GDR I3 (le 7 décembre 2002) en répondant aux besoins matériels du groupe de travail Modèle Formel de l Interaction. Je me suis investi dans plusieurs groupes de travail francophones : le groupe PDMIA dont le but est de mettre en contact des chercheurs qui s intéressent aux Processus Décisionnels de Markov et l Intelligence Artificielle. J y ai présenté mes travaux à deux reprises (2003 et 2004) et était présent à d autres occasions. J ai participé au groupe de travail Modèles Formels de l Interaction que j ai rencontré aux assises 2002. J ai pu présenter mes travaux à ce groupe en 2004 ([TWorkshop04a]). 10

Liste de publications Thèse [Tho05] Vincent Thomas. Proposition d un formalisme pour la construction automatique d interactions dans les systèmes multi-agents réactifs. PhD thesis, Université Henri Poincaré Nancy 1, 2005. Revue internationale avec comité de lecture [BCT03] Christine Bourjot, Vincent Chevrier, and Vincent Thomas. A new swarm mechanism based on social spiders colonies : from web weaving to region detection. Web Intelligence and Agent Systems : An International Journal - WIAS, 1(1) :47 64, Mar 2003. Revue nationale avec comité de lecture [CTC + 05] Marie Caroline Cotel, Vincent Thomas, Vincent Chevrier, Henri Schroeder, and Christine Bourjot. Processus cognitifs et différenciation sociale de groupes de rats : intérêt de la modélisation multi-agents. Cahiers Romans de Sciences Cognitives, 2005. accepté, a paraitre prochainement. Conférences internationales avec comité de lecture et actes [TBC04] Vincent Thomas, Christine Bourjot, and Vincent Chevrier. Interac-dec-mdp : Towards the use of interactions in dec-mdp. In Third International Joint Conference on Autonomous Agents and Multi-Agent Systems - AAMAS 04, New York, USA, pages 1450 1451, Jul 2004. article court. [TBCD04] Vincent Thomas, Christine Bourjot, Vincent Chevrier, and Didier Desor. Hamelin : A model for collective adaptation based on internal stimuli. In Stefan Schaal, Auke Ijspeert, Aude Billard, Sethu Vijayakumar, John Hallam, and Jean-Arcady Meyer, editors, From animal to animats 8 - Eighth International Conference on the Simulation of Adaptive Behaviour 2004 - SAB 04, Los Angeles, USA, pages 425 434, Jul 2004. [BCT02] Christine Bourjot, Vincent Chevrier, and Vincent Thomas. How social spider inspired an approach to region detection. In First International Joint Conference on Autonomous Agents & Multiagent Systems - AAMAS 2002, Bologna, Italy, pages 426 433, Jul 2002. [GTC01] Franck Gechter, Vincent Thomas, and François Charpillet. Robot localization by stochastic vision based device. In The 5th World Multi-Conference on Systemics, Cybernetics and Informatics - SCI 2001 - The 7th International Conference on Information Systems Analysis and Synthesis - ISAS 2001, Orlando, FL, USA, Jul 2001. 11

Conférences nationales avec comité de lecture et actes [TBC06] Vincent Thomas, Christine Bourjot, and Vincent Chevrier. Heuristique pour l apprentissage automatique décentralisé d interactions dans un système multi-agent. In Conférence en reconnaissance des formes et intelligence Artificielle RFIA2006 (accepté), Nov 2006. [TBC04] Vincent Thomas, Christine Bourjot, and Vincent Chevrier. Un formalisme pour la construction automatique d interactions dans les sma réactifs. In Journées Francophones sur les Systèmes Multi-Agents - JFSMA 2004, Paris, france, pages 83 88, Nov 2004. article court. [TBC03] Vincent Thomas, Christine Bourjot, and Vincent Chevrier. Du collectif pour la satisfaction individuelle : un modèle d auto-organisation. In Journées Francophones sur les Systèmes Multi-Agent - JFSMA 2003, Hammamet, Tunisie, pages 261 265, Nov 2003. article court. [GTC01] Franck Gechter, Vincent Thomas, and François Charpillet. Utilisation d un module de vision stochastique pour localiser un robot mobile. In Troisièmes Journées Nationales de la Recherche en Robotique - JNRR 2001, Hyères, France. INRIA, Oct 2001. Workshop international avec comité de lecture et actes [TBCD02] Vincent Thomas, Christine Bourjot, Vincent Chevrier, and Didier Desor. Mas and rats : Multi-agent simulation of social differentiation in rats groups. In International Workshop on Self-Organization and Evolution of Social Behaviour, Monte Verita, Ascona, Switzerland, pages 396 405, Sep 2002. Workshop national avec actes [Tho04] Vincent Thomas. Interac-dec-mdp : un premier formalisme pour l utilisation d interactions directes dans un mdp decentralise. In 4ème Journée Processus de Décision Markovien et Intelligence Artificielle - PDMIA 2004 et Décision et Planification, Paris, france, May 2004. [Tho03] Vincent Thomas. Apprentissage collectif par renforcement d inspiration biologique? le système hamelin. In Troisièmes Journées Nationales sur Processus Décisionnel de Markov et Intelligence Artificielle - PDM&IA 2003, Caen, France, Jun 2003. Rapports internes [TBC05] Vincent Thomas, Christine Bourjot, and Vincent Chevrier. Formalisme pour la construction automatique d interactions dans les SMA réactifs - version étendue, 2005. INRIA RR-5590 I.2.11.3 : Multiagent systems, I.2.11.1 : Intelligent agents. [Tho03] [Tho01] Vincent Thomas. Les relations de dominance : de la biologie aux systèmes markoviens. Comité de thèse, MAIA, Dec 2003. Vincent Thomas. Evaluation de systèmes multi-agents d inspiration biologique. application à l extraction de régions dans une image. Stage de dea, Jul 2001. 12

Séminaire/Workshops [TWorkshop04a] Vincent Thomas. Introduction d interactions dans les processus de dècision markoviens Groupe de travail MFI, GDRI3, 2004. [TWorkshop04b] Vincent Thomas. Towards the formalisation and the use and of interactions in Markov Decision Process Workshop Equipe Associee MAIA - Universite du Massachusetts, 2004. 13