Comportements Individuels Adaptatifs dans un Environnement Dynamique pour l'exploitation Collective de Ressource

Comportements Individuels Adaptatifs dans un Environnement Dynamique pour l'exploitation Collective de Ressource Intelligence Artificielle Située, Cerveau, corps et environnement, Drogoul A. & Meyer J-A. coordonnateurs, Editions Hermès, 1999 TOPIN Xavier, REGIS Christine, GLEIZES Marie-Pierre, GLIZE Pierre {regis, gleizes, glize}@irit.fr Institut de Recherche en Informatique de Toulouse 118, Route de Narbonne 31062 Toulouse, Cedex - France

IAS99 Comportements Individuels Adaptatifs dans un Environnement Dynamique pour l'exploitation Collective de Ressources Xavier Topin, Christine Régis, Marie-Pierre Gleizes, Pierre Glize IRIT - Université Paul Sabatier 118, route de Narbonne, 31062 TOULOUSE France {topin, regis, gleizes,glize}@irit.fr Résumé : La conception de collectif de robots autonomes pour la réalisation d'une tâche a donné lieu à de nombreux algorithmes et de nombreuses définitions de comportements. Notre contribution à ce type de recherche est de proposer un algorithme de comportement adaptatif pour un robot qui ne tient compte que de données locales sur l'état du robot ou de données étant perçues dans son environnement immédiat. En dotant tous les robots d'un même collectif de ce type de comportement, on obtient un système multi-agent auto-organisateur dépourvu de contrôle global qui peut évoluer dans des environnements dynamiques. Dans ce papier, nous avons choisi d'implémenter un collectif de robots chargé d'exploiter des ressources disposées dans l environnement. Les aptitudes de base de ces robots sont inspirées des fourmis naturelles. En effet, les fourmis sont des insectes sociaux qui ont fait leur preuve dans des activités de fourragement. De plus, ces systèmes naturels ont beaucoup été étudiés par les éthologues et par conséquent, les caractéristiques physiologiques des fourmis ainsi que leur comportement en phase de fourragement sont très bien connus et décrits. Ainsi, les résultats obtenus par nos robots-fourmis ont pu être comparés aux résultats de plusieurs espèces de fourmis naturelles simulées. L'analyse de ces résultats montre que les robots-fourmis coopératifs arrivent à s'adapter à des environnements différents et obtiennent des résultats au moins aussi bon que les fourmis naturelles. Dans la première partie de ce papier, les liens existants entre la robotique collective, les insectes sociaux et les systèmes multi-agents sont mis en évidence. La plate-forme de simulation des fourmis naturelles est ensuite décrite, puis la manière dont les robots-fourmis ont été conçus est détaillée. La dernière partie est consacrée à la description de simulations et à la discussion des résultats obtenus. Mots-clés : Robotique collective, systèmes multi-agents, auto-organisation, coopération, environnement 1

1. Introduction Le développement de collectifs de robots autonomes ayant à évoluer dans des environnements dynamiques intéresse la robotique et les systèmes multi-agents. Les chercheurs en robotique collective essayent de doter leurs robots physiques de caractéristiques leur permettant de communiquer, de se déplacer Les chercheurs en systèmes multi-agents travaillent plus particulièrement sur le comportement autonome des agents composant le système et sur la notion d émergence d un comportement intelligent du collectif. Dans ce papier, nous nous intéressons à des collectifs de robots logiciels qui explorent un environnement et collectent des ressources. Les principales caractéristiques des robots correspondent à celles des fourmis oecophylles. La plate-forme de simulation de l activité de fourragement et le modèle des fourmis naturelles sont décrits dans la deuxième partie. La conception de ces robots et les résultats obtenus sont présentés respectivement dans la troisième partie et la quatrième partie de cet article. Mais tout d abord quelques travaux en robotique collective et dans les systèmes multi-agents proches de notre problématique sont étudiés. 1.1 La robotique collective L enjeu de la robotique collective est de faire coopérer un ensemble de robots autonomes dans le but d exécuter des tâches complexes dans un environnement dynamique et /ou inconnu. Beaucoup d applications ont été inspirées de modèles empruntés à l éthologie. L exemple typique est celui du fourragement des fourmis qui est une source d inspiration pour modéliser le comportement de robots simples comme ceux décrits dans une extension du système MANTA (Drogoul,98). Basés sur un principe de parcimonie sur le plan individuel, ces robots-fourmis coopèrent de manière décentralisée sans communication ni interaction en utilisant l environnement comme mémoire. Cette mémoire à court terme confère une meilleure adaptabilité des phénomènes observés au niveau collectif. L idée dans MANTA est ici de doter les robots de certaines propriétés intéressantes pour leur conférer un comportement individuel simplifié à l extrême : robustesse aux pannes grâce à un collectif de robots interchangeables, adaptabilité du collectif dont le comportement n est pas planifié ni contrôlé, réactivité : le robot ne réfléchit pas, il agit et réagit avec son environnement simplicité de conception du robot et donc son coût est peu élevé. Notre approche est différente de celle de Drogoul car nous ne voulons pas simuler une fourmilière, nous proposons d implémenter le comportement d un robot-fourmi par un algorithme basé sur la coopération. La simulation des fourmis réelles nous sert seulement de système de référence pour évaluer notre algorithme. Un autre domaine d application privilégié concerne l exploration d un environnement dangereux ou lointain pour l homme. C est le cas d un essaim de robots coopératifs (Spires,98) munis de capteur pour rechercher des cibles (en l occurrence des mines cachées), et ceci en l absence d information sur la localisation de ces cibles. Chaque robot est muni d un algorithme de recherche coopératif basé sur l application de la courbe de remplissage d espace d Hilbert. Le contrôle est décentralisé. Les robots sont autonomes et communiquent entre eux pour permettre la coopération. Cette approche basée sur une répartition coopérative des régions à explorer diffère de la nôtre par le type d algorithme utilisé qui est ici un algorithme alpha-bêta par coordination avec une communication par diffusion. Le système multi-agent étudié par Mataric (Mataric,94) est composé d un groupe de 4 robots mobiles réalisant une tâche de fourragement pour rechercher des palets dans une zone donnée et les ramener à la «maison». Les agents n ont pas de modèle prédéfini du monde. Ils sont tous homogènes et n emploient pas de modèle explicite des autres. Le comportement collectif n est ici que la somme des activités individuelles, ce qui permet d observer un accroissement des interférences entre les agents et un déclin de performances pour tous les algorithmes étudiés, lorsque le nombre de robots augmente. Dans les travaux ultérieurs, elle s est orientée vers des agents plus «sociaux» et coopératifs pour résoudre ce problème. 1.2 L'apport des systèmes multi-agents Les systèmes de robotique collective peuvent être simulés par des systèmes multi-agents. En effet ils semblent partager les mêmes principes (Ossowski,99) : autonomie des agents, poursuite d un objectif local, 2

IAS99 interaction avec l environnement, comportement individuel basé sur le cycle perception / raisonnement / action. Labbani propose une méthodologie émergentiste (Labbani,98) pour concevoir et évaluer des comportements collectifs et des colonies de robots basée sur des capacités individuelles et des interactions, implantée sur les hypothèses suivantes : un ensemble d entités en interaction peuvent être exprimées dans une théorie ou un vocabulaire à un microniveau, la dynamique des interactions produit un phénomène global qui peut être une régularité, un état stable ou un processus, ce phénomène est observé par un observateur externe ou par le système lui-même à un macro-niveau. Le développement du collectif de robots-fourmis présenté est basé sur des techniques multi-agents. Comme dans le système de Labbani, nous nous intéressons à la conception d un seul agent, le comportement intelligent du collectif émergeant des interactions entre ces agents simples. Des modèles d agents comme le modèle ASTRO (Ocello,98) sont adaptés à un environnement temps réel et utilisent des connaissances sociales pour gérer la coopération basée sur les interactions. Les fonctions internes (raisonnement, décision, contrôle) de l agent guident son comportement alors que ses fonctions externes (communication, perception, action) gèrent les interactions et l organisation. Le modèle propose d intégrer en parallèle des capacités délibératives et réactives dans la structure des agents de manière à permettre une supervision en continue de l évolution de l environnement. 2 La modélisation des fourmis oecophylles Dans de nombreux systèmes naturels tels que les insectes sociaux, un grand nombre d'entités ou d'agents autonomes et simples réalisent des tâches complexes (Bonabeau,95). Ces systèmes tendent à prouver qu'un système composé d'agents simples en interaction donne des résultats aussi bons en termes de robustesse et de vitesse qu'une seule entité complexe. Les fourmis font partie des insectes sociaux qui ont une capacité à interagir pour accomplir une tâche globale qui peut être par exemple la survie de la colonie. Elles ont fait leur preuve dans des activités de fourragement et leur faculté d'adaptation à de nouveaux environnements au cours du temps n'est plus à démontrer. Ceci implique que les fourmis ont beaucoup été étudiées par les éthologues et par conséquent, les caractéristiques physiologiques des fourmis ainsi que leur comportement en phase de fourragement sont bien connus et décrits. Par exemple, la dynamique du tri collectif des fourmis est étudié par Deneubourg (Deneubourg,90). Les fourmis se déplacent de manière aléatoire, sans communication, ni organisation hiérarchique. Leur perception se restreint aux objets placés devant elles et elles peuvent distinguer deux ou plusieurs types d objets. Elles peuvent prendre ou déposer un objet selon une probabilité qui est fonction du nombre d objets identiques rencontrés récemment. Ce type d algorithme est moins efficace que d autres mais il a l avantage d être simple, robuste et flexible. Il semble que les fourmis soient d accord pour former des tas bien qu un tel consensus n existe pas. Il y a donc émergence d un comportement collectif. 2.1 La plate-forme Nous nous sommes ainsi intéressés à la simulation d'une espèce de fourmi : la fourmi oeccophylle. Les comportements de ce type de fourmi nous ont été spécifiés par des éthologues du laboratoire LEPA de l'université Paul Sabatier de Toulouse. Ainsi, dans un premier temps un système de simulation a été validé. Pour les éthologues, ce système représente un outil de travail. Pour nous, concepteurs d'artefacts, il constitue un système de référence ayant des performances équivalentes à un système naturel. Pour observer et faire des mesures sur le comportement des fourmis oecophylles, un environnement de simulation a été développé (voir figure 1). Il est constitué d'une arène de taille variable entre 1 et 10000 pixels qui peut éventuellement contenir des obstacles, c est-à-dire des zones inaccessibles par Figure 1 : L arène de fourragement 3

Des agrégats de nourriture sont matérialisés par des amas de points sur la figure 1. Un agrégat a une certaine densité et est constitué d'unités de nourritures où chaque unité de nourriture est représentée par un pixel. Les agrégats peuvent être disposés de manière aléatoire ou bien par l'utilisateur de la plate-forme. L'arène comporte au minimum un nid de fourmi, et chaque fourmi a une taille d'un pixel. 2.2 Les fourmis oecophylles Les caractéristiques physiologiques des fourmis oecophylles sont résumées dans le tableau ci-dessous. Seuil de perception de la nourriture Seuil de perception de la phéromone Seuil de perception des autres fourmis Temps maximum hors du nid Temps nécessaire pour le repos entre deux sorties Charge maximum de nourriture transportée Quantité de phéromone déposée 6 pixels 6 pixels 6 pixels 10 000 cycles 5 cycles 5 unités 10 unités Durant la phase de fourragement, la fourmi oecophylle passe par différents états tels que : - le déplacement. Il consiste à choisir une des huit directions autour de la position courante de la fourmi. - l exploitation. Elle consiste à prélever de la nourriture quand la fourmi est positionnée sur un item de nourriture - le repos. Une fourmi peut fourrager pendant un certain temps. Ensuite elle rentre au nid pour se reposer. - le retour au nid. Une fourmi a une mémoire de la position de son nid pour pouvoir y revenir. - le retour à la dernière source de nourriture. Si une fourmi retourne au nid chargée, quand elle repart explorer elle retourne sur le dernier lieu où elle avait trouvé de la nourriture. La modélisation du comportement de la fourmi consiste à choisir un nouvel état possible en fonction de l'état dans lequel se trouve la fourmi et de sa perception de l'environnement. Au début de la simulation les fourmis sortent du nid et passent en mode exploration, pour tenter de trouver de la nourriture. Elles sont alors attirées par la nourriture, si celle-ci est dans leur champ de vision. Si elles perçoivent de la phéromone, elles auront tendance à suivre cette piste de phéromone. L'algorithme du déplacement d'une fourmi peut être consulté dans (Topin,98). Si elles sont sur une unité de nourriture, alors elle vont l exploiter, c est-à-dire la prélever, puis continuer à explorer. Une fois la limite de nourriture transportable atteinte, la fourmi rentre au nid en laissant derrière elle une substance chimique, la phéromone, afin de relier le nid à la dernière source de nourriture trouvée. Une unité de nourriture se trouve rarement isolée, donc quand une fourmi rentre au nid chargée, il restait certainement de la nourriture à proximité. La phéromone permet ensuite aux fourmis suivantes d aller vers cette source de nourriture découverte et ainsi de continuer à l exploiter. Ces caractéristiques font qu'une fourmi a une perception très réduite de l'ensemble de l'environnement, qu'elle peut perdre une piste de phéromone si la densité est faible et qu'elle peut aussi oublier de prélever la totalité d'un agrégat de nourriture lorsque les unités de nourriture restants sont légèrement dispersés. 3 Les robots-fourmis coopératifs Notre objectif est de concevoir au niveau logiciel, un collectif de robots-fourmis chargés d'explorer un environnement et de collecter des ressources. Le système développé n'est pas une simulation de fourmis en train de fourrager mais un système de robots-fourmis autonomes qui s'adaptent à un environnement dynamique, pour exploiter des ressources. Le comportement des robots-fourmis s'inspire du comportement des fourmis oecophylles tout en étant différent, dans le sens où il n'est pas fidèle au comportement des fourmis naturelles observé par les éthologues. Nos travaux dans le cadre des systèmes multi-agents, nous ont permis d'avoir un fil conducteur dans leur conception. Ce guide de conception est exposé et justifié au début de ce chapitre. Ensuite nous nous intéresserons au développement de la partie comportementale des robots-fourmis qui permet d'obtenir des entités qui s'adaptent à la dynamique de leur environnement. Leur comportement est spécifié à partir la théorie de l'autoorganisation basée sur la coopération. 4

IAS99 3.1 L'auto-organisation basée sur la coopération Selon Vaari (Vaari,1994), l'auto-organisation est un mécanisme de construction de système à partir de plusieurs éléments, dans lequel chaque élément peut appliquer ses règles locales et dont le comportement collectif de ces éléments provoque des interactions entre le système et son environnement. L'auto-organisation basée sur la coopération est de la même manière un processus de construction de système en interaction avec son environnement. Mais la coopération implique que le système et son environnement tendent à s'ajuster mutuellement pour être en interactions coopératives et implique à un autre niveau que tous les éléments du système tendent à être aussi en interactions coopératives. Système S «Feed-back» Couplage par interactions Action Environnement E Figure 2 : Le couplage système-environnement Pour la conception de tels systèmes, quelques hypothèses sont nécessaires. Tout d'abord, un système doit être plongé dans un environnement. Cela signifie que le système réalise une fonction qui agit sur l'environnement et que l'environnement agit en retour sur le système. La conséquence de l'action du système sur l'environnement n'est peut être pas à l'origine de la prochaine action de l'environnement sur le système: ce n'est pas une conséquence directe. Mais elle peut participer à une action ultérieure de l'environnement sur le système. Une deuxième hypothèse est que le système étudié est constitué d'éléments (appelés agents par la suite). Une troisième hypothèse correspond au fait que la fonction globale que doit réaliser le système n'est pas connue ni codée explicitement dans chaque agent du système. Elle émerge du comportement collectif. Dans (Camps,98), nous avons posé comme thèse que tout système fonctionnellement adéquat est en interactions coopératives avec son environnement. Un système est en adéquation fonctionnelle s'il réalise la bonne activité. Et nous avons montré que pour tout système fonctionnellement adéquat, il existe au moins un système dont les éléments (ou agents) sont en interactions coopératives. Ceci nous amène à un procédé de construction de système qui consiste à créer les agents du système et à leur attribuer un comportement pour qu'ils maintiennent des interactions coopératives de leur point de vue. De manière générale, un agent est doté de compétences, de possibilités de communication ou d'interaction avec les autres éléments et/ou avec son environnement, de croyances sur certains autres éléments du système, d'aptitudes qui lui permettent de raisonner et d'une attitude sociale basée sur la coopération. Le comportement de chacun des agents est ensuite spécifié de manière à ce qu'il essaye d'atteindre son objectif local tout en gardant des interactions coopératives avec les autres. Avant chaque action, l'agent analyse localement s'il est ou non en interactions coopératives c'est-à-dire il recherche s'il existe des situations non coopératives et tente de les éliminer pour revenir à un état coopératif. Ceci car la coopération est l'attitude sociale qui guide son comportement. Dans le cadre de l'application des robots-fourmis, le système est constitué du collectif et les éléments du système sont assez facilement identifiés aux robots-fourmis. Un robot-fourmi a comme compétences celles qui correspondent aux aptitudes de base des fourmis appartenant à l'espèce des oecophylles et à leurs caractéristiques physiologiques. Ainsi, un robot-fourmi perçoit les obstacles, les ressources, les autres robots-fourmis et la phéromone. Son seul moyen de communication consiste à déposer de la phéromone. Il est capable de se déplacer, de prélever des ressources, de retourner à son nid, de se reposer et de retourner sur le dernier lieu où il a trouvé des ressources. Chaque robot-fourmi a une croyance implicite sur les autres robots-fourmis appartenant au même collectif : il sait que les autres robots-fourmis sont comme lui (même compétence, même aptitude, même croyances, même attitude sociale, même langage de communication). 5

3.2 Le comportement coopératif des robots-fourmis Etre coopératif pour un robot-fourmi signifie avoir toujours une attitude sociale coopérative. Dans un environnement dynamique et imprévu, les situations non coopératives sont très fréquentes, ceci implique que très souvent le robot-fourmi sera en situation non coopérative. Le comportement du robot-fourmi est donc celui qui lui permet de revenir à des interactions coopératives. En fonction de ses croyances sur les autres, de ses compétences, de ses moyens de communication, de son attitude sociale, de ses aptitudes et de ses perceptions des autres et de l'environnement "physique simulé", il essaye de revenir vers des interactions coopératives, s'il détecte des situations non coopératives. Tous nos efforts de spécification sont donc basés sur la définition de ce qui peut être pour un robot-fourmi une situation non coopérative et comment agir ensuite pour revenir à un état coopératif. Cette détection se fait de manière locale au robot-fourmi en fonction de ses capacités de perception de l'environnement. L'action spécifiée pour réagir à cette situation dépend aussi des aptitudes et des compétences du robot-fourmi. Pour chaque situation décrite ci-dessous, nous donnons en parallèle l'action qu'une fourmi oecophylle entreprendrait dans des conditions identiques. Un cas de non coopération survient lorsqu'une fourmi voit une ressource non exploitée et une ressource exploitée. Une fourmi oecophylle est attirée proportionnellement par la ressource, et ira plutôt là où il y a le plus de ressources. Pour le robot-fourmi cette situation correspond à une détection de concurrence qui en l'occurrence est une situation non coopérative de son point de vue. En général, deux agents sont en concurrence s ils veulent obtenir un même état du monde : ici, deux robots-fourmis veulent ramener la même quantité de ressources au nid. Le robot-fourmi a une croyance sur les autres robots-fourmis qui est que tous les robots-fourmis du système ont les mêmes comportements que lui c'est-à-dire que les robots-fourmis qu'il perçoit proche de ressources ont de grandes chances de prélever ces ressources. Aussi pour ne pas être en situation de concurrence, le robot-fourmi va vers la ressource non exploitée, même s il y en a moins, ou si la ressource se trouve plus loin (figure 3). Un deuxième cas de non coopération est détecté lorsqu'une fourmi en mode exploration voit une autre fourmi. Une fourmi oecophylle ira indifféremment vers la fourmi ou ailleurs. Pour un robot-fourmi, il se trouve dans une situation où il rencontre un autre robot-fourmi qui ne lui transmet pas d information (pas de phéromone). Donc, s il se dirige vers ce robot-fourmi, il entrera en situation de concurrence, car il visitera une zone déjà couverte par l autre robot-fourmi. Il évite donc cette zone et il n ira pas dans la direction du robot-fourmi perçu (figure 4). Figure 3 Figure 4 Une autre situation non coopérative survient quand une fourmi suit sa piste de phéromone et voit des ressources. Une fourmi oecophylle est attirée proportionnellement par la phéromone et la ressource, elle a donc plus de chance de suivre la piste, qui comporte a priori une grande concentration de phéromone. Un robot-fourmi risque de se retrouver en situation de concurrence s il se dirige vers des ressources exploitées par d autres agents. Pour éviter cette concurrence potentielle, il ira s il le peut vers des ressources nouvelles. Il va vers les ressources, même si la phéromone est présente en grande quantité (figure 5). 6

IAS99 Figure 5 Figure 6 Parce qu'un robot-fourmi est coopératif, il donne spontanément des informations aux autres robots-fourmis s'il croit que ces informations peuvent leur être utiles. C'est ce que l'on appelle la communication spontanée. Ainsi, une fourmi qui se trouve dans la situation suivante : elle rentre au nid et elle voit en passant des ressources, détient une information sur la localisation de ressources. Une fourmi oecophylle ne prend pas en compte l information liée à la perception de cette ressource. Par contre le robot-fourmi continue son chemin vers le nid en déposant plus de phéromone dans le but de donner des informations plus exactes aux autres sur l'environnement tel qu'il le perçoit (figure 6). Une fourmi doit retourner au nid sans être chargée au maximum parce qu'elle a écoulé son temps maximum hors du nid. Une fourmi oecophylle dépose de la phéromone en retournant au nid, comme elle le fait dans tous les cas puisqu'elle est chargée. Le robot-fourmi par souci de bien informer ces partenaires ne laisse pas de trace de phéromone. Ici aussi, l agent dispose d une information supplémentaire : il n y a plus de ressource là où il se trouve. Pour coopérer, il communique cela aux autres, en ne déposant pas de phéromone. Si par la suite l agent découvre des ressources, il le communiquera aux autres (figure 7). Figure 7 Figure 8 Une fourmi qui retourne au nid en ayant trouvé des ressources, recrute d'autres fourmis. La fourmi oecophylle recrute en fonction de la quantité de nourriture ramenée au nid. Toujours par souci d'informer de manière la plus juste possible, le robot-fourmi recrute en fonction de la dernière quantité de phéromone déposée. En effet, il dispose d une information supplémentaire : la somme des ressources détectées pendant le trajet. Ce critère est bien meilleur pour décider que d'autres robots-fourmis doivent sortir du nid que celui de la nourriture rapportée (figure 8). 7

4 Résultats et analyses De nombreuses mesures ont été réalisées, mais nous ne présentons ici que deux cas d'environnements qui représentent deux distributions différentes des ressources. Dans un premier type d'environnement dans les figures 9 et 11, 2500 ressources ont été réparties aléatoirement dans l'arène dans 5 agrégats de ressources, dans le deuxième dans les figures 10 et 12, les 2500 ressources ont été réparties dans 100 agrégats. De plus, les agrégats ont été positionnés au hasard dans l'aire de fourragement mais la densité de ressources par agrégats est la même dans les deux types d'environnements. Le nombre de ressources dans l'arène est fixe au départ, il diminue par le fait que les fourmis prélèvent les ressources. L'arène a une dimension de 500*500 pixels. Chaque simulation est réalisée pour 10000 cycles et l'efficacité de la collecte de ressource est calculée en comptant tous les 100 cycles le nombre cumulé de ressources ramenées au nid. Pour chaque ensemble de paramètres, le nombre cumulé de ressources ramenées au nid est la moyenne de 50 simulations. Sachant qu'à chaque nouvelle simulation, un nouvel environnement de départ est créé toujours avec les mêmes contraintes. Les robots-fourmis ont leurs résultats affichés par les courbes ayant les traits les plus épais. Pour montrer les capacités d'adaptation de ces entités logicielles, les mesures ont été effectuées avec des environnements différents. Mais aussi en comparant le comportement de ces robots-fourmis avec des espèces des fourmis oecophylles ayant des caractéristiques physiologiques différentes : les fourmis oecophylles 1 et 2 sur les courbes ci-dessous. Les caractéristiques physiologiques des robots-fourmis ont été modifiées en conséquence mais pas leur comportement. Environnement avec 5 agrégats Environnement avec 100 agrégats Nourriture ramenée au nid 2000 1800 1600 1400 1200 1000 800 600 400 200 0 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Cycles Fourmis oecophylles 1 Robots-fourmis 1 Nourriture ramenée au nid 2000 1800 1600 1400 1200 1000 800 600 400 200 0 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Cycles Fourmis oecophylles 1 Robots-Fourmis 1 Figure 9 Fourmis oecophylles 1 et robots-fourmis 1 Figure 10 Fourmis oecophylles 1 et robots-fourmis 1 dans un environnement de 5 agrégats dans un environnement de 100 agrégats Sur les figures 9 et 10, les robots-fourmis ont été comparés à des fourmis oecophylles ayant les caractéristiques physiologiques données au paragraphe 2.2. Environnement avec 5 agrégats Nourriture ramenée au nid 2000 1800 1600 1400 1200 1000 800 600 400 200 0 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Cycles Fourmis oecophylles 2 Robots-Fourmis 2 Figure 11 Fourmis oecophylles 2 et robots-fourmis 2 Figure 12 Fourmis oecophylles 2 et robots-fourmis 2 dans un environnement de 5 agrégats dans un environnement de 100 agrégats Sur les figures 11 et 12 les résultats obtenus par les robots-fourmis ont été comparé à des fourmis ayant des caractéristiques physiologiques qui différent légèrement de celles données au paragraphe 2.2. En effet les seuils de perception de la nourriture et de perception des autres fourmis ont comme valeur 30 pixels. L efficacité d une fourmilière est calculée exclusivement en fonction de la quantité de nourriture ramenée au nid en un nombre donné de cycles. 8

IAS99 Les robots-fourmis ont des résultats meilleurs ou aussi bons que les fourmis oecophylles. Ceci est obtenu par une évaluation directe et locale de l'environnement par les robots-fourmis. Quand ils trouvent au moins un comportement coopératif à avoir, ils l'adoptent, s'il y en a plusieurs ils en choisissent un au hasard. Les robots-fourmis de par leur comportement coopératif ont tendance à explorer de manière plus optimale l'environnement. Ils se repoussent, ce qui a pour conséquence de créer un meilleur «éparpillement» dans les premières secondes, et ainsi une meilleure occupation de l espace, pour trouver les ressources plus rapidement. De plus, comme les robots-fourmis occupent mieux l espace, ils trouvent plus d agrégats, tandis que les fourmis naturelles, suivant la phéromone, se retrouvent à beaucoup dans des endroits où il n y a plus de nourriture. Les robots-fourmis présentés n'apprennent rien c'est-à-dire qu'ils ne modifient pas leurs croyances ni leurs compétences. Ils sont adaptatifs dans le sens où sans avoir programmé de manière exhaustive toutes les situations auxquelles ils pourront être confronté, ils décident d'un comportement à avoir en fonction d'un certain état de leur environnement et de leur attitude coopérative. L'adaptation est vue comme le changement de comportement dans un environnement dynamique et simulé (Vaari, 1994). La dynamique de l'environnement d'un robot fourmi est réalisée par le fait que les robots-fourmis se déplacent, que les ressources sont prélevées. 5 Conclusion et perspectives Les robots-fourmis coopératifs présentés dans ce papier ont les mêmes caractéristiques physiologiques que les fourmis naturelles et les mêmes aptitudes de base (le déplacement, le prélèvement de la nourriture, le dépôt de phéromone). Par contre, le comportement des robots-fourmis n'est pas une simulation du modèle naturel. Le comportement de ces agents est décidé de manière locale en fonction de ce qu'il peut percevoir dans son environnement immédiat et de son attitude sociale basée sur la coopération. C'est ce dernier point qui constitue l'originalité de l'approche. En effet, localement le robot-fourmi interprète ce qui pour lui est une situation non coopérative et il va agir pour tenter de l'éliminer. C'est uniquement cela qui guide son comportement. Notre travail de concepteur a été de définir les situations non coopératives susceptibles de survenir dans le cadre de l'exploitation et de la collecte de ressources par un collectif. Cette définition est possible car il ne faut pas trouver toutes les situations non coopératives possibles dans un environnement mais uniquement déterminer ce qui est non coopératif du point de vue du robot-fourmi. Notre approche réduit la complexité de conception d'un collectif devant évoluer dans un environnement dynamique car d'une part la définition des situations coopératives se fait localement à un agent et d'autre part pour concevoir le collectif il suffit de concevoir un individu ensuite tous les autres sont identiques. Les résultats obtenus par les robots-fourmis ont pu être comparés à un système de simulation de fourmis naturelles effectuant aussi une tâche de fourragement dans des environnements identiques. Ils montrent qu'une attitude coopérative permet de réaliser de manière plus optimale la recherche de ressources dans un environnement dynamique. De plus, le changement des caractéristiques physiologiques des robots-fourmis sans changer leur comportement donne aussi de bons résultats. Ce travail a permis de réaliser au niveau logiciel un collectif de robot-fourmi "spécialisé" dans l'exploration d'un environnement et dans la récolte de ressources données, et dont le comportement est adaptatif. Une des perspectives de ce travail consiste à faire apprendre par le robot-fourmi son comportement. Dans ce nouveau cadre, le collectif qui est le centre de notre étude n'est plus la fourmilière mais le robot-fourmi. En se basant sur la même théorie de l'auto-organisation basée sur la coopération, on considère alors que le robot-fourmi est un système multi-agent auto-organisateur. Il sera capable de s'adapter à son environnement en apprenant quelle action il doit réaliser. En fonction des environnements dans lesquels on immergerait les robots-fourmis, le comportement appris devrait être différent. Remerciements La plate-forme d expérimentation a été réalisée en collaboration avec le LEPA Laboratoire d éthologie de l Université Paul Sabatier dans le cadre d un projet GIS «Sciences de la Cognition». Nous remercions les éthologues Guy Théraulaz et Vincent Fourcassié pour leurs conseils et expérimentations sur la plate-forme. 9

6 Références Bonabeau E., Théraulaz G. (Editeurs) Intelligence collective Ed. Hermès, 1995, Paris Deneubourg J.L., Goss S., Franks N., Sendova-Franks A., Detrain C., Chrétien L. The dynamics of collective sorting robot-like ants and ant-like robots - Simulation of Animal Behaviour ; From Animals to Animats, J.A. Meyer and S. Wilson (eds), MIT Press 1990 Drogoul A, Collinot A. - "Applying an Agent-orineted methodology to the Design of Artificial Organizations: A Case Study in Robotic Soccer -Autonomous Agents and Multi-Agent Systems Volume 1 Number 1, Kluwer Academic Publishers ISSN 1387-2532 1998 Drogoul A., Fresneau D. Métaphore du fourragement et modèle d exploitation collective de l espace sans communication ni interaction pour des colonies de robots autonomes mobiles Journées françaises IADSMA 1998, Pont-à-Mousson, France Ed. Hermès Glize Pierre, Gleizes Marie-Pierre, Camps Valérie - "Une Théorie de l'apprentissage fondée sur l'autoorganisation par Coopération" - "Apprentissage : des principes naturels aux méthodes artificielles" Textes réunis par Ritschard, Berchtold, Duc et Zighed, Éditions Hermès, Paris 1998 Labbani-Igbida O., Müller J.-P., Bourjault A. CIRTA : An Emergentist Methodology to design and Evaluate Collective Behaviours in Robots Colonies - LNAI 1456 First International Workshop on Collective Robotics Paris, France, july 1998, Ed Springer Verlag Mataric M.J. Interaction and intelligent behavior PhD of philosophy Massachussetts Institute of Technology May 1994 Ocello M., Demazeau Y., Baeijs C. Designing Organized Agents for Cooperation with Real Time Constraints - LNAI 1456 First International Workshop on Collective Robotics Paris, France, july 1998, Ed Springer Verlag Ossowski S. LNAI 1535 Co-ordination in Artificial Agent Societies- 1999, Ed. Springer Verlag Spires S.V., Goldsmith S.Y. Exhaustive Geographic Search with Mobile Robots Along Space Filling Curves - LNAI 1456 First International Workshop on Collective Robotics Paris, France, july 1998, Ed Springer Verlag Topin Xavier, "Réalisation d'une plate-forme de simulation pour l'étude du comportement des fourmis", Rapport de stage d'iup Systèmes Intelligents Toulouse Septembre 1998 Vaari Jani, "Modeling Adaptive Self-organization", Artificial Life IV edited by Brooks and Maes MIT Press 1994 10