Modèle multi-agents de prise de décision éthique



Documents pareils
Intelligence Artificielle et Robotique

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Cours de Master Recherche

Audition pour le poste de Maître de conférence INSA Lyon distributed Robotics avec aectation au CITI. Guillaume Lozenguez.

Rapport d'analyse des besoins

Introduction aux systèmes temps réel. Iulian Ober IRIT

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

Les apports de l informatique. Aux autres disciplines

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit.

Etudier l informatique

Introduction au datamining

Statistiques et traitement des données

Programmation d'agents intelligents Vers une refonte des fils de raisonnement. Stage de fin d'études Master IAD 2006

SCIENCES DE L ÉDUCATION

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Pourquoi l apprentissage?

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Quels outils pour prévoir?

Principe et règles d audit

Master Informatique Aix-Marseille Université

4.2 Unités d enseignement du M1

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

Une méthode d apprentissage pour la composition de services web

Modèles et algorithmes pour le conseil et la gestion des préférences en configuration de produit

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

UFR d Informatique. FORMATION MASTER Domaine SCIENCES, TECHNOLOGIE, SANTE Mention INFORMATIQUE

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C.

LANCEMENT D UN PROGRAMME DE FORMATION DE NOUVEAUX NÉGOCIATEURS APPEL DE CANDIDATURES

TERMES DE RÉFÉRENCE AXE : FORMATION CREATION ET GESTION DE BASES DE DONNEES

Les indices à surplus constant

CURRICULUM VITAE. Informations Personnelles

!-.!#- $'( 1&) &) (,' &*- %,!

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

Apprentissage Automatique

Baccalauréat ES Amérique du Nord 4 juin 2008

Format de l avis d efficience

CURRICULUM VITAE. Joseph ABDOU

sentée e et soutenue publiquement pour le Doctorat de l Universitl

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Contrôle stochastique d allocation de ressources dans le «cloud computing»

Sujet de thèse CIFRE RESULIS / LGI2P

Intelligence Artificielle Planification

Pour une entreprise plus performante

Dossier justificatif des travaux de R&D déclarés au titre du CIR

Baccalauréat universitaire (bachelor) en mathématiques et sciences informatiques

Les Entrepôts de Données

Vingt-cinq questions posées lors d une entrevue

MATHEMATIQUES ET SCIENCES POUR L INGENIEUR

Curriculum Vitae. Informations générales

Modélisation du comportement habituel de la personne en smarthome

Business Process Change:

L A B U S I N E S S. d a t a g i n f o r m a t i o n g a c t i o n

Francis BISSON ( ) Kenny CÔTÉ ( ) Pierre-Luc ROGER ( ) IFT702 Planification en intelligence artificielle

Chapitre 2. Eléments pour comprendre un énoncé

MASTER ECONOMIE APPLIQUEE

Formula Negator, Outil de négation de formule.

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

BOURSE DE RECHERCHE QUICK : SECURITE ET HYGIENE ALIMENTAIRE

CEG4566/CSI4541 Conception de systèmes temps réel

Rapport d évaluation du master

Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

GUIDE DE SOUMISSION D UN PROJET DE RECHERCHE

MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ DES CONSEILS DE DÉVELOPPEMENT FONDÉS

L apprentissage automatique

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

PEPI GPI (Gestion de Projet Informatique) - Note de Cadrage décembre

Le WACC est-il le coût du capital?

Efficacité énergétique des réseaux de cœur et d accès

Benchmark des Meilleures Pratiques : de la Communauté des utilisateurs de solutions CRM, XRM 1

Ce guide a pour objectif de faciliter le dépôt de candidature et la mise en place du dossier.

PROGRAMME DE CRÉATION ET INNOVATION TECHNOLOGIQUES EN CLASSE DE SECONDE GÉNÉRALE ET TECHNOLOGIQUE Enseignement d exploration

L intelligence artificielle distribuée appliquée aux jeux d équipe situés dans un milieu dynamique : l exemple de la RoboCup

Cycle de vie du logiciel. Unified Modeling Language UML. UML: définition. Développement Logiciel. Salima Hassas. Unified Modeling Language

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Bourses d excellence pour les masters orientés vers la recherche

AXIAD Conseil pour décider en toute intelligence

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Curriculum Vitae 1 er février 2008

intelligence artificielle et cognitique"

Accélérer l agilité de votre site de e-commerce. Cas client

JOURNEES SYSTEMES & LOGICIELS CRITIQUES le 14/11/2000. Mise en Œuvre des techniques synchrones pour des applications industrielles

TERMES DE RÉFÉRENCE AXE : FORMATION MANAGEMENT DES SYSTEMES D INFORMATION WINDOWS SERVER 2012

Ordonnancement temps réel

Suivant les langages de programmation, modules plus avancés : modules imbriqués modules paramétrés par des modules (foncteurs)

1 INFORMATION - INFORMATIQUE. 11 Systèmes d'information gestion des connaissances, knowledge management

Université de Bangui. Modélisons en UML

Principe de symétrisation pour la construction d un test adaptatif

Introduction à la robotique Licence 1ère année /2012

Section des Formations et des diplômes

Raisonnement probabiliste

Exclusion Mutuelle. Arnaud Labourel Courriel : arnaud.labourel@lif.univ-mrs.fr. Université de Provence. 9 février 2011

Transcription:

Équipe Modèles, Agents, Décision Laboratoire GREYC CNRS UMR 6072 Université de Caen Basse-Normandie ENSICAEN Boulevard du Maréchal Juin CS 14 032, 14 032 Caen Cedex 5 Tel. : +33 (0)2 31 56 74 84 Fax : +33 (0)2 31 56 73 30 Proposition de stage de master, 2013 2014 Modèle multi-agents de prise de décision éthique Encadrement : Grégory Bonnet Équipe MAD, laboratoire GREYC, Caen Mots-clefs : décision, éthique computationnelle, intelligence artificielle, système multi-agents Ce stage de recherche avec indemnisation (environ 440 euros par mois) entre dans le cadre du projet ANR ETHICAA et pourra éventuellement déboucher sur une bourse de thèse en cotutelle avec l école des Mines de Saint-Étienne. Contexte et problématique Les récents développements des technologies de l information et de la communication conduisent les utilisateurs humains à utiliser de plus en plus d agents artificiels (robots ou logiciels) ayant des capacités de décision autonomes embarquées. Cela concerne des domaines divers comme le commerce électronique et les logiciels de trading automatisés, le transport et les véhicules sans pilote, la domotique et les robots compagnons, la défense et les drones de combat ou de reconnaissance. Toutefois, déléguer la totalité ou une partie des décisions humaines à des agents autonomes soulève des questions éthiques tant du point de vue de la conception que de celui du fonctionnement en ligne. Par exemple, vouloir répondre à la question «peut-on s assurer qu un logiciel de trading automatisé est conforme au principe de gestion éthique 1 requis par certains fonds d investissement» conduit à proposer des modèles et des outils permettant d implanter des comportements éthiques dans des agents. Toutefois, les agents artificiels sont amenés à évoluer dans un environnement ouvert, et surtout à interagir avec des agents guidés par des principes éthiques différents, qui agissent pour le compte d autres êtres humains. Dans ce contexte, le problème n est plus uniquement celui de la représentation et de l implantation de règles éthiques, mais aussi un problème de décision multi-agents. Par exemple, un logiciel de trading éthique doit-il faire un investissement responsable auprès d un autre logiciel automatisé, dont il ignore les principes éthiques? 1. Ce principe de gestion consiste à intégrer des critères moraux, environnementaux ou sociaux jugés responsables du point de vue de l entreprise. Par exemple, des investissements écologiques ou humanitaires seront préférables à la production d armes, d alcool ou de tabac.

Travail envisagé Nous proposons, dans ce stage de recherche, d étudier le problème de prise de décision au sein d un système multi-agents, lorsque les agents qui le composent sont régis par des principes éthiques différents (ou pas de principes du tout pour certains). Sans pour autant se poser la question du choix des principes éthiques, il s agira alors de proposer un modèle de décision (par exemple fondé sur la théorie des jeux ou un processus décisionnel de Markov) permettant à un agent doté d un comportement éthique (spécifié par des règles de décision ou des propriétés sur l état du monde) de répondre aux questions suivantes : 1) doit-il remettre en cause ses décisions lorsqu elles entrent en conflit avec les principes éthiques d un autre agent? 2) dans quelle mesure doit-il coopérer avec les agents ayant des principes éthiques différents? 3) doit-il se comporter de manière éthique face aux agents qui ne le font pas? Le modèle pourra être instancié en simulation sur un scénario de commerce électronique ou de robotique militaire. Profil de candidature M2 Informatique (Décision et/ou Intelligence Artificielle) ayant un goût pour la modélisation et la philosophie. Références [Allen et al., 2006] Allen, C., Wallach, W., and Smith, I. (2006). Why machine ethics? IEEE Intelligent Systems, 21(4) :12 17. [Coleman, 2001] Coleman, K. (2001). Android arete : Towards a virtue ethic for computational agents. Ethics and Information Technologies, 3 :247 265. [Tamura, 2002] Tamura, H. (2002). Multi-agent utility theory for ethical conflict resolution. Journal of Telecommunications and Information Theory, 3 :37 39. Conditions et candidature Ce stage se déroulera dans l équipe «Modèles, Agents, Décision» du laboratoire GREYC, situé à Caen (https://www.greyc.fr/mad). Les candidatures sont à adresser directement aux encadrants du stage (prenom.nom@unicaen.fr) avant le 31 janvier 2014, accompagnées d un texte motivant la candidature, d un curriculum vitæ et des relevés de notes universitaires, y compris pour l année en cours. Il est vivement conseillé de prendre contact avec les encadrants avant cette date. Des renseignements généraux sur les stages, les possibilités de poursuite en thèse, et sur l équipe, peuvent être obtenus auprès de Bruno Zanuttini, responsable de l équipe. Tous les stages se déroulant dans l équipe sont indemnisés (436,05 euros/mois). Les meilleurs candidats pourront postuler sur l un des sujets de thèse pour lesquels l équipe peut obtenir un financement à partir d octobre 2014 : un sujet financé par le projet ANR ETHICAA (financement garanti), deux sujets sur allocation ministérielle, et un sujet en collaboration avec la DGA.

Équipe Modèles, Agents, Décision Laboratoire GREYC CNRS UMR 6072 Université de Caen Basse-Normandie ENSICAEN Boulevard du Maréchal Juin CS 14 032, 14 032 Caen Cedex 5 Tel. : +33 (0)2 31 56 74 84 Fax : +33 (0)2 31 56 73 30 Proposition de stage de master, 2013 2014 Décision multi-agents en présence de préférences individuelles Encadrement : Bruno Zanuttini, Abdel-Illah Mouaddib Équipe MAD, laboratoire GREYC, Caen Mots-clefs : décision multi-agents, préférences, décision collective, système collaboratif L objectif de ce stage est d étudier des problèmes de décision séquentielle, collective et collaborative, en présence de préférences individuelles sur les diverses situations de l environnement. Pour rendre ce problème concret, on pourra penser à une application à la conduite de touristes dans une ville, par des systèmes automatisés de recommandation. Dans un tel système, des groupes de touristes seraient munis d un «guide» automatisé, par exemple une application sur smartphone ou tablette, proposé par la ville, et exprimeraient des préférences sur les visites, les restaurants, les hôtels, etc. Les guides travailleraient en réseau, de façon collaborative, pour satisfaire au mieux les préférences des différents groupes de touristes, tout en tenant compte des contraintes liées à la multiplicité des groupes, notamment pour éviter les «embouteillages» dans les sites touristiques. Une autre application potentielle est le pilotage automatique de véhicules individuels, l organisation de réunions par des agendas intelligents, etc. Dans toutes ces applications, un certain nombre d agents agissent au nom d un ou plusieurs utilisateurs, chaque utilisateur ayant des préférences, potentiellement différentes, sur des objets ou des situations. D autre part, des contraintes rendent certains objets ou situations plus ou moins désirables (en fonction de l engorgement des sites touristiques, par exemple). Enfin, la qualité des décisions prises par les agents se mesure de façon séquentielle (par exemple, mener un groupe sur tel site peut faciliter la visite d un autre site, proche, par la suite) et collective (les décisions peuvent maximiser le respect des préférences pour les agents les moins satisfaits, maximiser la «somme» des satisfactions, etc.). L objectif de ce stage est de proposer une formalisation du problème, en s inspirant des applications évoquées. Dans le cadre du stage, on pourra émettre des hypothèses simplificatrices, en supposant par exemple que le nombre d agents est fixe (ou borné), que la fonction d agrégation des satisfactions individuelles est donnée, etc. Pour la définition du modèle formel, on pourra s appuyer sur l expertise des encadrants dans deux domaines : la décision séquentielle, multi-agent, dans l incertain, au travers des processus de décision markoviens [Sigaud and Buffet, 2008, Puterman, 1994, Matignon et al., 2012]), et la représentation formelle des préférences, en particulier avec les réseaux de préférences conditionnelles (CPnets [Boutilier et al., 2004, Koriche and Zanuttini, 2010]). Selon les goûts de l étudiant, l étude pourra alors s orienter vers (1) les aspects fondamentaux, par une étude formelle des modèles proposés pour la décision comme pour l exécution, par une étude de la complexité du problème de calcul de décisions, et par la proposition d algorithmes et d heuristiques,

ou (2) vers l implémentation d une application de démonstration sur l une des applications visées, en incluant l implémentation de premières solutions pour le calcul de décisions. Références [Boutilier et al., 2004] Boutilier, C., Brafman, R. I., Domshlak, C., Hoos, H. H., and Poole, D. (2004). Cp-nets : A tool for representing and reasoning with conditional ceteris paribus preference statements. Journal of Artificial Intelligence Research. [Koriche and Zanuttini, 2010] Koriche, F. and Zanuttini, B. (2010). Learning conditional preference networks. Artificial Intelligence, 174 :685 703. [Matignon et al., 2012] Matignon, L., Mouaddib, A.-I., and Jeanpierre, L. (2012). Distributed value functions for distributed decision makers coordination. In International Joint Conference on Autonomous Agent and MultiAgent systems (AAMAS). [Puterman, 1994] Puterman, M. L. (1994). Markov Decision Processes : Discrete Stochastic Dynamic Programming. John Wiley and Sons. [Sigaud and Buffet, 2008] Sigaud, O. and Buffet, O., editors (2008). Processus décisionnels de Markov en intelligence artificielle, volume 1 2. Hermes Science Publications / Lavoisier. Conditions et candidature Ce stage se déroulera dans l équipe «Modèles, Agents, Décision» du laboratoire GREYC, situé à Caen (https://www.greyc.fr/mad). Les candidatures sont à adresser directement aux encadrants du stage (prenom.nom@unicaen.fr) avant le 31 janvier 2014, accompagnées d un texte motivant la candidature, d un curriculum vitæ et des relevés de notes universitaires, y compris pour l année en cours. Il est vivement conseillé de prendre contact avec les encadrants avant cette date. Des renseignements généraux sur les stages, les possibilités de poursuite en thèse, et sur l équipe, peuvent être obtenus auprès de Bruno Zanuttini, responsable de l équipe. Tous les stages se déroulant dans l équipe sont indemnisés (436,05 euros/mois). Les meilleurs candidats pourront postuler sur l un des sujets de thèse pour lesquels l équipe peut obtenir un financement à partir d octobre 2014 : un sujet financé par le projet ANR ETHICAA (financement garanti), deux sujets sur allocation ministérielle, et un sujet en collaboration avec la DGA.

Équipe Modèles, Agents, Décision Laboratoire GREYC CNRS UMR 6072 Université de Caen Basse-Normandie ENSICAEN Boulevard du Maréchal Juin CS 14 032, 14 032 Caen Cedex 5 Tel. : +33 (0)2 31 56 74 84 Fax : +33 (0)2 31 56 73 30 Proposition de stage de master, 2013 2014 Complexité de requêtes naturelles sur des bases de connaissances temporelles Encadrement : Maroua Bouzid, Alexandre Niveau Équipe MAD, laboratoire GREYC, Caen Mots-clefs : représentation du temps, interaction homme-agent, représentation floue, granularité L objectif de ce stage est d étudier la complexité de requêtes et d opérations «naturelles» sur des bases de connaissances temporelles. Par «naturelles», on entend ici des opérations et des requêtes fournissant des résultats intuitifs pour l être humain, comme par exemple «le prochain siècle commencera dans presque exactement 87 ans», par opposition à «le prochain siècle commencera dans 87 ans, à 4 minutes et 20 millisecondes près». On s intéressera à un ou plusieurs langages de représentation du temps, en commençant par l algèbre des intervalles d Allen et sa version «floue». Dans ce formalisme, on peut représenter par exemple des connaissances telles que «pour toute date d, l intervalle de temps pendant lequel ma montre affiche d + 1 est à peu près un successeur immédiat 1 de l intervalle pendant lequel mon téléphone affiche la date d». Ceci permet de rendre compte de la synchronisation imparfaite des deux appareils. Dans un langage flou, un modificateur tel que «à peu près» est quantifié, et ces quantifications peuvent être propagées lors des opérations et des requêtes sur les bases de connaissances. On pourra ainsi déduire de l information précédente le degré flou auquel la relation suivante est vraie : «l intervalle pendant lequel ma montre affiche 00 h mm, où mm est un nombre quelconque de minutes, est à peu près un successeur immédiat de l intervalle pendant lequel mon téléphone affiche 23 h mm. L objectif de ce stage est d étudier la complexité de telles opérations et requêtes lorsque l on cherche à fournir des résultats «naturels». Sur l exemple, on souhaiterait déduire «l intervalle de temps pendant lequel ma montre affichera l année 2015 est presque exactement un successeur immédiat de l intervalle pendant lequel mon téléphone affichera 2014», ou encore «l intervalle pendant lequel ma montre affiche 00 h 00 est sans relation sûre avec celui pendant lequel mon téléphone affiche 23 h 59». Ici, le changement de granularité (du jour à l année ou à la minute) doit se traduire par un changement d interprétation des degrés flous (un même degré pouvant être lu «à peu près», «presque exactement», ou encore «sans relation sûre»). Ce changement de perspective nécessite de : définir formellement le langage de représentation utilisé, définir formellement les opérations et requête «naturelles» comme des problèmes de décision ou de calcul, 1. Relation meet de l algèbre des intervalles.

étudier ou revisiter les algorithmes correspondants et leur complexité. L objectif du stage est donc, partant d un exemple tel que ci-dessus, de mener cette étude complète, puis d étendre l étude à d autres requêtes et opérations. Le qualificatif «naturel» étant relativement imprécis, on s appuiera sur des cadres applicatifs concrets, qui pourront aller du suivi de scénarios de catastrophes naturelles à la planification sous contraintes temporelles, en passant par l extraction d événements dans des textes en langage naturel, des problématiques applicatives toutes bien connues dans l équipe MAD. Conditions et candidature Ce stage se déroulera dans l équipe «Modèles, Agents, Décision» du laboratoire GREYC, situé à Caen (https://www.greyc.fr/mad). Les candidatures sont à adresser directement aux encadrants du stage (prenom.nom@unicaen.fr) avant le 31 janvier 2014, accompagnées d un texte motivant la candidature, d un curriculum vitæ et des relevés de notes universitaires, y compris pour l année en cours. Il est vivement conseillé de prendre contact avec les encadrants avant cette date. Des renseignements généraux sur les stages, les possibilités de poursuite en thèse, et sur l équipe, peuvent être obtenus auprès de Bruno Zanuttini, responsable de l équipe. Tous les stages se déroulant dans l équipe sont indemnisés (436,05 euros/mois). Les meilleurs candidats pourront postuler sur l un des sujets de thèse pour lesquels l équipe peut obtenir un financement à partir d octobre 2014 : un sujet financé par le projet ANR ETHICAA (financement garanti), deux sujets sur allocation ministérielle, et un sujet en collaboration avec la DGA.

Équipe Modèles, Agents, Décision Laboratoire GREYC CNRS UMR 6072 Université de Caen Basse-Normandie ENSICAEN Boulevard du Maréchal Juin CS 14 032, 14 032 Caen Cedex 5 Tel. : +33 (0)2 31 56 74 84 Fax : +33 (0)2 31 56 73 30 Proposition de stage de master, 2013 2014 Éthique et formalisation dans les SMA Encadrement : Bruno Mermet, Gaële Simon, Grégory Bonnet Équipe MAD, laboratoire GREYC, Caen Mots-clefs : système multi-agents, éthique, spécification, vérification formelle 1 Contexte Le développement des technologies de l information et de la communication, d une part, et des robots, d autre part, fait que, de plus en plus, humains et entités informatiques sont en interaction. Par ailleurs, ces mêmes entités informatiques sont de plus en plus amenées à prendre des décisions, quelquefois à la place d humains, dans des environnements où des humains sont présents. Le contrôle de certaines règles éthiques par ces entités informatiques devient alors une question cruciale. Plusieurs caractéristiques des systèmes en question rendent le contrôle de règles éthiques crucial : le fonctionnement des entités informatiques envisagées est complexe ; le système est ouvert, ce qui signifie qu à tout moment, de nouvelles entités informatiques, développées indépendamment, peuvent rejoindre le système ; des vies humaines peuvent être en jeu suite aux décisions prises par ces entités informatiques (cas du pilotage de drones par exemple). Formaliser les règles éthiques, et pouvoir vérifier formellement qu un agent ou groupe d agents les respecte, apparaît donc comme un domaine de recherche important. L équipe MAD s intéresse, notamment, à la validation de systèmes multi-agents. L objectif de ces travaux est de proposer des techniques permettant de prouver formellement qu un agent ou un système multi-agents vérifie certaines propriétés. En particulier, ces techniques et les modèles utilisés permettent de prouver la correction du comportement d un agent vis-à-vis du but qui lui a été attribué. On peut également montrer que le système dans son ensemble respecte des propriétés d invariance, qui sont des propriétés garantissant que les agents et le système n atteindront jamais un état non souhaité (car dangereux par exemple). Ainsi, vérifier qu un robot ne pénètrera jamais dans une zone qui lui est interdite, ou qu il ne tombera jamais dans des escaliers, consiste à vérifier des propriétés d invariance. Afin de permettre et de faciliter ces preuves, un modèle appelé GDT4MAS a été proposé, au sein duquel le comportement de chaque agent est décrit par un GDT (Goal Decomposition Tree), qui repose notamment sur la logique du premier ordre et sur la logique temporelle. Un GDT permet de décrire

le comportement d un agent sous la forme d un arbre de décomposition de buts en sous-buts, chaque but étant spécifié formellement, entre autres, par une condition de satisfaction permettant d évaluer si le but est satisfait ou non. Dans ce contexte, nous nous intéressons à savoir dans quelle mesure les techniques employées pourraient être utilisées pour la vérification du respect de règles éthiques. 2 Sujet du stage Dans le cadre de ce stage, il s agit de réaliser une étude bibliographique sur l éthique dans les agents en général, et plus particulièrement sur les spécifications formelles proposées pour de telles règles. Dans un deuxième temps, il s agira notamment d étudier si ces règles peuvent être ramenées à des propriétés d invariance et/ou de vivacité. Dans l affirmative, une petite étude de cas pourra alors être proposée. Sinon, il s agira d argumenter sur l impossibilité d exprimer ainsi des règles éthiques. Ce travail sera mené dans le cadre d un projet A.N.R. offrant un financement de thèse. Références [Allen et al., 2006] Allen, C., Wallach, W., and Smith, I. (2006). Why machine ethics? IEEE Intelligent Systems, 21(4) :12 17. [Ganascia, 2007] Ganascia, J.-G. (2007). Modeling ethical rules of lying with answer set programming. Ethics and Information Technology, 9 :39 47. [Mermet and Simon, 2012] Mermet, B. and Simon, G. (2012). GDT4MAS : a formal model and language to specify and verify agent-based complex systems. Studia Informatica Universalis, 10(3) :5 32. [Mermet and Simon, 2013] Mermet, B. and Simon, G. (2013). A new proof system to verify GDT agents. In Proc. IDC 2013, pages 181 187. [Mermet et al., 2007] Mermet, B., Simon, G., Saval, A., and Zanuttini, B. (2007). Specifying, verifying and implementing a MAS : A case study. In Dastani, M., Segrouchni, A. E. F., Ricci, A., and Winikoff, M., editors, Post-Proc. 5th International Workshop on Programming Multi-Agent Systems (ProMAS 2007), number 4908 in Lecture Notes in Artificial Intelligence, pages 172 189. Springer. [Robbins and Wallace, 2007] Robbins, R.-W. and Wallace, W.-A. (2007). Decision support for ethical problem solving : A multi-agent approach. Decision Support Systems, 43(4) :1571 1587. Conditions et candidature Ce stage se déroulera dans l équipe «Modèles, Agents, Décision» du laboratoire GREYC, situé à Caen (https://www.greyc.fr/mad). Les candidatures sont à adresser directement aux encadrants du stage (prenom.nom@unicaen.fr) avant le 31 janvier 2014, accompagnées d un texte motivant la candidature, d un curriculum vitæ et des relevés de notes universitaires, y compris pour l année en cours. Il est vivement conseillé de prendre contact avec les encadrants avant cette date. Des renseignements généraux sur les stages, les possibilités de poursuite en thèse, et sur l équipe, peuvent être obtenus auprès de Bruno Zanuttini, responsable de l équipe. Tous les stages se déroulant dans l équipe sont indemnisés (436,05 euros/mois). Les meilleurs candidats pourront postuler sur l un des sujets de thèse pour lesquels l équipe peut obtenir un financement à partir d octobre 2014 : un sujet financé par le projet ANR ETHICAA (financement garanti), deux sujets sur allocation ministérielle, et un sujet en collaboration avec la DGA.

Équipe Modèles, Agents, Décision Laboratoire GREYC CNRS UMR 6072 Université de Caen Basse-Normandie ENSICAEN Boulevard du Maréchal Juin CS 14 032, 14 032 Caen Cedex 5 Tel. : +33 (0)2 31 56 74 84 Fax : +33 (0)2 31 56 73 30 Proposition de stage de master, 2013 2014 Recommandations de l être humain à des agents autonomes Encadrement : Maroua Bouzid, Laurent Jeanpierre, Abdel-Illah Mouaddib, Bruno Zanuttini Équipe MAD, laboratoire GREYC, Caen Mots-clefs : autonomie ajustable, interaction homme-agent, processus de décision markovien L objectif de ce stage est de poursuivre l étude menée par Nicolas Côté, dans le cadre de sa thèse, concernant le problème de l autonomie ajustable, et en particulier la prise en compte de recommandations de l être humain par un agent rationnel. On se placera dans un contexte où un agent rationnel planifie, décide, et exécute des plans pour des problèmes modélisés par des processus décisionnels markoviens (MDP). L autonomie ajustable, de façon générale, consiste pour l agent à pouvoir décider de laisser plus ou moins de contrôle à l être humain sur ses décisions ; typiquement, un agent mettant en œuvre une autonomie ajustable est capable de demander à un opérateur humain de le téléopérer, en cours de mission, si l espérance de gain des décisions qu il calcule lui-même est trop faible. Dans un contexte de recommandation, on généralise ce principe en considérant que l être humain peut, à son initiative ou à celle de l agent, fournir des «conseils» à l agent sur les actions ou les plans à choisir. L objectif de ce stage est de poser les premières pierres d une modélisation formelle de cette notion de recommandation. Comme suggéré par les travaux de Nicolas Côté, on cherchera à formaliser le cadre d un agent et d un opérateur possédant des modèles différents de l environnement. Par exemple, un robot mobile peut posséder un modèle de ses effecteurs (moteurs, roues...) correspondant à un environnement standard, mais sans être capable de détecter des changements de l environnement qui modifient ce modèle (neige, sable, etc.). À l inverse, un opérateur humain peut être capable de détecter ces changements, sans pour autant connaître un modèle précis des effecteurs de l agent dans l environnement ainsi modifié. Une recommandation peut alors être «éviter de passer par tel endroit (enneigé)», ou encore «considérer comme inconnu le modèle des effecteurs dans tel endroit». Formaliser les processus de recommandation, et de prise en compte des recommandations, demande à lever plusieurs verrous : modéliser un environnement perçu via deux modèles différents, tous les deux inexacts ou imprécis, et les critères d évaluation d une décision (ou d une politique) dans cet environnement, en fonction des deux modèles, définir formellement la notion de recommandation, puis caractériser les «bonnes» et les «mauvaises» recommandations, étudier la notion de situation awareness dans ce contexte, c est-à-dire l ensemble des informations utiles, pour l être humain, pour donner une «bonne» ou une «mauvaise» recommandation (on

pourra en particulier faire le lien avec la notion de «pertinence des observations» dans les environnements partiellement observables), proposer des algorithmes génériques permettant de calculer de bonnes recommandations (pour l être humain) et de les prendre en compte (pour l agent), et étudier la complexité des problèmes correspondants... Les travaux de Nicolas Côté ont lancé l étude de ces questions, notamment via un grand nombre d exemples typiques de recommandations et via des expérimentations. L objectif de ce stage n est pas de répondre de façon définitive à toutes ces questions, mais de poser les premières pierres d une étude formelle et systématique de ces notions. Une telle étude pourra mener, à moyen terme, à des systèmes basés sur des modélisations de problèmes de décision (MDP) fondées sur des théories solides, et largement utilisées en pratiques, tout en prenant en compte, de façon également justifiée par la théorie, l interaction avec l être humain. Les applications potentielles sont nombreuses, de la robotique domestique à l exploration de zones inconnues, en passant par les systèmes d aide à la décision tels qu utilisés en finance, en pilotage automatique, etc. Conditions et candidature Ce stage se déroulera dans l équipe «Modèles, Agents, Décision» du laboratoire GREYC, situé à Caen (https://www.greyc.fr/mad). Les candidatures sont à adresser directement aux encadrants du stage (prenom.nom@unicaen.fr) avant le 31 janvier 2014, accompagnées d un texte motivant la candidature, d un curriculum vitæ et des relevés de notes universitaires, y compris pour l année en cours. Il est vivement conseillé de prendre contact avec les encadrants avant cette date. Des renseignements généraux sur les stages, les possibilités de poursuite en thèse, et sur l équipe, peuvent être obtenus auprès de Bruno Zanuttini, responsable de l équipe. Tous les stages se déroulant dans l équipe sont indemnisés (436,05 euros/mois). Les meilleurs candidats pourront postuler sur l un des sujets de thèse pour lesquels l équipe peut obtenir un financement à partir d octobre 2014 : un sujet financé par le projet ANR ETHICAA (financement garanti), deux sujets sur allocation ministérielle, et un sujet en collaboration avec la DGA.

Équipe Modèles, Agents, Décision Laboratoire GREYC CNRS UMR 6072 Université de Caen Basse-Normandie ENSICAEN Boulevard du Maréchal Juin CS 14 032, 14 032 Caen Cedex 5 Tel. : +33 (0)2 31 56 74 84 Fax : +33 (0)2 31 56 73 30 Proposition de stage de master, 2013 2014 k-fault Tolerant MDPs Encadrement : Abdel-Illah Mouaddib Équipe MAD, laboratoire GREYC, Caen Mots-clefs : processus de décision markovien, tolérance aux fautes, système autonome Les processus décisionnels de Markov (MDP) constituent un modèle mathématique permettant de produire des stratégies de comportement de systèmes autonomes. Ces modèles se fondent sur une représentation explicite de l espace d états, formalisant ainsi toutes les situations qu un système autonome peut rencontrer. Lorsqu ils sont plongés dans des environnements complexes, les systèmes autonomes rencontrent plusieurs limitations, que ce soit du point de vue de la capacité computationnelle, de la capacité de perception ou d action, ce qui réduit leur performance. Aussi, les MDPs se fondent sur la maximisation d une espérance mathématique pour dériver une stratégie, ce qui cache certaines situations indésirables par lesquelles le système peut passer. Dans ce sujet, nous souhaitons étudier la possibilité pour un système de rencontrer des situations non prévues, ou d exécuter des actions non désirées, et pouvoir produire une stratégie robuste à certaines erreurs. Pour cela, un modèle formalisant des stratégies tolérantes aux fautes est à définir, et des algorithmes efficaces de résolution à proposer. Plus précisément, il est demandé dans ce stage : 1. de définir une taxonomie des fautes, en s inspirant de la littérature sur la conception des systèmes et la tolérance aux fautes, 2. de proposer un modèle MDP intégrant la notion de tolérance aux fautes, en s appuyant sur les MDP augmentés, 3. d étudier LAO* comme un algorithme de résolution, et de le comparer à d autres, 4. de tester sur un exemple de pilote automatique d un engin autonome. Conditions et candidature Ce stage se déroulera dans l équipe «Modèles, Agents, Décision» du laboratoire GREYC, situé à Caen (https://www.greyc.fr/mad). Les candidatures sont à adresser directement aux encadrants du stage (prenom.nom@unicaen.fr) avant le 31 janvier 2014, accompagnées d un texte motivant la candidature, d un curriculum vitæ et des relevés de notes universitaires, y compris pour l année en cours. Il est vivement conseillé de prendre contact avec les encadrants avant cette date. Des renseignements

généraux sur les stages, les possibilités de poursuite en thèse, et sur l équipe, peuvent être obtenus auprès de Bruno Zanuttini, responsable de l équipe. Tous les stages se déroulant dans l équipe sont indemnisés (436,05 euros/mois). Les meilleurs candidats pourront postuler sur l un des sujets de thèse pour lesquels l équipe peut obtenir un financement à partir d octobre 2014 : un sujet financé par le projet ANR ETHICAA (financement garanti), deux sujets sur allocation ministérielle, et un sujet en collaboration avec la DGA.