Intelligence Artificielle Agents Intelligents Bruno Bouzy http://web.mi.parisdescartes.fr/~bouzy bruno.bouzy@parisdescartes.fr Licence 3 Informatique UFR Mathématiques et Informatique Université Paris Descartes
Agents intelligents Agents et environnement Rationalité PEAS Types d environnement Structure des agents Conclusion 2 / 21
Agents intelligents Agents et environnement Rationalité PEAS Types d environnement Structure des agents Conclusion 3 / 21
Agents et environnement Les agents peuvent être des humains, des robots, des logiciels, des thermostats... sensors environment percepts actions? agent actuators 4 / 21
Le monde de l aspirateur A B Percepts: emplacement et état de propreté e.g., [A, Sale] Actions: Gauche, Droite, Aspire, Rien 5 / 21
Le monde de l aspirateur Percepts [A, Propre] [A, Sale] [B, Propre] [B, Sale]. Action Droite Aspire Gauche Aspire. Agent aspirateur function Reflex-Vacuum-Agent(location, status) return an action if status = Dirty then return Suck else if location = A then return Right else if location = B then return Left 6 / 21
Agents intelligents Agents et environnement Rationalité PEAS Types d environnement Structure des agents Conclusion 7 / 21
Rationalité Une mesure de performance évalue l environnement Un point par emplacement nettoyé dans le temps t? Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée? Un agent rationnel choisit l action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là Rationnel omniscient les percepts ne permettent peut-être pas d obtenir toutes les informations utiles Rationnel clairvoyant les actions peuvent ne pas avoir les effets escomptés Rationnel efficace Un agent rationnel explore, apprend, est autonome 8 / 21
Rationalité Une mesure de performance évalue l environnement Un point par emplacement nettoyé dans le temps t? Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée? Un agent rationnel choisit l action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là Rationnel omniscient les percepts ne permettent peut-être pas d obtenir toutes les informations utiles Rationnel clairvoyant les actions peuvent ne pas avoir les effets escomptés Rationnel efficace Un agent rationnel explore, apprend, est autonome 8 / 21
Rationalité Une mesure de performance évalue l environnement Un point par emplacement nettoyé dans le temps t? Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée? Un agent rationnel choisit l action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là Rationnel omniscient les percepts ne permettent peut-être pas d obtenir toutes les informations utiles Rationnel clairvoyant les actions peuvent ne pas avoir les effets escomptés Rationnel efficace Un agent rationnel explore, apprend, est autonome 8 / 21
Rationalité Une mesure de performance évalue l environnement Un point par emplacement nettoyé dans le temps t? Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée? Un agent rationnel choisit l action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là Rationnel omniscient les percepts ne permettent peut-être pas d obtenir toutes les informations utiles Rationnel clairvoyant les actions peuvent ne pas avoir les effets escomptés Rationnel efficace Un agent rationnel explore, apprend, est autonome 8 / 21
Rationalité Une mesure de performance évalue l environnement Un point par emplacement nettoyé dans le temps t? Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée? Un agent rationnel choisit l action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là Rationnel omniscient les percepts ne permettent peut-être pas d obtenir toutes les informations utiles Rationnel clairvoyant les actions peuvent ne pas avoir les effets escomptés Rationnel efficace Un agent rationnel explore, apprend, est autonome 8 / 21
Agents intelligents Agents et environnement Rationalité PEAS Types d environnement Structure des agents Conclusion 9 / 21
PEAS PEAS: Performance measure, Environment, Actuators, Sensors Pour concevoir un agent rationnel, il faut pouvoir spécifier l environnement Exemple: Taxi automatisé Mesure de performance: Environnement: Actionneurs: Capteurs: 10 / 21
PEAS PEAS: Performance measure, Environment, Actuators, Sensors Pour concevoir un agent rationnel, il faut pouvoir spécifier l environnement Exemple: Taxi automatisé Mesure de performance: sécurité, destination, profits, confort,... Environnement: Actionneurs: Capteurs: 10 / 21
PEAS PEAS: Performance measure, Environment, Actuators, Sensors Pour concevoir un agent rationnel, il faut pouvoir spécifier l environnement Exemple: Taxi automatisé Mesure de performance: sécurité, destination, profits, confort,... Environnement: rues, traffic, piétons, temps,... Actionneurs: Capteurs: 10 / 21
PEAS PEAS: Performance measure, Environment, Actuators, Sensors Pour concevoir un agent rationnel, il faut pouvoir spécifier l environnement Exemple: Taxi automatisé Mesure de performance: sécurité, destination, profits, confort,... Environnement: rues, traffic, piétons, temps,... Actionneurs: volant, accélérateur, frein, klaxon,... Capteurs: 10 / 21
PEAS PEAS: Performance measure, Environment, Actuators, Sensors Pour concevoir un agent rationnel, il faut pouvoir spécifier l environnement Exemple: Taxi automatisé Mesure de performance: sécurité, destination, profits, confort,... Environnement: rues, traffic, piétons, temps,... Actionneurs: volant, accélérateur, frein, klaxon,... Capteurs: vidéo, accéléromètre, GPS,... 10 / 21
Agents intelligents Agents et environnement Rationalité PEAS Types d environnement Structure des agents Conclusion 11 / 21
Types d environnement Totalement observable vs. partiellement observable Mono agent vs. Multi agent Déterministe vs. stochastique Episodique vs. séquentiel Statique vs. dynamique Discret vs. continu Monde réel? 12 / 21
Types d environnement Totalement observable vs. partiellement observable Mono agent vs. Multi agent Déterministe vs. stochastique Episodique vs. séquentiel Statique vs. dynamique Discret vs. continu Monde réel? 12 / 21
Types d environnement Totalement observable vs. partiellement observable Mono agent vs. Multi agent Déterministe vs. stochastique Episodique vs. séquentiel Statique vs. dynamique Discret vs. continu Monde réel? Partiellement observable, Multi agent, Stochastique, Séquentiel, Dynamique, Continu 12 / 21
Types d environnement Observable Déterministe Episodique Statique Discret Agent Echecs Poker Diag. médical Taxi 13 / 21
Types d environnement Echecs Poker Diag. médical Taxi Observable Total. Part. Part. Part. Déterministe Episodique Statique Discret Agent 13 / 21
Types d environnement Echecs Poker Diag. médical Taxi Observable Total. Part. Part. Part. Déterministe Det. Stoch. Stoch. Stoch. Episodique Statique Discret Agent 13 / 21
Types d environnement Echecs Poker Diag. médical Taxi Observable Total. Part. Part. Part. Déterministe Det. Stoch. Stoch. Stoch. Episodique Séq. Séq. Séq. Séq. Statique Discret Agent 13 / 21
Types d environnement Echecs Poker Diag. médical Taxi Observable Total. Part. Part. Part. Déterministe Det. Stoch. Stoch. Stoch. Episodique Séq. Séq. Séq. Séq. Statique Oui Oui Dyn. Dyn. Discret Agent 13 / 21
Types d environnement Echecs Poker Diag. médical Taxi Observable Total. Part. Part. Part. Déterministe Det. Stoch. Stoch. Stoch. Episodique Séq. Séq. Séq. Séq. Statique Oui Oui Dyn. Dyn. Discret Discret Discret Continu Continu Agent 13 / 21
Types d environnement Echecs Poker Diag. médical Taxi Observable Total. Part. Part. Part. Déterministe Det. Stoch. Stoch. Stoch. Episodique Séq. Séq. Séq. Séq. Statique Oui Oui Dyn. Dyn. Discret Discret Discret Continu Continu Agent Multi Multi Mono Multi 13 / 21
Agents intelligents Agents et environnement Rationalité PEAS Types d environnement Structure des agents Conclusion 14 / 21
Structure des agents Agent = architecture + programme Architecture : système, capteurs, actionneurs... Programme : 4 types basiques Agent réflexe simple Agent réfexe avec état Agent focalisé sur l objectif Agent focalisé sur l utilité 15 / 21
Agent réflexe simple Agent Sensors Condition action rules What the world is like now What action I should do now Environment Actuators 16 / 21
Agent réflexe avec état State How the world evolves What my actions do Condition action rules Sensors What the world is like now What action I should do now Environment Agent Actuators 17 / 21
Agent focalisé sur l objectif State How the world evolves What my actions do Goals Sensors What the world is like now What it will be like if I do action A What action I should do now Environment Agent Actuators 18 / 21
Agent focalisé sur l utilité State How the world evolves What my actions do Utility Sensors What the world is like now What it will be like if I do action A How happy I will be in such a state What action I should do now Environment Agent Actuators 19 / 21
Agents intelligents Agents et environnement Rationalité PEAS Types d environnement Structure des agents Conclusion 20 / 21
Conclusion Les agents intéragissent avec leur environnement à travers des capteurs et des actionneurs La mesure de performance évalue l environnement Un agent rationnel maximise la performance attendue La fonction de l agent décrit ce que l agent doit faire en toute circonstance Le programme de l agent implémente des fonctions d agent Le PEAS permet de spécifier l environnement 21 / 21