Chapitre Jeux dynamiques à information complète Les jeux sous forme normale donnent une représentation adéquate de joueurs effectuant des choix de stratégies simultanées. ans ces jeux, aucun joueur n a d information sur les stratégies utilisées par les autres joueurs au moment de faire son choix. ans de nomreux cas concrets, les joueurs effectuent leurs choix en fonction d une situation oservée qui dépend en particulier des choix précédents des autres joueurs. ar exemple c est le cas pour une enchère croissante, dans une négociation, dans le jeu d échecs. I. éfinitions: éfinition I.: Un jeu dynamique est le modèle d une situation où les joueurs choisissent séquentiellement leurs actions. Un jeu dynamique sera dit à information complète si tous les joueurs connaissent la structure du jeu. Remarque: Contrairement aux jeux statiques qui sont des jeux à information imparfaite, un jeu dynamique peut être à information parfaite ou imparfaite. éfinition I.: Un jeu est à information parfaite si chaque joueur est parfaitement informé des actions passées des autres joueurs. éfinition I.: Un jeu est à information imparfaite quand un joueur ignore certain des choix qui ont été effectués avant le sien. II. orme extensive d un jeu: éfinition II.: La représentation sous forme extensive d un jeu spécifie : Les joueurs concernés par le jeu (la nature n appartenant pas à l ensemle des joueurs). L ordre des décisions (les moments où chaque joueur aura jouer) Les actions (décisions) possiles de chaque joueur au moment où il joue. L information dont dispose chaque joueur au moment où il joue. Les paiements des joueurs pour chacune des cominaisons possiles d actions. éfinition II.: Un jeu sous forme extensive est donné par un arre de jeu contenant un nœud initial, des nœuds de décisions, des nœuds terminaux et des ranches reliant chaque nœud à ceux qui lui succèdent. n. Un ensemle de n joueurs our chaque nœud de décision, le nom du joueur qui a le droit de choisir une stratégie à ce nœud. our chaque joueur i, la spécification de l ensemle des actions permises à chaque nœud où il est susceptile de prendre une décision. La spécification des gains de chaque joueur à chaque nœud terminal. Exemple II.: Soit le jeu définit comme suit : Le joueur joue en premier et choisit une action a de l ensemle des actions A = { L, R}. Le joueur S oserve le choix de et choisit une action a de l ensemle des actions A { U } =.,
Le jeu s arrête et les paiements sont donnés par u ( a, a ) et (, ) Ce jeu en forme extensive est donné par l arre suivant: u a a. ranches = actions J L R œud initial (sans prédécesseur) œud de décision (intermédiaire) U U u ( L, U ), u ( L U ), u ( L, ), u ( L, ) u ( R, U ), u ( R, U ) u ( R, ), u ( R, ) œuds terminaux (sans successeur) Exemple II.: (le prolème de l entrant potentiel) Considérons le prolème d entrée d une firme dans le marché d un monopole. Une firme ( I ) est en situation de monopole sur un marché. Une autre firme ( E ) doit choisir entre entrer ou ne pas entrer. I peut choisir de comattre en cassant les prix ou de coopérer S il entre, la firme installée avec lui, de manière à créer un monopole joint. 0,00 si E n entre pas, si E entre et I comat et Les paiements pour E et I sont ( 0,50 ) si E entre et I coopère. Ce jeu en forme extensive est donné par l arre suivant. Coop. ( 0,50 ) E I ( 0,00) Com. ( 0,0) 7
III. Représentation d un jeu statique par la forme extensive: ous avons introduit les jeux statiques comme étant des jeux où les joueurs choisissent leurs actions simultanément. L exemple du dilemme du prisonnier a été construit sur cette ase. Mais en fait, le même résultat aurait été otenu si les prisonniers avaient joué de façon séquentielle avec cependant la condition que le joueur jouant en seconde position n oserve pas le choix du joueur jouant en première position. On peut de ce fait représenter le jeu du dilemme du prisonnier (jeu simultané) par le jeu dynamique suivant: Le prisonnier choisit une action a de l ensemle des actions A = {, } ( =nier, =dénoncé) Le prisonnier n oserve pas l action a choisie par le prisonnier et choisit une a de l ensemle des actions A = {, }. Les paiements sont donnés par u ( a, a ) et (, ) action u a a. Ainsi, on a interprété un jeu statique à information complète comme étant un jeu dynamique à information complète et imparfaite. La forme extensive de ce jeu est donnée par l arre suivant: (, ) ( 0,0) ( 0, 0) ( 8, 8) e ce fait, nous déduisons que dans un jeu dynamique il se peut qu un joueur qui doit prendre une décision ne connaisse pas les choix effectués par les joueurs qui ont joué avant lui. ans ce cas, il ne connaît pas parfaitement le nœud auquel il se situe. our représenter l état des connaissances des joueurs (ce qu ils savent et ce qu ils ne savent pas), on utilise la notion d ensemle d information. éfinition III.: À chaque étape d un jeu en forme extensive, on appelle ensemle h la collection de tous les nœuds que le joueur qui doit jouer à cette étape d information i i ne peut distinguer, compte tenu de l information dont il dispose. Chaque nœud contenu h contient alors exactement le même ensemle d actions localement disponiles. dans i.. our exprimer l idée que des nœuds de décision font partie d un même ensemle d information, on les entoure avec la même ellipse ou on les relie avec une ligne pointillée. Exemple III.: ile ou face avec oservation. Le joueur choisit pile ou face, puis le joueur choisit pile ou face après avoir oservé le choix du joueur. Ce dernier gagne si les choix sont égaux et perd si les choix sont différents. Le jeu est à somme nulle. 8
La forme extensive de ce jeu est donnée par l arre suivant. J J (, ) (-,) (-,) (, ) Cette figure montre que le joueur dispose de deux ensemles d information: Un singleton qui fait suite au choix de du joueur. Un singleton qui fait suite au choix de du joueur. Exemple III.: ile ou face sans oservation. On reprend l exemple de ile ou face avec maintenant la condition que le joueur ne connaît pas le choix du joueur quand il effectue son choix. La forme extensive de ce jeu est donnée par l arre suivant. J J (, ) (-,) (-,) (, ) Cette figure montre que le joueur dispose d un ensemle d information engloant ses deux nœuds de décision. Ceci signifie que le joueur ne différencie pas les deux nœuds. Il doit effectuer un choix indépendant de celui effectué par le joueur. Exemple III.: Le joueur joue en premier et choisit une action a de l ensemle des actions { L M R} A =,,. Le joueur oserve si a A { U } =., = L ou non et choisit une action a de l ensemle des actions 9
La forme extensive de ce jeu est donné par l arre suivant: L R J J J U U U Cette figure montre que le joueur dispose de deux ensemles d information: Un singleton qui fait suite au choix de L du joueur. Un ensemle d information (non singleton) engloant les deux autres nœuds de décision du joueur et qui fait suite au choix de M ou R par le joueur. Remarque: de là, nous pouvons utiliser la notion d ensemle d information pour: otenir la définition alternative permettant de distinguer entre un jeu à information parfaite et un jeu à information imparfaite. éfinir plus précisément un des concepts clés de la théorie des jeux : la stratégie. éfinition III.: Un jeu en forme extensive est. un jeu à information parfaite quand tous les ensemles d information du jeu sont des singletons i.e. réduit à un seul noeud,. un jeu à information imparfaite si au moins un ensemle d information du jeu n est pas un singleton i.e. contient plus d un nœud. éfinition III.: Une stratégie est un plan d action complet défini par le joueur avant le déut du jeu. our un joueur i, une stratégie s est ainsi une liste d actions particulières i (, i ( ), i i ) i s s K que ce joueur associe ex ante à chaque ensemle d information,, K susceptile d être atteint lorsqu il aura à effectuer ses choix. i i e manière générale, une stratégie d un joueur doit spécifier une action pour ce joueur chaque fois qu il est susceptile de jouer (s il joue, par exemple, à plusieurs tours du jeu, nous devons spécifier une action pour chacun des tours). Quelle que soit la complexité du jeu, les stratégies des joueurs doivent nous permettre de dérouler complètement le jeu quand on les comine. Exemple III.: Reprenons l exemple de ile ou ace avec oservation. Le joueur a un ensemle d information et il doit choisir entre deux stratégies, chacune se réduisant à une seule action ou. Le joueur, dispose de deux ensemles d information ={, } et ={, } et il doit prévoir un choix pour chacun de ses deux ensemles : jouer ou s il se trouve et 0
jouer ou s il se trouve dans (, ), (, ), (, ), (, ).. onc, il a à choisir entre stratégies différentes: IV. Equilire de ash parfait:. Représentation d un jeu dynamique par la forme normale: La forme normale d un jeu dynamique décrira ce dernier sous la forme d un jeu statique. Ceci est rendu possile par la notion de stratégie. Une stratégie est définie avant le déut du jeu mais sur la ase des informations à venir qui sont précisées par les règles du jeu. Le joueur peut donc associer le choix qu il désire à chaque ensemle d information envisageale d après les règles du jeu. ar conséquent, décrire un jeu dynamique sous sa forme normale n implique aucune perte d information et ne réduit en rien les possiilités stratégiques des joueurs. Exemple IV..: ile ou ace sans oservation (exemple III.). La forme normale de ce jeu est donnée par la matrice des paiements suivante. Joueur Joueur,, ( ) (,) (, ) ous retrouvons la présentation du jeu statique retenue dans le chapitre précédent. Exemple IV..: ile ou ace avec oservation (exemple III.). La forme normale de ce jeu est donnée par la matrice des paiements suivante. Joueur Joueur (, ) (, ) (, ) (, ) (, ) (, ) (,) (,) (,) (, ) (,) (, ) Exemple IV..: La ataille des sexes version statique. eux programmes sont envisageales pour la soirée de Monsieur et Madame : Ils peuvent assister à un match de oxe () ou ien admirer un allet (). La difficulté réside dans le fait que chacun doit se rendre à l un des deux spectacles en ignorant le choix de l autre. La forme extensive de ce jeu est donnée par l arre suivant. (, ) (, )
La forme normale de ce jeu est donnée par la matrice des paiements suivante. omme emme -,- (, ) (, ) Exemple IV..: La ataille des sexes version dynamique. ous reprenons l exemple IV. mais nous considérons une version dynamique. Monsieur sort en premier et laisse un message à son épouse lui indiquant le spectacle auquel il se rend. La forme extensive de ce jeu est donnée par l arre suivant. (, ) (, ) La forme normale de ce jeu est donnée par la matrice des paiements suivante. Joueur Joueur (, ) (, ) (, ) (, ) (, ) (, ) (, ) (, ) igure. Equilire de ash parfait dans un jeu dynamique à information complète et parfaite: éfinition IV..: Un équilire de ash d un jeu sous forme extensive est un équilire de ash de la forme normale associée. Exemple IV..: La ataille des sexes version dynamique. ans la forme normale du jeu dynamique (igure) nous pouvons, en utilisant la même procédure qu au chapitre, y rechercher les équilires de ash.,,,,,,. On otient, pour ce jeu, trois équilires de ash : ( ), ( ) et eux de ces équilires comportent une «menace» (ou annonce) non crédile que la femme n aurait pas intérêt à mettre en œuvre le cas échéant. Analysons les trois équilires.
L équilire =,(, ) est représenté par les trois segments en gras ci-dessous. (, ) (, ) ans le cadre de cet équilire, l homme va au allet. La femme, qui a oservé ( ), va également au allet. La succession des choix et est appelée sentier d équilire., compte tenu de sa stratégie, elle se serait rendu au allet. Si La femme avait oservait Le choix ( ) est qualifié de choix hors du sentier d équilire. est un équilire de ash mais soutenu par une menace non crédile hors du sentier d équilire. L équilire =,(, ) est représenté par les trois segments en gras ci-dessous. (, ) (, ) est un équilire de ash mais lui aussi il est soutenu par une menace non crédile hors du sentier d équilire. L équilire =,(, ) est représenté par les trois segments en gras ci-dessous. (, ) (, ) est un équilire de ash et il ne contient que des choix crédiles.
Les deux premiers équilires ne peuvent être retenus comme équilires du jeu dynamique, seul l équilire peut être conservé. On dira que est un équilire de ash parfait. Algorithme de Kuhn: rocédure de Récurrence vers l amont: (ackwards induction) ans un jeu dynamique à information complète et parfaite, l équilire de ash parfait peut être directement repéré par un raisonnement à reours qui consiste à partir de la fin de l arre du jeu pour remonter vers le sommet. où la définition d équilire parfait dans ce type de jeux. éfinition IV..: Un équilire de ash parfait est un ensemle de stratégies otenu par un raisonnement à reours qui rencontre, à chaque étape de la procédure, un seul joueur confronté à un simple prolème de maximisation. Exemple IV..: Résolution directe de la ataille des sexes version dynamique. Ici, la procédure à reours contient deux étapes. (, ) (, ) En récapitulant, l équilire de ash parfait est,(, ) ormellement: (, ) (, ).. Trouver la réponse optimale du joueur : max u ( s, s ) s S. éterminer l action optimale du joueur : max u s, MR ( s ) s S Ainsi, Le joueur anticipe la réaction optimale du joueur. Le joueur élimine les menaces non crédiles. Le joueur suppose que le joueur est rationnel. meilleure réponse de à s..
Exemple IV..: G J J V W X Y En récapitulant, l équilire de ash parfait est (,,,E,G ),(, ) V Y.. Equilire de ash parfait en sous-jeux: éfinition IV..: Un sous-jeu d un jeu sous forme extensive est un jeu issu du jeu original qui:. commence en un nœud n qui est un ensemle d information singleton.. inclut tous les nœuds successeurs de n et les nœuds terminaux (et aucun nœud prédécesseur).. ne coupe aucun ensemle d information. éfinition IV..: Quand un sous-jeu est différent du jeu original, on l appelle un sous-jeu propre ou strict. Motivation de.: ouvoir analyser le sous-jeu de façon autonome. Garantir que l histoire du jeu est connue de tous jusqu à n (tous les joueurs jouant après n savent que le jeu est passé par n ). Exemple IV..: Soit le jeu suivant décrit par sa forme extensive. A C E G (, ) (, ) (, ) (, ) ( 8,5 ) ( 7,6 ) ( 6,7 ) ( 5,8) L C C L L L L 5
Ce jeu admet 6 sous-jeux propres. Exemple IV..: Soit le jeu décrit par la forme extensive suivant. V W G M J X J Y C R 0 0 0 J 5 5 J C C 5 5 0 0 5 5 0 Ce jeu admet 5 sous-jeux dont sous-jeux propres et le jeu lui-même. éfinition IV..: Un profil de stratégies est un équilire de ash parfait en sous-jeux (ESJ) s il correspond à un équilire de ash dans chaque sous-jeu (Selten 965). étermination de l ESJ: Un équilire de ash parfait en sous-jeux est un ensemle de stratégie otenu par un raisonnement à reours qui rencontre, selon les étapes de la procédure, un seul joueur confronté à un prolème de maximisation ou plusieurs joueurs concernés par un sous-jeu. Exemple IV..: La ataille des sexes version dynamique. (, ) (, ) 6
Ce jeu admet sous-jeux propres. L équilire de ash du sous-jeu commençant en est. L équilire de ash du sous-jeu commençant en est.,,. ESJ est Exemple IV..: S G M J V SJ W X J SJ Y SJ C R 0 0 0 J 5 5 J C C 5 5 0 0 5 5 0 Les gains du joueur sont inscrits sur la première ligne de résultat et les gains du joueur sur la seconde. Ce jeu admet sous-jeux propres.,. L équilire de ash du sous-jeu S est (,G ) et le gain qui lui est associé est L équilire de ash du sous-jeu SJ est (, ) et le gain qui lui est associé est ( 0,0 ). Le sous-jeu SJ correspond, pour le joueur qui est le seul joueur concerné, à un simple prolème de maximisation. La solution est. On otient la forme extensive suivante. V W X J Y 0 0 7
Le sous-jeu SJ correspond, pour le joueur qui est le seul joueur concerné, à un simple prolème de maximisation. La solution est X. inalement, la dernière étape nous donne la forme réduite ci-après et qui admet comme solution w. V W 0 0 Il suffit à présent de récapituler les choix des joueurs pour caractériser l ESJ. On otient le s, s W,,,, G, X,. couple de stratégies ( ) = Remarque IV..: Si un jeu n admet pas de sous-jeux propres alors E ESJ. {ESJ} {E}. roposition IV..: Tout jeu fini à information parfaite possède au moins un ESJ en stratégies pures. 8