Jeux simultanés en information complète Fabien Prieur Premier semestre L3, 02 Octobre 2013
Introduction Référence Yildizoglu, M. : Introduction à la théorie des jeux. Dunod, 2003.
Introduction Les jeux simultanés Les joueurs rationnels choisissent simultanément leurs actions et reçoivent un gain qui dépend des stratégies choisies par l ensemble des joueurs. Jeux à information complète : Chaque joueur connaît l ensemble des actions qu il peut entreprendre, Chaque joueur connaît l ensemble des actions possibles pour les autres joueurs, Chaque joueur connaît les préférences des autres joueurs, Chaque joueur connaît les gains résultant de ces actions. Tout ce qu un joueur connaît est de connaissance commune.
Introduction Les jeux simultanés Les joueurs rationnels choisissent simultanément leurs actions et reçoivent un gain qui dépend des stratégies choisies par l ensemble des joueurs. Jeux à information complète : Chaque joueur connaît l ensemble des actions qu il peut entreprendre, Chaque joueur connaît l ensemble des actions possibles pour les autres joueurs, Chaque joueur connaît les préférences des autres joueurs, Chaque joueur connaît les gains résultant de ces actions. Tout ce qu un joueur connaît est de connaissance commune.
Introduction Les jeux simultanés Les joueurs rationnels choisissent simultanément leurs actions et reçoivent un gain qui dépend des stratégies choisies par l ensemble des joueurs. Jeux à information complète : Chaque joueur connaît l ensemble des actions qu il peut entreprendre, Chaque joueur connaît l ensemble des actions possibles pour les autres joueurs, Chaque joueur connaît les préférences des autres joueurs, Chaque joueur connaît les gains résultant de ces actions. Tout ce qu un joueur connaît est de connaissance commune.
Introduction Les jeux simultanés Les joueurs rationnels choisissent simultanément leurs actions et reçoivent un gain qui dépend des stratégies choisies par l ensemble des joueurs. Jeux à information complète : Chaque joueur connaît l ensemble des actions qu il peut entreprendre, Chaque joueur connaît l ensemble des actions possibles pour les autres joueurs, Chaque joueur connaît les préférences des autres joueurs, Chaque joueur connaît les gains résultant de ces actions. Tout ce qu un joueur connaît est de connaissance commune.
Introduction La connaissance commune X est de connaissance commune si tout le monde connaît X Et tout le monde sait que tout le monde connaît X Et tout le monde sait que tout le monde sait que tout le monde connaît X... Et ce indéfiniment. Implication des concepts de rationalité et de connaissance commune sur le comportement (stratégique) des joueurs.
Introduction Motivations - 1 1/ Comment décrire une situation de jeu? Définition & représentation d un jeu sous la forme normale. 2/ Comment résoudre le problème inhérent à un jeu? Jeux à somme non nulle : stratégies dominantes et dominées. Concept de solution et méthode de résolution : Equilibre en stratégies dominantes et Elimination itérative des stratégies strictement dominées Pour les jeux à somme nulle, stratégies prudentes.
Introduction Motivations - 2 Cependant, notions insuffisantes pour avoir une idée précise de ce qui va se passer dans un jeu. Stratégie rationalisable, meilleure réponse et équilibre de Nash. Stratégies pures vs.mixtes, interprétées comme l incertitude d un joueur à propos de ce qu un autre joueur va faire. Résultat d existence de Nash (1950) : tout jeu sous forme normale admet au moins un EN en stratégies mixtes. Applications : concurrence imparfaite, problèmes de pollution.
Introduction Plan 1 Introduction 2 Représentation du jeu sous forme normale 3 Stratégies dominantes, stratégies dominées Stratégies dominantes Stratégies dominées Elimination itérative des stratégies strictement dominées 4 Equilibre de Nash Stratégies rationalisables L équilibre de Nash en stratégies pures Equilibre de Nash en Stratégies mixtes Existence de l équilibre de Nash 5 Jeux à somme nulle et stratégies prudentes 6 Applications
Représentation du jeu sous forme normale Un exemple : le dilemme du prisonnier Deux individus sont arrêtés car suspectés d une série de crimes et emprisonnés dans des cellules différentes. Ils sont interrogés séparément par un représentant de l ordre cherchant à obtenir une confession de chaque suspect. Si 1 seul joueur avoue les crimes (coupable), il est récompensé : peine limitée à 1 an de détention, l autre écope de 5 ans. Si les deux confessent leurs actes : peine de 3 ans de prison. Si aucun n avoue les crimes (non coupable), possible de les confondre pour un des crimes : 2 ans de prison.
Représentation du jeu sous forme normale Illustration
Représentation du jeu sous forme normale Jeu de la colombe et du faucon Soit V la valeur d une ressource que se disputent 2 joueurs. 2 stratégies possibles : faucon vs. colombe. Si les 2 joueurs adoptent un comportement "pacifique" (colombe), alors ils partagent la ressource et obtiennent chacun V /2. Un joueur adoptant l autre stratégie "agressive" (faucon) n abandonnera pas (une partie de) la ressource.
Représentation du jeu sous forme normale Jeu de la colombe et du faucon - 2 Si un seul des 2 joueurs adopte la stratégie agressive, il récupère toute le ressource, et obtient V contre 0 pour l autre. Enfin, si les 2 joueurs sont agressifs, un combat devient inévitable et fait supporter un coût C/2 à chaque joueur. L issue du combat est incertaine, chaque joueur a 1 chance sur 2 de remporter le combat et la ressource.
Représentation du jeu sous forme normale Représentation 1/ et 2/ Deux joueurs, chacun dispose de 2 stratégies : {C, F }. 3/ Résultats possibles : (C,C), (C,F), (F,C) et (F,F). 4/ Gains associés à n importe quel profil de stratégies. Représentation sous la forme d un tableau 2 2. Dans chaque cellule figurent les gains associés au résultat : 2 valeurs, une pour chaque joueur. Par convention, les stratégies du premier joueur sont indiquées en ligne et son gain est la première valeur.
Représentation du jeu sous forme normale Remarque Variante du dilemme du prisonnier : Situations où les joueurs ont un intérêt à coopérer et où poursuivre son propre intérêt est préjudiciable... Mais individuellement rationnel. Incapacité à s engager à adopter telle ou telle stratégie.
Représentation du jeu sous forme normale Jeu de la poule mouillée Quand V < C... Histoire inspirée du film Rebel without a cause (1955) :
Représentation du jeu sous forme normale Jeu de la poule mouillée - 2 Deux individus foncent l un vers l autre au volant de leurs voitures. Ils doivent décider s ils stoppent ou bien s ils continuent. Le premier qui s écarte de la trajectoire perd la face ; mais conserve la vie sauve (0). L autre peut s arrêter ensuite et gagne (V). Si les deux continuent... Accident ( V C 2 ). Enfin, si les deux s arrêtent en même temps, ils ont fait preuve d autant de courage l un que l autre et récupèrent V/2.
Représentation du jeu sous forme normale Le jeu de la pièce Jeux à somme nulle : ce que gagne un joueur, l autre le perd. Jeu à 2 joueurs. La règle : chaque joueur prend une pièce de 1 euro dans sa main et la place soit côté pile soit côté face visible. Les gains : si les 2 présentent le même côté de la pièce, J1 paie 1 euro à J2. Sinon, c est J2 qui paie 1 euro à J1.
Représentation du jeu sous forme normale Formalisation La représentation sous forme normale d un jeu spécifie : Qui sont les joueurs, Quelles sont les actions qu ils peuvent entreprendre, Quels sont les résultats possibles, Quelle est la valeur qu ils attribuent à chaque résultat.
Représentation du jeu sous forme normale Formalisation La représentation sous forme normale d un jeu spécifie : Qui sont les joueurs, Quelles sont les actions qu ils peuvent entreprendre, Quels sont les résultats possibles, Quelle est la valeur qu ils attribuent à chaque résultat.
Représentation du jeu sous forme normale Formalisation La représentation sous forme normale d un jeu spécifie : Qui sont les joueurs, Quelles sont les actions qu ils peuvent entreprendre, Quels sont les résultats possibles, Quelle est la valeur qu ils attribuent à chaque résultat.
Représentation du jeu sous forme normale Formalisation La représentation sous forme normale d un jeu spécifie : Qui sont les joueurs, Quelles sont les actions qu ils peuvent entreprendre, Quels sont les résultats possibles, Quelle est la valeur qu ils attribuent à chaque résultat.
Représentation du jeu sous forme normale Formalisation La représentation sous forme normale d un jeu spécifie : Qui sont les joueurs, Quelles sont les actions qu ils peuvent entreprendre, Quels sont les résultats possibles, Quelle est la valeur qu ils attribuent à chaque résultat.
Représentation du jeu sous forme normale Notations - 1 1/ Jeu à n joueurs, indicés par i = 1,...n. Soit N l ensemble des joueurs : N = {1,..., i,..., n}. 2/ Soit S i l ensemble des stratégies à disposition du joueur i. N importe quel s i S i constitue une stratégie pure. 3/ Le vecteur s = (s 1,..., s i,..., s n ) est un résultat possible du jeu : Un profil de stratégies, une et une seule pour chaque joueur. On a s S, l ensemble de tous les résultats possibles : S = S 1... S i... S n = n S i. i=1
Représentation du jeu sous forme normale Notations - 2 4/ La fonction de gain (d utilité) du joueur i, u i : S R, Associe à chaque résultat possible s S un paiement u i (s) R. On note enfin s i = (s 1,..., s i 1, s i+1,..., s n ) un profil de stratégies pour tous les joueurs autre que i. On aura s i S i avec S i = S 1... S i 1 S i+1... S n. Un profil de stratégies s = (s i, s i ).
Représentation du jeu sous forme normale Jeu sous forme normale Definition La représentation sous forme normale d un jeu à n joueurs est une liste G = [N, S 1,..., S 2, u 1,..., u n ], soit G = [N, {S i }, {u i }], où pour tout i N, S i correspond à l ensemble des stratégies disponibles n pour le joueur i et u i : S i R est la fonction d utilité VNM du joueur i. i=1 Von Neumann et Morgenstern (1944) : fondateurs de la théorie de l utilité espérée pour la modélisation des choix en univers incertain.
Représentation du jeu sous forme normale Remarques - 1 Le problème de décision d un joueur : choisir sa stratégie afin de maximiser son niveau d utilité (ou d utilité espérée). Les joueurs choisissent simultanément, cela ne signifie pas qu ils agissent simultanément (dilemme du prisonnier). Impossible d observer le choix des autres avant de prendre sa décision Nécessaire de former des croyances sur les stratégies jouées par les autres
Représentation du jeu sous forme normale Remarques - 2 Représentation sous forme normale, jeux simultanés et jeux dynamiques. Représentation sous forme normale grâce à un tableau pour un nombre de joueurs 3. Au delà, impossible. Ensembles de stratégies discrets vs. continus.
Représentation du jeu sous forme normale Résumé Situation de jeu : L utilité obtenue par un joueur dépend de sa propre stratégie mais aussi de celles suivies par les autres joueurs. Contexte d interaction stratégique Le joueur rationnel va chercher à maximiser la valeur (espérée) de son utilité en adaptant sa décision aux croyances qu il forme sur le choix des autres. Les éléments constitutifs du jeu sont de connaissance commune.
Stratégies dominantes, stratégies dominées Question centrale de la théorie des jeux Comment jouer? Comment prédire le déroulement d un jeu où les joueurs sont rationnels et pleinement informés de la structure et de la rationalité des autres. Concepts de stratégies dominantes puis d équilibre en stratégies dominantes (premier concept de solution). Ensuite, concept lié de stratégies dominées. Enfin, processus d élimination itérative des stratégies strictement dominées.
Stratégies dominantes, stratégies dominées Stratégies dominantes La dominance Moyen simple de comparer les stratégies : notion de dominance. Illustration : le dilemme du prisonnier. Il existe une unique solution plausible à ce jeu : (C, C). Pour comprendre cela, il faut voir que jouer C est la meilleure stratégie de chaque joueur, indépendamment de ce que fait l autre. Cette action constitue une stratégie strictement dominante.
Stratégies dominantes, stratégies dominées Stratégies dominantes Stratégie strictement dominante (STD) Definition Une stratégie s i S i est une stratégie strictement dominante pour le joueur i dans le jeu G = [N, {S i }, {u i }] si pour tout s i S i, s i s i, on a u i (s i, s i ) > u i (s i, s i ) pour tout s i S i La stratégie s i est celle, parmi l ensemble S i, qui offre le paiement le plus élevé au joueur i et ce quelque soit les stratégies choisies par les autres joueurs, s i. Elle est l unique solution de la maximisation de u i par rapport à s i, indépendante du profil de stratégies joué par les rivaux de i.
Stratégies dominantes, stratégies dominées Stratégies dominantes Commentaires Peu importe ce que font les autres joueurs, s i est strictement meilleure que toutes les autres stratégies pour i. Si un joueur est rationnel et dispose d une stratégie strictement dominante (SDT), Alors il ne jouera aucune autre stratégie que celle-là. Et les autres vont être capables d anticiper ce choix.
Stratégies dominantes, stratégies dominées Stratégies dominantes Equilibre en stratégies strictement dominantes Lorsque tous les joueurs disposent d une stratégie SDT, alors on sait facilement prédire la solution du jeu : Equilibre en stratégies dominantes. Definition Un profil de stratégie s = (s 1,..., s i,..., s n ) constitue l equilibre en stratégies strictement dominantes du jeu G = [N, {S i }, {u i }] si et seulement si pour tout joueur i, s i S i est une stratégie strictement dominante.
Stratégies dominantes, stratégies dominées Stratégies dominantes Remarques Si un jeu admet un équilibre en stratégies SDT, alors il est unique. Pour le DDP, l équilibre en stratégies SDT est (C, C). Rq. Ce n est pas le meilleur résultat pour les 2 joueurs considérés conjointement : dominé au sens de Pareto par (N, N). Problème d existence : Dans la plupart des jeux, les joueurs ne disposent pas de telles stratégies. Exemple.
Stratégies dominantes, stratégies dominées Stratégies dominées Le principe Un joueur ne jouera jamais une stratégie "perdante", offrant de piètres performances. S appuyer sur l idée de dominance pour éliminer certaines stratégies en tant que choix possible. Stratégie strictement dominée : il existe une autre stratégie qui offre un gain supérieur, quelque soit le choix des autres joueurs. La stratégie N dans le DDP ou la stratégie B dans le jeu précédent. Relation(s) de préférence : préférence stricte ( ) vs. indifférence ( ) et classement des stratégies ; comparaison par paire.
Stratégies dominantes, stratégies dominées Stratégies dominées Stratégie strictement dominée (SDE) Definition Une stratégie s i S i est une stratégie strictement dominée pour le joueur i dans le jeu G = [N, {S i }, {u i }] s il existe une autre stratégie s i S i telle que, pour tout s i S i, u i (s i, s i ) > u i (s i, s i ) Dans ce cas, on dit que la stratégie s i domine strictement s i. Un joueur rationnel ne jouera jamais ce type de stratégie. Aucune croyance ne peut l amener à penser que c est une stratégie optimale.
Stratégies dominantes, stratégies dominées Stratégies dominées Version "faible" de la définition Definition Une stratégie s i S i est une stratégie faiblement dominée pour le joueur i dans le jeu G = [N, {S i }, {u i }] s il existe une autre stratégie s i S i telle que, pour tout s i S i, u i (s i, s i ) u i (s i, s i ) et pour certains s i S i u i (s i, s i ) > u i (s i, s i ) La stratégie s i fait au moins aussi bien que s i face à n importe quel profil de stratégies des autres joueurs, et fait strictement mieux que s i face à certains profils. (Faire au moins aussi bien = procurer un paiement au moins égal à.)
Stratégies dominantes, stratégies dominées Stratégies dominées Commentaires On dit que la stratégie s i domine faiblement s i. Un joueur rationnel jouera s i si et seulement s il est sûr que les profils face auxquels s i est meilleure ne se réaliseront jamais...... Et ne la jouera pas s il existe une probabilité non-nulle qu ils se réalisent effectivement. Exemple. Définition : Une stratégie s i est faiblement dominante pour le joueur i dans le jeu G si elle domine faiblement toutes les autres stratégies dans S i.
Stratégies dominantes, stratégies dominées Stratégies dominées Exemples Jeu de l embauche : Une entreprise (Es) doit décider d embaucher définitivement ou pas un Employé (Em) à l issue d une période d essai. L employé doit décider quelle stratégie adopter dans l entreprise : travailler dur pour faire ses preuves ou bien en faire le moins possible. Bataille de la mer de Bismarck (1944) : Lieu : sud ouest océan pacifique, Protagonistes : alliés (général Kenney) et japonais (général Masatomi)
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Le principe L élimination des stratégies dominées : réduire l ensemble des stratégies pouvant être jouées par des joueurs rationnels. En général, insuffisant pour obtenir une prédiction claire de l issue d un jeu. Pousser plus loin cette logique d élimination des stratégies SDE. Hypothèse : connaissance commune de la rationalité des joueurs. Jeu du DDP étendu : troisième stratégie pour chaque prisonnier, s enfuir.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Raisonnement Dans ce jeu, la stratégie N est meilleure que C seulement face à la stratégie F ( 3 < 0). Cependant, F est une stratégie SDE et ne peut être "rationalisée". Aucun joueur rationnel ne peut former une croyance concernant le choix de son adversaire l incitant à jouer F. Si la rationalité est connaissance commune : J1 sait que J2 ne jouera jamais F, donc l élimine de son raisonnement, idem pour J2. Si la rationalité des joueurs est connaissance commune, les seules stratégies que les joueurs seront susceptibles de jouer sont celles qui survivront à l élimination itérative des stratégies SDE.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Démarche 1 Eliminer les SSDE d un joueur. On obtient un jeu réduit. 2 Analyser si dans le jeu réduit, un autre joueur dispose d une SSDE. Si oui, on va l éliminer pour obtenir un nouveau jeu réduit etc. 3 Répétition du processus jusqu au moment où on ne pourra plus éliminer de nouvelle stratégie. L ordre d élimination des stratégies SDE des joueurs n a aucune influence sur l ensemble des stratégies qui "survivront", mais...
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Démarche 1 Eliminer les SSDE d un joueur. On obtient un jeu réduit. 2 Analyser si dans le jeu réduit, un autre joueur dispose d une SSDE. Si oui, on va l éliminer pour obtenir un nouveau jeu réduit etc. 3 Répétition du processus jusqu au moment où on ne pourra plus éliminer de nouvelle stratégie. L ordre d élimination des stratégies SDE des joueurs n a aucune influence sur l ensemble des stratégies qui "survivront", mais...
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Démarche 1 Eliminer les SSDE d un joueur. On obtient un jeu réduit. 2 Analyser si dans le jeu réduit, un autre joueur dispose d une SSDE. Si oui, on va l éliminer pour obtenir un nouveau jeu réduit etc. 3 Répétition du processus jusqu au moment où on ne pourra plus éliminer de nouvelle stratégie. L ordre d élimination des stratégies SDE des joueurs n a aucune influence sur l ensemble des stratégies qui "survivront", mais...
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Démarche 1 Eliminer les SSDE d un joueur. On obtient un jeu réduit. 2 Analyser si dans le jeu réduit, un autre joueur dispose d une SSDE. Si oui, on va l éliminer pour obtenir un nouveau jeu réduit etc. 3 Répétition du processus jusqu au moment où on ne pourra plus éliminer de nouvelle stratégie. L ordre d élimination des stratégies SDE des joueurs n a aucune influence sur l ensemble des stratégies qui "survivront", mais...
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Implication de la connaissance commune de la rationalité Si J1 est rationnel, il ne jouera jamais F. Si J2 est rationnel et sait que J1 est rationnel alors lui-même ne jouera jamais F qui est SDE par C et C. Si J1 sait que J2 est rationnel et sait que lui-même (J1) est rationnel, alors J1 ne jouera jamais N qui est SDE par C. Si J2 sait que J1 est rationnel et sait que lui-même, J2, est rationnel et sait que J1 est rationnel alors il ne jouera pas N. Le seul profil de stratégie qui survit est (C,C), unique solution du jeu.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Implication de la connaissance commune de la rationalité Si J1 est rationnel, il ne jouera jamais F. Si J2 est rationnel et sait que J1 est rationnel alors lui-même ne jouera jamais F qui est SDE par C et C. Si J1 sait que J2 est rationnel et sait que lui-même (J1) est rationnel, alors J1 ne jouera jamais N qui est SDE par C. Si J2 sait que J1 est rationnel et sait que lui-même, J2, est rationnel et sait que J1 est rationnel alors il ne jouera pas N. Le seul profil de stratégie qui survit est (C,C), unique solution du jeu.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Implication de la connaissance commune de la rationalité Si J1 est rationnel, il ne jouera jamais F. Si J2 est rationnel et sait que J1 est rationnel alors lui-même ne jouera jamais F qui est SDE par C et C. Si J1 sait que J2 est rationnel et sait que lui-même (J1) est rationnel, alors J1 ne jouera jamais N qui est SDE par C. Si J2 sait que J1 est rationnel et sait que lui-même, J2, est rationnel et sait que J1 est rationnel alors il ne jouera pas N. Le seul profil de stratégie qui survit est (C,C), unique solution du jeu.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Implication de la connaissance commune de la rationalité Si J1 est rationnel, il ne jouera jamais F. Si J2 est rationnel et sait que J1 est rationnel alors lui-même ne jouera jamais F qui est SDE par C et C. Si J1 sait que J2 est rationnel et sait que lui-même (J1) est rationnel, alors J1 ne jouera jamais N qui est SDE par C. Si J2 sait que J1 est rationnel et sait que lui-même, J2, est rationnel et sait que J1 est rationnel alors il ne jouera pas N. Le seul profil de stratégie qui survit est (C,C), unique solution du jeu.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Implication de la connaissance commune de la rationalité Si J1 est rationnel, il ne jouera jamais F. Si J2 est rationnel et sait que J1 est rationnel alors lui-même ne jouera jamais F qui est SDE par C et C. Si J1 sait que J2 est rationnel et sait que lui-même (J1) est rationnel, alors J1 ne jouera jamais N qui est SDE par C. Si J2 sait que J1 est rationnel et sait que lui-même, J2, est rationnel et sait que J1 est rationnel alors il ne jouera pas N. Le seul profil de stratégie qui survit est (C,C), unique solution du jeu.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Point fort et limites Manière de procéder assez commode mais deux limites : Chaque étape requiert une hypothèse supplémentaire sur ce que les joueurs savent de la rationalité des autres. Il faut supposer que : Tous les joueurs sont rationnels, Tous les joueurs savent que les joueurs sont rationnels, Tous les joueurs savent que tous les joueurs savent qu ils sont rationnels etc. Parfois prédiction très imprécise de ce qui sera effectivement joué Exemples.
Stratégies dominantes, stratégies dominées Elimination itérative des stratégies strictement dominées Résumé Le concept de stratégie SDT est trop restrictif : souvent, les joueurs ne disposent pas de telle stratégie. Par contre, lorsqu il existe un ESDT, il constitue l unique solution. Le processus d EISSDE opère dans un plus grand nombre de situations. Mais ne permet pas toujours d avoir une idée précise de la solution. Autres concepts de solution : Stratégies prudentes pour jeux à somme nulle, Equilibre de Nash pour une classe plus large de jeux.
Equilibre de Nash Stratégies rationalisables Analyse préalable Définition des notions de : Meilleure réponse (MR) puis de, Stratégie rationalisable (SR). Une stratégie est une MR (à un profil quelconque de stratégies des autres joueurs) lorsqu elle fait au moins aussi bien que toutes les autres stratégies face à ce profil. L ensemble des stratégies rationalisables : l ensemble des stratégies qui peuvent être rationalisées... CAD qui peuvent être jouées dans un jeu dont la structure et la rationalité des participants sont de connaissance commune.
Equilibre de Nash Stratégies rationalisables Meilleure réponse - 1 Definition Dans le jeu à n joueurs G = [N, {S i }, {u i }], une stratégie s i S i est une meilleure réponse pour le joueur i au profil de stratégies s i S i de ses rivaux si u i (s i, s i ) u i (s i, s i ) pour tout s i S i Une stratégie s i S i n est jamais une meilleure réponse s il n existe aucun profil de stratégie s i S i pour lequel s i est une meilleure réponse. Rq. Meilleure réponse et dominance.
Equilibre de Nash Stratégies rationalisables Meilleure réponse - 2 Dire que s i est une MR à s i s i est le choix optimal du joueur i quand il anticipe que ses rivaux jouent s i. Au contraire, la stratégie s i n est jamais une MR (JMR) s il n existe aucune croyance pour i qui justifie de choisir s i. Un joueur rationnel n emploiera pas une stratégie qui n est JMR. Quelles stratégies? Typiquement les SSDE mais une stratégie peut être JMR sans pour autant être SSDE. Critère (d élimination) moins contraignant.
Equilibre de Nash Stratégies rationalisables Meilleure réponse - 2 Dire que s i est une MR à s i s i est le choix optimal du joueur i quand il anticipe que ses rivaux jouent s i. Au contraire, la stratégie s i n est jamais une MR (JMR) s il n existe aucune croyance pour i qui justifie de choisir s i. Un joueur rationnel n emploiera pas une stratégie qui n est JMR. Quelles stratégies? Typiquement les SSDE mais une stratégie peut être JMR sans pour autant être SSDE. Critère (d élimination) moins contraignant.
Equilibre de Nash Stratégies rationalisables Elimination itérative des stratégies JMR Hypothèse : la rationalité des joueurs est connaissance commune. Le joueur rationnel ne jouera jamais une SJMR une fois qu il élimine la possibilité qu un autre joueur joue ce type de stratégie. L ensemble des stratégies qui restent après l EISJMR est inclus dans celui que l on obtient après EISSDE. Prédiction au moins aussi fine de l issue du jeu. L ordre dans lequel on réalise l élimination n importe pas.
Equilibre de Nash Stratégies rationalisables Elimination itérative des stratégies JMR Hypothèse : la rationalité des joueurs est connaissance commune. Le joueur rationnel ne jouera jamais une SJMR une fois qu il élimine la possibilité qu un autre joueur joue ce type de stratégie. L ensemble des stratégies qui restent après l EISJMR est inclus dans celui que l on obtient après EISSDE. Prédiction au moins aussi fine de l issue du jeu. L ordre dans lequel on réalise l élimination n importe pas.
Equilibre de Nash Stratégies rationalisables Elimination itérative des stratégies JMR Hypothèse : la rationalité des joueurs est connaissance commune. Le joueur rationnel ne jouera jamais une SJMR une fois qu il élimine la possibilité qu un autre joueur joue ce type de stratégie. L ensemble des stratégies qui restent après l EISJMR est inclus dans celui que l on obtient après EISSDE. Prédiction au moins aussi fine de l issue du jeu. L ordre dans lequel on réalise l élimination n importe pas.
Equilibre de Nash Stratégies rationalisables Elimination itérative des stratégies JMR Hypothèse : la rationalité des joueurs est connaissance commune. Le joueur rationnel ne jouera jamais une SJMR une fois qu il élimine la possibilité qu un autre joueur joue ce type de stratégie. L ensemble des stratégies qui restent après l EISJMR est inclus dans celui que l on obtient après EISSDE. Prédiction au moins aussi fine de l issue du jeu. L ordre dans lequel on réalise l élimination n importe pas.
Equilibre de Nash Stratégies rationalisables Elimination itérative des stratégies JMR Hypothèse : la rationalité des joueurs est connaissance commune. Le joueur rationnel ne jouera jamais une SJMR une fois qu il élimine la possibilité qu un autre joueur joue ce type de stratégie. L ensemble des stratégies qui restent après l EISJMR est inclus dans celui que l on obtient après EISSDE. Prédiction au moins aussi fine de l issue du jeu. L ordre dans lequel on réalise l élimination n importe pas.
Equilibre de Nash Stratégies rationalisables Stratégies rationalisables - 1 Les stratégies qui survivent à l EISJMR sont : Les stratégies qu un joueur rationnel peut justifier avec une croyance raisonnable sur le comportement des autres joueurs. Une croyance qui ne repose pas sur le fait qu un joueur va jouer une SJMR ou, une stratégie qui est une MR seulement à la croyance qu un autre joueur jouerait une SJMR. Ces stratégies forment l ensemble des stratégies rationalisables.
Equilibre de Nash Stratégies rationalisables Stratégies rationalisables - 2 Definition Dans le jeu à n joueurs G = [N, {S i }, {u i }], les stratégies dans S i qui survivent à l élimination itérative des stratégies qui ne sont jamais des meilleures réponses constituent les stratégies rationalisables du joueur i. Celles qui peuvent être jouées dans un jeu où structure et rationalité des joueurs sont de connaissance commune. Exemple. Jeu abstrait à deux joueurs et 4 stratégies.
Equilibre de Nash Stratégies rationalisables Remarques Même difficulté que celle posée par la méthode précédente : Les joueurs disposent potentiellement d un trop grand nombre de stratégies rationalisables pour avoir une idée précise de la solution. Aller plus loin en imposant des hypothèses additionnelles (différentes) à celle de la connaissance commune de la rationalité des joueurs.
Equilibre de Nash L équilibre de Nash en stratégies pures Raisonnement - 1 La plupart des stratégies peuvent être rationalisées. Raison pour laquelle il existe "trop" de stratégies rationalisables : Aucune condition sur la cohérence entre les croyances d un joueur et les actions choisies effectivement par ses adversaires. Le raisonnement de l équilibre de Nash va supposer la cohérence mutuelle des croyances.
Equilibre de Nash L équilibre de Nash en stratégies pures Raisonnement - 2 Supposez que la théorie fasse une prédiction unique s (solution). Pour que cette prédiction soit correcte, il est nécessaire que chaque joueur i adopte effectivement la stratégie prédite, s i. Cette stratégie si doit être une MR aux stratégies prédites pour les autres joueurs, s i. A l équilibre de Nash, chaque joueur offre une MR aux stratégies jouées par les adversaires. Cohérence mutuelle des croyances et des MR, Prédiction stable : aucun joueur n a intérêt à dévier.
Equilibre de Nash L équilibre de Nash en stratégies pures Exemple : la bataille des sexes Un couple souhaite trouver une sortie pour leur soirée. Choix entre 2 évènements : assister à un concert (C) ou à un match de rugby (R). Leur préoccupation principale est d être ensemble. Cependant, la femme préfère assister au concert alors que l homme souhaiterait plutôt aller voir le match de rugby. Caractéristique de ce jeu : conflit d intérêt.
Equilibre de Nash L équilibre de Nash en stratégies pures Equilibre de Nash : définition formelle Definition Dans le jeu à n joueurs G = [N, {S i }, {u i }], le profil de stratégies (s 1,..., s i,..., s n) constitue un équilibre de Nash si, pour chaque joueur i, s i S i est une meilleure réponse aux stratégies des n 1 autres joueurs s i = (s 1,..., s i 1, s i+1,..., s n) : u i (s i, s i) u i (s i, s i) pour tout s i S i C est à dire s i est solution de max s i S i u i (s i, s i)
Equilibre de Nash L équilibre de Nash en stratégies pures Discussion 1 Aucun joueur ne peut faire mieux en choisissant une autre stratégie que s i. 2 Aucun joueur n aurait d incitation à changer de stratégie s il connaissait les stratégies jouées par les autres joueurs. 3 Si la théorie prédit une solution, cette solution est un EN.
Equilibre de Nash L équilibre de Nash en stratégies pures Discussion 1 Aucun joueur ne peut faire mieux en choisissant une autre stratégie que s i. 2 Aucun joueur n aurait d incitation à changer de stratégie s il connaissait les stratégies jouées par les autres joueurs. 3 Si la théorie prédit une solution, cette solution est un EN.
Equilibre de Nash L équilibre de Nash en stratégies pures Discussion 1 Aucun joueur ne peut faire mieux en choisissant une autre stratégie que s i. 2 Aucun joueur n aurait d incitation à changer de stratégie s il connaissait les stratégies jouées par les autres joueurs. 3 Si la théorie prédit une solution, cette solution est un EN.
Equilibre de Nash L équilibre de Nash en stratégies pures Discussion 1 Aucun joueur ne peut faire mieux en choisissant une autre stratégie que s i. 2 Aucun joueur n aurait d incitation à changer de stratégie s il connaissait les stratégies jouées par les autres joueurs. 3 Si la théorie prédit une solution, cette solution est un EN.
Equilibre de Nash L équilibre de Nash en stratégies pures Par contradiction La théorie prédit s = (s 1,..., s i,..., s n) comme solution d un jeu. s n est pas un équilibre de Nash Il existe un joueur i pour lequel s i n est pas un MR à s i. CAD, il existe 1 autre stratégie s i telle que u i (s i, s i ) < u i(s i, s i ). Le joueur i a intérêt à dévier pour l autre stratégie s i. La théorie est contredite par la manière dont les joueurs jouent.
Equilibre de Nash L équilibre de Nash en stratégies pures Méthode Manière de procéder dans un jeu matriciel : Repérer et signaler (en les soulignant) les gains associés aux MR. EN : vecteur de paiement où tous les gains sont soulignés. Exemple abstrait : 2 joueurs et 3 stratégies. Le profil (B, D) seul associé à des MR mutuellement compatibles et des croyances mutuellement cohérentes : unique EN
Equilibre de Nash L équilibre de Nash en stratégies pures Limite Problème de multiplicité des équilibres : Si l équilibre en stratégies dominantes (lorsqu il existe) est unique, il peut exister plusieurs EN. Et ce concept ne dit rien sur la manière d en sélectionner un. Exemples. Jeu de la séduction, guerre des sexes. Quelle est la solution qui se réalise effectivement? Problème de coordination
Equilibre de Nash L équilibre de Nash en stratégies pures L EN est-il un concept acceptable? Une stratégie rationalisable : Croyances raisonnables L EN impose la cohérence mutuelle des croyances : Croyances exactes La stratégie jouée par chaque joueur est une MR aux stratégies effectivement jouées par les autres. Est-il raisonnable de supposer que les croyances sont correctes? Unicité de la solution Comment régler les problèmes de coordination?
Equilibre de Nash L équilibre de Nash en stratégies pures L EN est-il un concept acceptable? Une stratégie rationalisable : Croyances raisonnables L EN impose la cohérence mutuelle des croyances : Croyances exactes La stratégie jouée par chaque joueur est une MR aux stratégies effectivement jouées par les autres. Est-il raisonnable de supposer que les croyances sont correctes? Unicité de la solution Comment régler les problèmes de coordination?
Equilibre de Nash L équilibre de Nash en stratégies pures L EN est-il un concept acceptable? Une stratégie rationalisable : Croyances raisonnables L EN impose la cohérence mutuelle des croyances : Croyances exactes La stratégie jouée par chaque joueur est une MR aux stratégies effectivement jouées par les autres. Est-il raisonnable de supposer que les croyances sont correctes? Unicité de la solution Comment régler les problèmes de coordination?
Equilibre de Nash L équilibre de Nash en stratégies pures L EN est-il un concept acceptable? Une stratégie rationalisable : Croyances raisonnables L EN impose la cohérence mutuelle des croyances : Croyances exactes La stratégie jouée par chaque joueur est une MR aux stratégies effectivement jouées par les autres. Est-il raisonnable de supposer que les croyances sont correctes? Unicité de la solution Comment régler les problèmes de coordination?
Equilibre de Nash L équilibre de Nash en stratégies pures Les points focaux (Schelling, 1960) Raison extérieure à l environnement du jeu pour que les joueurs se coordonnent sur un résultat Exemple : Jeu de séduction
Equilibre de Nash L équilibre de Nash en stratégies pures Les points focaux (Schelling, 1960) - 2 Exemple du rendez-vous à New-York. Deux personnes doivent se retrouver un soir à New-York pour un dîner dans un restaurant mais ne peuvent pas communiquer. Deux possibilités : Soit ils se rejoignent à 20h00 en haut de l Empire State Building (ESB). Soit, à la même heure devant l horloge de la gare Grand Central (GC).
Equilibre de Nash L équilibre de Nash en stratégies pures Les points focaux (Schelling, 1960) - 3 Jeu de coordination : à la différence de la BDS, pas de conflit d intérêt : les joueurs veulent avant tout se retrouver. Supposez 1 Qu il y ait un restaurant dans GC qui ait une très grande réputation contrairement à celui se situant en haut de l ESB, 2 Que les joueurs connaissent cette information. Dans ce cas, (GC, GC) est un point focal. 2 EN mais le RDV à GC apparaît comme l issue évidente du jeu.
Equilibre de Nash L équilibre de Nash en stratégies pures L EN comme une norme sociale stable Situations où il existe une interaction longue et répétée entre les joueurs dont il émerge une manière naturelle de jouer le jeu. A force d intéragir, les joueurs apprennent comment jouer. EN vu comme une norme sociale stable issue de l interaction répétée, de l apprentissage. Exemple : Se déplacer dans le métro aux heures de pointes.
Equilibre de Nash L équilibre de Nash en stratégies pures Equilibre de Nash et autres concepts de solution - 1 Theorem Soit un jeu à n joueurs G = [N, {S i }, {u i }]. Si ce jeu admet un équilibre en stratégies strictement dominantes (s 1,..., s i,..., s n) alors cette solution correspond à l unique équilibre de Nash. Theorem Soit un jeu à n joueurs G = [N, {S i }, {u i }]. Si le processus d élimination itérative des stratégies strictement dominées sélectionne un unique profil de stratégie (s 1,..., s i,..., s n) alors ce profil constitue l unique équilibre de Nash du jeu.
Equilibre de Nash L équilibre de Nash en stratégies pures Equilibre de Nash et autres concepts de solution - 2 Theorem Soit un jeu à n joueurs G = [N, {S i }, {u i }]. Si le profil de stratégies (s 1,..., s i,..., s n) est un équilibre de Nash, alors il survit au processus d élimination itérative des stratégies strictement dominées. Preuve.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Au delà de l EN en stratégies pures Problème de l existence : jeu de la pièce. Se pose dans tous les jeux où les joueurs aimeraient deviner ce que vont faire les adversaires et ce afin d en tirer profit. Incertitude forte pèse sur les stratégies adoptées par les autres. Autoriser les joueurs à Former des croyances non pas sur les actions des adversaires mais sur les probabilités qu ont ces actions d être jouées. Répondre à ces stratégies en jouant ses propres stratégies avec une certaine probabilité.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemples Poker et question de savoir si on doit se "coucher" ou bien relancer quand un joueur mise de manière agressive. Bataille militaire et choix de la tactique de défense. Séance de tirs au but et choix d un côté pour le gardien.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Comment modéliser l incertitude? Afin de rendre compte de cette incertitude : Stratégie mixte Raisonnement sur les stratégies pures Différentes actions que pouvaient entreprendre les joueurs. Les stratégies mixtes sont des distributions de probabilités sur l ensemble des stratégies pures. Exemple. Le jeu de la pièce.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Stratégies mixtes Definition Etant donné l ensemble fini des M stratégies pures du joueur i, S i = {s i1,..., s im,..., s im }, une stratégie mixte σ i : S i [0, 1] assigne à chaque stratégie pure s im S i une probabilité σ i (s im ) 0 d être jouée avec M m=1 σ i(s im ) = 1. Généralisation : N importe quelle stratégie pure peut être représentée par une stratégie mixte où la distribution de probabilité est dégénérée.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Stratégie mixte et stratégie dominée Démonstration du caractère strictement dominé d une stratégie : "extension" aux stratégies mixtes. Dans un jeu où le joueur i ne peut former aucune croyance selon laquelle il serait optimal de jouer s i (JMR), alors il existe une autre stratégie qui domine strictement s i. Exemple. Aucune SP ne domine strictement une autre SP. Mais, il existe des stratégies mixtes qui dominent strictement B.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Equilibre de Nash en stratégies mixtes Soit (S i ) l ensemble des stratégies mixtes du joueur i : σ i (S i ) Definition Un profil de stratégies mixtes σ = (σ 1,..., σ i,..., σ n) constitue un équilibre de Nash du jeu G = [N, { (S i )}, {u i }] si pour tout i, U i (σ i, σ i ) U i(σ i, σ i ) pour tout σ i (S i ). Raisonnement non plus sur l utilité, u i mais, sur l espérance d utilité, U i.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Equilibre de Nash en stratégies mixtes - 2 Extension naturelle de la définition de l équilibre en stratégies pures. Le profil de stratégies mixtes σ est un EN si pour tout i σi MR aux stratégies mixtes jouées par les autres, σ i. est une Espérance d utilité : Cas à 2 joueurs avec S 1 = {s 11,..., s 1m,..., s 1M }, S 2 = {s 21,..., s 2k,..., s 2K }, σ 1 = (σ 11,..., σ 1m,..., σ 1M ), σ 2 = (σ 21,..., σ 2k,..., σ 2K ) : M K U 1 (σ 1, σ 2 ) = σ 1m σ 2k u 1 (s 1m, s 2k ) m=1 k=1
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS Soit σ H = (σ HC, σ HR ), une stratégie mixte quelconque de H, Avec σ HC la probabilité que H joue C et σ HR la probabilité qu il joue R. Soit σ F = (σ FC, σ FR ) une stratégie mixte quelconque de F. Résultats possibles (en SP) et les probabilités associées : (C, C) avec la probabilité σ HC σ FC (C, R) avec la probabilité σ HC (1 σ FC ) (R, C) avec la probabilité (1 σ HC )σ FC (R, R) avec la probabilité (1 σ HC )(1 σ FC )
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS Soit σ H = (σ HC, σ HR ), une stratégie mixte quelconque de H, Avec σ HC la probabilité que H joue C et σ HR la probabilité qu il joue R. Soit σ F = (σ FC, σ FR ) une stratégie mixte quelconque de F. Résultats possibles (en SP) et les probabilités associées : (C, C) avec la probabilité σ HC σ FC (C, R) avec la probabilité σ HC (1 σ FC ) (R, C) avec la probabilité (1 σ HC )σ FC (R, R) avec la probabilité (1 σ HC )(1 σ FC )
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS Soit σ H = (σ HC, σ HR ), une stratégie mixte quelconque de H, Avec σ HC la probabilité que H joue C et σ HR la probabilité qu il joue R. Soit σ F = (σ FC, σ FR ) une stratégie mixte quelconque de F. Résultats possibles (en SP) et les probabilités associées : (C, C) avec la probabilité σ HC σ FC (C, R) avec la probabilité σ HC (1 σ FC ) (R, C) avec la probabilité (1 σ HC )σ FC (R, R) avec la probabilité (1 σ HC )(1 σ FC )
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS - 2 Calcul de l utilité espérée de F pour le profil de SM σ = (σ F, σ H ) : U F (σ F, σ H ) = σ HC σ FC u F (C, C) + σ HC (1 σ FC )u F (C, R) + +(1 σ HC )σ FC u F (R, C) + (1 σ HC )(1 σ FC )u F (R, R) Soit, en remplaçant par les valeurs, U F (σ F, σ H ) = U F (σ FC, σ HC ) = σ FC (3σ HC 1) + 1 σ HC Objectif de chaque joueur, ici F : maximiser son utilité espérée max U F (σ FC, σ HC ) σ FC [0,1] Rq. Problème d optimisation linéaire dans la stratégie.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS - 3 Si 3σ HC 1 > (<)0 σ HC > (<)1/3 alors U F est strictement (dé)croissante en σ FC. F choisira sa MR σ FC = 1(= 0) càd jouer C(R). Si 3σ HC 1 = 0 σ HC = 1/3 alors U F est indépendante de σ FC. F est indifférente entre toutes ses SM (et SP) et choisira n importe quel σ FC [0, 1].
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS - 3 Si 3σ HC 1 > (<)0 σ HC > (<)1/3 alors U F est strictement (dé)croissante en σ FC. F choisira sa MR σ FC = 1(= 0) càd jouer C(R). Si 3σ HC 1 = 0 σ HC = 1/3 alors U F est indépendante de σ FC. F est indifférente entre toutes ses SM (et SP) et choisira n importe quel σ FC [0, 1].
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS - 4 La correspondance de meilleure réponse de F : 0 si σ HC < 1/3 σ FC (σ HC ) = [0, 1] si σ HC = 1/3 1 si σ HC > 1/3 Rq. Pas une fonction car à une valeur de σ HC peut correspondre plusieurs valeurs (infinité) de σ FC.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Exemple : la BDS - 5 Même exercice pour le joueur H. Son objectif : max σ HC [0,1] U H(σ HC, σ FC ) = σ HC (3σ FC 2) + 2 σ FC Définition de la correspondance de MR de H et représentation graphique : 0 si σ FC < 2/3 σ HC (σ FC ) = [0, 1] si σ FC = 2/3 1 si σ FC > 2/3
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Détermination de l EN en stratégies mixtes EN(s) du jeu : intersection(s) des correspondances de MR. Cohérence mutuelle des croyances (et des MR). Représentation graphique dans l espace (σ HC, σ FC ). Ici, 3 intersections : (σ HC, σ FC ) = (0, 0) : premier ENSP (R, R) (σ HC, σ FC ) = (1, 1) : second ENSP (C, C). (σ HC, σ FC ) = (1/3, 2/3) : ENSM non dégénérées.
Equilibre de Nash Equilibre de Nash en Stratégies mixtes Remarque Recherche de la stratégie mixte du joueur H telle que F est indifférente entre ses stratégies parce que toutes lui donnent le même paiement espéré. Puis, recherche de la stratégie mixte de F telle que M indifférent entre ses propres stratégies. Pas un hasard! Cette indifférence entre les stratégies jouées à l ENSM avec une probabilité positive est la caractéristique de ces équilibres. Rq. Recherche de l équilibre pour M, K > 2.
Equilibre de Nash Existence de l équilibre de Nash Remarques Dans n importe quel jeu fini, l EN se trouve à l intersection des correspondances de MR. Même lorsqu il y a plus de 2 joueurs et que ces joueurs disposent de plus de 2 stratégies. Evidemment la représentation n est possible que dans les cas simples à 2 joueurs et 2(3) stratégies.
Equilibre de Nash Existence de l équilibre de Nash Théorème d existences : Nash (1950) et Glicksberg (1952) Theorem Dans le jeu à n joueurs [N, { (S i )}, {u i }], si n est fini et si les S i sont finis pour tout i, alors il existe au moins un équilibre de Nash, constitué éventuellement de stratégies mixtes. Theorem Un jeu G = [N, { (S i )}, {u i }], admet au moins un équilibre de Nash en stratégies mixtes si, pour tout i : S i est un sous ensemble (non vide) compact de R m. u i est une fonction continue. Intuition graphique du fait que dans n importe quel jeu à 2 joueurs avec 2 stratégies, il existe un EN.
Jeux à somme nulle et stratégies prudentes Jeux à deux joueurs, à somme nulle Les intérêts des joueurs sont diamétralement opposés. Ce que l un gagne, l autre perd : pour tout (s 1, s 2 ) S 1 S 2, u 1 (s 1, s 2 ) + u 2 (s 1, s 2 ) = 0 u 2 (s 1, s 2 ) = u 1 (s 1, s 2 ) Definition Un jeu à deux joueurs et à somme nulle est la donnée du triplet G = (S 1, S 2, u) où les S i sont les ensembles de stratégies des deux joueurs et u(s 1, s 2 ) est le gain résultant du profil de stratégies (s 1, s 2 ) pour le joueur 1. Cela correspond aussi à la perte subie par l autre joueur. Rq. Jeux à somme constante : u 1 (s 1, s 2 ) + u 2 (s 1, s 2 ) = c
Jeux à somme nulle et stratégies prudentes Stratégie prudentes Le joueur 1 cherche à maximiser u, l autre à la minimiser. Hypothèse comportementale raisonnable, pour J1 : Envisager la pire des situations, Choisir une stratégie qui donne le meilleur paiement possible dans le pire des contextes. Par symétrie, pour J2 : Envisager la meilleure des situations pour son adversaire, Choisir la stratégie qui garantit le gain minimum à J1 (donc la perte maximum à J2). Stratégies prudentes. Exemples.
Jeux à somme nulle et stratégies prudentes Définitions Pour le joueur 1, le niveau de gain sécurisé (gain minimum qu il peut s assurer) : α 1 = max s1 S 1 [min s2 S 2 u(s 1, s 2 )]. Une stratégie s1 pour le joueur 1 est dite prudente si elle réalise ce gain sécurisé : α 1 = min s2 S 2 u(s1, s 2) Stratégie maximin. Pour le joueur 2, le niveau de gain sécurisé (perte maximum qu il peut s assurer) : α 2 = min s2 S 2 [max s1 S 1 u(s 1, s 2 )]. Une stratégie s2 pour le joueur 2 est dite prudente si elle réalise ce gain sécurisé : α 2 = max s1 S 1 u(s 1, s2 ) Stratégie minimax.
Jeux à somme nulle et stratégies prudentes Valeur du jeu, stratégies optimales Pour tous les jeux à deux joueurs et à somme nulle, α 1 α 2. Si α 1 = α 2 = α, alors α est appelée valeur du jeu. Un jeu à deux joueurs et à somme nulle possède un équilibre si et seulement si il a une valeur. Le profil de stratégies d équilibre correspond à (s 1, s 2 ) : stratégies optimales. Cet équilibre est un point selle de la fonction de paiement : Pour tout s 1 S 1 et tout s 2 S 2, u(s 1, s 2 ) u(s 1, s 2 ) u(s 1, s 2) Rq. stratégies pures vs. mixtes ; jeu sans valeur & multiplicité de stratégies.
Jeux à somme nulle et stratégies prudentes Jeu du duel au pistolet (bruyant)
Applications Application 1. La malédiction des ressources Pourquoi les pays riches en ressources naturelles sont généralement plus pauvres et ont des taux de croissance plus faibles que les autres? Article de K. Wick et E. Bulte (2006, Public Choice, vol. 128) Contesting Resources : Rent Seeking, Conflict, and the Natural Resource Curse Argument : Pays composés de groupes (ethniques, religieux) qui gaspillent des ressources économiques pour s approprier la richesse générée par les ressources naturelles.
Applications Description du problème Economie formée de deux groupes rivaux i = 1, 2 de taille E i. Le leader choisit l allocation de ses ressources entre : Production (W i ) et, Lutte pour le contrôle des (revenus) ressources naturelles (F i ). Sous la contrainte E i = W i + F i. Paiement de la production (rendements constants) : π iw = AW i. Paiement espéré de la lutte : π if = p i (F i, F j )R, i, j = 1, 2, i j. R : Revenus générés par les ressources naturelles dans l économie. p i : Fonction de succès de la contestation i.e., part des ressources obtenue pour (F i, F j ).
Applications Résolution du jeu de contestation - 1 1/ Supposez que les 2 groupes contestent la ressource. L objectif est de maximiser le profit espéré : max π i = AW i + p i (F i, F j )R, F i,w i sous la contrainte E i = W i + F i (0 < F i, W i < E i ) et étant donné : p i (F i, F j ) = F m i F m i + F m j, où m > 2 mesure la facilité de l accès aux ressources. Détermination de l équilibre de Nash du jeu de contestation en stratégies pures.
Applications Résolution du jeu de contestation - 2 2/ Considérez à présent l étape préalable où chaque groupe doit décider ou pas de contester la ressource. Deux stratégies possibles : P (paix) et C (contestation) Les joueurs connaissent les paiements du jeu précédent, obtenus quand les 2 contestent. Si un seul des deux joueurs (i) conteste, les paiements sont π i = A(E i ɛ) + R avec ɛ 0 et π j = AE j. Si les 2 optent pour la paix : π i = AE i, i = 1, 2. Trouver les équilibres de Nash de ce jeu.
Applications Application 2. Le duopole de Cournot (1838) A. Cournot a anticipé la définition de l EN de plus d un siècle. Mais dans le cas particulier du duopole. Une des applications économiques les plus connues de la TDJ car travail fondateur de l économie industrielle. Version très simple ici pour comprendre : Comment représenter ce jeu particulier sous la forme normale. Comment on parvient à la détermination de l EN.
Applications Enoncé du problème Soient q 1 et q 2 les quantités d un bien homogène produites respectivement par la firme 1 et la firme 2. La demande de marché est décrite par la fonction de demande inverse : { a bq si Q < a p(q) = b 0 si Q a b avec Q = q 1 + q 2 à l équilibre du marché. Les coûts de production sont quadratiques dans la quantité produite : c i (q i ) = cq2 i 2 (pas de CF). Concurrence par les quantités : les firmes choisissent les q i simultanément.
Applications Représentation sous forme normale Ensemble des joueurs : 2 firmes {F 1, F 2 }. Ensemble des stratégies : a priori, la F i peut choisir de produire n importe quelle quantité non négative : q i [0, + ) Fonction de gain ou de profit : π i (q i, q i ) = p(q i + q i )q i cq2 i 2 pour i = 1, 2
Applications Applications 3. La tragédie des communs Application à un problème de pollution : émissions de gaz à effet de serre (Helm, 2005). n pays dont l activité de production génère des émissions polluantes, e i. Les profits sont une (même) fonction du niveau d émission : π(e i ) avec π(0) = 0, π (0) > 0 et π (e i ) < 0. La pollution est perçue comme un dommage par l ensemble les pays Le dommage est fonction du niveau total des émissions : c i (e) avec e = j e j, c i (0) = 0, c i (e) > 0 et c i (e) > 0.
Applications Représentation sous forme normale Ensemble de joueurs : n pays {1,..., i,..., n}. Ensemble de stratégies : pour tout i = 1,..., n, E i = [0, + ). Fonction de gain : u i (e i, e) = π(e i ) c i (e). Calcul de l EN et comparaison avec l optimum social. Solution qui découlerait de la coopération entre les pays. Discussion : externalité négative. Application : π(e i ) = ae i (ē e i ), c i (e) = c i ( n j e j ) 2 2