Introduction à la Théorie des Jeux p.1/77
|
|
|
- Francis St-Arnaud
- il y a 10 ans
- Total affichages :
Transcription
1 Introduction à la Théorie des Jeux Sébastien Konieczny CRIL-CNRS Université d Artois - Lens Introduction à la Théorie des Jeux p.1/77
2 Théorie des Jeux Définition La théorie des jeux permet une analyse formelle des problèmes posés par l interaction stratégique d un groupe d agents rationnels poursuivant des buts qui leur sont propres. Introduction à la Théorie des Jeux p.2/77
3 Théorie des Jeux Définition La théorie des jeux permet une analyse formelle des problèmes posés par l interaction stratégique d un groupe d agents rationnels poursuivant des buts qui leur sont propres. groupe interaction stratégique rationnels Introduction à la Théorie des Jeux p.2/77
4 Théorie des Jeux Définition La théorie des jeux permet une analyse formelle des problèmes posés par l interaction stratégique d un groupe d agents rationnels poursuivant des buts qui leur sont propres. groupe interaction stratégique rationnels Normatif vs Descriptif Introduction à la Théorie des Jeux p.2/77
5 A quoi sert la théorie des jeux? Jeux de société (échecs, dames, go,...), Jeux de cartes (bridge, poker,...) Dois-je travailler ou faire semblant? Est-ce que j écoute de la musique ce soir? Enchères, vote Comportement animal Stratégies militaires/économiques Partages de ressource (marchandage) Est-ce qu une entreprise doit exploiter ses salariés? Est-ce qu une entreprise doit entrer sur un marché ou pas? Faut-il contrôler les déclarations d impots sur le revenu?... Introduction à la Théorie des Jeux p.3/77
6 Un peu d histoire... Cournot (1838), Borel (1921) Zermelo (1913) Von Neumann (1928) Theory of Games and Economic Behaviour, Von Neumann et Morgenstern (1944) Nash (1950) Selten (1965), Harsanyi (1967) Introduction à la Théorie des Jeux p.4/77
7 Bibliographie M. Yildizoglu. Introduction à la théorie des jeux. Dunod D. Kreps. Théorie des jeux et modélisation économique. Dunod D. Luce, H. Raiffa. Games and Decision. Wiley P. K. Dutta. Strategies and Games. MIT Press D. Fudenberg, J. Tirole. Game Theory. MIT Press J. Von Neumann, O. Morgenstern. Theory of Game and Economic Behavior. Princeton University Press Introduction à la Théorie des Jeux p.5/77
8 Terminologie - Une petite taxonomie... Jeux à somme nulle (strictement compétitifs) / Jeux à somme non-nulle Jeux à information complète / Jeux à information incomplète Jeux à information parfaite / Jeux à information imparfaite Jeux coopératifs / Jeux non-coopératifs Jeux à 2 joueurs / Jeux à n joueurs Introduction à la Théorie des Jeux p.6/77
9 Plan du cours Introduction - Formalisation d un jeu - Jeu sous forme normale - Jeu sous forme extensive - Stratégie Concepts de solution - Stratégies dominantes Equilibre de Nash - Critère de Pareto - Niveau de sécurité - Stratégies mixtes Résolution par chainage arrière - Menaces crédibles - Equilibres parfaits en sous-jeux Jeux à somme nulle Jeux répétés - Dilemme itéré du prisonnier Jeux à information incomplète Jeux coopératifs - Marchandage Introduction à la Théorie des Jeux p.7/77
10 Formalisation d un Jeu Qu est-ce qu un jeu? Qui? Joueurs Quoi? Coups (actions/choix) - Stratégies Quand? Déroulement du jeu Combien? Que rapporte chaque issue aux différents joueurs? Autres informations importantes: Information Répétition Introduction à la Théorie des Jeux p.8/77
11 Jeux sous forme stratégique - Exemple Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Introduction à la Théorie des Jeux p.9/77
12 Utilité Une hypothèse de base de la théorie des jeux est de considérer que les agents sont rationnels, c est-à-dire qu ils tentent d arriver à la situation la meilleure pour eux. On appelle Utilité la mesure de chaque situation aux yeux de l agent. L Utilité n est ni une mesure du gain matériel, monétaire, etc. mais une mesure subjective du contentement de l agent. Introduction à la Théorie des Jeux p.10/77
13 Utilité Une hypothèse de base de la théorie des jeux est de considérer que les agents sont rationnels, c est-à-dire qu ils tentent d arriver à la situation la meilleure pour eux. On appelle Utilité la mesure de chaque situation aux yeux de l agent. L Utilité n est ni une mesure du gain matériel, monétaire, etc. mais une mesure subjective du contentement de l agent. Utiliser une fonction d utilité pour définir les préférences de l agent ne suppose pas que l agent utilise cette fonction, mais qu il raisonne conformément à un ensemble de conditions de rationalité. Von Neuman et Morgenstern (1944), Savage (1954). Introduction à la Théorie des Jeux p.10/77
14 Jeux sous forme stratégique Un jeu sous forme stratégique est défini par : un ensemble N = {1,..., n} de joueurs pour chaque joueur i un ensemble de stratégies S i = {s 1,..., s ni } pour chaque joueur i une fonction de valuation µ i : S 1... S n IR, qui à chaque ensemble de stratégies associe les gains du joueur i. Notations : On notera s un profil de stratégies {s 1,..., s n } où i s i S i. On note s i le profil s des stratégies autres que celles du joueur i : s i = {s 1,..., s i 1, s i+1,..., s n }. On note S l espace des stratégies, ie : S = n i=1s i Introduction à la Théorie des Jeux p.11/77
15 Jeux sous forme extensive - Exemple x 1 y s 2 2 t u v (4,2) (3,1) (2,5) (9,0) Introduction à la Théorie des Jeux p.12/77
16 Jeux sous forme extensive Un jeu sous forme extensive est défini par : un ensemble N = {1,..., n} de joueurs un arbre fini composé de : un ensemble de noeuds {A, B, C,...} représentant les coups un ensemble de branches {x, y, z,...} représentant les alternatives à chaque coup une fonction de nommage qui indique à chaque noeud quel est le joueur qui doit jouer une fonction de valuation qui associe à chaque noeud terminal un vecteur de nombres représentant les gains de chacun des joueurs une partition des noeuds en un ensemble d ensembles d informations représentant les croyances (imparfaites) des joueurs Introduction à la Théorie des Jeux p.13/77
17 Jeux sous forme extensive - Ensemble d informations A x y s B C t u v Joueur 1 Joueur 2 (4,2) (3,1) (2,5) (9,0) Introduction à la Théorie des Jeux p.14/77
18 Jeux sous forme extensive - Ensemble d informations x A y s B C t u v (4,2) (3,1) (2,5) (9,0) Introduction à la Théorie des Jeux p.14/77
19 Jeux sous forme extensive - Ensemble d informations x A y u B C v u v (4,2) (3,1) (2,5) (9,0) Introduction à la Théorie des Jeux p.14/77
20 Jeux sous forme extensive - Ensemble d informations x A y u B C v u v (4,2) (3,1) (2,5) (9,0) Ensembles d information : {A} et {B, C} Coups simultanés Incertitude (croyances) Introduction à la Théorie des Jeux p.14/77
21 Relation entre formes stratégique et extensive A chaque jeu sous forme extensive correspond un jeu sous forme stratégique dans lequel les joueurs choisissent simultanément les stratégies qu ils mettront en oeuvre. En revanche, un jeu sous forme stratégique peut correspondre à plusieurs jeux sous forme extensive différents. Introduction à la Théorie des Jeux p.15/77
22 Relation entre formes stratégique et extensive A chaque jeu sous forme extensive correspond un jeu sous forme stratégique dans lequel les joueurs choisissent simultanément les stratégies qu ils mettront en oeuvre. En revanche, un jeu sous forme stratégique peut correspondre à plusieurs jeux sous forme extensive différents. Une stratégie est la spécification complète du comportement d un joueur dans n importe quelle situation (dans un jeu sous forme extensive cela signifie donc pour chaque ensemble d information où c est à ce joueur de jouer). Algorithme Introduction à la Théorie des Jeux p.15/77
23 Stratégie Une stratégie pure du joueur i est un plan d action qui prescrit une action de ce joueur pour chaque fois qu il est susceptible de jouer. On note par S i l ensemble des stratégies pures du joueur i et par s i une stratégie pure de ce joueur. Introduction à la Théorie des Jeux p.16/77
24 Relation entre formes stratégique et extensive Joueur 2 Forme stratégique : Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Introduction à la Théorie des Jeux p.17/77
25 Relation entre formes stratégique et extensive Joueur 2 Forme stratégique : Joueur 1 u v x 4,2 3,1 y 2,5 9,0 x A y Forme extensive : u B C v u v (4,2) (3,1) (2,5) (9,0) Introduction à la Théorie des Jeux p.18/77
26 Relation entre formes stratégique et extensive Joueur 2 Forme stratégique : Joueur 1 s1 s2 s3 s4 x 4,2 4,2 3,1 3,1 y 2,5 9,0 2,5 9,0 x A y Forme extensive : u B C v u v (4,2) (3,1) (2,5) (9,0) s1: u si x, u si y s2: u si x, v si y s3: v si x, u si y s4: v si x, v si y Introduction à la Théorie des Jeux p.19/77
27 Elimination de stratégies dominées Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Introduction à la Théorie des Jeux p.20/77
28 Elimination de stratégies dominées Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Introduction à la Théorie des Jeux p.20/77
29 Elimination de stratégies dominées Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Introduction à la Théorie des Jeux p.20/77
30 Elimination de stratégies dominées Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Une stratégie s i est (strictement) dominée pour le joueur i si il existe une stratégie s i telle que pour tous les profils s i µ i (s i, s i ) > µ i (s i, s i ) Introduction à la Théorie des Jeux p.20/77
31 Elimination de stratégies dominées Joueur 2 Joueur 1 u v x 4,2 3,1 y 2,5 9,0 Une stratégie s i est faiblement dominée pour le joueur i si il existe une stratégie s i telle que pour tous les profils s i µ i (s i, s i ) µ i (s i, s i ) Introduction à la Théorie des Jeux p.20/77
32 Elimination de stratégies dominées Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Introduction à la Théorie des Jeux p.21/77
33 Elimination de stratégies dominées Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Introduction à la Théorie des Jeux p.21/77
34 Elimination de stratégies dominées Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Introduction à la Théorie des Jeux p.21/77
35 Elimination de stratégies dominées Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,2 Introduction à la Théorie des Jeux p.21/77
36 Elimination de stratégies dominées Joueur 2 Joueur 1 u v w x 3,6 7,1 4,8 y 5,1 8,2 6,1 z 6,0 6,2 3,3 Introduction à la Théorie des Jeux p.21/77
37 Elimination de stratégies dominées Un jeu est dit résolvable par élimination itérative des stratégies dominées, si on obtient un unique profil en éliminant successivement des stratégies (strictement) dominées. Les profils obtenus aprés élimination itérative des stratégies (strictement) dominées (EISD) ne dépendent pas de l ordre choisi pour l élimination des stratégies. Par contre, on peut obtenir des profils différents lorsque l on choisit des ordres différents pour l élimination itérative de stratégies faiblement dominées (EISfD). Les résultats obtenus par EISD sont donc plus robustes que ceux obtenus par EISfD. Problème majeur de cette méthode: tous les jeux ne sont pas résolvable par EISD! Introduction à la Théorie des Jeux p.22/77
38 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 Introduction à la Théorie des Jeux p.23/77
39 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 Introduction à la Théorie des Jeux p.23/77
40 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 Introduction à la Théorie des Jeux p.23/77
41 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 Introduction à la Théorie des Jeux p.23/77
42 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 Introduction à la Théorie des Jeux p.23/77
43 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 Introduction à la Théorie des Jeux p.23/77
44 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 Introduction à la Théorie des Jeux p.23/77
45 Equilibre de Nash Joueur 2 Joueur 1 u v w x 3,0 0,2 0,3 y 2,0 1,1 2,0 z 0,3 0,2 3,0 La notion d équilibre de Nash est une situation telle qu aucun joueur n a intérêt à dévier (seul) de la situation obtenue. Un équilibre de Nash est un profil de stratégies s = {s 1,..., s n} tel que pour tout joueur i, pour toute stratégie s S i : µ i (s 1, s i) µ i (s, s i) Introduction à la Théorie des Jeux p.23/77
46 Equilibre de Nash et fonction de meilleure réponse La fonction de meilleure réponse du joueur i est la fonction B i qui associe à chaque combinaison de stratégies des autres joueurs s i les stratégies du joueur i qui maximise son utilité: B i (s i ) = {s i S i t.q. µ i (s i, s i ) µ i (s i, s i ) pour tout s i S i } Introduction à la Théorie des Jeux p.24/77
47 Equilibre de Nash et fonction de meilleure réponse La fonction de meilleure réponse du joueur i est la fonction B i qui associe à chaque combinaison de stratégies des autres joueurs s i les stratégies du joueur i qui maximise son utilité: B i (s i ) = {s i S i t.q. µ i (s i, s i ) µ i (s i, s i ) pour tout s i S i } Un équilibre de Nash est un profil s tel que la stratégie du joueur i est une meilleure réponse: s i B i (s i) pour tout i N Introduction à la Théorie des Jeux p.24/77
48 Equilibre de Nash: Propriétés Un profil (unique) obtenu par élimination itérative de stratégies (strictement) dominées (EISD) est un équilibre de Nash (et c est le seul équilibre du jeu). Introduction à la Théorie des Jeux p.25/77
49 Equilibre de Nash: Propriétés Un profil (unique) obtenu par élimination itérative de stratégies (strictement) dominées (EISD) est un équilibre de Nash (et c est le seul équilibre du jeu). Un jeu (en stratégies pures) peut avoir plusieurs équilibres de Nash, mais il peut aussi n en avoir aucun! Introduction à la Théorie des Jeux p.25/77
50 Equilibre de Nash: Propriétés Un profil (unique) obtenu par élimination itérative de stratégies (strictement) dominées (EISD) est un équilibre de Nash (et c est le seul équilibre du jeu). Un jeu (en stratégies pures) peut avoir plusieurs équilibres de Nash, mais il peut aussi n en avoir aucun! Question: comment choisir un équilibre particulier lorsqu il y en a plusieurs? Introduction à la Théorie des Jeux p.25/77
51 Equilibre de Nash: Propriétés Un profil (unique) obtenu par élimination itérative de stratégies (strictement) dominées (EISD) est un équilibre de Nash (et c est le seul équilibre du jeu). Un jeu (en stratégies pures) peut avoir plusieurs équilibres de Nash, mais il peut aussi n en avoir aucun! Question: comment choisir un équilibre particulier lorsqu il y en a plusieurs? Deux équilibres de Nash s = (s i, s i) et s = (s i, s i) sont interchangeables si pour tout i (s i, s i) et (s i, s i) sont aussi des équilibres de Nash. Introduction à la Théorie des Jeux p.25/77
52 Equilibre de Nash: Propriétés Un profil (unique) obtenu par élimination itérative de stratégies (strictement) dominées (EISD) est un équilibre de Nash (et c est le seul équilibre du jeu). Un jeu (en stratégies pures) peut avoir plusieurs équilibres de Nash, mais il peut aussi n en avoir aucun! Question: comment choisir un équilibre particulier lorsqu il y en a plusieurs? Deux équilibres de Nash s = (s i, s i) et s = (s i, s i) sont interchangeables si pour tout i (s i, s i) et (s i, s i) sont aussi des équilibres de Nash. Deux équilibres de Nash s et s sont équivalents si ils donnent la même utilité à tous les joueurs, i.e. pour tout i N µ i (s ) = µ i (s ). Introduction à la Théorie des Jeux p.25/77
53 Critère de Pareto Joueur 2 Joueur 1 u v x 4,4 3,1 y 2,3 7,5 Introduction à la Théorie des Jeux p.26/77
54 Critère de Pareto Joueur 2 Joueur 1 u v x 4,4 3,1 y 2,3 7,5 Un profil s domine un profil s au sens de Pareto si il est au moins aussi bon pour tous les joueurs et si s est strictement meilleur pour au moins l un d entre eux, i.e. pour tout s i s et s i s on a s i s i et il existe s j s et s j s tel que s j > s j. Introduction à la Théorie des Jeux p.26/77
55 Critère de Pareto Joueur 2 Joueur 1 u v x 4,4 3,1 y 2,3 7,5 Un profil s domine un profil s au sens de Pareto si il est au moins aussi bon pour tous les joueurs et si s est strictement meilleur pour au moins l un d entre eux, i.e. pour tout s i s et s i s on a s i s i et il existe s j s et s j s tel que s j > s j. Un profil s domine strictement un profil s au sens de Pareto si s est strictement meilleur pour tous les joueurs, i.e. pour tout s i s et s i s on a s i > s i. Introduction à la Théorie des Jeux p.26/77
56 Critère de Pareto vs niveau de sécurité Joueur 2 Joueur 1 u v x 9,9 0,8 y 8,0 7,7 Introduction à la Théorie des Jeux p.27/77
57 Critère de Pareto vs niveau de sécurité Joueur 2 Joueur 1 u v x 9,9 0,8 y 8,0 7,7 On définit le niveau de sécurité d une stratégie s i pour le joueur i comme le gain minimum que peut apporter cette stratégie quel que soit le choix des autres joueurs, soit min s i µ i (s i, s i ) On définit le niveau de sécurité d un joueur i comme le niveau de sécurité maximal des stratégies de i. Introduction à la Théorie des Jeux p.27/77
58 Points focaux Le problème posé par la multiplicité d équilibres de Nash est un problème de coordination. Pour certains jeux, certains équilibres semblent plus évidents que d autres aux joueurs. Cela est du à certaines conventions sociales. Ces équilibres de Nash obtenus à partir de ces conventions sont appelés points focaux. Introduction à la Théorie des Jeux p.28/77
59 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Introduction à la Théorie des Jeux p.29/77
60 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Sur cet exemple le niveau de sécurité des deux joueurs est 0. Introduction à la Théorie des Jeux p.29/77
61 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Sur cet exemple le niveau de sécurité des deux joueurs est 0. Supposons que le joueur 1 joue aléatoirement f et c avec une probabilité de 1/2 µ 1 (< (f, 1/2), (c, 1/2) >, f) = 1/ /2 0 = 1 µ 1 (< (f, 1/2), (c, 1/2) >, c) = 1/ /2 1 = 1/2 Introduction à la Théorie des Jeux p.29/77
62 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Sur cet exemple le niveau de sécurité des deux joueurs est 0. Supposons que le joueur 1 joue aléatoirement f et c avec une probabilité de 1/2 µ 1 (< (f, 1/2), (c, 1/2) >, f) = 1/ /2 0 = 1 µ 1 (< (f, 1/2), (c, 1/2) >, c) = 1/ /2 1 = 1/2 Avec cette stratégie le niveau de sécurité du joueur 1 est 1/2 Introduction à la Théorie des Jeux p.29/77
63 Stratégies pures - Stratégies mixtes Les stratégies que nous avons définies et utilisées pour le moment sont des stratégies pures, c est-à-dire les options qui se présentent aux joueurs. Une stratégie mixte σ i est une distribution de probabilité sur l ensemble des stratégies pures. L ensemble des stratégies mixtes d un joueur i se note Σ i. L ensemble des stratégies pures utilisées (i.e. dont la probabilité n est pas nulle) par une stratégie mixte σ i est appelé le support de la stratégie mixte. Notons p i (s k ) la probabilité associée à s k par σ i, l utilité d un profil de stratégies mixtes σ est définie par : µ i (σ) = X s S( ny p j (s j ))µ i (s) j=1 Introduction à la Théorie des Jeux p.30/77
64 Stratégie Une stratégie pure du joueur i est un plan d action qui prescrit une action de ce joueur pour chaque fois qu il est susceptible de jouer. On note par S i l ensemble des stratégies pures du joueur i et par s i une stratégie pure de ce joueur. Introduction à la Théorie des Jeux p.31/77
65 Stratégie Une stratégie pure du joueur i est un plan d action qui prescrit une action de ce joueur pour chaque fois qu il est susceptible de jouer. On note par S i l ensemble des stratégies pures du joueur i et par s i une stratégie pure de ce joueur. Une stratégie mixte du joueur i est une distribution de probabilités p i définie sur l ensemble des stratégies pures du joueur i. On note Σ i l ensemble des stratégies mixtes du joueur i et par σ i une stratégie mixte de ce joueur. Introduction à la Théorie des Jeux p.31/77
66 Stratégie Une stratégie pure du joueur i est un plan d action qui prescrit une action de ce joueur pour chaque fois qu il est susceptible de jouer. On note par S i l ensemble des stratégies pures du joueur i et par s i une stratégie pure de ce joueur. Une stratégie mixte du joueur i est une distribution de probabilités p i définie sur l ensemble des stratégies pures du joueur i. On note Σ i l ensemble des stratégies mixtes du joueur i et par σ i une stratégie mixte de ce joueur. Une stratégie locale du joueur i en un ensemble d information A est une distribution de probabilités sur l ensemble des actions disponibles en cet ensemble d information. On note Π ia l ensemble des stratégies locales du joueur i pour l ensemble d information A et π ia une stratégie locale de ce joueur en A. Une stratégie comportementale du joueur i est un vecteur de stratégies locales de ce joueur, contenant une stratégie locale par ensemble d information de ce joueur. On note Π i l ensemble des stratégies comportementales du joueur i, et π i une stratégie comportementale de ce joueur. Introduction à la Théorie des Jeux p.31/77
67 Equilibres de Nash en stratégies mixtes Définition Un équilibre de Nash en stratégies mixtes est un profil de stratégies mixtes σ Σ tel que pour tout i et tout σ i Σ i µ i (σ i, σ i) µ i (σ i, σ i) Introduction à la Théorie des Jeux p.32/77
68 Equilibres de Nash en stratégies mixtes Définition Un équilibre de Nash en stratégies mixtes est un profil de stratégies mixtes σ Σ tel que pour tout i et tout σ i Σ i µ i (σ i, σ i) µ i (σ i, σ i) Théorème. σ est un équilibre de Nash si et seulement si pour tout i et tout s i S i µ i (σ i, σ i) µ i (s i, σ i) Introduction à la Théorie des Jeux p.32/77
69 Equilibres de Nash en stratégies mixtes Définition Un équilibre de Nash en stratégies mixtes est un profil de stratégies mixtes σ Σ tel que pour tout i et tout σ i Σ i µ i (σ i, σ i) µ i (σ i, σ i) Théorème. σ est un équilibre de Nash si et seulement si pour tout i et tout s i S i µ i (σ i, σ i) µ i (s i, σ i) Théorème.[Nash, 1950] Tout jeu sous forme stratégique a un équilibre de Nash en stratégies mixtes. Introduction à la Théorie des Jeux p.32/77
70 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de sécurité? Introduction à la Théorie des Jeux p.33/77
71 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de sécurité? µ 1 (< (f, x), (c, 1 x) >, f) = x 2 + (1 x) 0 = 2x µ 1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1 x Introduction à la Théorie des Jeux p.33/77
72 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de sécurité? µ 1 (< (f, x), (c, 1 x) >, f) = x 2 + (1 x) 0 = 2x µ 1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1 x max x min(2x, 1 x) = 1/3 Introduction à la Théorie des Jeux p.33/77
73 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de sécurité? µ 1 (< (f, x), (c, 1 x) >, f) = x 2 + (1 x) 0 = 2x µ 1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1 x max x min(2x, 1 x) = 1/3 Le niveau de sécurité du joueur 1 est donc de 2/3. Introduction à la Théorie des Jeux p.33/77
74 La guerre des sexes Joueur 2 Joueur 1 f c f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de sécurité? µ 1 (< (f, x), (c, 1 x) >, f) = x 2 + (1 x) 0 = 2x µ 1 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 1 = 1 x max x min(2x, 1 x) = 1/3 Le niveau de sécurité du joueur 1 est donc de 2/3. Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cette stratégie? Introduction à la Théorie des Jeux p.33/77
75 Représentation graphique du jeu µ 1 2 2x 1 0 1/3 2/3 1 x Introduction à la Théorie des Jeux p.34/77
76 Représentation graphique du jeu µ /3 2/3 1 x 1 x Introduction à la Théorie des Jeux p.34/77
77 Représentation graphique du jeu µ 1 2 2x 1 0 1/3 2/3 1 x 1 x Introduction à la Théorie des Jeux p.34/77
78 La guerre des sexes Joueur 2 Joueur 1 y f 1 y c f 2,1 0,0 c 0,0 1,2 Soit y la probabilité avec laquelle le joueur 2 joue f, quelle est la meilleure réponse du joueur 1? Introduction à la Théorie des Jeux p.35/77
79 La guerre des sexes Joueur 2 Joueur 1 y f 1 y c f 2,1 0,0 c 0,0 1,2 Soit y la probabilité avec laquelle le joueur 2 joue f, quelle est la meilleure réponse du joueur 1? µ 1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y µ 1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y Introduction à la Théorie des Jeux p.35/77
80 La guerre des sexes Joueur 2 Joueur 1 y f 1 y c f 2,1 0,0 c 0,0 1,2 Soit y la probabilité avec laquelle le joueur 2 joue f, quelle est la meilleure réponse du joueur 1? µ 1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 = 2y Donc: µ 1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y Si 2y > 1 y (y > 1/3), la meilleure réponse du joueur 1 est de jouer f Si 2y < 1 y (y < 1/3), la meilleure réponse du joueur 1 est de jouer c Si 2y = 1 y (y = 1/3), le joueur 1 est indifférent entre f et c, il peut donc jouer l une ou l autre, ou n importe quelle combinaison des deux. Introduction à la Théorie des Jeux p.35/77
81 La guerre des sexes Joueur 2 y 1 y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, quelle est la meilleure réponse du joueur 2? Introduction à la Théorie des Jeux p.36/77
82 La guerre des sexes Joueur 2 y 1 y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, quelle est la meilleure réponse du joueur 2? µ 2 (< (f, x), (c, 1 x) >, f) = x 1 + (1 x) 0 = x µ 2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x) Introduction à la Théorie des Jeux p.36/77
83 La guerre des sexes Joueur 2 y 1 y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1 x Soit x la probabilité avec laquelle le joueur 1 joue f, quelle est la meilleure réponse du joueur 2? µ 2 (< (f, x), (c, 1 x) >, f) = x 1 + (1 x) 0 = x µ 2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x) Donc: Si x > 2(1 x) (x > 2/3), la meilleure réponse du joueur 2 est de jouer f Si x < 2(1 x) (x < 2/3), la meilleure réponse du joueur 2 est de jouer c Si x = 2(1 x) (x = 2/3), le joueur 2 est indifférent entre f et c, il peut donc jouer l une ou l autre, ou n importe quelle combinaison des deux. Introduction à la Théorie des Jeux p.36/77
84 La guerre des sexes Joueur 2 y 1 y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1 x Les gains des deux joueurs avec un profil en stratégie mixte σ sont donc: µ 1 (σ) = x y 2 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1 = 3xy x y + 1 µ 2 (σ) = x y 1 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2 = 3xy 2x 2y + 2 Introduction à la Théorie des Jeux p.37/77
85 La guerre des sexes Joueur 2 1/3 2/3 Joueur 1 f c f 2,1 0,0 2/3 c 0,0 1,2 1/3 Les gains des deux joueurs avec un profil en stratégie mixte σ sont donc: µ 1 (σ) = 3xy x y + 1 µ 2 (σ) = 3xy 2x 2y + 2 Le profil σ = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un équilibre de Nash en stratégie mixte. Introduction à la Théorie des Jeux p.37/77
86 La guerre des sexes Joueur 2 1/3 2/3 Joueur 1 f c f 2,1 0,0 2/3 c 0,0 1,2 1/3 Les gains des deux joueurs avec un profil en stratégie mixte σ sont donc: µ 1 (σ) = 3xy x y + 1 µ 2 (σ) = 3xy 2x 2y + 2 Le profil σ = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un équilibre de Nash en stratégie mixte. Les gains des deux joueurs avec σ sont : µ 1 (σ ) = 3.2/3.1/3 2/3 1/3 + 1 = 2/3 µ 2 (σ ) = 3.2/3.1/3 2.2/3 2.1/3 + 2 = 2/3 Introduction à la Théorie des Jeux p.37/77
87 Représentation graphique du jeu y 1 2/3 1/3 joueur1 0 1/3 2/3 1 x Introduction à la Théorie des Jeux p.38/77
88 Représentation graphique du jeu y 1 joueur2 2/3 1/3 joueur1 0 1/3 2/3 1 x Introduction à la Théorie des Jeux p.38/77
89 Représentation graphique du jeu y 1 joueur2 2/3 1/3 joueur1 0 1/3 2/3 1 x Introduction à la Théorie des Jeux p.38/77
90 Coopération - Itération - Corrélation Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer? Introduction à la Théorie des Jeux p.39/77
91 Coopération - Itération - Corrélation Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer? µ 1 = µ 2 = 1/ /2 1 = 3/2 Introduction à la Théorie des Jeux p.39/77
92 Coopération - Itération - Corrélation Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer? µ 1 = µ 2 = 1/ /2 1 = 3/2 Lorsque tous les joueurs peuvent observer un même événement aléatoire, ils peuvent alors s accorder sur des équilibres corrélés Une stratégie corrélée est une distribution de probabilités sur les profils possibles. Introduction à la Théorie des Jeux p.39/77
93 Coopération - Itération - Corrélation Joueur 2 Joueur 1 f c f 2,1 0,0 c 0,0 1,2 Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer? µ 1 = µ 2 = 1/ /2 1 = 3/2 Lorsque tous les joueurs peuvent observer un même événement aléatoire, ils peuvent alors s accorder sur des équilibres corrélés Une stratégie corrélée est une distribution de probabilités sur les profils possibles. Que se passe-t-il si la partie est jouée plusieurs fois? Introduction à la Théorie des Jeux p.39/77
94 Itération: Le dilemme des prisonniers... Deux personnes arrêtées ensemble en possession d armes à feu sont soupçonnés d un délit fait en commun. Les policiers les séparent et disent à chacun : Si un des deux avoue et que l autre n avoue rien, le premier est libéré, et le second emprisonné (5 ans); Si les deux avouent, les deux iront en prison (4 ans); Si aucun des deux n avoue, les deux seront seront libérés assez vite (2 ans). Vous êtes un des deux prisonniers, que faites-vous? Introduction à la Théorie des Jeux p.40/77
95 [DIP] Le dilemme des prisonniers Joueur 2 Joueur 1 C D C 3,3 0,5 D 5,0 1,1 Introduction à la Théorie des Jeux p.41/77
96 [DIP] Le dilemme itéré... Vous n avez pas vraiment les mêmes goûts que votre voisin en matière de musique. Il lui arrive souvent d écouter sa musique à fond. De même il vous arrive (en représailles) de mettre votre musique à un volume plus que raisonnable. Ce qui a pour conséquences que le lendemain il recommence à nouveau. En dehors de ces périodes agitées, vous appréciez les périodes où aucun de vous ne gêne l autre. Supposons que l on pondère votre satisfaction : Vous avez une satisfaction de 5 à écouter votre musique à un volume important. La satisfaction est de 0 lorsque votre voisin met sa musique à fond. Une soirée calme, sans musique vous apporte une satisfaction de 3. Le fait d écouter simultanément votre musique mêlée à celle du voisin, donne une satisfaction de 1. Vous savez ce que votre voisin a eu comme comportement les jours précédents, que faites-vous aujourd hui? Introduction à la Théorie des Jeux p.42/77
97 [DIP] Le dilemme... Introduction par FLOOD et DRESHER à la RAND Corp. en 1952 Jeu à somme non-nulle 2 joueurs jouent simultanément 2 choix de jeux : COOPÉRER, i.e. être gentil, on notera C TRAHIR, i.e. être méchant, on notera D Les gains des joueurs, notés S, P, R et T, sont fonction de leur choix de jeu avec : (0) S < P < R < T Introduction à la Théorie des Jeux p.43/77
98 [DIP] Le dilemme itéré... Les joueurs se rencontrent plusieurs fois À chaque itération les joueurs ont connaissance des coups précédents Ils ne connaissent pas le terme du jeu Le gain d un joueur est le cumul de ses gains dans chaque rencontre Pour favoriser la coopération on ajoute la contrainte : (0) S + T < 2R Introduction à la Théorie des Jeux p.44/77
99 [DIP] Dilemme itéré des prisonniers (résumé) Dilemme... S < P < R < T... itéré S + T < 2R Cooperate Defect Cooperate R = 3 Reward récompense pour coopération mutuelle T = 5 Temptation tentation à trahir Defect S = 0 Sucker s payoff salaire de la dupe P = 1 Punishment punition pour la trahison mutuelle Score du joueur de la ligne. Introduction à la Théorie des Jeux p.45/77
100 [DIP] Des applications concrètes... Deux pays doivent-ils lever des taxes douanières sur les produits importés de l autre pays. Deux entreprises concurrentes doivent-elles essayer de s entendre pour se partagé un marché ou se faire concurrence? Deux espèces vivant sur un même territoire doivent-elles cohabiter ou se disputer la nourriture disponible? Introduction à la Théorie des Jeux p.46/77
101 [DIP] Les stratégies Quelques exemples : gentille méchante per_ccd rancunière lunatique majoritaire_gentille majoritaire_méchante donnant_donnant Introduction à la Théorie des Jeux p.47/77
102 [DIP] Exemples (rencontres) score de gentille = 0 jeu de gentille C C C C C C C C C C jeu de méchante D D D D D D D D D D score de méchante = 50 score de per_ccd = 13 jeu de per_ccd C C D C C D C C D C jeu de rancunière C C C D D D D D D D score de rancunière = 33 Introduction à la Théorie des Jeux p.48/77
103 [DIP] Quelle est la meilleure stratégie? qui batte toutes les autres : Introduction à la Théorie des Jeux p.49/77
104 [DIP] Quelle est la meilleure stratégie? qui batte toutes les autres : méchante, car généralisation du dilemme non itéré Introduction à la Théorie des Jeux p.49/77
105 [DIP] Quelle est la meilleure stratégie? qui batte toutes les autres : méchante, car généralisation du dilemme non itéré qui fasse le meilleur score possible face à toutes les autres : Introduction à la Théorie des Jeux p.49/77
106 [DIP] Quelle est la meilleure stratégie? qui batte toutes les autres : méchante, car généralisation du dilemme non itéré qui fasse le meilleur score possible face à toutes les autres : aucune, car meilleure contre méchante et contre rancunière est impossible Introduction à la Théorie des Jeux p.49/77
107 [DIP] Quelle est la meilleure stratégie? qui batte toutes les autres : méchante, car généralisation du dilemme non itéré qui fasse le meilleur score possible face à toutes les autres : aucune, car meilleure contre méchante et contre rancunière est impossible Problème de définition du critère d évaluation des stratégies Introduction à la Théorie des Jeux p.49/77
108 [DIP] Quelle est la meilleure stratégie? Sur des confrontations de 100 parties : Le gain maximal est de 500 points Le gain minimal est de 0 point C est ce qu obtiennent MÉCHANTE et GENTILLE l une contre l autre. Introduction à la Théorie des Jeux p.50/77
109 [DIP] Quelle est la meilleure stratégie? Sur des confrontations de 100 parties : Le gain maximal est de 500 points Le gain minimal est de 0 point C est ce qu obtiennent MÉCHANTE et GENTILLE l une contre l autre. Mais... 2 gentilles entre elles obtiennent chacune 300 points 2 méchantes entre elles obtiennent chacune 100 points Chaque stratégie est bonne (au sens du meilleur score) face à certaines et mauvaises face à d autres car elle ne sait pas à qui elle a affaire. Introduction à la Théorie des Jeux p.50/77
110 [DIP] Les tournois Plusieurs stratégies se rencontrent 2 à 2, comme pour un tournoi sportif Le gain d une stratégie est le cumul de ses scores face à chaque adversaire Toutes les parties ont la même longueur (même nombre d itérations), mais les stratégies ne la connaissent pas et ne peuvent pas le savoir Introduction à la Théorie des Jeux p.51/77
111 [DIP] Exemples (tournoi) gentille méchante per_ccd rancunière gentille méchante per_ccd rancunière Score >< Classement >: 1 méchante 2 rancunière 3 gentille 4 per_ccd Introduction à la Théorie des Jeux p.52/77
112 [DIP] Un tournoi Tournois entre 10 stratégies parmi 12 : gentille méchante lunatique donnant_donnant rancunière per_ddc per_ccd majoritaire_gentille majoritaire_méchante méfiante sondeur donnant_donnant_dur Nombre de tournois joués par chaque stratégie : 55 Donnez le classement du tournoi... Introduction à la Théorie des Jeux p.53/77
113 [DIP] Un tournoi gentille méchante lunatique donnant_donnant rancunière per_ddc per_ccd majoritaire_gentille majoritaire_méchante méfiante sondeur donnant_donnant_dur Scores : donnant_donnant : 42 majoritaire_gentille : 19 rancunière : 4 sondeur : 1 lunatique : 0 méchante : 0 Introduction à la Théorie des Jeux p.54/77
114 [DIP] donnant-donnant : une bonne stratégie Au premier coup je coopère (C), ensuite si mon adversaire a coopéré (C) au coup précédent, je coopère (C), s il a trahi (D), je trahis (D). Introduction à la Théorie des Jeux p.55/77
115 [DIP] donnant-donnant : une bonne stratégie Au premier coup je coopère (C), ensuite si mon adversaire a coopéré (C) au coup précédent, je coopère (C), s il a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne! Introduction à la Théorie des Jeux p.55/77
116 [DIP] donnant-donnant : une bonne stratégie Au premier coup je coopère (C), ensuite si mon adversaire a coopéré (C) au coup précédent, je coopère (C), s il a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne! Au mieux elle fait le même score. Introduction à la Théorie des Jeux p.55/77
117 [DIP] donnant-donnant : une bonne stratégie Au premier coup je coopère (C), ensuite si mon adversaire a coopéré (C) au coup précédent, je coopère (C), s il a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne! Au mieux elle fait le même score. Mais, au pire elle ne perd que 5 points quel que soit l adversaire et la longueur de la partie! Introduction à la Théorie des Jeux p.55/77
118 [DIP] Évolution écologique Simulation de l évolution naturelle : Chaque stratégie est représentée par une population de N entités On effectue un tournoi entre toutes les entités Les entités de faibles stratégies (au sens du classement dans le tournoi) sont défavorisées, celles à stratégie forte sont favorisées La favorisation est réalisée par une redistribution proportionnelle de la population Ce cycle est répété jusqu à stabilisation de la population Introduction à la Théorie des Jeux p.56/77
119 [DIP] Exemples (évolution) spiteful all_c all_d per_ccd Introduction à la Théorie des Jeux p.57/77
120 [DIP] Une morale très morale... Critères de qualité pour une stratégie (en évolution) : [Axelrod,81] Gentillesse Réactivité Pardon Simplicité Introduction à la Théorie des Jeux p.58/77
121 [DIP] Une morale très morale... Critères de qualité pour une stratégie (en évolution) : [Axelrod,81] Gentillesse Réactivité Pardon Simplicité Les bonnes stratégies au dilemme le sont aussi dans les variantes du dilemme (asynchrone, avec renoncement, bruits,... ) Introduction à la Théorie des Jeux p.58/77
122 [DIP] Une morale très morale... Critères de qualité pour une stratégie (en évolution) : [Axelrod,81] Gentillesse Réactivité Pardon Simplicité Les bonnes stratégies au dilemme le sont aussi dans les variantes du dilemme (asynchrone, avec renoncement, bruits,... ) Pour plus de détails sur le dilemme itéré des prisonniers : Introduction à la Théorie des Jeux p.58/77
123 Jeux répétés Soit un jeu G = {S, {µ i } i=1,...,n }, où S est l ensemble (fini) des profils de stratégies et µ i est la fonction d utilité du joueur i. On note (G, T ) le jeu répété obtenu en jouant T fois le jeu de base G. Lorsque le jeu est répété un nombre infini de fois, on note (G, ) le jeu correspondant. Introduction à la Théorie des Jeux p.59/77
124 Jeux répétés Soit un jeu G = {S, {µ i } i=1,...,n }, où S est l ensemble (fini) des profils de stratégies et µ i est la fonction d utilité du joueur i. On note (G, T ) le jeu répété obtenu en jouant T fois le jeu de base G. Lorsque le jeu est répété un nombre infini de fois, on note (G, ) le jeu correspondant. On peut également distinguer les jeux répétés un nombre fini, mais indéfini de fois: à chaque tour, il y a une probabilité 1 q que le jeu s arrête. Introduction à la Théorie des Jeux p.59/77
125 Jeux répétés Soit un jeu G = {S, {µ i } i=1,...,n }, où S est l ensemble (fini) des profils de stratégies et µ i est la fonction d utilité du joueur i. On note (G, T ) le jeu répété obtenu en jouant T fois le jeu de base G. Lorsque le jeu est répété un nombre infini de fois, on note (G, ) le jeu correspondant. On peut également distinguer les jeux répétés un nombre fini, mais indéfini de fois: à chaque tour, il y a une probabilité 1 q que le jeu s arrête. Facteur d actualisation : Lorsqu un jeu est répété, il se peut que les gains obtenus à l itération courante µ t soient plus/moins importants aux yeux de l agent que les gains à l itération suivante µ t+1. Pour modéliser cela on peut utiliser un facteur d actualisation δ. µ t = δµ t+1 Le facteur d actualisation δ = µ t /µ t+1 représente donc l attrait du joueur pour les gains actuels. Introduction à la Théorie des Jeux p.59/77
126 Jeux répétés: Théorème Folk L utilité d un joueur dans un jeu répété est donc: µ i (G, T ) = Σ T t=0δ t µ i (t) Introduction à la Théorie des Jeux p.60/77
127 Jeux répétés: Théorème Folk L utilité d un joueur dans un jeu répété est donc: µ i (G, T ) = Σ T t=0δ t µ i (t) Pour pouvoir comparer le gain dans le cas du jeu répété à celui du jeu de base, on utilise la moyenne des gains du joueur: µ i (G, T )/T Introduction à la Théorie des Jeux p.60/77
128 Jeux répétés: Théorème Folk L utilité d un joueur dans un jeu répété est donc: µ i (G, T ) = Σ T t=0δ t µ i (t) Pour pouvoir comparer le gain dans le cas du jeu répété à celui du jeu de base, on utilise la moyenne des gains du joueur: µ i (G, T )/T Si tµ i (t) = µ, alors µ i (G, ) = 1 1 δ µ Introduction à la Théorie des Jeux p.60/77
129 Jeux répétés: Théorème Folk L utilité d un joueur dans un jeu répété est donc: µ i (G, T ) = Σ T t=0δ t µ i (t) Pour pouvoir comparer le gain dans le cas du jeu répété à celui du jeu de base, on utilise la moyenne des gains du joueur: µ i (G, T )/T Si tµ i (t) = µ, alors µ i (G, ) = 1 1 δ µ Théorème Folk: Soit un jeu répété (G, ) avec un facteur d actualisation δ suffisamment proche de 1 et µ = (µ 1,..., µ 2 ) un vecteur de gains réalisable de ce jeu, alors il existe un équilibre de Nash du jeu répété qui donne µ comme vecteur de gains. Introduction à la Théorie des Jeux p.60/77
130 Jeux répétés: Théorème Folk L utilité d un joueur dans un jeu répété est donc: µ i (G, T ) = Σ T t=0δ t µ i (t) Pour pouvoir comparer le gain dans le cas du jeu répété à celui du jeu de base, on utilise la moyenne des gains du joueur: µ i (G, T )/T Si tµ i (t) = µ, alors µ i (G, ) = 1 1 δ µ Théorème Folk: Soit un jeu répété (G, ) avec un facteur d actualisation δ suffisamment proche de 1 et µ = (µ 1,..., µ 2 ) un vecteur de gains réalisable de ce jeu, alors il existe un équilibre de Nash du jeu répété qui donne µ comme vecteur de gains. L équilibre de Nash en question est un équilibre de Nash parfait en sous-jeux (voir plus loin). Notion de menace crédible. Introduction à la Théorie des Jeux p.60/77
131 Jeux répétés: Théorème Folk L utilité d un joueur dans un jeu répété est donc: µ i (G, T ) = Σ T t=0δ t µ i (t) Pour pouvoir comparer le gain dans le cas du jeu répété à celui du jeu de base, on utilise la moyenne des gains du joueur: µ i (G, T )/T Si tµ i (t) = µ, alors µ i (G, ) = 1 1 δ µ Théorème Folk: Soit un jeu répété (G, ) avec un facteur d actualisation δ suffisamment proche de 1 et µ = (µ 1,..., µ 2 ) un vecteur de gains réalisable de ce jeu, alors il existe un équilibre de Nash du jeu répété qui donne µ comme vecteur de gains. L équilibre de Nash en question est un équilibre de Nash parfait en sous-jeux (voir plus loin). Notion de menace crédible. Ce résultat signifie que l ensemble des équilibres de Nash d un jeu répété est immense: quasiment toute séquence (finie) de jeu correspond à un équilibre de Nash. Introduction à la Théorie des Jeux p.60/77
132 Jeux à deux joueurs à Somme nulle Rôle central le plus simple pas de notion de majorité pas de coalition Introduction à la Théorie des Jeux p.61/77
133 Jeux à deux joueurs à Somme nulle Rôle central le plus simple pas de notion de majorité pas de coalition Strictement Compétitif Les joueurs ont des préférences strictement opposées Pour tout profil de stratégies s, on a µ 1 (s) + µ 2 (s) = a Introduction à la Théorie des Jeux p.61/77
134 Jeux à deux joueurs à Somme nulle Rôle central le plus simple pas de notion de majorité pas de coalition Strictement Compétitif Les joueurs ont des préférences strictement opposées Pour tout profil de stratégies s, on a µ 1 (s) + µ 2 (s) = 0 Introduction à la Théorie des Jeux p.61/77
135 Jeux à deux joueurs à Somme nulle Rôle central le plus simple pas de notion de majorité pas de coalition Strictement Compétitif Les joueurs ont des préférences strictement opposées Pour tout profil de stratégies s, on a µ 1 (s) + µ 2 (s) = 0 Exemples : Jeux de plateau (echecs, dames,...) Guerre... Introduction à la Théorie des Jeux p.61/77
136 Jeux à deux joueurs à somme nulle - Exemple Joueur 2 Joueur 1 y 1 y 2 y 3 y 4 x 1 18,-18 3,-3 0,0 2,-2 x 2 0,0 3,-3 8,-8 20,-20 x 3 5,-5 4,-4 5,-5 5,-5 x 4 9,-9 3,-3 0,0 20,-20 Introduction à la Théorie des Jeux p.62/77
137 Jeux à deux joueurs à somme nulle - Exemple Joueur 2 Joueur 1 y 1 y 2 y 3 y 4 x x x x Introduction à la Théorie des Jeux p.62/77
138 Jeux à deux joueurs à somme nulle - Exemple Joueur 2 Joueur 1 y 1 y 2 y 3 y 4 x x x x Le joueur 1 tente de maximiser son niveau de sécurité v x = max i (min j µ(x i, y j )) Le joueur 2 tente de minimiser le niveau de sécurité du joueur 1 v y = min j (max i µ(x i, y j )) Introduction à la Théorie des Jeux p.62/77
139 Jeux à deux joueurs à somme nulle - Exemple Joueur 2 Joueur 1 y 1 y 2 y 3 y 4 x x x x Le joueur 1 tente de maximiser son niveau de sécurité v x = max i (min j µ(x i, y j )) Le joueur 2 tente de minimiser le niveau de sécurité du joueur 1 v y = min j (max i µ(x i, y j )) Si v x = v y = v, alors tout couple de stratégies (x i, y i ), x i garantissant v au joueur 1 et y i garantissant v au joueur 2 forment un équilibre de Nash et sont des stratégies respectivement maximin et minimax pour les joueurs 1 et 2. Introduction à la Théorie des Jeux p.62/77
140 Jeux sous forme extensive x 1 y z 3 u w 1 y x 2 y x 3 w (3,2,9) u (3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5) w u (4,2,4) (2,3,1) Introduction à la Théorie des Jeux p.63/77
141 Jeux sous forme extensive x 1 y z 3 u w 1 y x 2 y x 3 w (3,2,9) u (3,0,0) 2 (1,0,3) (3,2,2) (2,3,1) (5,5,5) w u (4,2,4) (2,3,1) Récurrence à rebours (backward induction) On commence par chercher les choix optimaux à la dernière période (noeuds terminaux). On remonte l arbre de noeud en noeud, en cherchant à chaque noeud le choix optimal, une fois qu on a pris en compte les choix optimaux pour chaque noeud fils. Introduction à la Théorie des Jeux p.63/77
142 Jeux sous forme extensive Tout jeu (fini) sous forme extensive à information parfaite a un équilibre de Nash en stratégies pures (équilibre obtenable par récurrence à rebours). (Zermelo (1953), Kuhn (1953)) Introduction à la Théorie des Jeux p.64/77
143 Forme extensive - Sous-jeu (2,2) x 1 (3,1) u w y 2 v r 1 s z 2 w (2,-2) (-2,2) (-2,2) (2,-2) z Introduction à la Théorie des Jeux p.65/77
144 Forme extensive - Sous-jeu x 1 y (2,2) u 2 v (3,1) 1 (0,0) Introduction à la Théorie des Jeux p.65/77
145 Forme extensive - Sous-jeu x 1 y (2,2) u 2 v (3,1) 1 (0,0) Un sous-jeu d un jeu sous forme extensive est un jeu composé d un noeud (qui est un ensemble d information singleton), de tous les noeuds successeurs de ce noeud, de tous les arcs reliant ces noeuds, et des utilités associées à tous les noeuds terminaux successeurs. Introduction à la Théorie des Jeux p.65/77
146 Forme extensive - Menaces non crédibles 1 Joueur 2 x y (2,2) u 2 v (3,1) (0,0) Joueur 1 u v x 2,2 2,2 y 3,1 0,0 Introduction à la Théorie des Jeux p.66/77
147 Forme extensive - Menaces non crédibles 1 Joueur 2 x y (2,2) u 2 v (3,1) (0,0) Joueur 1 u v x 2,2 2,2 y 3,1 0,0 l équilibre de Nash xv n est pas crédible car il repose sur la menace non-crédible du joueur 2 de jouer v. Introduction à la Théorie des Jeux p.66/77
148 Equilibre parfait en sous-jeux Un équilibre de Nash d un jeu sous forme extensive est un équilibre parfait en sous-jeux si toute restriction du profil de stratégies à un sousjeu est un équilibre de Nash pour ce sous-jeu. Introduction à la Théorie des Jeux p.67/77
149 Equilibre parfait en sous-jeux Un équilibre de Nash d un jeu sous forme extensive est un équilibre parfait en sous-jeux si toute restriction du profil de stratégies à un sousjeu est un équilibre de Nash pour ce sous-jeu. Pour les jeux à informations parfaites, la notion d équilibre parfait en sous-jeux coïncide avec la notion de récurrence à rebours. Introduction à la Théorie des Jeux p.67/77
150 Promesse non crédible D accord pour travailler 2 1 Exploiter 2 Ne pas exploiter 2 (2,-1) (1,1) Pas d accord pour travailler (0,0) Introduction à la Théorie des Jeux p.68/77
151 Promesse non crédible D accord pour travailler 2 1 Exploiter 2 Ne pas exploiter 2 (2,-1) (1,1) Pas d accord pour travailler (0,0) Réputation Introduction à la Théorie des Jeux p.68/77
152 Le mille-pattes - Limites de la récurrence à rebours (100,100) (1,1) (0,3) (2,2) (98,98) (97,100) (99,99) (98,101) R D r d R D R D r d R D r d Introduction à la Théorie des Jeux p.69/77
153 Limites de la récurrence à rebours Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur 1 choisit d abord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien. Introduction à la Théorie des Jeux p.70/77
154 Limites de la récurrence à rebours Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur 1 choisit d abord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien. Ecrire ce jeu sous forme extensive en ne considérant que les partages (5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2. Introduction à la Théorie des Jeux p.70/77
155 Jeux coopératifs à 2 joueurs Dans les jeux coopératifs on autorise la communication et les accords entre joueurs avant la partie. Tous les messages formulés par un joueur sont transmis sans modification à l autre joueur. Tous les accords entre joueurs seront respectés. L évaluation des situations par un joueur n est pas perturbée par les négociations préliminaires. Guerre des sexes Introduction à la Théorie des Jeux p.71/77
156 Jeu de marchandage - Ensemble de négociation L ensemble de négociation d un jeu de marchandage est l ensemble des issues : réalisables appartenant à l espace de marchandage efficientes telles qu aucune autre issue ne donne plus à un joueur et autant à l autre (non pareto-dominée) individuellement rationnelles chaque joueur gagne au moins autant que le gain qu il est sur d obtenir si il n y a pas d accord. Introduction à la Théorie des Jeux p.72/77
157 Jeu de Marchandage - Solution de Nash Invariance à l échelle d utilité Si [R 1, (u 1, v 1)] et [R 2, (u 2, v 2)] sont deux versions du même jeu de marchandage, ie si ils ne diffèrent que sur les unités et l origine des fonctions d utilités, alors les deux solutions F ([R 1, (u 1, v 1)]) et F ([R 2, (u 2, v 2)]) doivent être les mêmes au changement d échelle près. Pareto optimalité La solution du jeu de marchandage (u 0, v 0 ) doit satisfaire les propriétés suivantes : u 0 u et v 0 v (u 0, v 0 ) est un point de R il n y a pas de (u, v) dans R (différent de (u 0, v 0 )) tel que u u 0 et v v 0. Introduction à la Théorie des Jeux p.73/77
158 Jeu de Marchandage - Solution de Nash Indépendance des alternatives non disponibles Soient deux jeux de marchandage avec le même point de status quo et tels que les issues du premier sont incluses dans les issues du second. Si la solution du second jeu est réalisable dans le premier jeu, alors ce doit être aussi la solution du premier jeu : Si R 1 R 2 et F ([R 2, (u, v )]) R 1, alors F ([R 1, (u, v )]) = F ([R 2, (u, v )]) Symétrie Si un jeu de marchandage a les propriétés suivantes : u = v (u, v) R implique (v, u) R (u 0, v 0 ) = F ([R, (u, v )]) Alors u 0 = v 0 Introduction à la Théorie des Jeux p.74/77
159 Jeu de Marchandage - Solution de Nash Soit un jeu de marchandage [R, (u, v )], procédons comme suit : Changeons l origine des utilités des joueurs pour que le point (u, v ) soit transformé en (0, 0). Soit [R, (0, 0)] le jeu correspondant. Dans R trouver (l unique) point (u 0, v 0) (u 0 > 0 et v 0 > 0) tel que u 0v 0 est le maximum de tous les produits uv avec (u, v) dans R (u > 0 et v > 0). Le point (u 0, v 0) est la solution de Nash du jeu [R, (0, 0)]. La solution de Nash de [R, (u, v )] est obtenu en inversant la transformation d utilité. Introduction à la Théorie des Jeux p.75/77
160 Jeu de Marchandage - Solution de Nash Soit un jeu de marchandage [R, (u, v )], procédons comme suit : Changeons l origine des utilités des joueurs pour que le point (u, v ) soit transformé en (0, 0). Soit [R, (0, 0)] le jeu correspondant. Dans R trouver (l unique) point (u 0, v 0) (u 0 > 0 et v 0 > 0) tel que u 0v 0 est le maximum de tous les produits uv avec (u, v) dans R (u > 0 et v > 0). Le point (u 0, v 0) est la solution de Nash du jeu [R, (0, 0)]. La solution de Nash de [R, (u, v )] est obtenu en inversant la transformation d utilité. Théorème. L unique solution qui vérifie les 4 propriétés désirées est la solution de Nash. (Nash (1950)) Introduction à la Théorie des Jeux p.75/77
161 Jeux contre la nature Si on considère un jeu à deux joueurs dont un des deux joueurs est la nature, on fait de la décision dans le risque ou dans l incertain. En ce sens la théorie de la décision peut être vue comme un cas particulier de la théorie des jeux. Introduction à la Théorie des Jeux p.76/77
162 Conclusion Jeux coopératifs Jeux à information incomplète Rationalité limitée Introduction à la Théorie des Jeux p.77/77
Simulation centrée individus
Simulation centrée individus Théorie des jeux Bruno BEAUFILS Université de Lille Année 4/5 Ce document est mis à disposition selon les termes de la Licence Creative Commons Attribution - Partage dans les
Jeux sous forme extensive (Jeux dynamiques)
(Jeux dynamiques) Plan du chapitre ( juillet 008) / éfinitions, exemples et équivalences Arbres de jeux, information et mémoire tratégies et réduction en forme normale Équilibre de Nash parfait en sous-jeux
Modèles et simulations informatiques des problèmes de coopération entre agents
Modèles et simulations informatiques des problèmes de coopération entre agents Bruno Beaufils LIFL Axe CIM Équipe SMAC Laboratoire d'informatique Plan 1. Motivations 2. Dilemme itéré du prisonnier 3. Simulations
Economie de l Incertain et des Incitations
Economie de l Incertain et des Incitations CHAPITRE 2 Eléments de théorie des jeux en information symétrique et asymétrique Equilibres Bayesiens - Université de Tours - M1 AGE - Arnold Chassagnon - Automne
Théorie des Jeux Et ses Applications
Théorie des Jeux Et ses Applications De la Guerre Froide au Poker Clément Sire Laboratoire de Physique Théorique CNRS & Université Paul Sabatier www.lpt.ups-tlse.fr Quelques Définitions de la Théorie des
CHAPITRE 5. Stratégies Mixtes
CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,
Feuille 1 : représentation d interactions stratégiques, connaissance commune
Université Paris-Dauphine, Departement MIDO. Théorie des jeux, L3, 2009/2010. Feuille 1 : représentation d interactions stratégiques, connaissance commune Exercice 1 ( Il y a deux joueurs. A la période
Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.
Deuxième partie Les jeux non-coopératifs avec information complète 3. Équilibre de Nash (1951) 35 4. Dynamique et rétroduction 61 5. Jeux répétés 85 3. Équilibre de Nash (1951) John Nash a généralisé
COURS 8 : INTRODUCTION A LA THEORIE DES JEUX
Université Pierre et Marie Curie Licence Informatique 2014-2015 Cours LI 352 - Industrie Informatique et son Environnement Économique Responsable : Jean-Daniel Kant ([email protected]) COURS 8 :
FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX
Lucie MÉNAGER EUREQua, université de Paris I Panthéon-Sorbonne Olivier TERCIEUX Paris-Jourdan Sciences économiques (PSE) et CNRS FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX Mots-clés
Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de
Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de l espérance d utilité Olivier Bos [email protected]
La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal
La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante
QUI VEUT JOUER AVEC MOI?
QUI VEUT JOUER AVEC MOI? Michel Rigo (Université de Liège) http://www.discmath.ulg.ac.be/ JOUER SÉRIEUSEMENT, POURQUOI? Jeux coopératifs : marché boursier, économie, émergence de réseaux sociaux,... Mise
Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)
CORRECTION D EXAMEN CONTROLE CONTINU n 1 Question de cours Question 1 : Les équilibres de Cournot et de Stackelberg sont des équilibres de situation de duopole sur un marché non coopératif d un bien homogène.
Resolution limit in community detection
Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.
Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)
Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck) Stéphane Cardon Nathalie Chetcuti-Sperandio Fabien Delorme Sylvain agrue CRI - Université d Artois {cardon,chetcuti,delorme,lagrue}@cril.univ-artois.fr
Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014
Attitude des ménages face au risque - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014 Plan du cours 1. Introduction : demande de couverture et comportements induits pa 2. Représentations
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
LE PROBLEME DU PLUS COURT CHEMIN
LE PROBLEME DU PLUS COURT CHEMIN Dans cette leçon nous définissons le modèle de plus court chemin, présentons des exemples d'application et proposons un algorithme de résolution dans le cas où les longueurs
Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications
Université Paris-Dauphine DUMI2E 1ère année, 2009-2010 Applications 1 Introduction Une fonction f (plus précisément, une fonction réelle d une variable réelle) est une règle qui associe à tout réel x au
Représentation des Nombres
Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...
Programmation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
L oligopole ESCP 2012 2103
Structures de marché L oligopole Anne Yvrande Billon ESCP 2012 2103 1 Plan du cours (1/2) 1. Introduction : qu est ce qu un oligopole? 2. L oligopole de Cournot 3. Le «paradoxe de Bertrand» 2 1. Introduction
Coopération dans les réseaux ad hoc : Application de la théorie des jeux et de l évolution dans le cadre d observabilité imparfaite
Coopération dans les réseaux ad hoc : Application de la théorie des jeux et de l évolution dans le cadre d observabilité imparfaite Pietro Michiardi Institut Eurecom 2229, route des Cretes BP 193 694 Sophia-Antipolis,
COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES
COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES Cours 6c Principe Protocole centralisé, un commissaire-priseur/vendeur (auctioneer) et plusieurs enchérisseurs/acheteurs (bidders) Le commissaire-priseur
Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines
Modèles à Événements Discrets. Réseaux de Petri Stochastiques
Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés
Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
L apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Les indices à surplus constant
Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté
Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation
IFIPS S7 - informatique Université Paris-Sud 11 1er semestre 2009/2010 Théorie des Graphes Cours 3: Forêts et Arbres II / 1 Forêts et arbres II Théorème 1.1. Les assertions suivantes sont équivalentes
Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2
Probabilités Table des matières I Petits rappels sur le vocabulaire des ensembles 2 I.1 s................................................... 2 I.2 Propriétés...................................................
Annexe 6. Notions d ordonnancement.
Annexe 6. Notions d ordonnancement. APP3 Optimisation Combinatoire: problèmes sur-contraints et ordonnancement. Mines-Nantes, option GIPAD, 2011-2012. [email protected] Résumé Ce document
Assurance maladie publique et «Opting out» - Réflexions théoriques
Assurance maladie publique et «Opting out» - Réflexions théoriques Carine Franc CREGAS INSERM - U 537 Une définition de «l opting out» «to opt out» : choisir de ne pas participer ; [hopital, school] choisir
YANN ROUDAUT - Professeur de l Ecole Française de Poker - [email protected] - 06 28 76 48 93
MODULE LA GESTION DU CAPITAL " La Bankroll" YANN ROUDAUT - Professeur de l Ecole Française de Poker - [email protected] - 06 28 76 48 93 PLAN DU COURS q Présentation du rapport Tactique
CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal
III CHOIX OPTIMAL DU CONSOMMATEUR A - Propriétés et détermination du choix optimal La demande du consommateur sur la droite de budget Résolution graphique Règle (d or) pour déterminer la demande quand
CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER. Epargne et emprunt Calcul actuariel
CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER Epargne et emprunt Calcul actuariel Plan du cours Préambule : la contrainte budgétaire intertemporelle et le calcul actuariel I II III Demandes d épargne
Fonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Texte Agrégation limitée par diffusion interne
Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse
La microéconomie est-elle utile?
La microéconomie est-elle utile? Les manuels de microéconomie comportent généralement des centaines de pages, pleines de courbes et de formules mathématiques. Une proportion importante des articles publiés
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar [email protected]
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar [email protected] Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,
Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très
Nathalie Bulle (1998), Compte-rendu de Rainer Hegselmann, Ulrich Mueller, Klaus G. Troitzsch (eds.).- Modelling and simulation in the social sciences
Nathalie Bulle (1998), Compte-rendu de Rainer Hegselmann, Ulrich Mueller, Klaus G. Troitzsch (eds.).- Modelling and simulation in the social sciences from the philosophy of science point of view. - Dordrecht/
Collection «Poker Expert» Sous la direction de François Montmirel. Parution le 3 avril 2009. Poker Cash 2
Collection «Poker Expert» Sous la direction de François Montmirel Parution le 3 avril 2009 Poker Cash 2 Triompher dans les cash games de poker hold em no-limit par Dan Harrington et Bill Robertie Titre
FONCTION DE DEMANDE : REVENU ET PRIX
FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie
DOCM 2013 http://docm.math.ca/ Solutions officielles. 1 2 10 + 1 2 9 + 1 2 8 = n 2 10.
A1 Trouvez l entier positif n qui satisfait l équation suivante: Solution 1 2 10 + 1 2 9 + 1 2 8 = n 2 10. En additionnant les termes du côté gauche de l équation en les mettant sur le même dénominateur
Le scoring est-il la nouvelle révolution du microcrédit?
Retour au sommaire Le scoring est-il la nouvelle révolution du microcrédit? BIM n 32-01 octobre 2002 Frédéric DE SOUSA-SANTOS Le BIM de cette semaine se propose de vous présenter un ouvrage de Mark Schreiner
Canevas théoriques du projet sur le poker Partie A
Partie A Dans une partie de poker, particulièrement au Texas Hold em Limit, il est possible d effectuer certains calculs permettant de prendre la meilleure décision. Quelques-uns de ces calculs sont basés
Cours de Probabilités et de Statistique
Cours de Probabilités et de Statistique Licence 1ère année 2007/2008 Nicolas Prioux Université Paris-Est Cours de Proba-Stat 2 L1.2 Science-Éco Chapitre Notions de théorie des ensembles 1 1.1 Ensembles
Probabilités conditionnelles Loi binomiale
Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard
Apprentissage par renforcement (1a/3)
Apprentissage par renforcement (1a/3) Bruno Bouzy 23 septembre 2014 Ce document est le chapitre «Apprentissage par renforcement» du cours d apprentissage automatique donné aux étudiants de Master MI, parcours
Chapitre 5 : Flot maximal dans un graphe
Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d
Le théorème des deux fonds et la gestion indicielle
Le théorème des deux fonds et la gestion indicielle Philippe Bernard Ingénierie Economique& Financière Université Paris-Dauphine mars 2013 Les premiers fonds indiciels futent lancés aux Etats-Unis par
Économie de l environnement
Économie de l environnement Ch. 3. Biens publics RSE 2014-2015 Économie de l environnement Prof. Philippe Polomé Université Lyon 2 GATE CNRS UMR 5824 www.gate.cnrs.fr/perso/polome RSE 2014-2015 Économie
Chapitre 5. Équilibre concurrentiel et bien-être
Chapitre 5 Équilibre concurrentiel et bien-être Microéconomie III 5 1 5.1 Qu est-ce qu un équilibre souhaitable socialement? E cacité versus équité Que nous permet de dire la science économique sur l e
Théorèmes de Point Fixe et Applications 1
Théorèmes de Point Fixe et Applications 1 Victor Ginsburgh Université Libre de Bruxelles et CORE, Louvain-la-Neuve Janvier 1999 Published in C. Jessua, C. Labrousse et D. Vitry, eds., Dictionnaire des
Cours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Optimisation Discrète
Prof F Eisenbrand EPFL - DISOPT Optimisation Discrète Adrian Bock Semestre de printemps 2011 Série 7 7 avril 2011 Exercice 1 i Considérer le programme linéaire max{c T x : Ax b} avec c R n, A R m n et
Introduction à la théorie des graphes. Solutions des exercices
CAHIERS DE LA CRM Introduction à la théorie des graphes Solutions des exercices Didier Müller CAHIER N O 6 COMMISSION ROMANDE DE MATHÉMATIQUE 1 Graphes non orientés Exercice 1 On obtient le graphe biparti
1 Définition et premières propriétés des congruences
Université Paris 13, Institut Galilée Département de Mathématiques Licence 2ème année Informatique 2013-2014 Cours de Mathématiques pour l Informatique Des nombres aux structures Sylviane R. Schwer Leçon
Exercices - Polynômes : corrigé. Opérations sur les polynômes
Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)
Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies
Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure
Probabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Le modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
L'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Intégration et probabilités TD1 Espaces mesurés
Intégration et probabilités TD1 Espaces mesurés 2012-2013 1 Petites questions 1) Est-ce que l ensemble des ouverts de R est une tribu? 2) Si F et G sont deux tribus, est-ce que F G est toujours une tribu?
L Equilibre Macroéconomique en Economie Ouverte
L Equilibre Macroéconomique en Economie Ouverte Partie 3: L Equilibre Macroéconomique en Economie Ouverte On abandonne l hypothèse d économie fermée Les échanges économiques entre pays: importants, en
Intégration et probabilités TD1 Espaces mesurés Corrigé
Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.
La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
!-.!#- $'( 1&) &) (,' &*- %,!
0 $'( 1&) +&&/ ( &+&& &+&))&( -.#- 2& -.#- &) (,' %&,))& &)+&&) &- $ 3.#( %, (&&/ 0 ' Il existe plusieurs types de simulation de flux Statique ou dynamique Stochastique ou déterministe A événements discrets
Marchés oligopolistiques avec vente d un bien non homogène
Marchés oligopolistiques avec vente d un bien non homogène Partons de quelques observations : 1. La plupart des industries produisent un grand nombre de produits similaires mais non identiques; 2. Parmi
Efficience des marchés et finance comportementale
Efficience des marchés et finance comportementale Martin Vlcek, Quantitative Investment Manager (BCV) 06.12.2013 Contenu 1. Introduction 2. Théorie de l efficience du marché 3. Finance comportementale
Raisonnement probabiliste
Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte
Principe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, [email protected] 2 Université
Chapitre 5 LE MODELE ENTITE - ASSOCIATION
Chapitre 5 LE MODELE ENTITE - ASSOCIATION 1 Introduction Conception d une base de données Domaine d application complexe : description abstraite des concepts indépendamment de leur implémentation sous
Pi, poker et informatique ; une «épuisante» alliance pour des projets en mathématiques
Pi, poker et informatique ; une «épuisante» alliance pour des projets en mathématiques Jean Fradette et Anik Trahan, Cégep de Sherbrooke Résumé Dans un cours intégrateur en mathématiques, des étudiants
PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES
Leçon 11 PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES Dans cette leçon, nous retrouvons le problème d ordonnancement déjà vu mais en ajoutant la prise en compte de contraintes portant sur les ressources.
Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12
Probabilités. I - Rappel : trois exemples. Exemple 1 : Dans une classe de 25 élèves, il y a 16 filles. Tous les élèves sont blonds ou bruns. Parmi les filles, 6 sont blondes. Parmi les garçons, 3 sont
LE GUIDE COMPLET PRETS A PARIER
LE GUIDE COMPLET PRETS A PARIER Ce guide va vous proposer deux manières de profiter des jeux «Prêts à Parier» disponibles sur le site Promoturf. Ces pronostics sont le résultat d une amélioration majeure
Probabilités. C. Charignon. I Cours 3
Probabilités C. Charignon Table des matières I Cours 3 1 Dénombrements 3 1.1 Cardinal.................................................. 3 1.1.1 Définition............................................. 3
Contradicting Beliefs and Communication. J.-M. Tallon, J.-C. Vergnaud, & S. Zamir CNRS-EUREQua
Contradicting Beliefs and Communication J.-M. Tallon, J.-C. Vergnaud, & S. Zamir CNRS-EUREQua Introduction Papier propose : Considère structure de Kripke (KD45 au lieu de S5) Processus de communication
M2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
LA METHODE DU COUT CIBLE (TARGET COSTING)
LA METHODE DU COUT CIBLE (TARGET COSTING) Finalité de la démarche Optimiser les performances futures de profit du produit sur l ensemble de son cycle de vie. Prérequis Connaissance élémentaire de la problématique
Matériel. . 9 cartes Personnage
Avec cette extension, les règles de base peuvent être modifiées de cinq façons différentes et combinables comme bon vous semble Les dames de Troyes font leur apparition sous la forme de trois nouvelles
Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer
Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1
Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation
Théorie et codage de l information
Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q
Probabilités Loi binomiale Exercices corrigés
Probabilités Loi binomiale Exercices corrigés Sont abordés dans cette fiche : (cliquez sur l exercice pour un accès direct) Exercice 1 : épreuve de Bernoulli Exercice 2 : loi de Bernoulli de paramètre
ISO/CEI 19770-1. Technologies de l information Gestion des actifs logiciels. Partie 1: Procédés et évaluation progressive de la conformité
NORME INTERNATIONALE ISO/CEI 19770-1 Deuxième édition 2012-06-15 Technologies de l information Gestion des actifs logiciels Partie 1: Procédés et évaluation progressive de la conformité Information technology
Qu est-ce que la virtualisation?
I Qu est-ce que la virtualisation? L actuel et le virtuel Considérons pour commencer l opposition facile et trompeuse entre réel et virtuel. Dans l usage courant, le mot virtuel s emploie souvent pour
