Cours 8 : Applicatios pratiques de la prograatio liéaire Christophe Gozales LIP6 Uiversité Paris 6, Frace
Pla du cours Cours 8 : Applicatios pratiques de la prograatio liéaire 2/23 1 Jeux à deux joueurs à soe ulle 2 Théorèe du MINIMAX e stratégies pures 3 stratégies ixtes 4 Théorèe du MINIMAX e stratégies ixtes
Jeux à deux joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 3/23 Théorie des jeux théorie des jeux = étude des situatios (les jeux) où des agets (les joueurs) ot à choisir des stratégies stratégies = résultat (paieet, gai) pour chaque joueur les résultats dépedet des stratégies jouées par tous les joueurs
Jeux à deux joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 3/23 Théorie des jeux théorie des jeux = étude des situatios (les jeux) où des agets (les joueurs) ot à choisir des stratégies stratégies = résultat (paieet, gai) pour chaque joueur les résultats dépedet des stratégies jouées par tous les joueurs Jeu à deux joueurs U jeu das lequel il y a que 2 agets
Exeple de jeu à deux joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 4/23 Exeple : le dilee des prisoiers Deux criiels présués : Boie et Clyde iterrogés séparéet par la police = 3 cas : 1 ils iet tous les deux = pas de preuve = faible peie (1 a) 2 ils avouet tous les deux = peie plus forte (8 as) 3 l u des deux avoue tadis que l autre ie = peies = 0 a pour l u et 10 as pour l autre Problèe : Que vot faire, que doivet faire, les prisoiers?
Fore orale d u jeu à deux joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 5/23 Défiitio de la fore orale jeu à deux joueurs = tableau de gais atrice de jeu = atrice des gais liges = stratégies du 1er joueur coloes = stratégies du 2èe joueur
Fore orale d u jeu à deux joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 5/23 Défiitio de la fore orale jeu à deux joueurs = tableau de gais atrice de jeu = atrice des gais liges = stratégies du 1er joueur coloes = stratégies du 2èe joueur Exeple : le dilee des prisoiers tous deux iet = peies d 1 a tous deux avouet = peies de 8 as l u avoue, l autre ie = peies respectives = 0 a et 10 as
Fore orale d u jeu à deux joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 5/23 Défiitio de la fore orale jeu à deux joueurs = tableau de gais atrice de jeu = atrice des gais liges = stratégies du 1er joueur coloes = stratégies du 2èe joueur Exeple : le dilee des prisoiers tous deux iet = peies d 1 a tous deux avouet = peies de 8 as l u avoue, l autre ie = peies respectives = 0 a et 10 as Boie \ Clyde Nier Avouer Nier (1 a,1 a) (10 as,0 a) Avouer (0 a,10 as) (8 as,8 as)
Fore orale d u jeu à deux joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 5/23 Défiitio de la fore orale jeu à deux joueurs = tableau de gais atrice de jeu = atrice des gais liges = stratégies du 1er joueur coloes = stratégies du 2èe joueur Exeple : le dilee des prisoiers tous deux iet = peies d 1 a tous deux avouet = peies de 8 as l u avoue, l autre ie = peies respectives = 0 a et 10 as Boie \ Clyde Nier Avouer Nier (-1,-1) (-10,0) Avouer (0,-10) (-8,-8)
Jeu à deux joueurs à soe ulle Cours 8 : Applicatios pratiques de la prograatio liéaire 6/23 Défiitio d u jeu à deux joueurs à soe ulle Jeu pour lequel la soe des paieets est toujours égale à 0 stratégies des joueurs
Jeu à deux joueurs à soe ulle Cours 8 : Applicatios pratiques de la prograatio liéaire 6/23 Défiitio d u jeu à deux joueurs à soe ulle Jeu pour lequel la soe des paieets est toujours égale à 0 stratégies des joueurs Fore orale d u jeu à deux joueurs à soe ulle atrice des gais coe das le jeu à 2 joueurs classique ais o écrit que le gai du 1er joueur (celui des liges) gai du 2èe joueur = gai du 1er joueur
Exeple de jeu à deux joueurs à soe ulle Cours 8 : Applicatios pratiques de la prograatio liéaire 7/23 3 boites : Noire, Rouge, Verte joueur II : répartit 2 pièces de 1 e etre les 3 boites joueur I : choisit 1 boite et gage so coteu
Exeple de jeu à deux joueurs à soe ulle Cours 8 : Applicatios pratiques de la prograatio liéaire 7/23 3 boites : Noire, Rouge, Verte joueur II : répartit 2 pièces de 1 e etre les 3 boites joueur I : choisit 1 boite et gage so coteu Matrice de jeu : joueur I \ joueur II NN RR VV NR NV RV N 2 0 0 1 1 0 R 0 2 0 1 0 1 V 0 0 2 0 1 1
Jeu à deux joueurs à soe ulle : fore géérale Cours 8 : Applicatios pratiques de la prograatio liéaire 8/23 joueur I \ joueur II 1 2 j 0 1 g 1,1 g 1,2 g 1,j0 g 1, 2 g 2,1 g 2,2 g 2,j0 g 2, i 0 g i0,1 g i0,2 g i0,j 0 g i0, g,1 g,2 g,j0 g, les gais g i,j dépedet des stratégies i et j des joueurs g i,j = gai du joueur I g i,j = gai du joueur II
Stratégie des joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 9/23 Les joueurs choisisset leurs stratégies à l isu l u de l autre
Stratégie des joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 9/23 Les joueurs choisisset leurs stratégies à l isu l u de l autre joueur I : stratégie i 0 = gai iiu = i j=1 g i 0,j
Stratégie des joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 9/23 Les joueurs choisisset leurs stratégies à l isu l u de l autre joueur I : stratégie i 0 = gai iiu = i j=1 g i 0,j joueur prudet = redre ce gai le plus élevé possible
Stratégie des joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 9/23 Les joueurs choisisset leurs stratégies à l isu l u de l autre joueur I : stratégie i 0 = gai iiu = i j=1 g i 0,j joueur prudet = redre ce gai le plus élevé possible critère MAXIMIN stratégie du joueur I : stratégie i telle que ax i=1 i j=1 g i,j
Stratégie des joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 9/23 Les joueurs choisisset leurs stratégies à l isu l u de l autre joueur I : stratégie i 0 = gai iiu = i j=1 g i 0,j joueur prudet = redre ce gai le plus élevé possible critère MAXIMIN stratégie du joueur I : stratégie i telle que ax i=1 secod joueur : stratégie j 0 = perte axiale = i j=1 g i,j ax i=1 g i,j 0 joueur prudet = redre cette perte la plus petite possible
Stratégie des joueurs Cours 8 : Applicatios pratiques de la prograatio liéaire 9/23 Les joueurs choisisset leurs stratégies à l isu l u de l autre joueur I : stratégie i 0 = gai iiu = i j=1 g i 0,j joueur prudet = redre ce gai le plus élevé possible critère MAXIMIN stratégie du joueur I : stratégie i telle que ax i=1 secod joueur : stratégie j 0 = perte axiale = i j=1 g i,j ax i=1 g i,j 0 joueur prudet = redre cette perte la plus petite possible critère MINIMAX stratégie du joueur II : stratégie j telle que i j=1 ax i=1 g i,j
Théorèe du iiax e stratégies pures (1/2) Cours 8 : Applicatios pratiques de la prograatio liéaire 10/23 Théorèe du iiax e stratégies pures ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j
Théorèe du iiax e stratégies pures (1/2) Cours 8 : Applicatios pratiques de la prograatio liéaire 10/23 Théorèe du iiax e stratégies pures ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j Déostratio : i, j, i j=1 g i,j g i,j
Théorèe du iiax e stratégies pures (1/2) Cours 8 : Applicatios pratiques de la prograatio liéaire 10/23 Théorèe du iiax e stratégies pures ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j Déostratio : i, j, i, j, i j=1 g i,j g i,j i j=1 g i,j g i,j
Théorèe du iiax e stratégies pures (1/2) Cours 8 : Applicatios pratiques de la prograatio liéaire 10/23 Théorèe du iiax e stratégies pures ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j Déostratio : i, j, i, j, i j=1 g i,j g i,j i g i,j ax j=1 i=1 g i,j
Théorèe du iiax e stratégies pures (1/2) Cours 8 : Applicatios pratiques de la prograatio liéaire 10/23 Théorèe du iiax e stratégies pures ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j Déostratio : i, j, j, ax i=1 i j=1 g i,j g i,j i g i,j ax j=1 i=1 g i,j
Théorèe du iiax e stratégies pures (1/2) Cours 8 : Applicatios pratiques de la prograatio liéaire 10/23 Théorèe du iiax e stratégies pures ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j Déostratio : i, j, j, ax i=1 i j=1 g i,j g i,j i g i,j ax j=1 i=1 g i,j ebre de gauche = costate = ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j CQFD
Théorèe du iiax e stratégies pures (2/2) Cours 8 : Applicatios pratiques de la prograatio liéaire 11/23 ax i=1 g i,j j=1 i i j=1 ax i=1 g i,j : 3 boites : Noire, Rouge, Verte joueur II : répartit 2 pièces de 1 e etre les 3 boites joueur I : choisit 1 boite et gage so coteu joueur I \ joueur II NN RR VV NR NV RV i N 2 0 0 1 1 0 0 R 0 2 0 1 0 1 0 V 0 0 2 0 1 1 0 ax 2 2 2 1 1 1
Stratégies ixtes / stratégies pure (1/3) Cours 8 : Applicatios pratiques de la prograatio liéaire 12/23 les joueurs e peuvet être certais d obteir plus que ce qu ils peuvet s assurer VON NEUMANN : e oyee peuvet-ils s assurer plus? = cocept de stratégie ixte
Stratégies ixtes / stratégies pure (1/3) Cours 8 : Applicatios pratiques de la prograatio liéaire 12/23 les joueurs e peuvet être certais d obteir plus que ce qu ils peuvet s assurer VON NEUMANN : e oyee peuvet-ils s assurer plus? = cocept de stratégie ixte stratégie ixte joueur I : p = p 1 p 2. p joueur II : q = q 1 q 2. q p = stratégie ixte du joueur I, p i = proba de jouer la stratégie i q = stratégie ixte du joueur II, q j = proba de jouer la stratégie j
Stratégies ixtes / stratégies pure (2/3) Cours 8 : Applicatios pratiques de la prograatio liéaire 13/23 { 1 si i = stratégie pure du joueur I : p = vecteur uité, i.e., p i i0 = 0 si i i 0 { 1 si j = j0 stratégie pure du joueur II : q = vecteur uité, i.e., q j = 0 si j j 0
Stratégies ixtes / stratégies pure (2/3) Cours 8 : Applicatios pratiques de la prograatio liéaire 13/23 { 1 si i = stratégie pure du joueur I : p = vecteur uité, i.e., p i i0 = 0 si i i 0 { 1 si j = j0 stratégie pure du joueur II : q = vecteur uité, i.e., q j = 0 si j j 0 Eseble de stratégies ixtes P = {eseble { des stratégies } ixtes du 1er joueur} = p : p i 0 et p i = 1 i=1 Q = {eseble des stratégies ixtes du 2èe joueur} = q : q j 0 et q j = 1 j=1
Stratégies ixtes / stratégies pure (3/3) Cours 8 : Applicatios pratiques de la prograatio liéaire 14/23 Pr({i, j}) = proba que le joueur I joue i et le joueur II joue j Les joueurs jouet idépedaet = Pr({i, j}) = p i q j
Stratégies ixtes / stratégies pure (3/3) Cours 8 : Applicatios pratiques de la prograatio liéaire 14/23 Pr({i, j}) = proba que le joueur I joue i et le joueur II joue j Les joueurs jouet idépedaet = Pr({i, j}) = p i q j espérace athéatique de gai du joueur I le joueur I joue la stratégie p le joueur II joue la stratégie q G = atrice du jeu Espérace de gai = p i q j g i,j = p T Gq i=1 j=1
Stratégies ixtes / stratégies pure (3/3) Cours 8 : Applicatios pratiques de la prograatio liéaire 14/23 Pr({i, j}) = proba que le joueur I joue i et le joueur II joue j Les joueurs jouet idépedaet = Pr({i, j}) = p i q j espérace athéatique de gai du joueur I le joueur I joue la stratégie p le joueur II joue la stratégie q G = atrice du jeu Espérace de gai = p i q j g i,j = p T Gq i=1 j=1 à partir de aiteat : les joueurs veulet optiiser leur espérace de gai
Miiax et axii e stratégies ixtes Cours 8 : Applicatios pratiques de la prograatio liéaire 15/23 Miiax et axii e stratégies ixtes MAXIMIN = ax p P i q Q pt Gq MINIMAX = i q Q ax p P pt Gq MAXIMIN = espérace de gai iiale du joueur I MINIMAX = espérace de perte axiale du joueur II
Miiax et axii e stratégies ixtes Cours 8 : Applicatios pratiques de la prograatio liéaire 15/23 Miiax et axii e stratégies ixtes MAXIMIN = ax p P i q Q pt Gq MINIMAX = i q Q ax p P pt Gq MAXIMIN = espérace de gai iiale du joueur I MINIMAX = espérace de perte axiale du joueur II E stratégies pures, MAXIMIN MINIMAX
Théorèe du Miiax e stratégies ixtes Cours 8 : Applicatios pratiques de la prograatio liéaire 16/23 Théorèe du iiax (vo Neua) Das tout jeu à deux joueurs à soe ulle, le iiax et le axii e stratégies ixtes sot égaux, i.e., ax i p P q Q pt Gq = i ax q Q p P pt Gq
Déostratio du théorèe du iiax (1/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 17/23 Déostratio : déostratio de ax p P i q Q pt Gq i q Q ax p P pt Gq : = idetique à la déo du théorèe e stratégies pures
Déostratio du théorèe du iiax (1/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 17/23 Déostratio : déostratio de ax p P i q Q pt Gq i q Q ax p P pt Gq : = idetique à la déo du théorèe e stratégies pures G T i = lige i de la atrice du jeu G j = coloe j de la atrice du jeu
Déostratio du théorèe du iiax (1/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 17/23 Déostratio : déostratio de ax p P i q Q pt Gq i q Q ax p P pt Gq : = idetique à la déo du théorèe e stratégies pures G T i = lige i de la atrice du jeu G j = coloe j de la atrice du jeu Motros que ce qu u joueur peut s assurer e espérace cotre les stratégies pures de l adversaire, il peut aussi l assurer cotre les stratégies ixtes, i.e., ax i p P q Q pt Gq = ax i p P j=1 pt G j = i ax q Q i=1 GT i q
Déostratio du théorèe du iiax (2/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 18/23 Soit p ue stratégie ixte quelcoque Déostratio de i q Q pt Gq = i j=1 pt G j : stratégie pure = stratégie ixte particulière = i q Q pt Gq i j=1 pt G j
Déostratio du théorèe du iiax (2/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 18/23 Soit p ue stratégie ixte quelcoque Déostratio de i q Q pt Gq = i j=1 pt G j : stratégie pure = stratégie ixte particulière = i q Q pt Gq i j=1 pt G j Réciproqueet : si j, p T G j µ alors : q, p T Gq = p T G j q j = j=1 j=1 [ p T G j] q j µq j = µ j=1
Déostratio du théorèe du iiax (2/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 18/23 Soit p ue stratégie ixte quelcoque Déostratio de i q Q pt Gq = i j=1 pt G j : stratégie pure = stratégie ixte particulière = i q Q pt Gq i j=1 pt G j Réciproqueet : si j, p T G j µ alors : q, p T Gq = p T G j q j = j=1 j=1 [ p T G j] q j µq j = µ j=1 de êe : ax p P pt Gq = ax i=1 GT i q
Déostratio du théorèe du iiax (3/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 19/23 Résué du trasparet précédet : Soit p ue stratégie ixte quelcoque alors : i q Q pt Gq = i j=1 pt G j et ax p P pt Gq = ax i=1 GT i q
Déostratio du théorèe du iiax (3/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 19/23 Résué du trasparet précédet : Soit p ue stratégie ixte quelcoque alors : i q Q pt Gq = i j=1 pt G j et ax p P pt Gq = ax i=1 GT i q vrai quel que soit p doc : ax i p P q Q pt Gq = ax p P i j=1 pt G j i q Q ax p P p T Gq = i q Q ax i=1 GT i q
Déostratio du théorèe du iiax (4/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 20/23 Déostratio par l absurde de MINIMAX MAXIMIN : Supposos que MAXIMIN < MINIMAX
Déostratio du théorèe du iiax (4/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 20/23 Déostratio par l absurde de MINIMAX MAXIMIN : Supposos que MAXIMIN < MINIMAX Soit α tel que MAXIMIN < α < MINIMAX
Déostratio du théorèe du iiax (4/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 20/23 Déostratio par l absurde de MINIMAX MAXIMIN : Supposos que MAXIMIN < MINIMAX Soit α tel que MAXIMIN < α < MINIMAX Or MAXIMIN = ax p P i j=1 pt G j (cf. trasparet précédet)
Déostratio du théorèe du iiax (4/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 20/23 Déostratio par l absurde de MINIMAX MAXIMIN : Supposos que MAXIMIN < MINIMAX Soit α tel que MAXIMIN < α < MINIMAX Or MAXIMIN = ax p P i j=1 pt G j (cf. trasparet précédet) doc stratégie ixte p, i j=1 pt G j < α
Déostratio du théorèe du iiax (4/6) Déostratio par l absurde de MINIMAX MAXIMIN : Supposos que MAXIMIN < MINIMAX Soit α tel que MAXIMIN < α < MINIMAX Or MAXIMIN = ax p P i j=1 pt G j (cf. trasparet précédet) doc stratégie ixte p, i j=1 pt G j < α doc p telle que j, p T G j α p T G j α j doc le systèe p T 1 = 1 p i 0 i est icopatible où 1 = vecteur de taille costitué uiqueet de 1 Cours 8 : Applicatios pratiques de la prograatio liéaire 20/23
Cours 8 : Applicatios pratiques de la prograatio liéaire 21/23 Déostratio du théorèe du iiax (5/6) p T G j α j p T 1 = 1 p i 0 i p T G α p T 1 1 p T 1 1 p T I 0 p T ( G) α p T ( 1 ) 1 p T 1 1 p T ( I ) 0 où I = atrice idetité et α = vecteur costitué de α
Cours 8 : Applicatios pratiques de la prograatio liéaire 21/23 Déostratio du théorèe du iiax (5/6) p T G j α j p T 1 = 1 p i 0 i p T G α p T 1 1 p T 1 1 p T I 0 p T ( G) α p T ( 1 ) 1 p T 1 1 p T ( I ) 0 où I = atrice idetité et α = vecteur costitué de α Rappel : théorèe de l alterative u et u seul des éocés suivats est vrai : 1 il existe v tel que v T A c T 2 il existe x 0 tel que Ax = 0 et c T x < 0
Cours 8 : Applicatios pratiques de la prograatio liéaire 21/23 Déostratio du théorèe du iiax (5/6) p T G j α j p T 1 = 1 p i 0 i p T G α p T 1 1 p T 1 1 p T I 0 p T ( G) α p T ( 1 ) 1 p T 1 1 p T ( I ) 0 où I = atrice idetité et α = vecteur costitué de α Rappel : théorèe de l alterative u et u seul des éocés suivats est vrai : 1 il existe v tel que v T A c T 2 il existe x 0 tel que Ax = 0 et c T x < 0 A = [ G 1 1 I ] et c T = [ α T 1 1 0 T ] = p tel que p T A c T = x 0 tel que Ax = 0 et c T x < 0
Déostratio du théorèe du iiax (6/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 22/23 A = [ G 1 1 I ] et c T = [ α T 1 1 0 T ] y 0 x = z z 0 0 tel que Ax = 0 et ct x < 0 d 0
Déostratio du théorèe du iiax (6/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 22/23 A = [ G 1 1 I ] et c T = [ α T 1 1 0 T ] y 0 x = z z 0 0 tel que Ax = 0 et ct x < 0 d 0 c T x = α T y z + z < 0 = systèe Ax = Gy 1 z + 1 z I d = 0 y 0, z 0, z 0, d 0 = systèe α T y + z z > 0 Gy + 1 z 1 z + I d = 0 y 0, z 0, z 0, d 0
Déostratio du théorèe du iiax (6/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 22/23 A = [ G 1 1 I ] et c T = [ α T 1 1 0 T ] y 0 x = z z 0 0 tel que Ax = 0 et ct x < 0 d 0 c T x = α T y z + z < 0 = systèe Ax = Gy 1 z + 1 z I d = 0 y 0, z 0, z 0, d 0 = systèe α T y + z z > 0 Gy + 1 z 1 z + I d = 0 y 0, z 0, z 0, d 0 = Gy 1 (z z ) 1 α T y = q t.q. Gq 1 α T q = 1 α = α
Déostratio du théorèe du iiax (6/6) Cours 8 : Applicatios pratiques de la prograatio liéaire 22/23 A = [ G 1 1 I ] et c T = [ α T 1 1 0 T ] y 0 x = z z 0 0 tel que Ax = 0 et ct x < 0 d 0 c T x = α T y z + z < 0 = systèe Ax = Gy 1 z + 1 z I d = 0 y 0, z 0, z 0, d 0 = systèe α T y + z z > 0 Gy + 1 z 1 z + I d = 0 y 0, z 0, z 0, d 0 = Gy 1 (z z ) 1 α T y = q t.q. Gq 1 α T q = 1 α = α = G i q α i = cotradictio de otre hypothèse de départ
Théorèe du Miiax e stratégies ixtes Cours 8 : Applicatios pratiques de la prograatio liéaire 23/23 Théorèe du iiax (vo Neua) Das tout jeu à deux joueurs à soe ulle, le iiax et le axii e stratégies ixtes sot égaux, i.e., ax i p P q Q pt Gq = i ax q Q p P pt Gq = théorèe de dualité