Théorie des Jeux. Mohammed Said RADJEF

Documents pareils
Cours 02 : Problème général de la programmation linéaire

Optimisation Discrète

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Résolution d équations non linéaires

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Chapitre 5 : Flot maximal dans un graphe

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul différentiel sur R n Première partie

Programmation linéaire

Limites finies en un point

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Programmation linéaire

Exercices Corrigés Premières notions sur les espaces vectoriels

Comparaison de fonctions Développements limités. Chapitre 10

CCP PSI Mathématiques 1 : un corrigé

Résolution de systèmes linéaires par des méthodes directes

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Cours d analyse numérique SMI-S4

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Chapitre 2. Matrices

Probabilités sur un univers fini

Simulation centrée individus

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

3 Approximation de solutions d équations

Fonctions de plusieurs variables

Correction du Baccalauréat S Amérique du Nord mai 2007

Probabilités sur un univers fini

CHAPITRE 5. Stratégies Mixtes

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Calcul différentiel. Chapitre Différentiabilité

Quantification Scalaire et Prédictive

Chapitre 3. Les distributions à deux variables

Plus courts chemins, programmation dynamique

Planche n o 22. Fonctions de plusieurs variables. Corrigé

Economie de l Incertain et des Incitations

Théorème du point fixe - Théorème de l inversion locale

Chapitre 2 Le problème de l unicité des solutions

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Cours d Analyse. Fonctions de plusieurs variables

Filtrage stochastique non linéaire par la théorie de représentation des martingales

par Denis-Charles Cisinski & Georges Maltsiniotis

Prudence, Epargne et Risques de Soins de Santé Christophe Courbage

Principe de symétrisation pour la construction d un test adaptatif

Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Dérivées d ordres supérieurs. Application à l étude d extrema.

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

Programmation Linéaire - Cours 1

Image d un intervalle par une fonction continue

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Programmation linéaire et Optimisation. Didier Smets

I. Polynômes de Tchebychev

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Théorèmes de Point Fixe et Applications 1

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Exercice 3 (5 points) A(x) = 1-e -0039' e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2

LES MÉTHODES DE POINT INTÉRIEUR 1

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Fonctions homographiques

Modèles et Méthodes de Réservation

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Cours de méthodes de scoring

O, i, ) ln x. (ln x)2

Commande de systèmes non retardés par retour de sortie statique échantillonné

EXERCICE 4 (7 points ) (Commun à tous les candidats)

Analyse en Composantes Principales

Techniques de Lyapunov en contrôle quantique pour le couplage dipolaire et polarisabilité

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

Continuité et dérivabilité d une fonction

Comment démontrer des formules sans effort? exposé de maîtrise

Correction du baccalauréat ES/L Métropole 20 juin 2014

Le produit semi-direct

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Commun à tous les candidats

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

I. Ensemble de définition d'une fonction

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Chapitre 1 : Évolution COURS

Chapitre VI - Méthodes de factorisation

Chp. 4. Minimisation d une fonction d une variable

Moments des variables aléatoires réelles

Modèles bi-dimensionnels de coques linéairement élastiques: Estimations de l écart entre leurs solutions.

aux différences est appelé équation aux différences d ordre n en forme normale.

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Le théorème des deux fonds et la gestion indicielle

Propriétés des options sur actions

Théorie des Jeux Et ses Applications

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Espérance conditionnelle

Transcription:

Unité de Recherche LaMOS Département de Recherche Opérationnelle Faculté des Sciences Exactes Université Abderrahmane Mira de Béjaia Année universitaire 2016-2017

Jeux bimatriciels Considérons un jeu fini à deux joueurs à somme non nulle I, {X i } i I, {f i } i I, (1) où I = {1, 2}- est l ensemble des deux joueurs (P1) et (P2) X 1 = {x 11, x 12,..., x 1m } est l ensemble des stratégies pures du premier joueur X 2 = {x 21, x 22,..., x 2n } est l ensemble des stratégies pures du second joueur la fonction de gain du premier joueur f 1 : X 1 X 2 R (x 1i, x 2j ) f 1 (x 1i, x 2j ) = a ij la fonction de gain du second joueur f 2 : X 1 X 2 R (x 1i, x 2j ) f 2 (x 1i, x 2j ) = b ij

Jeux bimatriciels Le jeu (1) peut être entièrement caractérisé par les deux matrices des gains A, B, (2) où A = (a ij ) i M,j N est la matrice des gains du premier joueur, B = (b ij ) i M,j N est la matrice des gains du second joueur.

Jeux bimatriciels Remarque Parfois, pour alléger les notations, on notera par i X 1 la stratégie x 1i X 1 du joueur (P1) et il en serait de même pour le joueur (P2).

Concepts de solutions Considérons un jeu bi-matriciel (A, B).

Concepts de solutions Considérons un jeu bi-matriciel (A, B). Étant donnée l hypothèse que les deux joueurs (P1) et (P2) sont rationnels et doivent prendre leurs décisions simultanément, que peut-on prédire qu ils vont jouer, ou que peut-on prédire qu ils ne vont pas jouer?

Concepts de solutions Considérons un jeu bi-matriciel (A, B). Étant donnée l hypothèse que les deux joueurs (P1) et (P2) sont rationnels et doivent prendre leurs décisions simultanément, que peut-on prédire qu ils vont jouer, ou que peut-on prédire qu ils ne vont pas jouer? quels choix stratégiques feraient les deux joueurs?

Concepts de solutions Considérons un jeu bi-matriciel (A, B). Étant donnée l hypothèse que les deux joueurs (P1) et (P2) sont rationnels et doivent prendre leurs décisions simultanément, que peut-on prédire qu ils vont jouer, ou que peut-on prédire qu ils ne vont pas jouer? quels choix stratégiques feraient les deux joueurs? La réponse à ces questions fera l objet de ce chapitre.

Équilibre en stratégies non dominées Definition On dit que la stratégie pure i X 1 du joueur (P1) (respectivement j X 2 du joueur (P2)), domine strictement la stratégie pure i X 1 pour le joueur (P1), (respectivement j X 2 du joueur (P2)), si, a i k > a ik, k {1,..., m}, (respectivement, b kj > b kj, k {1,..., n}).

Équilibre en stratégies non dominées Definition (Équilibre en stratégies non dominées) Une situation (x 1i, x 2j ) X 1 X 2 est appelée équilibre en stratégies non dominées dans le jeu bi-matriciel (2), si la stratégie x 1i X 1 (respectivement x 2j X 2 ) est une stratégie non dominée pour le joueur (P1) (respectivement pour le joueur (P2)).

Dilemme du prisonnier Exemple (Dilemme du prisonnier) Le dilemme du prisonnier est l un des exemples les plus connus dans la littérature de la théorie des jeux. Il caractérise une situation dans laquelle deux individus sont suspectés d avoir commis un crime. Interrogés séparément, la police leur fait les propositions suivantes :

Dilemme du prisonnier S ils avouent tous les deux, ils seront condamnés à 8 ans de prison chacun. S ils nient tous les deux, ils seront condamnés à 2 ans de prison chacun. Si l un avoue et l autre nie, alors celui qui aura nié sera condamné à 30 ans de prison, alors que l autre sera libéré. Les évaluations des différentes situations du jeu pour chacun des deux joueurs sont données sous forme de deux matrices notées : A pour le joueur (P1) et B pour le joueur (P2).

Dilemme du prisonnier (P1) Avouer Nier (P2) ( Avouer Nier ) ( 8, 8) (0, 30) ( 30, 0) ( 2, 2) Figure: Jeu du dilemme du prisonnier.

Dilemme du prisonnier (P1) Avouer Nier (P2) ( Avouer Nier ) ( 8, 8) (0, 30) ( 30, 0) ( 2, 2) Figure: Jeu du dilemme du prisonnier. L équilibre en stratégies non dominées dans cette situation est la paire de stratégies pures (x 11, x 21 )=(avouer, avouer).

Stratégies de sécurité Definition Une paire de stratégies (x 1i, x 2j ) X 1 X 2 est une paire de stratégies de sécurité pour les deux joueurs (P1) et (P2) dans le jeu bimatriciel (2), si V S 1 V S 2 = min a i j = max j=1,n i=1,m = min b ij = max i=1,m j=1,n min a ij, j=1,n min i=1,m b ij. (3)

Niveaux de sécurité Les niveaux de sécurité correspondants aux joueurs (P1) et (P2) respectivement sont V S 1 et V S 2.

Exemple Exemple (P2) (P1) A N ( A N 8 0 30 2 ) Figure: Jeu du dilemme du prisonnier. La stratégie de sécurité pour le joueur (P1) est : V S 1 = min a i j = max j=1,n i=1,m min a ij j=1,n x 11 = Avouer et V S 1 = 8.

Exemple Exemple (P2) (P1) A N ( A N 8 30 0 2 ) Figure: Jeu du dilemme du prisonnier. La stratégie de sécurité pour le joueur : V S 2 = min b ij = max i=1,m j=1,n min i=1,m b ij. (P2) est x 21 =Avouer et V S 2 =-8.

Rationalité individuelle Definition (Rationalité individuelle) Une situation (x 1i, x 2j ) X 1 X 2 dans le jeu bimatriciel (2) est dite individuellement rationnelle, si { ai j V S 1 b i j V S 2

exemple Exemple La situation (x 11, x 21 )=(avouer, avouer) est individuellement rationnelle dans le jeu du dilemme du prisonnier.

Équilibre de Nash en stratégies pures L équilibre de Nash en stratégies pures dans le cas du jeu bimatriciel (2) est défini comme suit : Definition (Équilibre de Nash) Une situation (x 1i, x 2j ) X 1 X 2 est un équilibre de Nash dans le jeu bimatriciel (2), si { ai j a ij, i = 1, m ; b i j b i j, j = 1, n ;

Exemple (P1) Avouer Nier (P2) ( Avouer Nier ) ( 8, 8) (0, 30) ( 30, 0) ( 2, 2) Figure: Jeu du dilemme du prisonnier. La situation (x 11, x 21 )=(avouer, avouer) constitue un équilibre de Nash dans le jeu du dilemme du prisonnier.

Remarque Remarque Un jeu bimatriciel peut admettre plus d une solution équilibre de Nash, avec les gains respectifs différents. Dans ce cas, le choix entre ces équilibres devient problématique.

Exemple Considérons le jeu bimatriciel suivant : A = x 11 x 12 ( x 21 x 22 ) 4 0 3 2 B = x 11 x 12 ( x 21 x 22 ) 2 0 4 5

Exemple Considérons le jeu bimatriciel suivant : A = x 11 x 12 ( x 21 x 22 ) 4 0 3 2 B = x 11 x 12 ( x 21 x 22 ) 2 0 4 5 Ce jeu admet deux équilibres de Nash en stratégies pures qui sont (x 11, x 21 ) et (x 12, x 22 ) avec les résultats correspondants (4, 2) et (2, 5) respectivement.

Exemple Considérons le jeu bimatriciel suivant : A = x 11 x 12 ( x 21 x 22 ) 4 0 3 2 B = x 11 x 12 ( x 21 x 22 ) 2 0 4 5 Mais puisqu il n y a pas de coopération entre les joueurs, le joueur (P1) peut alors choisir sa stratégie x 11 et le joueur (P2) sa stratégie x 22.

Exemple Considérons le jeu bimatriciel suivant : A = x 11 x 12 ( x 21 x 22 ) 4 0 3 2 B = x 11 x 12 ( x 21 x 22 ) 2 0 4 5 Mais puisqu il n y a pas de coopération entre les joueurs, le joueur (P1) peut alors choisir sa stratégie x 11 et le joueur (P2) sa stratégie x 22, qui mènerait vers un résultat du jeu égal à (0, 0) qui n est pas favorable pour les deux joueurs, en d autres termes, on obtient une situation qui ne soit même pas un équilibre.

Exemple Considérons le jeu bimatriciel suivant : A = x 11 x 12 ( x 21 x 22 ) 4 0 3 2 B = x 11 x 12 ( x 21 x 22 ) 2 0 4 5 Mais puisqu il n y a pas de coopération entre les joueurs, le joueur (P1) peut alors choisir sa stratégie x 11 et le joueur (P2) sa stratégie x 22, qui mènerait vers un résultat du jeu égal à (0, 0) qui n est pas favorable pour les deux joueurs, en d autres termes, on obtient une situation qui ne soit même pas un équilibre. Ceci est en fait l un des dilemmes dans la prise de décision dans les jeux non coopératifs lorsque un jeu donné admet plus d un équilibre de Nash en stratégies pures.

Équivalence stratégique Definition Deux jeux bimatriciels avec de matrices de gains (A, B) et (C, D) respectivement sont dits stratégiquement équivalents, s il existe des constantes positives γ 1, γ 2, δ 1 et δ 2 telles que : a ij = γ 1 c ij + δ 1 b ij = γ 2 d ij + δ 2 pour tout i = 1,..., m, j = 1,..., n.

Équivalence stratégique Proposition Tous les jeux bimatriciels stratégiquement équivalents possèdent le même équilibre de Nash.

Équivalence stratégique Proposition Les équilibres de Nash dans un jeu bimatriciel (A, B) sont interchangeables, si le jeu (A, B) est stratégiquement équivalent à (A, A).

Équilibre de Pareto La question que l on peut se poser est de savoir s il est possible d ordonner les solutions d équilibre de Nash pour déclarer une seule d entre elles comme solution équilibre de Nash la plus favorable. Ceci n est pas toujours possible, puisqu il n existe pas d ordre total entre des paires de nombres. Mais quelques notions de meilleure et admissible peuvent être introduites à travers un ordre partiel.

Domination au sens de Pareto Definition Une paire de stratégies (x 1i1, x 2j1 ) est dite Pareto-meilleure qu une autre paire de stratégies (x 1i2, x 2j2 ), si, { ai2 j 2 a i1 j 1, b i2 j 2 b i1 j 1. où, l une, au moins des inégalités, est stricte.

Equilibre admissible Definition Un équilibre de Nash est dit admissible s il n existe pas un autre équilibre de Nash qui est Pareto-meilleur.

Exemple Exemple Considérons le jeu bimatriciel suivant : A = x 11 x 12 ( x 21 x 22 ) 3 3 0 5, B = x 11 x 12 ( x 21 x 22 ) 3 2 0 3 ;

Exemple A = x 11 x 12 ( x 21 x 22 ) 3 3 0 5, B = x 11 x 12 ( x 21 x 22 ) 3 2 0 3 ; Ce jeu admet deux équilibres de Nash en stratégies pures qui sont (x 11, x 21 ) et (x 12, x 22 ) avec les résultats correspondant (3, 3) et (5, 3) respectivement, mais un seul équilibre de Nash est admissible qui est (x 12, x 22 ), appelé aussi équilibre de Pareto.

Calcul de l équilibre de Nash en stratégies pures Nous décrivons dans ce qui suit certains algorithmes qui permettent de déterminer l ensemble des équilibres de Nash en stratégies pures dans un jeu bimatriciel (2).

Algorithme basé sur la notion de jeu augmenté Cet algorithme, dû à S. X. BAI, est basé sur la notion du jeu augmenté correspondant au jeu bimatriciel (2) avec les mêmes espaces de stratégies pures X 1 pour le joueur (P1) et X 2 pour le joueur (P2) et des matrices de gains à et B qui seront définies d une manière spécifique.

Jeu augmenté Definition Le jeu augmenté correspondant au jeu bimatriciel (2) est défini par : < X 1, X 2, Ã, B >, (4) où Ã = (ã ij ) 1 i m,1 j n, ã ij = ) B = ( b ij, b ij = 1 i m,1 j n { aij, si a ij = max a kj ; k M, sinon ; { bij, si b ij = max b ik ; k M, sinon ; (5) (6) où M > max{ a ij, b ij }. i,j

Jeu augmenté Proposition (S. X. BAI) Une situation (x 1i, x 2j ) X 1 X 2 est un équilibre de Nash en stratégies pures dans le jeu bimatriciel (2), si et seulement si, { ãi j > M, b i j > M.

Algorithme de S. X. BAI Introduire les deux m n matrices A et B. Déterminer un scalaire M tel que : M = max( a ij, b ij ) + 1. (7) i,j Construire à et B selon la formule (5). Rechercher les paires de stratégies (x 1i, x 2j ) vérifiant { ãi j > M, b i j > M. Si une telle paire de stratégies n existe pas, terminer, le jeu n admet pas d équilibre de Nash en stratégies pures, sinon aller à l étape 5. Sélectionner dans l ensemble des équilibres de Nash, un équilibre de Nash admissible. Terminer.

Proposition Proposition L algorithme de S. X. BAI montre à la fin de l exécution que : soit le jeu bimatriciel (2) admet un équilibre de Nash en stratégies pures, soit il n existe pas de telle solution.

Exemple Soit le jeu bimatriciel suivant : A = x 11 x 12 x 13 x 21 x 22 x 23 4 5 6 2 8 3, 3 9 2 B = x 11 x 12 x 13 x 21 x 22 x 23 3 1 2 1 4 6. 0 6 8

Exemple On calcule la valeur de M selon la formule (7) : M = max( a ij, b ij ) + 1 = 9 + 1 = 10. i,j Construisons les matrices à et B selon la formule (5). ã = x 11 x 12 x 13 x 21 x 22 x 23 4 10 6 10 10 10, 10 9 10 b = x 11 x 12 x 13 x 21 x 22 x 23 3 10 10 10 10 6 10 10 8

Exemple ã = x 11 x 12 x 13 x 21 x 22 x 23 4 10 6 10 10 10, 10 9 10 b = x 11 x 12 x 13 x 21 x 22 x 23 3 10 10 10 10 6 10 10 8 La seule paire de stratégies vérifiant { ãi j > 10, b i j > 10, est la paire de stratégies pures (x 1i, x 2j ) = (x 11, x 21 ) qui constitue un équilibre de Nash en stratégies pures, avec les gains respectifs des joueurs (P1) et (P2) égaux à 4 et 3.

Jeux bimatriciels en stratégies mixtes Comme pour les jeux matriciels, en absence d un équilibre de Nash en stratégie pures, les joueurs utiliseront leurs stratégies mixtes. Le jeu bimatriciel correspondant au jeu bimatriciel (2) est défini par < m, n, f 1, f 2 >, (8) où m = {α = (α 1, α 2,..., α m ) R m / α i m {0, 1}, i = 1,..., m, α i = 1} est l ensemble i=1 des stratégies mixtes du joueur (P1), n = {β = (β 1, β 2,..., β n ) R n / β j {0, 1}, j = n 1,..., n, β j = 1} est l ensemble des stratégies j=1 mixtes du joueur (P2),

Jeux bimatriciels en stratégies mixtes f 1 est la fonction des gains du joueur (P1) définie par : f 1 : m n R (9) (α, β) f 1 (α, β) = α t Aβ, (10) f 2 est la fonction des gains du joueur (P2) définie par : f 2 : m n R (11) (α, β) f 1 (α, β) = α t Bβ, (12)

Jeux bimatriciels en stratégies mixtes Definition Un couple de stratégies mixtes (α, β ) m n est un équilibre de Nash du jeu (8), si α t Aβ (α ) t Aβ, α m, (13) (α ) t Bβ (α ) t Bβ, β n (14)

Programmation bilinéaire L une des formulations possibles du problème de la recherche d un équilibre de Nash en stratégies mixtes dans le jeu bimatriciel (8) est sa transformation en un problème de programmation nonlinéaire (en fait un programme bilinéaire).

Programmation bilinéaire Proposition Une situation (α, β ) m n est un équilibre de Nash en stratégies mixtes dans le jeu bimatriciel (8), si et seulement, si α m est solution optimale du problème P 1 (β ) : P 1 (β ) max α m α t Aβ, l t mα = 1, α 0, (15a) et β n est solution optimale du problème P 2 (α ) : max (α ) t Bβ, P 2 (α β ) l nβ t = 1, β 0. où l m = (1, 1,..., 1) t R m et l n = (1, 1,..., 1) t R n. (15b)

Théorème Théorème Une paire de stratégies (α, β ) m n est un équilibre de Nash en stratégies mixtes dans le jeu bimatriciel (8) si et seulement si, (α, β, p, q ) est une solution du problème de programmation bilinéaire suivant : max α,β,p,q {α t Aβ + α t Bβ + p + q}, Aβ pl m, B t α ql n, α t l m = 1, β t l n = 1, α 0, β 0, où l m = (1, 1,..., 1) t R m et l n = (1, 1,..., 1) t R n. (16)

Preuve Soit (α, β ) m n un équilibre de Nash en stratégies mixtes dans le jeu (8). Dans ce cas, α est solution optimale du problème suivant : P 1 (β ) max α m α t Aβ, l t mα = 1, α i 0, i = 1,..., m, (17a) et β solution optimale du problème suivant : α t Bβ, P 2 (α ) max β n l t nv = 1, β j 0, j = 1,..., n. (17b)

Preuve Posons α t Aβ = p et α t Bβ = q, (18) Des relations (17a) et (17b) on aura : α t Aβ p, α m, (19) α t Bβ q, β n, (20) Soient α m et β n. Des relations (19) et (20) on aura : n a ij βj p, i = 1,..., m, (21) j=1 m b ij αi q, j = 1,..., n. (22) i=1 D où Aβ p l m, (23) B t α q l n. (24)

Preuve Des relations (17a), (17b), (23) et (24), on déduit que (α, β, p, q ) (25) est une solution réalisable du problème (16) et de la relation (18) on déduit que : α t Aβ + α t Bβ + p + q = 0. (26)

Preuve Par ailleurs toute solution réalisable (α, β, p, q) du problème (16) vérifie : Aβ pl m, (27) B t α ql n. (28) En multipliant les membres de l inégalité (27) par α t et les membres de l inégalité (28) par β on obtient : α t Aβ pα t l m = p, α t Bβ ql t nβ = q. Ainsi, pour toute solution réalisable (α, β, p, q), la fonction objectif du problème (16) satisfait α t Aβ + α t Bβ + p + q 0, (29) et de la relation (26), on déduit que (α, β, p, q ) est la solution optimale du problème (16).

Preuve Inversement, soit (ᾱ, β, p, q) une solution optimale du problème (16). L existence d une solution réalisable du problème (16) a été prouvée par (25). Plus précisément chaque jeu bimatriciel (A, B) admet un équilibre de Nash en stratégies mixtes (α, β ) et donc (25) est une solution réalisable de (16). De plus, de (25), on déduit la valeur maximale de la fonction objectif de (16) est non positive, qui, d après (29), implique et ᾱa β + ᾱb β + p + q = 0 (30) A β pl m (31) B t ᾱ ql n (32) ᾱ t l m = 1 (33) β t l n = 1 (34) ᾱ 0, β 0 (35)

Preuve De la relation (31), on aura : α 0/ lmα t = 1, α t A β pα t l m = p (36) et de la relation (32) on aura : β 0/ lnβ t = 1, ᾱ t Bβ ql nβ t = q (37)

Preuve Des relations (30), (36) et (37), on déduit que : α t A β + ᾱbβ p q = ᾱ t A β + ᾱb β (38) En particulier, des relations (31) et (32), on aura : { ᾱt A β p, ᾱ t B β q. (39)

Preuve Des relations (38) et (39), on déduit que : { ᾱt A β = p, ᾱ t B β = q. (40) Des relations (36) et (37), on déduit que : α t A β ᾱ t A β, (41) ᾱ t Bβ ᾱ t B β, (42)

Preuve c est-à-dire : ᾱ est une solution du problème max α t A β, α lmα t = 1, α 0, et β est une solution du problème max ᾱ t Bβ, β ln 1 β = 1, β 0,

Calcul d un équilibre en stratégies pures - Programmation linéaire bivalente L une des formulations possibles du problème de la recherche d un équilibre de Nash en stratégies pures dans le jeu bi-matriciel (2) est la programmation bivalente.

Calcul d un équilibre en stratégies pures - Programmation linéaire bivalente Considérons le jeu suivant à deux joueurs : U, V, f 1, f 2, (43) où U = {u = (u 1, u 2,..., u m ) R m / u i {0, 1}, i = m 1,..., m, u i = 1} est l ensemble des stratégies i=1 du joueur (P1), V = {v = (v 1, v 2,..., v n ) R n / v j {0, 1}, j = n 1,..., n, v j = 1} est l ensemble des stratégies du j=1 joueur (P2),

Calcul d un équilibre en stratégies pures - Programmation linéaire bivalente f 1 est la fonction des gains du joueur (P1) définie par : f 1 : U V R (u, v) f 1 (u, v) = u t Av, f 2 est la fonction des gains du joueur (P2) définie par : f 2 : U V R (u, v) f 2 (u, v) = u t Bv.

Calcul d un équilibre en stratégies pures - Programmation linéaire bivalente Proposition 1 Une situation (x 1i, x 2j ) X 1 X 2 est un équilibre de Nash en stratégies pures dans le jeu bimatriciel (2), si et seulement si il existe une situation (u, v ) U V qui est un équilibre de Nash en stratégies pures dans le jeu (43), où { u = (u1, u2,..., ui,..., u m) R m avec uk 0 si k i = ; 1 sinon, (44) et v = (v 1, v 2,..., v j,..., v n ) R n avec v l = { 0 si l j ; 1 sinon. (45)

où l m = (1, Mohammed 1,..., Said 1) t RADJEF R m et Théorie l n = des (1, Jeux 1,..., 1) t R n. Calcul d un équilibre en stratégies pures - Programmation linéaire bivalente Proposition 1 Une situation (u, v ) U V est un équilibre de Nash en stratégies pures dans le jeu bi-matriciel (43), si et seulement, si u est solution optimale du problème max u u t Av, e t mu = 1, u {0, 1} m, (46a) et v est solution optimale du problème max v u T Bv, env t = 1, v {0, 1} n. (46b)

Programmation linéaire bivalente Théorème Une paire de stratégies (x 1i, x 2j ) X 1 X 2 est un équilibre de Nash en stratégies pures dans le jeu bimatriciel (2), si et seulement si, (u, v, p, q ) est une solution du problème de programmation bi-linéaire suivant : max u,v,p,q {u t Av + u t Bv + p + q}, Av pl m, B t u ql n, u t l m = 1, v t l n = 1, u {0, 1} m, v {0, 1} n, (47)

Programmation linéaire bivalente Dans les conditions du théorème précédent, on aura x 1i u k = { 0 si k i ; 1 sinon, x 2j { vl 0 si l j = ; 1 sinon. u t Av = p et u t Bv = q