Introduction à la théorie des jeux et aux problèmes de révélations d information

Documents pareils
CHAPITRE 5. Stratégies Mixtes

L Assurance. L Assurance

Introduction à la Théorie des Jeux p.1/77

Théorie des Jeux Et ses Applications

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Loi binomiale Lois normales

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Probabilités conditionnelles Exercices corrigés

Calculs de probabilités conditionelles

Les indices à surplus constant

Programmation linéaire

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Sujet 4: Programmation stochastique propriétés de fonction de recours

Programmation linéaire

La classification automatique de données quantitatives

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Lagrange, où λ 1 est pour la contrainte sur µ p ).

Mathématiques appliquées à l'économie et à la Gestion

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Optimisation des fonctions de plusieurs variables

OPTIMISATION À UNE VARIABLE

Corrigé du baccalauréat S Asie 21 juin 2010

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

PRECISION - REJET DE PERTURBATIONS T.D. G.E.I.I.

Cours de Recherche Opérationnelle IUT d Orsay. Nicolas M. THIÉRY. address: Nicolas.Thiery@u-psud.fr URL:

Cours d Analyse. Fonctions de plusieurs variables

Simulation centrée individus

La mesure de Lebesgue sur la droite réelle

Economie de l Incertain et des Incitations

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Théorèmes de Point Fixe et Applications 1

Exercice : la frontière des portefeuilles optimaux sans actif certain

Feuille d exercices 2 : Espaces probabilisés

TSTI 2D CH X : Exemples de lois à densité 1

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Le théorème des deux fonds et la gestion indicielle

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

4. Martingales à temps discret

Optimisation Discrète

Chapitre 2. Matrices

Chapitre 5 : Flot maximal dans un graphe

Développements limités. Notion de développement limité

Chp. 4. Minimisation d une fonction d une variable

1 de 46. Algorithmique. Trouver et Trier. Florent Hivert. Mél : Florent.Hivert@lri.fr Page personnelle : hivert

Suites numériques 3. 1 Convergence et limite d une suite

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Automatique (AU3): Précision. Département GEII, IUT de Brest contact:

CCP PSI Mathématiques 1 : un corrigé

Image d un intervalle par une fonction continue

Limites finies en un point

Correction du baccalauréat ES/L Métropole 20 juin 2014

Couples de variables aléatoires discrètes

Canevas théoriques du projet sur le poker Partie A

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Chapitre 7 : Intégration sur un intervalle quelconque

Calcul différentiel sur R n Première partie

THESE de DOCTORAT. présentée pour obtenir le grade de : Docteur de l Université Paris 1 Panthéon-Sorbonne. présentée par

Quelques tests de primalité

Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe

Le théorème de Thalès et sa réciproque

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Cours 02 : Problème général de la programmation linéaire

Lois de probabilité. Anita Burgun

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Travaux dirigés d introduction aux Probabilités

Programmation Linéaire - Cours 1

Raisonnement par récurrence Suites numériques

Équations non linéaires

O, i, ) ln x. (ln x)2

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Cours de Probabilités et de Statistique

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

FONCTION DE DEMANDE : REVENU ET PRIX

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Simulation de variables aléatoires

Jeux sous forme extensive (Jeux dynamiques)

LES MÉTHODES DE POINT INTÉRIEUR 1

LES PROBLEMES D ASYMETRIE D INFORMATION AU SEIN DE L ENTREPRISE

Compression Compression par dictionnaires

MATH ELEMENTS DU CALCUL DES PROBABILITES

RECHERCHE OPERATIONNELLE

Groupe symétrique. Chapitre II. 1 Définitions et généralités

FIMA, 7 juillet 2005

Commun à tous les candidats

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

ENS de Lyon TD septembre 2012 Introduction aux probabilités. A partie finie de N

Partie 1. La structure des réseaux sociaux

un environnement économique et politique

Chapitre 3. Les distributions à deux variables

) ) ) ) Structure et optimisation des coûts de la conformité Analyse comparée de PCI DSS et ISO CNIS EVENT. 27 avril 2011.

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

Modèles et Méthodes de Réservation

Moments des variables aléatoires réelles

Chapitre 3 : INFERENCE

Transcription:

Introduction à la théorie des jeux et aux problèmes de révélations d information Marc Quincampoix Université de Brest ENS Ker Lann, 28 septembre 2011.

Introduction Interaction stratégique dans un système entre des acteurs qui ayant des intérêts divergents, prennent des décisions produisant un résultat. Pascal XVII ème,... Borel, Zermelo, J. Von Neumann, O. Morgenstern. Games and Economic Behaviour (1944) De J. Nash Prix Nobel Economie 1994 à R. Aumann Prix Nobel Economie 2005 L exemple de N. Rothschild le 20 juin 1815

Jeux matriciels à somme nulle à 2 joueurs Deux joueurs I et II choisisent simultanément leurs actions dans des ensembles finis I et J. Le résultat des actions i I et j J est un nombre a i,j paiement du jeu que J II doit verser à J I Soit la matrice A = (a i,j ) (i,j) I J Le premier joueur maximise le paiement, le second joueur minimise le paiement H B ( G D ) 2 3 1 6

Plan 1. Introduction 2. Jeux à somme nulle et information complète 3. Jeux à somme nulle et information incomplète 4. Extension

Jeux à somme nulle et information complète Le Joueur I peut garantir v = max i I min j J a i,j Le Joueur II peut garantir v + = min j J max i I a i,j On a toujours v v +. Si v = v + on dit que le jeu a une valeur (pure). ( ) ( ) v 2 3 = 2 = v + 2 3 1 6 1 6 v ( 1 0 0 1 ) = 0 <= v + ( 1 0 0 1 ) = 1 Question J I peut il ameliorer le paiement v?

( ) 1 0 Si on a un nombre très grand de jeux, le joueur 0 1 I peut choisir une fréquence (une stratégie ) de jouer H ou bas (par ex. jouer H un coup sur trois en moyenne). Plus généralement il choisit une probabilité p [0, 1] de jouer H et 1 p de jouer B. Sa valeur moyenne garantie est alors v = max min{p.1 + (1 p)0, p.0 + (1 p)1} = max min{p, 1 p} p [0,1] p [0,1] = 1 2 > v = 0 ( voir graphique ) En jouant une probabilité au lieu d un choix de ligne J I a amélioré son gain. min max{q, 1 q} = 1 q [0,1] 2 = v+ < v + = 1.

Stratégies Mixtes Notation (I) = {(p 1, p 2,... p I ) (R + ) I, i I p i = 1} Définitions Une stratégie mixte de J I est le choix de p (I), une stratégie pure est le choix d un i I. Définition similaire des stratégies mixtes q (J). Valeurs mixtes : Proposition v = max p (I) min q (J) v + = i,j min q (J) v v = max min p (I) j j p i q j a i,j = max p (I) max p (I) pt Aq min q (J) pt Aq p i a i,j v + v + i

Equilibres de Nash A toutes stratégies (σ, τ) (pures ou mixtes) est associé un paiement g(σ, τ) (pures g(i, j) = a i,j, mixtes g(p, q) = p T Aq) Une paire de stratégies (σ, τ ) (pures ou mixtes) est un équilibre de Nash ssi σ, τ, g(σ, τ ) g(σ, τ ) g(σ, τ) Remarques S il y a un équilibre de Nash - par exemple en stratégies mixte - le jeu a une valeur v + = v qui est le paiement de la stratégie donnant l équilibre. Inversement, si le jeu a une valeur en stratégie mixte alors il existe un couple de stratégies qui est un équilibre de Nash.

Théorème de Von Neumann Tout jeu fini à deux joueurs et à somme non nulle a une valeur en stratégie mixte. Il y a donc un équilibre de Nash en stratégie mixte. Démonstration On sait que v v +. Il suffit de prouver que v + v. Pour cela on va montrer que α R, α < v + = α < v Soit donc α < v + = min q (J) max i I g(i, q). Donc pour tout q il existe un i tel que g(i, q) > α. Ceci s exprime aussi par g(, q) := (g(1, q), g(2, q),... g(i, q)) / ], α] I. On peut donc séparer le convexe q g(, q) = g(, (q)) et ], α] I par un (hyper)plan (voir graphique).

λ R I, β R, q, x ], α] I, < λ, x > < β < < g(., q), λ > REMARQUES: i, λ i 0 et i λ i 0 Définissons p (I) par p := i 1 λ λ. Donc pour tout q, i < p, g(., q) > > β i λ >>< p, (α, α... α) >= α i D où min q < p, g(., q) > > α, donc encore c est à dire v > α. max p min q < p, g(., q) > > α CQFD

Plan 1. Introduction 2. Jeux à somme nulle et information complète 3. Jeux à somme nulle et information incomplète 4. Extensions

Jeux à information incomplète d un coté Sont donnés deux ensembles d actions I et J des deux joueurs, K un ensemble d états de la nature, une famille de jeux matriciels (A k ) k K. Description du jeu en n étapes Initialement k K est tiré au hasard suivant une probabilité p (K). Le joueur I est informé de k mais pas le joueur II. la probabilité p est connue des deux joueurs; A chaque t = 1, 2... n, connaissant les actions précédentes des joueurs les joueurs choisissent simultanément i t I et j t J. A l étape n, J I recoit n t=1 a k i t,j t du joueur II. On appelle v n (p) la valeur du jeu en n étapes.

Exemple 1 ( ) I = J = {1, 2} K = {a, b} A a 1 0 = A 0 0 b = On se ramène à G D HH p 0 HB p 1 p BB 0 1 p BH 0 0 ( 0 0 0 1 On voit v 1 (p) = min{p, 1 p} Problème Le jeu infiniment répété a-t-il une valeur en moyenne? lim n v n (p) n? )

Encore l exemple quand p = 1 2 On a vu v 1 ( 1 2 ) = 1 2 avec pour stratégie optimale HB. Cette stratégie est très mauvaise si le jeu se répète car à partir de t = 2 J II peut entièrement déduire si k = a ou k = b et donc amener un paiement de 0 et donc le paiement infini moyen pour J I sera 0. On parle de stratégie complètement révélatrice. Une stratégie non révélatrice serait de jouer indépendemment de l état (par exemple en stratégie mixte de jouer ( H ou B 12 ) avec probabilité 2 1) on est alors face à un jeu 0 dont la valeur est 1 4 > 0. 0 1 2

Stratégies Stratégie pure du joueur I: σ = (σ 1, σ 2... σ n ) où σ t : K (I J) t 1 I Stratégie mixte du joueur I: σ = (σ 1, σ 2... σ n ) où σ t : K (I J) t 1 (I) Stratégie mixte du joueur II: τ = (τ 1, τ 2... τ n ) où τ t : (I J) t 1 (J) RESULTAT: Il existe une valeur v n (p) en stratégie mixte pour les jeux G n

Le jeu Auxilliaire où aucun joueur n est informé Description du jeu Initialement k K est tiré au hasard suivant une probabilité p (K). Ni le joueur I ni le joueur II ne sont informés de k, la probabilité p est connue des deux joueurs; Les joueurs choisissent simultanément une action i I et j J ce qui conduit à un paiement espéré de k K ak i,j p k On appelle u(p) la valeur de ce jeu matriciel de matrice A(p) := k K Ak p k ( ) p 0 Dans l exemple u(p) = val = p(1 p) 0 1 p

Le résultat de Aumann et Maschler Théorème La valeur limite moyenne du jeu existe. v n (p) p (K), lim n n = cav(u)(p) où cav(u) est l enveloppe concave de u, c est à dire la plus petite fonction concave au dessus de u. Dans l exemple, p u(p) = p(1 p) est concave donc lim n v n (p) n = p(1 p). Remarques sur la preuve Clairement v n(p) n p v n (p) est concave. v n(p) n < cav(u)(p) + Cst n u(p).

Autre exemple (voir graphique) I = {1, 2}, J = {1, 2, 3}, = {a, b} ( ) ( ) A a 4 0 2 = A 4 0 2 b 0 4 2 = 0 4 2 ( ) 4p 4(1 p) 4p 2 u(p) = V al 4p 4(1 p) 4p + 2

Plan 1. Introduction 2. Jeux à somme nulle et information complète 3. Jeux à somme nulle et information incomplète 4. Extensions

Jeux à information incomplète des deux cotés Sont donnés deux ensembles d actions I et J, K L un ensemble d états de la nature, une famille de jeux matriciels (A k,l ) (k,l) K L. Description du jeu en n étapes Initialement (k, l) K L sont tirés au hasard suivant une probabilité p (K) et q (L). Le joueur I est informé de k mais pas le joueur II. Le joueur II est informé de l mais pas le joueur I. Les probabilités p et q sont publiques. A t = 1, 2... n, les joueurs choisissent i t I et j t J. A l étape n, J I reçoit n t=1 a k,l i t,j du joueur II. t On appelle v n (p) la valeur du jeu en n étapes.

Le résultat de Mertens et Zamir Théorème La valeur limite moyenne du jeu existe. v n (p, q) (p, q) (K) (L), lim = v(p, q) n n C est l unique fonction v : (p, q) (K) (L) v(p, q) R solution du système d équations fonctionelles v = cav p min{u, v}, v = vex q max{u, v} où u est la valeur du jeu où aucun joueur n est informé.

Jeux à deux joueurs et à somme non nulle Dilemme du prisonnier H B ( G D ) ( 3, 3) (0, 6) ( 6, 0) ( 1, 1)

Equilibre pour jeux à deux joueurs et à somme non nulle Actions des deux joueurs : I et J. Matrice des paiements A = [(a i,j, b i,j )] (i,j) I J Definition (i, j ) est un équilibre de Nash en stratégie pure si et seulement si { ai,j a (i, j) I J i,j b i,j b i,j Théorème de Nash Il existe un équilibre de Nash en stratégie mixte Autres extensions : Problèmes d information, Cas de N > 2 joueurs...

XXI ème siècle Temps continu, jeux différentiels Jeux répétés à information incomplète en finance

Références J. Von Neumann, O. Morgenstern. (1944) Games and Economic Behaviour S. Sorin (2002) A First Course on Zero-Sum Repeated Games, Springer R. Laraki, J. Renault, T. Tomala (2007) Introduction à la théorie des jeux répétés. Editions de l X