Correction examen théorie des jeux

Documents pareils
Economie de l Incertain et des Incitations

CHAPITRE 5. Stratégies Mixtes

Simulation centrée individus

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Jeux sous forme extensive (Jeux dynamiques)

1 Définition et premières propriétés des congruences

Probabilités sur un univers fini

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Probabilités sur un univers fini

Cours 02 : Problème général de la programmation linéaire

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

L oligopole ESCP

I. Cas de l équiprobabilité

Probabilités conditionnelles Exercices corrigés

La consolidation à une date ultérieure à la date d acquisition

Manuel utilisateur. Version 1.6b

LES PROBLEMES D ASYMETRIE D INFORMATION AU SEIN DE L ENTREPRISE

Théorèmes de Point Fixe et Applications 1

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

La maison Ecole d ' Amortissement d un emprunt Classe de terminale ES. Ce qui est demandé. Les étapes du travail

TESTS D'HYPOTHESES Etude d'un exemple

Limites finies en un point

Feuille 1 : représentation d interactions stratégiques, connaissance commune

Comparaison de fonctions Développements limités. Chapitre 10

Le produit semi-direct

Probabilités Loi binomiale Exercices corrigés

Introduction à la Théorie des Jeux p.1/77

Continuité en un point

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

1 Première section: La construction générale

Université Paris-Dauphine DUMI2E 1ère année, Applications

PRIME D UNE OPTION D ACHAT OU DE VENTE

Intégration et probabilités TD1 Espaces mesurés Corrigé

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

Fibonacci et les paquerettes

DOCM Solutions officielles = n 2 10.

Chapitre 1 : Évolution COURS

Problèmes de Mathématiques Filtres et ultrafiltres

Cahier des charges. pour la réalisation d une étude. Articulation des programmations nationale et communautaire en faveur de la R&D

Introduction / En quoi consiste une veille commerciale? / Quel est son rôle? / Quels sont les bénéfices au niveau de l organisation

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Exe Livret Animateur_Exe Livret Animateur 01/02/11 11:10 Page1

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Théorème du point fixe - Théorème de l inversion locale

Les indices à surplus constant

Conversion d un entier. Méthode par soustraction

B B A C U C C U C G 2 E 0 B 0

III- Raisonnement par récurrence

Calculs de probabilités avec la loi normale

HTML. Notions générales

LES TOUT PREMIERS PAS

Calculs de probabilités conditionelles

Sécurité de l'information

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Raisonnement par récurrence Suites numériques

Canevas théoriques du projet sur le poker Partie A

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Estimation et tests statistiques, TD 5. Solutions

Prudence, Epargne et Risques de Soins de Santé Christophe Courbage

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Règlement du jeu télévisé «JEUX DE NUIT»

Cours Fonctions de deux variables

Programmation linéaire et Optimisation. Didier Smets

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Principes de Finance

PRIVOR Plus prévoyance optimisée. Sécurité élevée et chances attractives de rendement

CHAPITRE 2 : MARCHE DES CHANGES A TERME ET PRODUITS DERIVES

Proposition. Si G est un groupe simple d ordre 60 alors G est isomorphe à A 5.

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

le PARCOURS de vente

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Resolution limit in community detection

avec des nombres entiers

Transactions de l agriculteur 1.5 /kilo 2.0 /kilo 2.5 /kilo Vente de la récolte l agriculteur

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

N d anonymat : Remarques générales :

Plan. 5 Actualisation. 7 Investissement. 2 Calcul du taux d intérêt 3 Taux équivalent 4 Placement à versements fixes.

PROBABILITÉS CONDITIONNELLES

4. Exercices et corrigés

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Baccalauréat ES Amérique du Nord 4 juin 2008

Projet d informatique M1BI : Compression et décompression de texte. 1 Généralités sur la compression/décompression de texte

I. Polynômes de Tchebychev

Groupe symétrique. Chapitre II. 1 Définitions et généralités

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

L HÔTELLERIE, UN NOUVEAU MÉTIER POUR UNE NOUVELLE CATÉGORIE D INVESTISSEURS

ELEC2753 Electrotechnique examen du 11/06/2012

Stratégie d assurance retraite

Chapitre 3. Les distributions à deux variables

Optimisation Discrète

P A P 1 D 1 -S 1 S 1 D 1

Primaire. analyse a priori. Lucie Passaplan et Sébastien Toninato 1

La relation client constitue un axe progrès stratégique pour toutes les entreprises.

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Suites numériques 3. 1 Convergence et limite d une suite

Transcription:

Correction examen théorie des jeux 2009-2010 July 13, 2010 Exercice 1 1) jeu sous forme extensive (à gauche) et forme normale (à droite): Nature 0.5 0.5 Rouge Noire C D C D (-1;1) (-1;1) c d c d Joueur 1 ensemble d info Joueur 2 c d C R C N (-1;1) (-1;1) C R D N (0;0) ( 1.5; 1.5) D R C N (0;0) (0.5; 0.5) D R D N (1;-1) (0;0) (1;-1) (2;-2) (1;-1) (-2;2) Dans le jeu sous forme normale, la notation de la stratégie C R D N signifie que le joueur 1 après avoir vu une carte Rouge (indice R) choisit de se Coucher (C) et après avoir vu une carte Noire (indice N) choisit de Doubler sa mise (D). Le paiement (-1.5;1.5) est obtenu en remarquant qu avec probabilité 0.5 la carte est Rouge, donc le joueur 1 se couche est le paiement est (-1;1) et avec probabilité 0.5 la carte est Noire, le joueur 1 Double sa mise, le joueur 2 aussi, donc le paiement est ( 2; 2). L espérance du paiement est donc 0.5 ( 1, 1) + 0.5 ( 2; 2) = ( 1.5, 1.5). Vu qu il est spécifié que le jeu est à somme nulle, on aurait pu écrire uniquement les paiements du joueur 1 (au lieu du couple des paiements). 2) Équilibres de Nash et stratégies optimales: a) Dans un jeu à deux joueurs à somme nulle, un couple de stratégies optimales est un équilibre de Nash. Réciproquement, tout équilibre de Nash est un couple de stratégies optimales. b) Le paiement d un équilibre de Nash est donc égal à la valeur du jeu à somme nulle. 3) Stratégies dominées Les stratégies C R C N et C R D N sont strictement dominées par la stratégie D R D N. Il n y a pas d autres stratégies faiblement ou strictement dominées. On peut remarquer que C R D N est aussi faiblement dominée par D R C N 1

4) Valeur du jeu et stratégies optimales Après élimination des stratégies strictement c d dominées, le jeu se ramène à : D R C N (0;0) (0.5; 0.5) D R D N (1;-1) (0;0) Il n y a pas d équilibres en stratégies pures, on va donc chercher un équilibre de Nash (d après la question précédente, équilibre de Nash et stratégies optimales coincident) en stratégie mixte. La stratégie mixte (x, 1 x) du joueur 1 rend le joueur 2 indifférent entre c et d à la condition que: x 0 + (1 x) 1=x 0.5 + (1 x) 0 donc si x =2/3. De la même façon la stratégie mixte (y, 1 y) du joueur 2 rend le joueur 1 indifférent entre D R C N et D R D N si y 0 + (1 y) 0.5 =y 1 + (1 y) 0 donc si y =1/3. Les stratégies optimales sont donc 2 3 D RC N + 1 3 D RD N pour le joueur 1 et 1 3 c+ 2 3d pour le joueur 2. La valeur du jeu est obtenue en calculant le paiement du joueur 1 à cet équilibre, qui est égal à 1/3 0 + 2/3 0.5 = 1/3. Exercice 2 Éliminer des stratégies faiblement dominées peut éliminer des équilibres: G D Dans le jeu H (0;0) (0; 0) (H, G) est un équilibre de Nash, mais la stratégie H B (0;0) (1;0) est faiblement dominée par la stratégie B. L élimination des stratégies faiblement dominée élimine donc cet équilibre. Exercice 3 1) Existence d une stratégie gagnante: G 1 n est un jeu sous forme extensive, fini, à information parfaite (chaque joueur sait toujours à quel noeud de l arbre le jeu se trouve), sans hasard, et qui se termine toujours par la victoire d un des joueurs (pas forcément toujours le même, peu importe). On sait qu il existe alors une stratégie gagnante pour un des joueurs. On peut d ailleurs la construire grâce à une induction amont (aussi appelée à rebours). 2) Exemple de stratégies gagnantes: Le joueur 1 a une stratégie gagnante dans G 1 1, G1 4 et G1 5. Dans G1 2 et G1 3 c est le joueur 2. Dans G 1 4, le joueur 1 choisit à la première étape de faire 2 paquets de 2 allumettes. Quel que soit le choix du paquet du joueur 2, ce dernier sera obligé de faire 2 paquets de 1 allumette et le joueur 1 n à plus qu à choisir n importe quel paquet de 1 allumette. 3) Détermination de N α et N β : a) L énoncé précise que, par définition du jeu, le joueur i gagne dans le jeu G i 1, donc 1 N α. Soit n 2 fixé. Supposons qu il existe n 1 tel que 1 n 1 n 1, n 1 N β et n n 1 N β. Alors dans les deux jeux G 1 n 1 et G 1 n n 1 le joueur 2 a une stratégie gagnante. Par symétrie entre les 2

joueurs, le joueur 1 a une stratégie gagnante dans les deux jeux G 2 n 1. Revenons au jeu G 1 n, il suffit donc au joueur 1 de choisir à la première étape n 1. En effet, le joueur 2 a alors le choix entre le jeu G 2 n 1 mais dans les deux cas le joueur 1 a une stratégie gagnante. Ce dernier va donc gagner quel que soit le choix du joueur 2. Donc : n 1, 1 n 1 n n 1,n 1 N β et n n 1 N β = n N α Supposons maintenant que n N α. Donc le joueur 1 a une stratégie gagnante dans G 1 n. Une telle stratégie décrit le choix à la première étape d un certain n 1 tel que 1 n 1 n 1 et ensuite tel que quel que soient les choix du joueur 2, le joueur 1 a toujours une réponse qui lui assure la victoire. On rappelle qu à la première étape le joueur 2 a le choix entre G 2 n 1. S il choisit G 2 n 1 alors en continuant de suivre sa stratégie gagnante (dans G 1 n) le joueur 1 est assuré de gagner dans ce sous-jeu. De même, si le joueur 2 a choisit G 2 n n 1. Ainsi, le joueur 1 a une stratégie gagnante dans G 2 n. Par symétrie entre les joueurs, le joueur 2 a une stratégie gagnante dans G 1 n 1 et G 1 n n 1. Donc n 1 N β et n n 1 N β. Ainsi: n N α = n 1, 1 n 1 n n 1,n 1 N β et n n 1 N β Pour la seconde équivalence. Vu que soit le joueur 2, soit le joueur 1, a une stratégie gagnante: n N β n N α non ( n 1, 1 n 1 n n 1,n 1 N β et n n 1 N β) n 1, 1 n 1 n n 1,n 1 N β ou n n 1 N β n 1, 1 n 1 n n 1,n 1 N α ou n n 1 N α b) Soit p N. On appelle H p l hypothèse de récurrence suivante : } H p : { k p; {5k 1, 5k, 5k +1} N N α et {5k +2, 5k +3} N β H 0 est vraie car 1 N α,2 N β et 3 N β, d après la question 1. Soit p N. Supposons H p vraie et montrons qu elle implique H p+1. 5(p + 1) 1 = 5p +4 N α car 2 et 5p + 2 sont dans N β d après H p ; 5(p + 1) = 5p +5 N α car 2 et 5p + 3 sont dans N β d après H p ; 5(p + 1) + 1 = 5p +6 N α car 3 et 5p + 3 sont dans N β d après H p ; 5(p + 1) + 2 = 5p +7 N β. En effet, soient n 1 et n 2 tels que 5p + 7 = n 1 + n 2. Il existe p 1,p 2 N et k 1,k 2 { 1, 0, 1, 2, 3} tels que n 1 =5p 1 + k 1 et n 2 =5p 2 + k 2. Si k 1 {2, 3} alors nécessairement k 2 { 1, 0} (car k 1 + k 2 est congru à 2 modulo 5). Donc, d après l hypothèse de récurrence 1 si n 1 N α, n 2 N α. 1 Pour être extrêmement rigoureux, il faudrait remarquer que n 1 5p+6 et donc il faut utiliser l hypothèse de récurrence H p ainsi que les trois points précédents 3

5(p + 1) + 3 = 5p +8 N β. Comme précédemment, soient n 1 et n 2 tels que 5p + 8 = n 1 + n 2. Il existe p 1,p 2 N et k 1,k 2 { 1, 0, 1, 2, 3} tels que n 1 =5p 1 + k 1 et n 2 =5p 2 + k 2. Si k 1 {2, 3} alors nécessairement k 2 {1, 0} (car k 1 + k 2 est congru à 3 modulo 5). Donc si n 1 N α, n 2 N α. Ainsi H p+1 est vraie. 4) Premier coup d une stratégie optimale dans G 1 104 104 est de la forme 5p 1 avec p = 21, donc d après la question précédente le joueur 1 avait une stratégie gagnante dans G 1 104, et le premier coup du joueur 1 peut être par exemple de faire un tas de 102 allumettes et un autre tas de 2 allumettes. Il aurait aussi été possible de faire deux tas de 7 et 97 allumettes, 12 et 92, etc. Exercice 4 1) Stratégies pures Dans ce jeu, une stratégie pure du joueur 1 est une fonction de {0, 1} dans R, i.e. donner, pour chaque qualité possible, un prix. Une stratégie du joueur 2 est une fonction de R dans {O, N}, i.e. dire, pour chaque prix, s il accepte (O) ou refuse (N) l offre. 2) Absence d équilibre pur avec des biens de qualité 1 vendus: a) Si l on suppose que des biens de qualité 1 sont vendus alors nécessairement le joueur 2 accepte d en acheter au prix proposé. Il accepte donc les offres au prix p 1. b) Un vendeur ayant un bien de qualité 1 et le vendant au prix p 1 gagne p 1 1 tandis qu il gagne 0 sans vendre. Comme on a supposé que le bien est vendu, il est nécessaire que le prix du vendeur maximise son paiement, donc nécessairement p 1 1 0, d où p 1 1. Si le vendeur propose un bien de qualité 0 à un prix p 0 inférieur à p 1 alors il aurait strictement plus en proposant le prix p 1. En effet supposons que le bien est vendu au prix p 0 ; il aurait aussi été vendu au prix p 1 (car l acheteur accepte l offre p 1 ) et donc le gain du vendeur est strictement supérieur. Si l on suppose au contraire que le bien n est pas vendu au prix p 0, il est par contre vendu au prix p 1. Donc le vendeur gagne strictement plus en proposant p 1 (qui est supérieur ou égal à 1) qu en ne le vendant pas au prix p 0. Donc nécessairement p 0 p 1. c) Si p 0 >p 1, alors p 0 p 1 et p 0 > 0. Comme p 0 p 1, étant donnée la stratégie du vendeur, l acheteur peut connaître la qualité du bien directement à partir du prix ; comme de plus p 0 > 0, l acheteur a intérêt à refuser les offres au prix p 0 (les accepter revient à acheter à un prix strictement positif une voiture de qualité nulle). Il les refuse donc, puisqu on suppose que les stratégies des joueurs forment un équilibre. Par conséquent, le vendeur gagnerait davantage en proposant pour les biens de qualité nulle p 0 = p 1 (car p 1 > 0 et les offres au prix p 1 sont acceptés par hypothèse), ce qui contredit l hypothèse que les stratégies des joueurs forment un équilibre. Supposons alors que p 0 = p 1. Si l acheteur accepte l offre, il gagne p 1 avec probabilité 2/3 et 2 p 1 avec probabilité 1/3, soit un gain espéré de 2/3 p 1 < 0 car p 1 1. Donc la meilleure réponse de l acheteur est de ne pas acheter et réaliser un gain de 0. 4

En conclusion, dans un équilibre pur, aucun bien n est vendu (car le vendeur sera toujours incité à faire passer un bien de mauvaise qualité pour un bien de bonne qualité). 3) Avec des certificats: a) Une stratégie pure du joueur 1 est une fonction de {0, 1} dans {C, NC} R, i.e. dire, pour chaque qualité q du bien, s il obtient le certificat et quel prix il propose. Une stratégie du joueur 2 est une fonction de {C, NC} R dans {O, N}, i.e. dire, étant donnés un certificat (ou non) et un prix, s il accepte l offre ou pas. b) Supposons que le joueur 2 ait les croyances suivantes aucun bien avec certificat n est de qualité 1 et une proportion 1/3 de ceux qui n ont pas de certificat sont de qualité 1 et que sa stratégie consiste à refuser tous les offres. Vu que toutes les offres sont refusés, tous les vendeurs ont intérêt à ne pas faire passer de certificat et donc les croyances de l acheteur sont confirmées. Par ailleurs la stratégie consistant à ne pas acheter face à une proportion 2/3 de biens de qualité 0 est optimale d après la question précédente. On a donc bien un équilibre bayésien parfait mélangeant. c) Supposons que le joueur 2 ait les croyances suivantes tous les biens avec certificat sont de qualité 1 et tous ceux qui n ont pas de certificat sont de qualité 0 et que sa stratégie consiste à accepter les offres avec certificat à un prix inférieur ou égal à 2. Un vendeur d un bien de qualité 1 obtient, s il fait passer un certificat et que l offre est acceptée, un paiement de p 1 1 1/2 =p 1 1.5; s il n obtient pas de certificat (ou si l offre est refusée) il obtient 0. Il a donc intérêt à obtenir le certificat et à proposer un prix p 1 = 2. Un vendeur d un bien de qualité 0 obtient, s il fait passer un certificat, au maximum 2 3 1 (car p 0 2 pour que l offre soit acceptée); il a donc intérêt à ne pas faire passer de certificat et à ne pas vendre l objet. Les croyances du joueur sont donc à nouveau confirmées. Par ailleurs la stratégie décrite est une meilleure réponse à la stratégie du vendeur. Il s agit donc d un équilibre bayésien parfait séparant. 5