Jeux sous formes extensive

Documents pareils
Economie de l Incertain et des Incitations

L oligopole ESCP

Feuille 1 : représentation d interactions stratégiques, connaissance commune

Fonctions homographiques

Calculs de probabilités conditionelles

I. Cas de l équiprobabilité

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Simulation centrée individus

Canevas théoriques du projet sur le poker Partie A

Calcul élémentaire des probabilités

Chapitre 3 : INFERENCE

CHAPITRE 5. Stratégies Mixtes

Comment vendre ses livres numériques sur la boutique Amazon Kindle (Jean-Claude Dunyach)

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

EXERCICES - ANALYSE GÉNÉRALE

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Probabilités conditionnelles Exercices corrigés

Probabilités III Introduction à l évaluation d options

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Les indices à surplus constant

Chapitre 1 : Évolution COURS

Jeux sous forme extensive (Jeux dynamiques)

Probabilités (méthodes et objectifs)

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Les devoirs en Première STMG

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Concurrence imparfaite

COMMUNAUTE ECONOMIQUE ET MONETAIRE DE L AFRIQUE CENTRALE LA COMMISSION

TD n o 8 - Domain Name System (DNS)

P1 : Corrigés des exercices

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Les salaires de L écosystème php en france. L Association Française des Utilisateurs de PHP (AFUP) le cabinet de recrutement spécialisé Agence-e

FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX

Logistique, Transports

PROGRAMME INTERNATIONAL POUR LE SUIVI DES ACQUIS DES ÉLÈVES QUESTIONS ET RÉPONSES DE L ÉVALUATION PISA 2012 DE LA CULTURE FINANCIÈRE

Affiliation Cash Livre PDF Gratuit Cliquez Ici Pour Télécharger Merci!

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

N d anonymat : Remarques générales :

Probabilités conditionnelles

P A P 1 D 1 -S 1 S 1 D 1

Simulation de variables aléatoires

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

O, i, ) ln x. (ln x)2

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Annexe B : Exemples. Avis de vente aux enchères liées Système de plafonnement et d échange de droits d émission de gaz à effet de serre (GES)

ECONOMIE MANAGÉRIALE NESSRINE OMRANI ECOLE POLYTECHNIQUE

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

L analyse situationnelle

- un jeu de K cartes représentées par des nombres C 1, C 2 à C K avec K entier strictement

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

1 er guide PDF. Comment démarrer?

Kerberos mis en scène

CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER. Epargne et emprunt Calcul actuariel

I La théorie de l arbitrage fiscal de la dette (8 points)

Peut-on imiter le hasard?

Cours de Probabilités et de Statistique

Objets Combinatoires élementaires

L ATTRIBUTION EN MARKETING DIGITAL

UN MBA POUR QUI, POURQUOI?

PRIME D UNE OPTION D ACHAT OU DE VENTE

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Introduction à la Théorie des Jeux p.1/77

Cours Fonctions de deux variables

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Seconde et première Exercices de révision sur les probabilités Corrigé

Exe Livret Animateur_Exe Livret Animateur 01/02/11 11:10 Page1

Conseils pratiques pour les épreuves

E-Forum sur l Approche par les Compétences

Problématique / Problématiser / Problématisation / Problème

TSTI 2D CH X : Exemples de lois à densité 1

Lagrange, où λ 1 est pour la contrainte sur µ p ).

UNE SOLUTION CRM CONÇUE POUR LA FORCE DE VENTE

ECOLE DES HAUTES ETUDES COMMERCIALES CORRIGÉ TYPE DE L EXAMEN

L ÉCHO de GUSTAVE La Page d Economie du Lycée Gustave Eiffel de Budapest

GUIDE COMPLET APP STORE OPTIMIZATION. Comment bien référencer son application dans les stores?

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Une proposition de séquence relative à l étude des sons /an/, /on/ et de leurs graphies. Cadre général

Chapitre 6. Le calcul du PIB, de l inflation et de la croissance économique. Objectifs d apprentissage. Objectifs d apprentissage (suite)

Stratégie simple et efficace pour augmenter officieusement le taux de vos livrets d épargne défiscalisés

PRENOM NOM DE L ENTREPRISE DATE DU STAGE METIER

Programmation linéaire

Aspects fiscaux des placements en société

BOURSE DE. de produits dérivés. Le supermarché

TD 3 : suites réelles : application économique et nancière

Chapitre 4 : cas Transversaux. Cas d Emprunts

Probabilités. C. Charignon. I Cours 3

Théorie des Jeux Et ses Applications

Info «travailleur indépendant»

La responsabilité civile et l'entreprise

Contenu. N Pages. Formavision: Une approche pratique de la formation 2. Objectifs de la séance 3

Attirez les meilleurs employés et consolidez votre entreprise

MATH ELEMENTS DU CALCUL DES PROBABILITES

Transcription:

Jeux sous formes extensive Cours : DEA APE Micro II Olivier Gossner Olivier.Gossner@enpc.fr CERAS, Fédération Jourdan Jeux et information, ENPC, 2003-2004 p. 1/2

Introduction Dans les cours précédents, nous avons toujours supposé que les joueurs connaissent parfaitement et les règles du jeu, y compris les utilités de tous les joueurs associées à chaque issue possible du jeu. Comment fait-on lorsque ceci n est pas vérifié? Exemples : Cournot, enchères, votes... Jeux et information, ENPC, 2003-2004 p. 2/2

Exemple Considérons les deux variations suivantes du dilemme du prisonnier qui diffèrent par l utilité du joueur 2 s il joue T. S T S T S 0,-2-10,1 T -1,-10-5,-5 S 0,-2-10,-7 T -1,-10-5,-11 Que peut-on dire si le joueur 2 sait quelle version du jeu est jouée mais le joueur 1 ne le sait pas? Jeux et information, ENPC, 2003-2004 p. 3/2

Astuce fondamentale On supposera que le joueur 1 a une croyance sur le jeu qui est joué (Savage). Soit 0 < µ < 1 la croyance que le jeu est le premier et 1 µ le second. Ceci revient à dire que: En première période, la Nature tire le jeu selon la loi (µ, 1 µ). Le joueur 2 est informé du résultat, mais pas le joueur 1. Le joueur 1 et le joueur 2 choisissent simultanément S ou T. Jeux et information, ENPC, 2003-2004 p. 4/2

Résolution Représenter ce nouveau jeu sous forme extensive. Quels sont les ensembles de stratégies pour chacun des joueurs? Résoudre le jeu. Jeux et information, ENPC, 2003-2004 p. 5/2

Plan du cours 1. Modèle général 2. Méthode de résolution 3. Applications Jeux et information, ENPC, 2003-2004 p. 6/2

Modèle de jeux bayésiens Un jeu bayésien est donné par Un ensemble de joueurs I ; Des ensembles de types Θ i ; Une loi P Θ sur Θ = Π i Θ i ; Des ensembles S i de stratégies, S = Π i S i ; Des fonctions d utilité g i : S Θ R. Jeux et information, ENPC, 2003-2004 p. 7/2

Déroulement du jeu 1. La nature tire un profil θ = (θ i ) i selon P Θ ; 2. Chaque joueur i est informé de θ i ; 3. Chaque joueur i choisit s i, s = (s i ) i ; 4. L utilité pour i est g i (s,θ). Jeux et information, ENPC, 2003-2004 p. 8/2

Cas particuliers Utilités personnelles connues : g i ne dépend pas de θ i, et peut donc s écrire g i (s,θ i ). Types indépendants: Les types sont tirés indépendamment, P Θ (θ) = Π i P Θ (θ i ). Le type d un joueur ne le renseigne pas sur les types des autres. Jeux et information, ENPC, 2003-2004 p. 9/2

Forme normale et Nash Une stratégie (pure) pour le joueur i est une application f i : θ i S i. Le paiement (espéré) du joueur i correspondant à un profil de stratégies f = (f j ) j est U i (f) = θ Θ P Θ (θ)g i ((f j (θ j )) j,θ)) Ceci définit le jeu bayésien sous forme normale. Définition Un équilibre de Nash bayésien est un équilibre de cette forme normale. Jeux et information, ENPC, 2003-2004 p. 10/2

Discussion Pourquoi la résolution d un jeu bayésien fait-elle intervenir tous les types d un joueur? Après tout, si je suis de type θ i, je devrais juste chercher à prendre une bonne décision étant donné ce type, sans avoir à me préoccuper de ce que j aurais fait si j avais été d un autre type θ i!! Jeux et information, ENPC, 2003-2004 p. 11/2

Discussion 2 La réponse tient au fait que pour chercher une bonne décision étant donné θ i, je dois me demander ce que feront autres joueur dans tous leurs types possibles. Les autres joueurs ne savent pas forcément que je suis de type θ i. Par conséquent, ils peuvent se demander ce que je ferais moi si j étais de type θ i. Donc moi aussi je devrais me le demander!!! Jeux et information, ENPC, 2003-2004 p. 12/2

Raisonnement à type donné Soit Θ i l ensemble des types de i ayant P Θ probabilité > 0. Supposons que le joueur i soit de type θ i Θ i et pense que les autres joueurs utilisent les stratégies f i. Conditionnellement à θ i Θ i, la croyance de i sur Θ est P θ i = P Θ ( θ i ). Le paiement espéré conditionnel à θ i en jouant s i est alors : V i (s i,θ i,f i ) = θ i P θ i (θ i )g i (s i,f i (θ i ),θ i,θ i ) Jeux et information, ENPC, 2003-2004 p. 13/2

Meilleures réponses Proposition f i est une meilleure réponse à f i si et seulement si pour tout θ i Θ i, f i (θ i ) maximise V i (,θ i,f i ) Pour jouer une meilleure réponse à des stratégies données aux autres joueurs, il faut et il suffit donc de jouer une meilleure réponse type par type!! Jeux et information, ENPC, 2003-2004 p. 14/2

Vente de voitures d occasion Une voiture peut être de bonne (B) ou mauvaise (M) qualité avec probabilités ( 2 1, 1 2 ). Le vendeur connaît la qualité, et l acheteur non. Les choix possibles du vendeur sont de chercher à vendre (V ), ou non (NV ). L acheteur peut choisir d acheter (A), ou non (NA). Le prix p est fixé à l avance. Les utilités pour la voiture sont de 3 pour le vendeur et 4 pour l acheteur si la qualité est bonne, et de 0 pour les deux sinon. Jeux et information, ENPC, 2003-2004 p. 15/2

Résolution Décrire la situation comme un jeu bayésien ; Quels sont les ensembles de stratégies? A-t-on types indépendants? Utilités personnelles connues? Résoudre pour les différentes valeurs de p. Jeux et information, ENPC, 2003-2004 p. 16/2

Valeur de l information Deux joueurs, A et B, cherchent à deviner le tirage d une pièce de monnaie, pile ou face. A annonce son choix (B entend A), puis B. Les gains sont de 3 pour un joueur le seul à bien deviner, de 1 chacun si les deux devinent bien, et de 0 pour un joueur qui devine mal. Cas 1 : A connaît le résultat du tirage. Cas 2 : A ne connaît pas le résultat du tirage. Quel cas est est le plus favorable à chacun des joueurs? Jeux et information, ENPC, 2003-2004 p. 17/2

Marché du travail Pour comprendre si le niveau d études peut servir à signaler la qualité d un candidat au travail, on étudie le modèle suivant : 1. Un travailleur peut avoir une productivité de 1 ou de 2 avec probabilités (π, 1 π) ; 2. Le travailleur choisit un niveau d études y 0 3. 2 employeurs proposent des salaires w 1 (y) et w 2 (y) en fonction du niveau d études observé y ; 4. Le travailleur choisit un employeur. Jeux et information, ENPC, 2003-2004 p. 18/2

Utilités Le coût pour un agent de type (productivité) t du niveau d éducation y est y t (donc plus élevé pour un travailleur de productivité plus basse). L utilité pour un joueur de type t qui choisit le niveau d éducation y et qui touche le salaire w est w y t. L utilité pour une firme qui n embauche pas est 0. L utilité pour une firme qui embauche le type t au salaire w est t w. Jeux et information, ENPC, 2003-2004 p. 19/2

Simplifications A la fin du jeu, le travailleur choisit le salaire le plus élevé. Les deux firmes sont donc en compétition de Bertrand et proposent le même salaire : w(y) = w 1 (y) = w 2 (y). Ce salaire correspond à l espérance de la productivité étant donné y, donc 1 w(y) 2. Jeux et information, ENPC, 2003-2004 p. 20/2

Équilibres mélangeants On appelle ainsi un équilibre du jeu dans lequel les deux types de travailleurs choisissent le même niveau d études: (y 1 = y 2 = y). On a un équilibre de ce type pour y 1 π. Jeux et information, ENPC, 2003-2004 p. 21/2

Équilibres séparateurs On appelle ainsi un équilibre du jeu dans lequel les deux types de travailleurs choisissent différents niveaux d études: (y 1 y 2 ). On a un équilibre de ce type pour y 1 = 0 et 1 y 2 2. Jeux et information, ENPC, 2003-2004 p. 22/2

Enchères Deux acheteurs potentiels pour un même objet. Les valuations (v 1,v 2 ) sont distribuées uniformément et indépendemment dans l intervalle [0, 1]. Le vendeur (qui ne connaît pas les valuations) a le choix entre une enchère au premier prix, ou au second prix. Quel est le meilleur choix (celui qui permet de maximiser les revenus espérés)? Jeux et information, ENPC, 2003-2004 p. 23/2

Enchères au second prix Quels sont les joueurs? Quels sont les ensembles de stratégies? Quelles sont les fonctions de paiement? Chaque joueur a une stratégie faiblement dominante. Ces stratégies forment un équilibre de Nash. Jeux et information, ENPC, 2003-2004 p. 24/2

Enchères au premier prix Quels sont les joueurs? Quels sont les ensembles de stratégies? Quelles sont les fonctions de paiement? On cherche un équilibre de Nash symmétrique dans lequel chaque joueur joue une stratégie f différentiable strictement croissante. On écrit que f(θ i ) maximise le paiement espéré. Jeux et information, ENPC, 2003-2004 p. 25/2

Calcul des revenus Quel est le revenu espéré du vendeur dans chacun des cas? Conclusion? Ce résultat n est pas du au hasard, c est un cas particulier d un résultat plus général, le théorème d équivalence des revenus. Jeux et information, ENPC, 2003-2004 p. 26/2