Chapitre 2 section 6. Classe de jeux dynamiques spécifiques : jeux dits «répétés»

Documents pareils
L oligopole ESCP

Jeux sous forme extensive (Jeux dynamiques)

Introduction à la Théorie des Jeux p.1/77

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Annexe 6. Notions d ordonnancement.

Simulation centrée individus

1 Démarrage de Marionnet

Administration de Parc Informatique TP03 : Résolution de noms

Fonctions de plusieurs variables

KPI (Key Performance Indicator) dans MOSS

Continuité et dérivabilité d une fonction

UML Diagramme de communication (communication diagram) Emmanuel Pichon 2013

Théorie des Jeux Et ses Applications

Comment valoriser une entreprise et sur quels critères? ISEC 22 novembre 2011 Evaluation d entreprises

gestion des processus La gestion des processus

Quels oligopoles la régulation doit-elle faire émerger? Réunion Fratel Tunis, 17 octobre 2008 Nicolas Curien, membre de l ARCEP

Charte de déontologie SMS+ applicable au 01/10/2013

Assurance maladie publique et «Opting out» - Réflexions théoriques

Économie de l environnement

Chp. 4. Minimisation d une fonction d une variable

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Cours No 3 : Identificateurs, Fonctions, Premières Structures de contrôle.

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

«Dire et écrire» pour réaliser une composition en travail collaboratif en géographie. Agnès Dullin, lycée J. Racine 20 rue du Rocher, Paris

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt

Bonus Cappés et Reverse Bonus Cappés

Génie logiciel pour le commerce électronique Hiver 2003 Prof.: Julie Vachon

FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX

Les offres non compétitives dans les enchères du Trésor*

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

Ordonnancement temps réel

La méthode des scores, particulièrement de la Banque de France

Les coûts de la production. Microéconomie, chapitre 7

SOMMAIRE. Qu est-ce que le compteur électronique... page 1. Comment consulter les informations... page 1. Les différentes options tarifaires...

Politique de capitalisation du Fonds d assurance automobile du Québec DATE DE MISE À JOUR

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Université Paris-Dauphine DUMI2E 1ère année, Applications

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Statistique : Résumé de cours et méthodes

Chapitre 7. Récurrences

Modes Opératoires WinTrans Mai 13 ~ 1 ~

Eléments constitutifs et synthèse des convertisseurs statiques. Convertisseur statique CVS. K à séquences convenables. Source d'entrée S1

ANNEXE 1 RECOMMANDATIONS DEONTOLOGIQUES APPLICABLES AUX SERVICES SMS+ / MMS+

NORME IAS 07 LE TABLEAU DES FLUX DE TRÉSORERIE

Architecture des Systèmes d Information Architecture des Systèmes d Information

Énergie et Mondialisation

Gestion financière pour le trafic des paiements par cartes

techniques de tirs a l avant - partie 2

I) L ouverture des économies à l international

Economie de l Incertain et des Incitations

Dossier 1 ETUDE DE CAS

Modélisation des données

COURS 8 : INTRODUCTION A LA THEORIE DES JEUX

1 Pourquoi une Gestion des Niveaux de Services?

Programmation linéaire

BREVET DE TECHNICIEN SUPÉRIEUR ÉPREUVE DE MANAGEMENT DES ENTREPRISES BOITIER PHARMA

Marchés oligopolistiques avec vente d un bien non homogène

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

Premiers Pas en Programmation Objet : les Classes et les Objets

CHAPITRE VIII : Les circuits avec résistances ohmiques

Diane Patrimoine. L épargne salariale : outil d optimisation et de défiscalisation de la rémunération. Diane Patrimoine 1

Qu est-ce que la Bourse?

N Facture : Client : Date : Récapitulatif du au RUE DU VILLAGE LIEGE

Théorie Financière 8 P. rod i u t its dé dérivés

1 Mesure de la performance d un système temps réel : la gigue

Chapitre 2 Les ondes progressives périodiques

Eléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm)

CAPTEURS - CHAINES DE MESURES

Guide d utilisation. Version 10

OUVERTURE des MARCHÉS EUROPÉENS de l ÉNERGIE

Perspectives. Les Orientations générales de la politique monétaire en Afrique du Sud. Ediab Ali. que monétaire

Samuel Bassetto 04/2010

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Image d un intervalle par une fonction continue

ANIMER UNE COMMUNAUTÉ CONSTRUCTION21

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

«Cloud Computing» La gestion des logiciels dans un contexte d impartition Raymond Picard, Vice-président, droit des technologies de l information

Logique binaire. Aujourd'hui, l'algèbre de Boole trouve de nombreuses applications en informatique et dans la conception des circuits électroniques.

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Fibonacci et les paquerettes

ANNEXE 1 RECOMMANDATIONS DEONTOLOGIQUES APPLICABLES AUX SERVICES SMS+ / MMS+

Le transistor bipolaire

Marchés, réseaux et politique de la concurrence. Claude Crampes

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Vendre. PANdOre INTRODUCTION. But du vendeur : faire en sorte que tout se passe au mieux entre l entreprise et les clients/les partenaires.

Raisonnement par récurrence Suites numériques

FONCTION DE DEMANDE : REVENU ET PRIX

FICHE D IMPACT PROJET DE TEXTE REGLEMENTAIRE

ATELIERS THEMATIQUES COMMERCES UNIONS COMMERCIALES ATELIER CONDUITE DE REUNION DECIDER - CONVAINCRE MOBILISER

Probabilités III Introduction à l évaluation d options

Publication sur serveur distant

BULLETIN OFFICIEL DES IMPÔTS

FICHE TECHNIQUE. Les obligations des entreprises en faveur de l emploi vis-à-vis des salariés âgés : plan senior/contrat de génération

Expression des contraintes. OCL : Object C o n t r a i n t L a n g u a g e

UTILISATION DE LA BORNE PAR LE CLIENT

Transcription:

Chapitre 2 section 6 Classe de jeux dynamiques spécifiques : jeux dits «répétés»

Chapitre 2 section 6 Classe de jeux dynamiques spécifiques : jeux dits «répétés» capte des situations où les joueurs se «rencontrent» régulièrement interactions répétées

Chapitre 2 section 6 Classe de jeux dynamiques spécifiques : jeux dits «répétés» capte des situations où les joueurs se «rencontrent» régulièrement interactions répétées rôle explicite du temps : apprentissage, acquisition d une réputation, incitations à coopérer (cadre non coopératif)

Soit le jeu EG de concurrence entre deux firmes : Firme 1 Entente Guerre Firme 2 Entente Guerre 3 4 3 1 1 0 4 0

Situation du type «dilemme du prisonnier où l EN (G, G) est Pareto dominé par (E, E) : Firme 1 Entente Guerre Firme 2 Entente Guerre 3 4 3 1 1 0 4 0

Mais admettons que les deux firmes se «rencontrent» régulièrement, avec les mêmes actions possibles à chaque fois,

Mais admettons que les deux firmes se «rencontrent» régulièrement, avec les mêmes actions possibles à chaque fois, par exemple pendant T 2 périodes en supposant que chacune observe ce qu a fait l autre à la fin de chaque période

Mais admettons que les deux firmes se «rencontrent» régulièrement, avec les mêmes actions possibles à chaque fois, par exemple pendant T 2 périodes en supposant que chacune observe ce qu a fait l autre à la fin de chaque période le jeu simultané EG ne représente qu une occurrence (étape) d un jeu plus long à T périodes jeu répété, fini (T < périodes seulement)

Mais admettons que les deux firmes se «rencontrent» régulièrement, avec les mêmes actions possibles à chaque fois, par exemple pendant T 2 périodes en supposant que chacune observe ce qu a fait l autre à la fin de chaque période le jeu simultané EG ne représente qu une occurrence (étape) d un jeu plus long à T périodes jeu répété, fini (T < périodes seulement) question :émergence à LT de la coopération?

problème : le nombre de stratégies possibles pour chaque joueur augmente rapidement avec T :

problème : le nombre de stratégies possibles pour chaque joueur augmente rapidement avec T : rappel : une stratégie est un plan contingent i.e. spécifie ce que fait un joueur à chacun de ses ensembles d info.

problème : le nombre de stratégies possibles pour chaque joueur augmente rapidement avec T : rappel : une stratégie est un plan contingent i.e. spécifie ce que fait un joueur à chacun de ses ensembles d info. Supposons T = 2

Représentation sous forme extensive (sans les gains) : F1 Etape 1 E F 2 G E G E G F1 Etape 2 E G E G E G E G F2

Jeu simultané à l étape 1 F1 E G Etape 1 E F 2 G E 3 G 4 3-1 0 4 E G E F1 G -1 0 Etape 2 E G E G E G E G F2

Idem en chaque sous jeu à l étape 2 F1 Etape 1 E F 2 G E G E G F1 Etape 2 E G E G E G E G F2 E E 3 G -1 G 4 3-1 0 4 0

exemple : nb de stratégies de F1 si T = 2?

exemple : nb de stratégies de F1 si T = 2? F1 a 1 nœud de décision en t=1 4 nœuds de décision en t=2 F2 a 1 ensemble d info. en t=1 4 ensembles d info. en t=2

exemple : nb de stratégies de F1 si T = 2? F1 a 1 nœud de décision en t=1 4 nœuds de décision en t=2 F2 a 1 ensemble d info. en t=1 4 ensembles d info. en t=2 à l étape 2, F1 a deux actions possibles à chacun de ses 4 nœuds de décision,

exemple : nb de stratégies de F1 si T = 2? F1 a 1 nœud de décision en t=1 4 nœuds de décision en t=2 F2 a 1 ensemble d info. en t=1 4 ensembles d info. en t=2 à l étape 2, F1 a deux actions possibles à chacun de ses 4 nœuds de décision, soit : 4 2 = 16 arrangements possibles en tenant compte des 2 actions à l étape 1, ceci donne : 2 x 4 2 = 32 stratégies pour F1 du type : (E ; E E E E) (E ; G E E E) (E ; E G E E) (G ; E E E E) (G ; G G G G) etc

Si T=3, F1 a 1 nœud de décision en t=1 4 en t=2 16 en t=3 D où un nb de stratégies = 2 x 4 2 x 16 2 = 8192 conséquence : quand T devient grand, le nb de stratégies devient très élevé ( T=20, plusieurs millions)! Donc potentiellement complexe à analyser

Néanmoins dans la mesure où le jeu est fini,

Néanmoins dans la mesure où le jeu est fini, i.e. l horizon des joueurs est borné (il existe pour eux une date terminale pour le jeu : T < ), alors un jeu répété fini est très simple à analyser

Néanmoins dans la mesure où le jeu est fini, i.e. l horizon des joueurs est borné (il existe pour eux une date terminale pour le jeu : T < ), alors un jeu répété fini est très simple à analyser l applica on du concept d EPSJ requiert qu une combinaison de stratégies n est un EPSJ que s il induit un équilibre de Nash dans chacun de ses sous jeux

or, chaque joueur sait : qu à l étape 2, chaque sous jeu est identique au jeu statique (peu importe l histoire passée, i.e. les gains/pertes antérieures)

or, chaque joueur sait : qu à l étape 2, chaque sous jeu est identique au jeu statique (peu importe l histoire passée, i.e. les gains/pertes antérieures) que le seul EN du jeu statique est (G, G) (G, G) est donc l unique EN dans chaque sous jeu

or, chaque joueur sait : qu à l étape 2, chaque sous jeu est identique au jeu statique (peu importe l histoire passée, i.e. les gains/pertes antérieures) que le seul EN du jeu statique est (G, G) (G, G) est donc l unique EN dans chaque sous jeu le seul EPSJ du jeu répété à T=2 correspond donc à une combinaison de stratégies où chacun des joueurs choisit partout G généralisable à tout T <

en d autres termes, connaissant la date terminale T (quelle qu elle soit : T 2),

en d autres termes, connaissant la date terminale T (quelle qu elle soit : T 2), il est individuellement inutile (irrationnel) de tenter de se construire une réputation d agent coopératif en choisissant unilatéralement «Entente», quel que soit l instant du jeu et la longueur de T

en d autres termes, connaissant la date terminale T (quelle qu elle soit : T 2), il est individuellement inutile (irrationnel) de tenter de se construire une réputation d agent coopératif en choisissant unilatéralement «Entente», quel que soit l instant du jeu et la longueur de T puisqu à la date terminale, chacun choisira «Guerre» par raisonnement inductif à rebours, c est vrai à chaque date

en d autres termes, connaissant la date terminale T (quelle qu elle soit : T > 2), il est individuellement inutile (irrationnel) de tenter de se construire une réputation d agent coopératif en choisissant unilatéralement «Entente», quel que soit l instant du jeu et la longueur de T puisqu à la date terminale, chacun choisira «Guerre» par raisonnement inductif à rebours, c est vrai à chaque date la coopéra on ne peut pas émerger omme EPSJ dans un jeu répété fini à info complète

jeu répété infini l argument d induc on à rebours u lisé pour le jeu fini (effet dead line) n a plus de pertinence à tout moment, l avenir du jeu (gains/pertes) influence les décisions présentes

jeu répété infini l argument d induc on à rebours u lisé pour le jeu fini (effet dead line) n a plus de pertinence à tout moment, l avenir du jeu (gains/pertes) influence les décisions présentes conséquence : tout est possible! la coopération, comme la guerre mul plicité d EN et d EPSJ

Résultat général : Folk théorèmes dans un jeu répété à l infini, où les joueurs ont un nombre fini d actions à chaque occurrence, toute combinaison d actions répétée sur une séquence finie peut constituer l unique résultat d un équilibre du jeu;

Résultat général : Folk théorèmes dans un jeu répété à l infini, où les joueurs ont un nombre fini d actions à chaque occurrence, toute combinaison d actions répétée sur une séquence finie peut constituer l unique résultat d un équilibre du jeu; condition requise (2 joueurs) : une certaine valeur du taux d actualisation

Argument : En horizon fini, il n est pas possible de se construire une réputation (coopération) ni d inciter l autre à coopérer (punition) en raison de la dead line T

Argument : En horizon fini, il n est pas possible de se construire une réputation (coopération) ni d inciter l autre à coopérer (punition) en raison de la dead line T En horizon infini, en revanche, à chaque occurrence du jeu, il reste toujours à venir un grand nb de périodes (une infinité de répétitions du jeu) qui peut inciter un joueur à user de représailles (punir l autre, au moins sur une durée finie) afin d inciter l autre à coopérer

On va montrer que jouer E à chaque période pour les deux joueurs, peut être maintenant obtenu comme le résultat d un EN du jeu répété à l infini Jouer E à l infini si l autre joue aussi E à l infini, donne à chaque joueur un gain cumulé égal à : t=1 x δ t 1 x (3) = 3 x ( t=1 x δ t 1 ) = 3/(1 δ) C est le gain max, pour tout δ < 1 mais supporté par différentes stratégies!

Mais montrons d abord que (G,G) est aussi un EN du jeu infini Jouer G à l infini si l autre joue aussi G à l infini, donne à chaque joueur un gain cumulé égal à : t=1 x δ t 1 x 0 = 0 Donc, une déviation unilatérale E (à la date 1, par exemple) donnerait un gain négatif 1 + t=2 x δ t 1 x 0 = 1 Donc, pas d incitation à dévier (en tout t)!

En fait, il existe beaucoup d autres types d EN (en termes de stratégies) induisant la coopération (en termes de résultat) stratégies «œil pour œil» : Jouer E dès le départ, et tant que l autre joue E; mais dès que l autre joue G, jouer G à l infini donne à chaque joueur un gain cumulé égal à : t=1 x δ t 1 x (3) = 3 + 3 δ /(1 δ) à l équilibre (i.e. si l autre la joue)

inversement, une déviation unilatérale G (à la date 2, par exemple) donnerait un gain : 3 + 4 δ + t=3 x δ t 1 x 0 = 3 + 4 δ Donc, pas d incitation à dévier si : 3 δ /(1 δ) > 4 δ 3 > 4 x (1 δ) 4 x δ > 1 δ > 1/4 «œil pour œil» donne 1 EN avec coopération pour certaines valeurs de δ Є (1/4, 1)

Idée : les représailles sont crédibles si T, mais peuvent être coûteuses punir seulement pour certaines périodes peut être suffisant Jouer alternativement E puis G dès le départ, et tant que l autre joue E; sinon, jouer G à l infini Stratégies dites «tit for tat» jouer E initialement; puis jouer en t ce que l autre a joué en t 1

Conclusion : Présenter des concepts clés pour analyser le fonctionnement des marchés, dès que l on sort des deux cas polaires que sont la CPP et le monopole Utilisés dans le champ suivant, mais aussi, suite du cursus: L3, M instruments fondamentaux de l éco moderne essen els aussi dans le champ de l économie du droit ( Law & Economics)