Jeux dynamiques à information complète

Documents pareils
Jeux sous forme extensive (Jeux dynamiques)

Probabilités sur un univers fini

Simulation centrée individus

Chapitre 5 : Flot maximal dans un graphe

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Résolution d équations non linéaires

Synthèse de cours (Terminale S) Calcul intégral

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Introduction à la Théorie des Jeux p.1/77

Techniques d analyse de circuits

Economie de l Incertain et des Incitations

Théorie des graphes et optimisation dans les graphes

Probabilités conditionnelles Exercices corrigés

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Chapitre 5 LE MODELE ENTITE - ASSOCIATION

Systèmes à guirlandes pour câbles et tuyaux

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Outil d envoi de courrier électronique. STILOG I.S.T. et Claude Mayer Tous droits réservés

CH.6 Propriétés des langages non contextuels

chapitre 4 Nombres de Catalan

données à caractère personnel (ci-après "la LVP"), en particulier l'article 30 ;

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

NetCrunch 6. Superviser

Le compte épargne temps

TUTORIAL 1 ETUDE D UN MODELE SIMPLIFIE DE PORTIQUE PLAN ARTICULE

Le Dossier Médical Personnel et la sécurité

Le plan d action marketing et commercial : De la réflexion marketing à l action commerciale

PRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES

Projet Active Object

Dalla TCIAAA2 DOSSIER SMART

Partie 1 : Évaluer le marché

Prudence, Epargne et Risques de Soins de Santé Christophe Courbage

Statistique : Résumé de cours et méthodes

Modèle conceptuel : diagramme entité-association

La haute disponibilité

ADAPTATION DES OBLIGATIONS RELATIVES AU BIEN-ETRE DES INTERIMAIRES

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Règles du Jeu et Code du Fair-Play

FOIRE AUX QUESTIONS PAIEMENT PAR INTERNET. Nom de fichier : Monetico_Paiement_Foire_aux_Questions_v1.7 Numéro de version : 1.7 Date :

A L ERT. Pour démarrer rapidement avec

Système d information pour la gestion d un réseau d Université

Projet de décision unilatérale instituant (ou régularisant) un régime collectif complémentaire obligatoire couvrant le risque

Cours IV Mise en orbite

L oligopole ESCP

S8 - INFORMATIQUE COMMERCIALE

Engagement de l ABC en matière de lisibilité des documents hypothécaires. Préparé par l Association des banquiers canadiens

Programme d'assistance Financiere de la FIFA (FAP) et prime de resultat financier : Reglement et directives administratives pour 2015

Décrets, arrêtés, circulaires

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Guide du/de la candidat/e pour l élaboration du dossier ciblé

Module 24 : Analyse de scénarios

Métriques de performance pour les algorithmes et programmes parallèles

Fonctions homographiques

SUPERTOTO TERMES & CONDITIONS. Table des Matières

Rappel sur les bases de données

Le Statut Auto-Entrepreneur

et les Trois Marches d'assurance

Julien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration

M&S Automation. Analyse Statistiques Qualité. Ingénierie de l information. acquisition et stockage des données. analyse des données

YANN ROUDAUT - Professeur de l Ecole Française de Poker - roudaut@ecolefrancaisedepoker.fr

Keyyo Guide de mise en service CTI / API / TAPI Keyyo

Votre capital le plus précieux: Les collaborateurs de votre entreprise.

«Laissez-moi jouer en sécurité»

K W = [H 3 O + ] [OH - ] = = K a K b à 25 C. [H 3 O + ] = [OH - ] = 10-7 M Solution neutre. [H 3 O + ] > [OH - ] Solution acide

Description du procédé de remplacement des appareils. Description du procédé de remplacement des appareils. 1) Choix de l appareil de remplacement B

Technologie SDS (Software-Defined Storage) de DataCore

Introduction / En quoi consiste une veille commerciale? / Quel est son rôle? / Quels sont les bénéfices au niveau de l organisation

Le marketing stratégique

exigences des standards ISO 9001: 2008 OHSAS 18001:2007 et sa mise en place dans une entreprise de la catégorie des petites et moyennes entreprises.

Une offre performante, la clé du succès Techniques Marketing pour PME, TPE et Indépendant

Intelligence Artificielle Planification

Configuration des routes statiques, routes flottantes et leur distribution.

LES DÉTERMINANTS DE MATRICES

Chapitre 2 LE CAS PRATIQUE

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Automatique (AU3): Précision. Département GEII, IUT de Brest contact:

Lundi 10 décembre Casino de Paris

TURBOS WARRANTS CERTIFICATS. Les Turbos Produits à effet de levier avec barrière désactivante. Produits non garantis en capital.

NOTA : article L pour les départements et article L pour les régions.

Dérivation : Résumé de cours et méthodes

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

location et services : vente directe via des agences en propre ; produits de collectivités : vente directe, revendeurs, télévente et vente en ligne.

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Modifications au 1 er janvier 2015

Sécurité sur le web : protégez vos données dans le cloud

REGLEMENT RELATIF AU COMPTE EPARGNE TEMPS A LA VILLE DE ROUEN

Ces formations se font uniquement «Sur mesure» - Nous contacter. II - Techniques de vente «Avancées» - 6 ou 7 modules selon le concept vente

Hydrodynamique des lits fluidisés en régime de bullage

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

Plan et résumé de l intervention de Jean-Philippe Dunand

L apport des logiciels d optimisation des stocks multi-échelons

Taille optimale dans l industrie du séchage du bois et avantage compétitif du bois-énergie : une modélisation microéconomique.

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Organisation de dispositifs pour tous les apprenants : la question de l'évaluation inclusive

PROFIS Installation. Module 4: Module 3D Design

Théorie des Jeux Et ses Applications

Cahier des charges Remontée des ventes

Transcription:

Chapitre Jeux dynamiques à information complète Les jeux sous forme normale donnent une représentation adéquate de joueurs effectuant des choix de stratégies simultanées. ans ces jeux, aucun joueur n a d information sur les stratégies utilisées par les autres joueurs au moment de faire son choix. ans de nomreux cas concrets, les joueurs effectuent leurs choix en fonction d une situation oservée qui dépend en particulier des choix précédents des autres joueurs. ar exemple c est le cas pour une enchère croissante, dans une négociation, dans le jeu d échecs. I. éfinitions: éfinition I.: Un jeu dynamique est le modèle d une situation où les joueurs choisissent séquentiellement leurs actions. Un jeu dynamique sera dit à information complète si tous les joueurs connaissent la structure du jeu. Remarque: Contrairement aux jeux statiques qui sont des jeux à information imparfaite, un jeu dynamique peut être à information parfaite ou imparfaite. éfinition I.: Un jeu est à information parfaite si chaque joueur est parfaitement informé des actions passées des autres joueurs. éfinition I.: Un jeu est à information imparfaite quand un joueur ignore certain des choix qui ont été effectués avant le sien. II. orme extensive d un jeu: éfinition II.: La représentation sous forme extensive d un jeu spécifie : Les joueurs concernés par le jeu (la nature n appartenant pas à l ensemle des joueurs). L ordre des décisions (les moments où chaque joueur aura jouer) Les actions (décisions) possiles de chaque joueur au moment où il joue. L information dont dispose chaque joueur au moment où il joue. Les paiements des joueurs pour chacune des cominaisons possiles d actions. éfinition II.: Un jeu sous forme extensive est donné par un arre de jeu contenant un nœud initial, des nœuds de décisions, des nœuds terminaux et des ranches reliant chaque nœud à ceux qui lui succèdent. n. Un ensemle de n joueurs our chaque nœud de décision, le nom du joueur qui a le droit de choisir une stratégie à ce nœud. our chaque joueur i, la spécification de l ensemle des actions permises à chaque nœud où il est susceptile de prendre une décision. La spécification des gains de chaque joueur à chaque nœud terminal. Exemple II.: Soit le jeu définit comme suit : Le joueur joue en premier et choisit une action a de l ensemle des actions A = { L, R}. Le joueur S oserve le choix de et choisit une action a de l ensemle des actions A { U } =.,

Le jeu s arrête et les paiements sont donnés par u ( a, a ) et (, ) Ce jeu en forme extensive est donné par l arre suivant: u a a. ranches = actions J L R œud initial (sans prédécesseur) œud de décision (intermédiaire) U U u ( L, U ), u ( L U ), u ( L, ), u ( L, ) u ( R, U ), u ( R, U ) u ( R, ), u ( R, ) œuds terminaux (sans successeur) Exemple II.: (le prolème de l entrant potentiel) Considérons le prolème d entrée d une firme dans le marché d un monopole. Une firme ( I ) est en situation de monopole sur un marché. Une autre firme ( E ) doit choisir entre entrer ou ne pas entrer. I peut choisir de comattre en cassant les prix ou de coopérer S il entre, la firme installée avec lui, de manière à créer un monopole joint. 0,00 si E n entre pas, si E entre et I comat et Les paiements pour E et I sont ( 0,50 ) si E entre et I coopère. Ce jeu en forme extensive est donné par l arre suivant. Coop. ( 0,50 ) E I ( 0,00) Com. ( 0,0) 7

III. Représentation d un jeu statique par la forme extensive: ous avons introduit les jeux statiques comme étant des jeux où les joueurs choisissent leurs actions simultanément. L exemple du dilemme du prisonnier a été construit sur cette ase. Mais en fait, le même résultat aurait été otenu si les prisonniers avaient joué de façon séquentielle avec cependant la condition que le joueur jouant en seconde position n oserve pas le choix du joueur jouant en première position. On peut de ce fait représenter le jeu du dilemme du prisonnier (jeu simultané) par le jeu dynamique suivant: Le prisonnier choisit une action a de l ensemle des actions A = {, } ( =nier, =dénoncé) Le prisonnier n oserve pas l action a choisie par le prisonnier et choisit une a de l ensemle des actions A = {, }. Les paiements sont donnés par u ( a, a ) et (, ) action u a a. Ainsi, on a interprété un jeu statique à information complète comme étant un jeu dynamique à information complète et imparfaite. La forme extensive de ce jeu est donnée par l arre suivant: (, ) ( 0,0) ( 0, 0) ( 8, 8) e ce fait, nous déduisons que dans un jeu dynamique il se peut qu un joueur qui doit prendre une décision ne connaisse pas les choix effectués par les joueurs qui ont joué avant lui. ans ce cas, il ne connaît pas parfaitement le nœud auquel il se situe. our représenter l état des connaissances des joueurs (ce qu ils savent et ce qu ils ne savent pas), on utilise la notion d ensemle d information. éfinition III.: À chaque étape d un jeu en forme extensive, on appelle ensemle h la collection de tous les nœuds que le joueur qui doit jouer à cette étape d information i i ne peut distinguer, compte tenu de l information dont il dispose. Chaque nœud contenu h contient alors exactement le même ensemle d actions localement disponiles. dans i.. our exprimer l idée que des nœuds de décision font partie d un même ensemle d information, on les entoure avec la même ellipse ou on les relie avec une ligne pointillée. Exemple III.: ile ou face avec oservation. Le joueur choisit pile ou face, puis le joueur choisit pile ou face après avoir oservé le choix du joueur. Ce dernier gagne si les choix sont égaux et perd si les choix sont différents. Le jeu est à somme nulle. 8

La forme extensive de ce jeu est donnée par l arre suivant. J J (, ) (-,) (-,) (, ) Cette figure montre que le joueur dispose de deux ensemles d information: Un singleton qui fait suite au choix de du joueur. Un singleton qui fait suite au choix de du joueur. Exemple III.: ile ou face sans oservation. On reprend l exemple de ile ou face avec maintenant la condition que le joueur ne connaît pas le choix du joueur quand il effectue son choix. La forme extensive de ce jeu est donnée par l arre suivant. J J (, ) (-,) (-,) (, ) Cette figure montre que le joueur dispose d un ensemle d information engloant ses deux nœuds de décision. Ceci signifie que le joueur ne différencie pas les deux nœuds. Il doit effectuer un choix indépendant de celui effectué par le joueur. Exemple III.: Le joueur joue en premier et choisit une action a de l ensemle des actions { L M R} A =,,. Le joueur oserve si a A { U } =., = L ou non et choisit une action a de l ensemle des actions 9

La forme extensive de ce jeu est donné par l arre suivant: L R J J J U U U Cette figure montre que le joueur dispose de deux ensemles d information: Un singleton qui fait suite au choix de L du joueur. Un ensemle d information (non singleton) engloant les deux autres nœuds de décision du joueur et qui fait suite au choix de M ou R par le joueur. Remarque: de là, nous pouvons utiliser la notion d ensemle d information pour: otenir la définition alternative permettant de distinguer entre un jeu à information parfaite et un jeu à information imparfaite. éfinir plus précisément un des concepts clés de la théorie des jeux : la stratégie. éfinition III.: Un jeu en forme extensive est. un jeu à information parfaite quand tous les ensemles d information du jeu sont des singletons i.e. réduit à un seul noeud,. un jeu à information imparfaite si au moins un ensemle d information du jeu n est pas un singleton i.e. contient plus d un nœud. éfinition III.: Une stratégie est un plan d action complet défini par le joueur avant le déut du jeu. our un joueur i, une stratégie s est ainsi une liste d actions particulières i (, i ( ), i i ) i s s K que ce joueur associe ex ante à chaque ensemle d information,, K susceptile d être atteint lorsqu il aura à effectuer ses choix. i i e manière générale, une stratégie d un joueur doit spécifier une action pour ce joueur chaque fois qu il est susceptile de jouer (s il joue, par exemple, à plusieurs tours du jeu, nous devons spécifier une action pour chacun des tours). Quelle que soit la complexité du jeu, les stratégies des joueurs doivent nous permettre de dérouler complètement le jeu quand on les comine. Exemple III.: Reprenons l exemple de ile ou ace avec oservation. Le joueur a un ensemle d information et il doit choisir entre deux stratégies, chacune se réduisant à une seule action ou. Le joueur, dispose de deux ensemles d information ={, } et ={, } et il doit prévoir un choix pour chacun de ses deux ensemles : jouer ou s il se trouve et 0

jouer ou s il se trouve dans (, ), (, ), (, ), (, ).. onc, il a à choisir entre stratégies différentes: IV. Equilire de ash parfait:. Représentation d un jeu dynamique par la forme normale: La forme normale d un jeu dynamique décrira ce dernier sous la forme d un jeu statique. Ceci est rendu possile par la notion de stratégie. Une stratégie est définie avant le déut du jeu mais sur la ase des informations à venir qui sont précisées par les règles du jeu. Le joueur peut donc associer le choix qu il désire à chaque ensemle d information envisageale d après les règles du jeu. ar conséquent, décrire un jeu dynamique sous sa forme normale n implique aucune perte d information et ne réduit en rien les possiilités stratégiques des joueurs. Exemple IV..: ile ou ace sans oservation (exemple III.). La forme normale de ce jeu est donnée par la matrice des paiements suivante. Joueur Joueur,, ( ) (,) (, ) ous retrouvons la présentation du jeu statique retenue dans le chapitre précédent. Exemple IV..: ile ou ace avec oservation (exemple III.). La forme normale de ce jeu est donnée par la matrice des paiements suivante. Joueur Joueur (, ) (, ) (, ) (, ) (, ) (, ) (,) (,) (,) (, ) (,) (, ) Exemple IV..: La ataille des sexes version statique. eux programmes sont envisageales pour la soirée de Monsieur et Madame : Ils peuvent assister à un match de oxe () ou ien admirer un allet (). La difficulté réside dans le fait que chacun doit se rendre à l un des deux spectacles en ignorant le choix de l autre. La forme extensive de ce jeu est donnée par l arre suivant. (, ) (, )

La forme normale de ce jeu est donnée par la matrice des paiements suivante. omme emme -,- (, ) (, ) Exemple IV..: La ataille des sexes version dynamique. ous reprenons l exemple IV. mais nous considérons une version dynamique. Monsieur sort en premier et laisse un message à son épouse lui indiquant le spectacle auquel il se rend. La forme extensive de ce jeu est donnée par l arre suivant. (, ) (, ) La forme normale de ce jeu est donnée par la matrice des paiements suivante. Joueur Joueur (, ) (, ) (, ) (, ) (, ) (, ) (, ) (, ) igure. Equilire de ash parfait dans un jeu dynamique à information complète et parfaite: éfinition IV..: Un équilire de ash d un jeu sous forme extensive est un équilire de ash de la forme normale associée. Exemple IV..: La ataille des sexes version dynamique. ans la forme normale du jeu dynamique (igure) nous pouvons, en utilisant la même procédure qu au chapitre, y rechercher les équilires de ash.,,,,,,. On otient, pour ce jeu, trois équilires de ash : ( ), ( ) et eux de ces équilires comportent une «menace» (ou annonce) non crédile que la femme n aurait pas intérêt à mettre en œuvre le cas échéant. Analysons les trois équilires.

L équilire =,(, ) est représenté par les trois segments en gras ci-dessous. (, ) (, ) ans le cadre de cet équilire, l homme va au allet. La femme, qui a oservé ( ), va également au allet. La succession des choix et est appelée sentier d équilire., compte tenu de sa stratégie, elle se serait rendu au allet. Si La femme avait oservait Le choix ( ) est qualifié de choix hors du sentier d équilire. est un équilire de ash mais soutenu par une menace non crédile hors du sentier d équilire. L équilire =,(, ) est représenté par les trois segments en gras ci-dessous. (, ) (, ) est un équilire de ash mais lui aussi il est soutenu par une menace non crédile hors du sentier d équilire. L équilire =,(, ) est représenté par les trois segments en gras ci-dessous. (, ) (, ) est un équilire de ash et il ne contient que des choix crédiles.

Les deux premiers équilires ne peuvent être retenus comme équilires du jeu dynamique, seul l équilire peut être conservé. On dira que est un équilire de ash parfait. Algorithme de Kuhn: rocédure de Récurrence vers l amont: (ackwards induction) ans un jeu dynamique à information complète et parfaite, l équilire de ash parfait peut être directement repéré par un raisonnement à reours qui consiste à partir de la fin de l arre du jeu pour remonter vers le sommet. où la définition d équilire parfait dans ce type de jeux. éfinition IV..: Un équilire de ash parfait est un ensemle de stratégies otenu par un raisonnement à reours qui rencontre, à chaque étape de la procédure, un seul joueur confronté à un simple prolème de maximisation. Exemple IV..: Résolution directe de la ataille des sexes version dynamique. Ici, la procédure à reours contient deux étapes. (, ) (, ) En récapitulant, l équilire de ash parfait est,(, ) ormellement: (, ) (, ).. Trouver la réponse optimale du joueur : max u ( s, s ) s S. éterminer l action optimale du joueur : max u s, MR ( s ) s S Ainsi, Le joueur anticipe la réaction optimale du joueur. Le joueur élimine les menaces non crédiles. Le joueur suppose que le joueur est rationnel. meilleure réponse de à s..

Exemple IV..: G J J V W X Y En récapitulant, l équilire de ash parfait est (,,,E,G ),(, ) V Y.. Equilire de ash parfait en sous-jeux: éfinition IV..: Un sous-jeu d un jeu sous forme extensive est un jeu issu du jeu original qui:. commence en un nœud n qui est un ensemle d information singleton.. inclut tous les nœuds successeurs de n et les nœuds terminaux (et aucun nœud prédécesseur).. ne coupe aucun ensemle d information. éfinition IV..: Quand un sous-jeu est différent du jeu original, on l appelle un sous-jeu propre ou strict. Motivation de.: ouvoir analyser le sous-jeu de façon autonome. Garantir que l histoire du jeu est connue de tous jusqu à n (tous les joueurs jouant après n savent que le jeu est passé par n ). Exemple IV..: Soit le jeu suivant décrit par sa forme extensive. A C E G (, ) (, ) (, ) (, ) ( 8,5 ) ( 7,6 ) ( 6,7 ) ( 5,8) L C C L L L L 5

Ce jeu admet 6 sous-jeux propres. Exemple IV..: Soit le jeu décrit par la forme extensive suivant. V W G M J X J Y C R 0 0 0 J 5 5 J C C 5 5 0 0 5 5 0 Ce jeu admet 5 sous-jeux dont sous-jeux propres et le jeu lui-même. éfinition IV..: Un profil de stratégies est un équilire de ash parfait en sous-jeux (ESJ) s il correspond à un équilire de ash dans chaque sous-jeu (Selten 965). étermination de l ESJ: Un équilire de ash parfait en sous-jeux est un ensemle de stratégie otenu par un raisonnement à reours qui rencontre, selon les étapes de la procédure, un seul joueur confronté à un prolème de maximisation ou plusieurs joueurs concernés par un sous-jeu. Exemple IV..: La ataille des sexes version dynamique. (, ) (, ) 6

Ce jeu admet sous-jeux propres. L équilire de ash du sous-jeu commençant en est. L équilire de ash du sous-jeu commençant en est.,,. ESJ est Exemple IV..: S G M J V SJ W X J SJ Y SJ C R 0 0 0 J 5 5 J C C 5 5 0 0 5 5 0 Les gains du joueur sont inscrits sur la première ligne de résultat et les gains du joueur sur la seconde. Ce jeu admet sous-jeux propres.,. L équilire de ash du sous-jeu S est (,G ) et le gain qui lui est associé est L équilire de ash du sous-jeu SJ est (, ) et le gain qui lui est associé est ( 0,0 ). Le sous-jeu SJ correspond, pour le joueur qui est le seul joueur concerné, à un simple prolème de maximisation. La solution est. On otient la forme extensive suivante. V W X J Y 0 0 7

Le sous-jeu SJ correspond, pour le joueur qui est le seul joueur concerné, à un simple prolème de maximisation. La solution est X. inalement, la dernière étape nous donne la forme réduite ci-après et qui admet comme solution w. V W 0 0 Il suffit à présent de récapituler les choix des joueurs pour caractériser l ESJ. On otient le s, s W,,,, G, X,. couple de stratégies ( ) = Remarque IV..: Si un jeu n admet pas de sous-jeux propres alors E ESJ. {ESJ} {E}. roposition IV..: Tout jeu fini à information parfaite possède au moins un ESJ en stratégies pures. 8