La théorie des jeux:

Documents pareils
Introduction à la Théorie des Jeux p.1/77

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

CHAPITRE 5. Stratégies Mixtes

Simulation centrée individus

Economie de l Incertain et des Incitations

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Comment parier jute sur les sites de paris sportifs

COURS 8 : INTRODUCTION A LA THEORIE DES JEUX

Annexe 1 au règlement Sporttip

Fiche d animation n 1 : Pêle-mêle

GAGNEZ DE L ARGENT GRACE AUX PARIS SPORTIFS SUR INTERNET TECHNIQUES ET METHODES GAGNANTES

- Livret de Règles -

Chapitre 2/ La fonction de consommation et la fonction d épargne

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

COMMENT GAGNER DE L ARGENT AUX PARIS FOOT

Théorie des Jeux Et ses Applications

Formules et Approches Utilisées dans le Calcul du Coût Réel

PROBABILITÉS CONDITIONNELLES

CAC, DAX ou DJ : lequel choisir?

Exercice 6 Associer chaque expression de gauche à sa forme réduite (à droite) :

ANNEXE J POTEAUX TESTÉS SELON UN CHARGEMENT STATIQUE ET TESTÉS SELON UN CHARGEMENT CYCLIQUE ET STATIQUE

GUIDE FISCAL RELATIF AUX CARTES D ACHAT AU CANADA

TD de Macroéconomie Université d Aix-Marseille 2 Licence 2 EM Enseignant: Benjamin KEDDAD

YANN ROUDAUT - Professeur de l Ecole Française de Poker - roudaut@ecolefrancaisedepoker.fr

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

ASR1 TD7 : Un microprocesseur RISC 16 bits

Jeux sous forme extensive (Jeux dynamiques)

Le Rapprochement Bancaire. Mode d'emploi

Jeux mathématiques en maternelle. Activités clés. Jeu des maisons et des jardins (Yvette Denny PEMF)

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Vous incarnez un surdoué en informatique qui utilise son ordinateur afin de pirater des comptes bancaires un peu partout dans le monde et s en mettre

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Programmation linéaire

Assurance maladie publique et «Opting out» - Réflexions théoriques

- un jeu de K cartes représentées par des nombres C 1, C 2 à C K avec K entier strictement

Evaluation diagnostique de CM1 Circonscription de Saint Just en Chaussée Livret du maître partie Français

Retour table des matières

Théorèmes de Point Fixe et Applications 1

Les Cartes et leur Valeur

NOTORIETE DE L ECONOMIE SOCIALE SOLIDAIRE ET ATTENTES DE LA JEUNESSE

Item 169 : Évaluation thérapeutique et niveau de preuve

Personal Financial Services Fonds de placement

Qu est-ce qu une probabilité?

guide de branchement

Introduction 1. Bibliographie 317 Remerciements 323 Index Pearson Education France Investisseurs de légende Glen Arnold

4. Exercices et corrigés

Poudlard But Matériel : Mise en place Prologue d'emplacements différents

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

La pratique des décisions dans les affaires

FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX

Une proposition de séquence relative à l étude des sons /an/, /on/ et de leurs graphies. Cadre général

Assurance et prévention des catastrophes naturelles et technologiques

POKER ET PROBABILITÉ

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

PARC Olympique Lyonnais

Marchés oligopolistiques avec vente d un bien non homogène

Ordonnancement temps réel

Le Seven Card Stud. Club Poker 78

MODALITES DE SUIVI DU PROJET ANNUEL DU MASTER 2 SOLUTIONS INFORMATIQUES LIBRES

Parallélisme et Répartition

Otolift Rubis Monte-escalier pour courbe extérieure

UML Diagramme de communication (communication diagram) Emmanuel Pichon 2013

I2 I3. relations. publiques

Virtual PBX Quick User Guide

Modèles et simulations informatiques des problèmes de coopération entre agents

Sujet : Frais chargés aux détaillants par les émetteurs de cartes de crédit et leurs pratiques

Intelligence Artificielle Planification

RÉFORME DES MOINS DE 12 ANS

Indicateur de position PI-D2100 Guide de l utilisateur

TD : Codage des images

GÉODÉSIE, COORDONNÉES ET GPS

CONDITIONS PARTICULIERES DE VENTE EN LIGNE. Suite à la modification de la législation, ces conditions seront mises à jour prochainement

Taxis parisiens : tarifs, réglementations, droits des usagers

Programmation linéaire

Sauvegarde avec Windows 7

Sujet 4: Programmation stochastique propriétés de fonction de recours

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

ENQUETE SUR LA SITUATION DES GRANDES VILLES ET AGGLOMERATIONS EN MATIERE D ASSURANCES DOMMAGES

IDENTIFIER LES TEMPS DE JEU NE PAS PERDRE LE BALLON

Modèle de changement d organisation. Leanpizza.net présente. Petit Guide Rapide du jeu de cartes Modèle de Changement d Organisation

Guide de configuration d'une classe

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Introduction à la théorie des files d'attente. Claude Chaudet

Analyse trimestrielle du marché des jeux en ligne en France

Modélisation aléatoire en fiabilité des logiciels

Économie de l environnement

(51) Int Cl.: B23P 19/00 ( ) B23P 19/04 ( ) F01L 1/053 ( )

Analyse des bruits de clavier d ordinateur

Faites connaissance avec votre Rubik s Cube Étape 1

Les assurances du particulier. Place Reine Astrid FLORENVILLE. Tél : 061/ Fax : 061/ info@verdun.be -

Première expérience?

Unité 1. Au jour le jour

Méthode : On raisonnera tjs graphiquement avec 2 biens.

Livret du Stagiaire en Informatique

Présentation et portée du cours : CCNA Exploration v4.0

Transcription:

La théorie des jeux: Cours sur les Sociétés Virtuelles GMIN334 Master 2-Informatique" Jacques Ferber LIRMM - Université Montpellier II 161 rue Ada 34292 Montpellier Cedex 5 Email: ferber@lirmm.fr Home page: www.lirmm.fr/~ferber Version 1.1 Sept. 2012

Présentation" u La théorie des jeux constitue une approche mathématique de problèmes de stratégie tels qu on en trouve en recherche opérationnelle et en économie. u Elle étudie les situations où les choix de deux protagonistes - ou davantage - ont des conséquences pour l un comme pour l autre. u Utilisé pour analyser les situations de coopération/ conflits qui prennent en compte les choix de l autre (des autres) Jacques Ferber - LIRMM 2

Exemple" u Restaurant l n personnes sont au restaurant l Chaque personne choisit de payer ce qu il consomme: c est un problème de décision individuelle. l Avant le repas, on décide de partager la note en n, quel que soit ce qu on mange: cela devient un jeu!! F Intérêt à manger plus que les autres, et que les autres mangent moins.. u Applications dans de nombreux domaines l Economie, domaine militaire, gestion d entreprise, systèmes multi-agents, etc.. Jacques Ferber - LIRMM 3

Exemple et définition" u Le jeu: Pierre/ciseau/feuille l Pierre gagne contre ciseau, ciseau contre feuille, feuille contre pierre u Définitions: l Joueurs: les protagonistes d une situation de coopération/ compétition.. l Choix, action: une décision l Stratégie: une suite de choix l Gain (payoff): ce que chaque joueur gagne en fonction des coups des autres Jacques Ferber - LIRMM 4

Représentation sous forme de matrices" u Deux joueurs: l pierre gagne contre ciseau, ciseau contre feuille, feuille contre pierre J2: P J2: C J2: F J1: P 0,0 1,0 0,1 J1: C 0,1 0,0 1,0 J1: F 1,0 0,1 0,0 Jacques Ferber - LIRMM 5

Jeux simultanés" u Le principe Ø Si jeu coopératif: les joueurs peuvent se concerter avant de faire un choix. Si jeu non coopératif, les joueurs ne peuvent pas communiquer avant.. Ø On traitera plus le cas des jeux non coopératifs, plus classiques.. Ø Chaque joueur i choisit sa stratégie s i sans connaître les choix des autres. Ø Alors each joueur i reçoit son gain u i (s 1, s 2,..., s n ). Ø Le jeu s arrête Ø Une grande catégorie de jeux qui ont été très analysés Ø Formalisation Ø Un ensemble fini de joueurs {1, 2,, n} Ø Espace des stratégies (choix) de chaque joueur S 1 S 2... S n Ø Les fonctions de gain de chaque joueur u 1 u 2... u n où u i : S 1 S 2... S n R. Ø Exemple Jacques Ferber - LIRMM 6

Jeux à 2 joueurs" J2: d1 J2: d2 J1: d1 x,x u,v J1: d2 v,u y,y u Jeux symétriques u Jeu d accord social ssi: l x ou y >0 et, si x et y >0, alors x=y l u ou v négatif ou nul Jacques Ferber - LIRMM 7

Exemple d accord social" u Deux personnes, Jean et Marie, décident d aller au restaurant.. u Ils ne communiquent pas, mais ils connaissent leur préférences mutuelles (informations complètes) u Jean et Marie préfèrent le restau Indien à la pizzéria l Un bon début de soirée en perspective Marie Pizza Indien Jean Pizza Indien 1, 1 0, 0 0, 0 2, 2 Jacques Ferber - LIRMM 8

Exemple de jeu sans accord social: la bataille des sexes" u Un autre jour, Jean et Marie ont décidé de sortir ensemble. Chacun préfère sortir plutôt qu être seul.. u Marie préfère l Opéra, Jean le match de foot u Mais on suppose qu ils ne communiquent pas, mais ils connaissent leur préférences (informations complètes) u La solution, il faut que l un choisisse le choix de l autre, mais que l autre ne change pas de choix.. l Une mauvaise soirée en perspective Marie Opéra Match foot Opéra Jean Match foot 2, 1 0, 0 0, 0 1, 2 Jacques Ferber - LIRMM 9

Dilemme des prisonniers" u Le dilemme du prisonnier l chaque prisonnier peut trahir (T) ou non (S) l si aucun n avoue (S-S) : 2 ans l si les 2 trahissent (T-T): 4 ans l si un seul trahit: il est libre et l autre a 5 ans Joueur 2 Joueur 1 S: T: S: -2,-2-5,0 T: 0,-5-4,-4 l x = -2, y = -4 l u = -5, v = 0 l Ce n est pas un jeu d accord social Jacques Ferber - LIRMM 10

Equilibre de Nash" u L'équilibre de Nash décrit une issue d un jeu non coopératif dans lequel aucun joueur n a intérêt à modifier sa stratégie, compte tenu des stratégies des autres joueurs. u Soit un jeu non-coopératif à n joueurs, et s*= (s* 1,...,s* n ) une combinaison de choix stratégiques de ces n joueurs l s* i est le choix stratégique du joueur i l s* i S i, l ensemble des stratégies praticables par le joueur i. l u i (s* 1,...,s* n ) est le gain du joueur i lorsque s* est sélectionné. u s i S i u i (s* 1, s* i, s* n ) > u i (s* 1, s i, s* n ) Jacques Ferber - LIRMM 11

Exemple" Joueur 2 L C R T 0, 4 4, 0 5, 3 Joueur 1 M 4, 0 0, 4 5, 3 B 3, 5 3, 5 6, 6 u La combinaison des stratégies (B, R) possède la propriété suivante: l Le joueur 1 ne peut pas faire mieux que B, sachant que le joueur 2 choisit L, C ou R l Le joueur 2 ne peut pas mieux faire que R, sachant que le joueur 1 choisit T, B ou M u Il existe donc un équilibre de Nash (et en plus optimal..) l tout le monde est heureux! (jeu d accord social, on verra pourquoi avec Pareto) Jacques Ferber - LIRMM 12

Equilibre de Nash dans le dilemme du prisonnier" u Il existe un équilibre de Nash dans le dilemme du prisonnier. Celui ou les deux trahissent!! l Bien qu il existe un autre équilibre, mais qui ne peut être choisi «rationnellement» par aucun des deux joueurs.. l Car rester silencieux (S) ne constitue pas un équilibre: l autre joueur pouvant améliorer son gain en jouant (T ) Joueur 2 Joueur 1 S: T: S: -2,-2-5,0 T: 0,-5-4,-4 Jacques Ferber - LIRMM 13

Jeux de coordination" u Jeux symétriques dans lesquels il s agit simplement de se mettre d accord (sans compétition) l Ex: rouler à gauche ou à droite Joueur 2 Joueur 1 G: D: G: 1,1-1,-1 D: -1,-1 1,1 2 équilibres de Nash Jacques Ferber - LIRMM 14

Un problème politique: les marchands de glace" u Deux marchands de glace doivent choisir un emplacement sur une plage où les clients sont répartis uniformément (prix et glaces sont les mêmes u Emplacement au hasard: l Chaque acheteur étant paresseux va vers le plus proche l Donc Bleu a plus d acheteur que Rouge (nombre proportionnel à la ligne de plage devant chaque vendeur. Jacques Ferber - LIRMM 15

Marchands de glace #2" u Même en cas de symétrie, chacun à intérêt à aller vers le centre de la plage u Résultat final: les marchands se retrouvent au centre (équilibre de Nash) u Mais pas un équilibre optimal, si l on prend en compte le déplacement des clients Jacques Ferber - LIRMM 16

Optimum de Pareto" u Préférence au sens de Pareto > P : l Entre les états des agents d un jeu l (u 1, u i, u n ) > P (u 1, u i, u n ) ssi i [1,n], u i u i u Optimum de Pareto: maximum de cette relation u on ne peut augmenter le gain d un agent sans diminuer celui d un autre l Très souvent utilisé en économie pour décrire un monde optimum Jacques Ferber - LIRMM 17

Accord social" u Choix des restaus et accord social: l Deux équilibres de Nash (P-I et I-P) l Un optimum de Pareto (I-I) Marie Pizza Indien Jean Pizza Indien 1, 1 0, 0 0, 0 2, 2 Jacques Ferber - LIRMM 18

Pareto et l économie" u Utilitarisme stricte: principe du plus grand bonheur: l On cherche à augmenter les gains (le bonheur, la satisfaction) de l ensemble de la population. l Mais si les gains des riches augmentent au détriment des pauvres? l Pareto permet d atteindre les états les plus satisfaisants et l utilitarisme (la somme des gains) de partager les états de Pareto en préférant les états les plus satisfaisants. u Néanmoins Pareto n est ni équitable, ni «social»: l Sur l ensemble des états de Pareto on peut préférer les états offrant les plus grands biens.. F L augmentation des riches si elle ne diminue pas la richesse des pauvres est donc meilleure au sens de Pareto et de l utilitarisme. Jacques Ferber - LIRMM 19

Pareto et l économie" u Le cas d un système n offrant que des possibilités de plus grandes richesses l Tous les états sont des optima de Pareto, car l augmentation des richesses de l un ne se fait jamais au détriment des richesses de l autre.. l Le critère utilitariste considère que l état D, D est bien meilleur que les autres états, mais cela n est pas très équitables en terme de répartition de richesses l Mais il n est pas sûr de ce fait que le joueur 1 joue D, car il n a aucun intérêt pour lui.. (en jouant C, il a pratiquement la même assurance de gains) Joueur 2 Joueur 1 A B C D A 5, 10 10, 20 10, 30 15, 40 B 10, 20 10, 30 15,30 15, 50 C 15, 30 20, 40 20, 50 20, 50 D 20, 20 20, 50 20, 70 20, 200 Jacques Ferber - LIRMM 20

Les équilibres du dilemme des prisonniers" Joueur 2 Joueur 1 S: T: S: -2,-2-5,0 T: 0,-5-4,-4 u équilibre de Nash: (T,T) u optimum de Pareto: (S,S) Jacques Ferber - LIRMM 21

Les équilibres" u Lorsque Pareto inclut dans Nash, pas de pbs.. u Lorsque Pareto n est pas inclus dans Nash: l pbs de coopération. Le moindre écart peut faire repasser dans l équilibre de Nash qui n est pas optimal au sens de Pareto (ex: dilemme du prisonnier). u Question: comment obtenir l optimum de Pareto? l Par la coopération l Communication l ou itération (et évolution) Jacques Ferber - LIRMM 22

Compétition sur les dilemmes du prisonnier" u Lancé par Axelrod.. Livre en 1984 (Donnant donnant) u Idée: l Mettre en compétition des programmes qui jouent au dilemme du prisonnier itératif. u Le nombre d itération l Nombre n est connu d avance l Nombre peut s arrêter à n importe quel moment u On fait la somme à la fin des gains obtenus Jacques Ferber - LIRMM 23

Stratégies sur des suites (1)" u Donnant-donnant : coopération au premier tour, puis stratégie précédente du partenaire. u Majorité mou : choix majoritaire de l'adversaire, coopération si égalité et au premier tour. u Rancunière : coopération, puis défection permanente si le partenaire fait une fois défection u Donnant-donnant dur : coopération, sauf si le partenaire a trahi une des 2 fois précédentes u Gentille : toujours coopérer u Périodique gentille : séquence cyclique de deux coopération, puis une défection Jacques Ferber - LIRMM 24

Stratégies sur des suites (2)" u Sondeur : séquence trahir, coopérer, coopérer u Lunatique : défection une fois sur deux en moyenne (séquences aléatoires) u Méfiante : défection au premier tour, puis stratégie précédente du partenaire u Majorité dur: choix majoritaire de l'adversaire, défection si égalité et au premier tour. u Méchante : toujours faire défection u Périodique méchante : séquence cyclique de deux défections, puis une coopération Jacques Ferber - LIRMM 25

Comparaison" u u u u u u u u u u u u Donnant-donnant Majorité-mou Rancunière Donnant-donnant-dur Gentille Périodique-gentille Sondeur Lunatique Méfiante Majorité-dur Méchante Périodique-méchante Jacques Ferber - LIRMM 26

Tournoi du 50e anniversaire" u Chaque équipe pouvait soumettre plusieurs programmes u Équipe Nick Jennings (Southampton) u Stratégie = séquence de 10 coups pour se reconnaître l Si oui: stratégie maitre esclave l Si non: stratégie méchante u En fait: création d une coalition entre deux programmes pour faire augmenter les gains Jacques Ferber - LIRMM 27

Evolutionary Game Theory" u La théorie des jeux évolutifs l Utilise le principe du dilemme du prisonnier itératif.. u Concept d ESS (evolutionary stable strategy) l Stratégie qui, sur un long terme évolutionnaire, se révèle particulièrement stable et empêche le développement d autres stratégies plus nouvelles. l La stratégie «tit for tat» (donnant donnant) dans le dilemme du prisonnier est évolutionnairement stable. Elle peut battre n importe quelle stratégie que l on pourrait inventer pour ce jeu. Jacques Ferber - LIRMM 28

Stratégies dominante" u On dit qu une stratégie s1 domine une stratégie s2 si ses gains sont meilleurs, quels que soient les choix des autres joueurs. u Une stratégie est dominée si il existe une autre stratégie qui réalise un meilleur gain, indépendamment des autres choix.. Jacques Ferber - LIRMM 29