Théorie des Jeux Et ses Applications

Documents pareils
Théorie des Jeux Et ses Applications

Introduction à la Théorie des Jeux p.1/77

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T3 2013

QUI VEUT JOUER AVEC MOI?

Jeux sous forme extensive (Jeux dynamiques)

CHAPITRE 5. Stratégies Mixtes

Analyse trimestrielle du marché des jeux en ligne en France

Simulation centrée individus

Modèles et simulations informatiques des problèmes de coopération entre agents

Collection «Poker Expert» Sous la direction de François Montmirel. Parution le 3 avril Poker Cash 2

Canevas théoriques du projet sur le poker Partie A

POKER ET PROBABILITÉ

Les règles de base du poker :

YANN ROUDAUT - Professeur de l Ecole Française de Poker - roudaut@ecolefrancaisedepoker.fr

Collection «Poker Expert» Sous la direction de François Montmirel. Parution le 25 février Poker Cash 1

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

RÉFORME DES MOINS DE 12 ANS

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T1 2014

Economie de l Incertain et des Incitations

REDCACTUS POKER ONLINE

Code de conduite sur les paris sportifs pour les athlètes

Angoulême Poker Club. Compétitions online et live

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Chapitre 2/ La fonction de consommation et la fonction d épargne

THE EUROPEAN LOTTERIES CODE DE CONDUITE SUR LES PARIS SPORTIFS

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T4 2014

Chapitre 1 : Introduction au contrôle de gestion. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 1

L oligopole ESCP

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

Comment parier jute sur les sites de paris sportifs

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Homologation ARJEL : Retour d expérience

L2M Poker Club Championnat A

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Charte My Poker Ligue Association

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)

LBPoker. Barrière BarrierePoker.fr est un site de poker en ligne agréé par l Arjel sous le numéro 0023-PO

Apprentissage par renforcement (1a/3)

All in Lorsqu un joueur n est plus en mesure de miser l entier du montant exigé, il est qualifié de «All in».

Bilan 2011 du marché des jeux en ligne en France

ESSEC Cours Wealth management

COMMENT GAGNER DE L ARGENT AUX PARIS FOOT

EPT GRAND FINAL SEASON 11 TOURNAMENT SCHEDULE

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T2 2013

Christophe Le Page CIRAD - UPR Green

Exercices sur le chapitre «Probabilités»

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

La philosophie Ludi. recréer cet esprit chaleureux et amical afin de faire passer des bons moments à ses internautes autour d une même passion.

«Les jeux en ligne, quelle influence en France?»

DARSHAN TEAM : la newsletter du club Numéro 5 (mars 2010)

PROGRAMME 2014/2015 LICENCIÉS CLUBS. Juillet 2014 SOMMAIRE

Poker. A rendre pour le 25 avril

Synthèse. Jeux d argent. Internet et jeux vidéo. Comparaison avec les apprentis

Le Seven Card Stud. Club Poker 78

EPT BARCELONA SEASON 12 TOURNAMENT SCHEDULE

Efficience des marchés et finance comportementale

Complexité et auto-organisation chez les insectes sociaux. Complexité et auto-organisation chez les insectes sociaux

Super HUD- Guide Utilisateur

Les bases du Poker. Le pot central, c'est-à-dire l argent accumulé au centre de la table est constitué de jetons qui représentent de l argent réel.

Machines virtuelles Cours 1 : Introduction

LE RÔLE DU POKER EN LIGNE DANS LES TRAJECTOIRES DE JEU DE HASARD ET D ARGENT

Introduction CHAPITRE 1

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

Institut Informatique de gestion. Communication en situation de crise

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

MANUEL INTÉGRÉ EA SPORTS GRAND CHELEM TENNIS 2

Probabilités conditionnelles Loi binomiale

Jeux d argent en ligne. Quelques résultats

Règles Aménagées Tournoi à 3

Voilà en effet le genre de situations classiques et très inconfortables dans lequel le joueur de poker se retrouve bien souvent.

La microéconomie est-elle utile?

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

QUALITÉ DE L APPRENTISSAGE DE L INTUBATION ORO-TRACHÉALE EN LABORATOIRE DE SIMULATION, SON INTÉRÊT POUR LES PATIENTS.

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T2 2014

My Poker Manager Guide Utilisateur. Guide Utilisateur

PRIX ENTREPRISE & CONVIVIALITE 2011

RÈGLEMENT. sur la collaboration avec les intermédiaires

COMPETENCES E P S et BASKET BALL au CYCLE 3. R.Reynaud CPC. LYON PART-DIEU mai 2003 en référence au document d'antoine Muguet

Chapitre 3. La répartition

SYNTHÈSE DES PROPOSITIONS

Diagramme de déploiement

SUPERTOTO TERMES & CONDITIONS. Table des Matières

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

FORMATS DE JEU POUR LA PRATIQUE DU SOCCER AU QUÉBEC FÉDÉRATION DE SOCCER DU QUÉBEC

«Baromètre de l enregistrement des joueurs sur les sites agréés en France»

En cas de partage avec des «side pots», chaque pot est traité séparément en commençant par les extérieurs.

Analyse trimestrielle du marché des jeux en ligne en France. 2 ème trimestre 2015

LE POKER, INTERNET ET LE DROIT

Instruction KONAMI COSSy Online et KTS

Resolution limit in community detection

Jeux sérieux : définition, pertinence, étude de cas

QUEL JOUEUR DE POKER ETES-VOUS?

Pi, poker et informatique ; une «épuisante» alliance pour des projets en mathématiques

Transcription:

Théorie des Jeux Et ses Applications De la Guerre Froide au Poker Clément Sire Laboratoire de Physique Théorique CNRS & Université Paul Sabatier, Toulouse www.lpt.ups-tlse.fr

Quelques Définitions de la Théorie des Jeux Branche des mathématiques étudiant des modèles de conflit, coopération, prise de décisions «Ensemble d'outils pour analyser les situations dans lesquelles ce qu'il est optimal de faire pour un agent (personne physique, entreprise, animal, trader...) dépend des anticipations qu'il forme sur ce qu'un ou plusieurs autres agents vont faire» (Wikipédia).

Quelques Définitions de la Théorie des Jeux L'objectif de la théorie des jeux est de modéliser ces situations de choix, de déterminer une stratégie optimale (compétitive ou collaborative!) pour chacun des agents, de prédire l issue du jeu, et de trouver comment aboutir, à «l'équilibre», à une situation «optimale»

Un Peu d Histoire Antoine Augustin Cournot (1801-1877) publie en 1838 ses Recherches sur les principes mathématiques de la théorie des richesses Application à l économie Notion d équilibre d un jeu entre deux agents Première théorie de l offre et la demande Notions de monopole, d oligopole Implications philosophiques (déterminisme physique, liberté, hasard )

Un Peu d Histoire Émile Borel (1871-1956) publie en 1938 ses Applications aux jeux de hasard Théorème du MiniMax (jeux à somme nulle) Liens avec les «vrais» jeux (bridge, la «relance» ) Importance de la théorie des probabilités

Un Peu d Histoire John von Neumann (1903-1957) et Oskar Morgenstern (1902-1977) publient en 1944 leur Theory of games and economic behavior Résolution générale des jeux à somme nulle (théorème mathématique du point fixe) Exemples d applications à la décision économique et politique Quelques contributions de J. Von Neumann : Axiomatisation des mathématiques ; logique mathématique Axiomatisation de la mécanique quantique Théorie de l information Architecture des ordinateurs Manhattan project

Un Peu d Histoire John Nash (1928-) généralise ces travaux aux jeux à somme non nulle et inaugure (1994) la liste des théoriciens des jeux ayant obtenu le «Prix Nobel d économie» : T. Schelling et R. Baumann (2005), L. Hurwicz et al. (2007) Un homme d'exception (A beautiful mind 2001)

Quelques Concepts/Notions Clés Quantifier «objectivement» des questions a priori subjectives Rationalité (ou non!) des agents Coopération (coalition) ou compétition (antagonisme) Intérêt individuel vs collectif Information connue partielle ou complète ; mémoire Jeux simultanés, séquentiels, répétés, finis Jeux à somme nulle ou non nulle Équilibres de Nash (aucun agent n a intérêt à dévier unilatéralement de sa stratégie)

Quelques Domaines d Application Économie et finance Relations internationales Sciences politiques Organisation sociale Sociologie Biologie évolutive et comportementale Philosophie

L Apport du Physicien Expérience de la modélisation de phénomènes naturels (identification des ingrédients essentiels) Retours théorie/expérience (nécessité du caractère robuste et prédictif d un modèle) Recours systématique aux simulations numériques (design/test/solution du modèle) Éventail de techniques mathématiques issues de la physique statistique et non linéaire

La «Science» du Poker Émile Borel résout un jeu à deux joueurs (1938) : la «relance» Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une «main» aléatoire c A et c B 2[0,1] A commence A relance R$ si c A >r A A se couche si c A <r A B suit R$ si c B >r B La meilleure main gagne (R+1)$ B se couche si c B <r B A gagne 1$ B gagne 1$ Borel démontre la meilleure stratégie de A et B

La «Science» du Poker John von Neumann (1944) modifie les règles de la «relance» (plus proche du vrai poker) Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une «main» aléatoire c A et c B 2[0,1] A relance de R$ B se couche si c B <r B A gagne 1$ A commence si c A >r A ou parfois si c A <s A B suit de R$ si c B >r B La meilleure main gagne (R+1)$ A «check» si s A <c A <r A La meilleure main gagne 1$ La meilleure A-stratégie implique de bluffer aléatoirement avec les mains très faibles

WSOP 2009: 57 tournois (200 6500 joueurs) Main event: 6494 joueurs; 10000$ buy-in ; prix du gagnant: 8.5 M$

Fraction de joueurs F(X) moins riches qu un joueur donné ayant X fois la fortune moyenne

Comparaison avec la distribution des salaires bruts de la population salariée française (2007) Le poker moins égalitaire pour X<2, plus pour X>2 1 F ( X) ~ X France 2.5

Rions un peu : les «équations du poker» Equation vérifiée par la dérivée de F( X) La durée d un tournoi de poker en fonction du nombre initial de joueurs

Modélisation des championnats de base-ball Système isolé ; absence de match nul ; aspects psychologiques mineurs ; grande base de données Fraction de victoires vs le rang final durant deux ères identifiées par le modèle (1900-1960 ; 1961-2012) Distribution du nombre de victoires répétées 1 2 n

Modélisation des championnats de football Nombre de points et fraction de victoires (domicile & extérieur) et de matchs nuls dans les ligues majeures européennes vs le rang final (UK et Allemagne)

Mouvements collectifs dans les bancs de poissons

Expériences du CRCA Toulouse (G. Theraulaz et al.) Ces expériences (1, 2, 5 30 poissons) permettent d identifier les règles individuelles de prise de décisions, les «forces élémentaires» (alignement attraction), et les paramètres microscopiques conduisant à la modélisation mathématique

Modèle validé expérimentalement Expériences vs simulations sur ordinateur du modèle Transition vers un banc ordonné quand on augmente la vitesse individuelle (et donc la force d alignement)

Mouvements collectifs de groupes humains a. Dispositif expérimental utilisé pour l'étude des déplacements collectifs de piétons. Un système de capture de mouvement en 3D permet de suivre les positions de chaque piéton. b. Lorsque deux groupes de piétons se déplacent en directions opposées, le trafic se structure en files distinctes après une vingtaine de secondes. Cette organisation collective est instable et peut disparaître quelques instants plus tard, puis réapparaître. c. Densité de piétons dans le couloir et vitesse radiale des piétons dans une expérience (haut) et une simulation numérique (bas) du modèle heuristique de déplacement de piétons (N=60 piétons). Le modèle montre que l'instabilité de la dynamique de ségrégation résulte de la variabilité des vitesses de marche.

Mouvements collectifs de groupes humains Modélisation du mouvement individuel (prises de décisions) et des interactions entre individus testée expérimentalement Formation spontanée de files et corrélations observées expérimentalement bien reproduites dans les simulations numériques Expérience Modèle

Un jeu «en or» (MiniMax) Les histoires possibles du jeu forment un arbre de 2n coups joués, avec un score final : S n 2{x k, k=1,,2 2n } ; x k nombres aléatoires entre 0 et 1 A veut maximiser le score S n et B veut le minimiser n 2 3 5 Sn max choix de A minchoix de B xk 0.382... n 2

Le «polymère joueur» Jeu en arbre (inspiré d un modèle de polymère en milieu désordonné) avec accumulation de scores locaux (les a i valent 0 ou 1 avec probabilité {1-p, p}) x k i chemin i A veut maximiser le score et B veut le minimiser (importance de la «profondeur d analyse») a

Et maintenant, jouons! Le «dilemme du prisonnier» Merrill Flood et Melvin Dresher 1950 Placez-vous par 2 et attribuez-vous chacun un nom (A n et B n, n=1, 2, 3, ) Vous et votre «ami» avez été arrêtés pour un crime et la police vous interroge séparément À chacun d entre vous, le même «marché» est proposé : Aucun de vous ne dénonce l autre : 1 an de prison ferme pour les deux L un des deux dénonce l autre : il repart libre (immunité) et l autre écope de 5 ans de prison Chacun dénonce l autre : les deux écopent de 3 ans fermes À vous de jouer (sans communiquer)! Dénoncez-vous votre «ami»? (oui/non)

De la théorie à l expérience Le dilemme du prisonnier a fait l objet d un très grand nombre d études expérimentales, tant en économie qu en psychologie sociale : Certaines études ont montré que les femmes coopèrent davantage que les hommes. Chez des enfants âgés de 6 à 11 ans, on a observé un taux de coopération (c està-dire un pourcentage de sujets optant pour la coopération) qui augmente avec l âge, un résultat suggérant, en conformité avec certains principes de la psychologie de l enfant, un apprentissage progressif des normes sociales de coopération. Les étudiants en économie sont moins coopératifs que les autres! Les étudiants anglo-saxons coopèrent moins que les autres. Les traits de personnalité influencent le comportement face au jeu. Les autistes ne se comportent pas différemment des sujets «normaux», mais ont une perception très différente du jeu. La communication entre les joueurs renforce la coopération. La coopération est plus forte lorsque les sujets se connaissent et partagent un esprit de groupe. L introduction d un mécanisme de sanction peut renforcer la coopération, même si elle a parfois des effets pervers en introduisant une suspicion entre les joueurs qui peut inhiber certains comportements coopératifs. La pression sociale (pression par les pairs) est un mécanisme incitatif à la coopération particulièrement puissant.

Et maintenant, jouons! Le «concours de beauté» John Maynard Keynes 1936, Alain Ledoux (Jeux & Stratégie) 1981, et Hervé Moulin 1986 Écrivez chacun un nombre entier entre 0 et 1000, en secret et sans communiquer entre vous Nous calculerons la moyenne m de vos réponses Le gagnant est celui dont la réponse s approchera le plus de la moitié de la moyenne m Le gagnant recevra un prix mirifique! À vous de jouer!

Merci de votre attention Et de votre participation! Présentation téléchargeable (avec d autres séminaires de vulgarisation) sur ma page sur le site du LPT Toulouse

Quelques liens http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux_en_relations_i nternationales http://www.math.ens.fr/culturemath/materiaux/eber/prisonnier.htm http://fr.wikipedia.org/wiki/concours_de_beaut%c3%a9_de_keynes http://www.lpt.ups-tlse.fr/spip.php?article239 (avec notamment un texte de vulgarisation en français) http://fr.wikipedia.org/wiki/programme_d%27%c3%a9checs http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux_combinatoires