Théorie des Jeux Et ses Applications

Documents pareils
Introduction à la Théorie des Jeux p.1/77

QUI VEUT JOUER AVEC MOI?

Simulation centrée individus

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

CHAPITRE 5. Stratégies Mixtes

Jeux sous forme extensive (Jeux dynamiques)

Modèles et simulations informatiques des problèmes de coopération entre agents

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Collection «Poker Expert» Sous la direction de François Montmirel. Parution le 3 avril Poker Cash 2

L oligopole ESCP

Economie de l Incertain et des Incitations

POKER ET PROBABILITÉ

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

Intelligence Artificielle et Robotique

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Canevas théoriques du projet sur le poker Partie A

Pi, poker et informatique ; une «épuisante» alliance pour des projets en mathématiques

Collection «Poker Expert» Sous la direction de François Montmirel. Parution le 25 février Poker Cash 1

Chapitre 2/ La fonction de consommation et la fonction d épargne

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T3 2013

Les nombres entiers. Durée suggérée: 3 semaines

YANN ROUDAUT - Professeur de l Ecole Française de Poker - roudaut@ecolefrancaisedepoker.fr

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Coup de Projecteur sur les Réseaux de Neurones

Les règles de base du poker :

Photons, expériences de pensée et chat de Schrödinger: une promenade quantique

Marchés, réseaux et politique de la concurrence. Claude Crampes

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Item 169 : Évaluation thérapeutique et niveau de preuve

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

La microéconomie est-elle utile?

Introduction CHAPITRE 1

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Resolution limit in community detection

Efficience des marchés et finance comportementale

Cryptologie et physique quantique : Espoirs et menaces. Objectifs 2. distribué sous licence creative common détails sur

Théories criminologiques II (CRM 3701)

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Poker. A rendre pour le 25 avril

Le Seven Card Stud. Club Poker 78

THE EUROPEAN LOTTERIES CODE DE CONDUITE SUR LES PARIS SPORTIFS

Introduction 1. Bibliographie 317 Remerciements 323 Index Pearson Education France Investisseurs de légende Glen Arnold

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Angoulême Poker Club. Compétitions online et live

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Introduction au datamining

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

Les apports de l informatique. Aux autres disciplines

L ordinateur quantique (suite)

Peut-on imiter le hasard?

Code de conduite sur les paris sportifs pour les athlètes

Exercices sur le chapitre «Probabilités»

Qu est-ce qu un ordinateur quantique et à quoi pourrait-il servir?

Les mathématiques du XXe siècle

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Partenaires: w w w. c o g m a s t e r. n e t

Résumé des communications des Intervenants

REDCACTUS POKER ONLINE

Apprentissage par renforcement (1a/3)

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

Nathalie Bulle (1998), Compte-rendu de Rainer Hegselmann, Ulrich Mueller, Klaus G. Troitzsch (eds.).- Modelling and simulation in the social sciences

Analyse trimestrielle du marché des jeux en ligne en France

Probabilités. I - Expérience aléatoire. II - Evénements

Les probabilités. Guide pédagogique Le présent guide sert de complément à la série d émissions intitulée Les probabilités produite par TFO.

Cours de Probabilités et de Statistique

Optimisation des ressources des produits automobile première

La persistance des nombres

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

Théories criminologiques II (CRM 3701)

FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX

Fig. 1 Le détecteur de LHCb. En bas à gauche : schématiquement ; En bas à droite: «Event Display» développé au LAL.

ACDSBELGIUM.ORG! PAGE 1

Probabilités conditionnelles Loi binomiale

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Optimisation Discrète

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

ENSEIGNEMENT DES SCIENCES ET DE LA TECHNOLOGIE A L ECOLE PRIMAIRE : QUELLE DEMARCHE?

Un centre de simulation : pourquoi et comment? Conférence Management, CHU Toulouse Anne-Claude Allin 9 avril 2014

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?

«Les jeux en ligne, quelle influence en France?»

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

OPTIMISATION À UNE VARIABLE

Pourquoi l apprentissage?

Problématique / Problématiser / Problématisation / Problème

Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1

Débouchés professionnels

Théorèmes de Point Fixe et Applications 1

All in Lorsqu un joueur n est plus en mesure de miser l entier du montant exigé, il est qualifié de «All in».

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Homologation ARJEL : Retour d expérience

Voilà en effet le genre de situations classiques et très inconfortables dans lequel le joueur de poker se retrouve bien souvent.

COMMENT GAGNER DE L ARGENT AUX PARIS FOOT

L apprentissage automatique

Transcription:

Théorie des Jeux Et ses Applications De la Guerre Froide au Poker Clément Sire Laboratoire de Physique Théorique CNRS & Université Paul Sabatier www.lpt.ups-tlse.fr

Quelques Définitions de la Théorie des Jeux Branche des mathématiques étudiant des modèles de conflit, coopération, prise de décisions «Ensemble d'outils pour analyser les situations dans lesquelles ce qu'il est optimal de faire pour un agent (personne physique, entreprise, animal, trader...) dépend des anticipations qu'il forme sur ce qu'un ou plusieurs autres agents vont faire» (Wikipédia).

Quelques Définitions de la Théorie des Jeux L'objectif de la théorie des jeux est de modéliser ces situations, de déterminer une stratégie optimale (compétitive ou collaborative!) pour chacun des agents, de prédire l issue du jeu et de trouver comment aboutir à l'équilibre à une situation «optimale».

Un Peu d Histoire Antoine Augustin Cournot (1801-1877) publie en 1838 ses Recherches sur les principes mathématiques de la théorie des richesses Application à l économie Notion d équilibre d un jeu entre deux agents Première théorie de l offre et la demande Notions de monopole, oligopole Implications philosophiques (déterminisme physique, liberté, hasard )

Un Peu d Histoire Émile Borel (1871-1956) publie en 1938 ses Applications aux jeux de hasard Théorème du MiniMax (jeux à somme nulle) Liens avec les «vrais» jeux (bridge, «la relance» ) Importance de la théorie des probabilités

Un Peu d Histoire John von Neumann (1903-1957) et Oskar Morgenster (1902-1977) publient en 1944 leur Theory of games and economic behavior Résolution générale des jeux à somme nulle (théorème du point fixe) Exemples d applications à la décision économique et politique Quelques contributions de J. Von Neumann : Axiomatisation des mathématiques ; logique mathématique Axiomatisation de la mécanique quantique Théorie de l information Architecture des ordinateurs Manhattan project

Un Peu d Histoire John Nash (1928-) généralise ces travaux aux jeux à somme non nulle et inaugure (1994) la liste des théoriciens des jeux ayant obtenu le «Prix Nobel d économie» : T. Schelling et R. Baumann (2005), L. Hurwicz et al. (2007) Un homme d'exception (A beautiful mind 2001)

Quelques concepts/notions clés Quantifier «objectivement» des questions a priori subjectives Rationalité (ou non) des agents Coopération (coalition) ou compétition (antagonisme) Intérêt individuel vs collectif Information connue partielle ou complète ; mémoire Jeux simultanés, séquentiels, répétés, finis Jeux à somme nulle ou non nulle Équilibres de Nash (aucun agent n a intérêt à dévier unilatéralement de sa stratégie)

Quelques domaines d applications Économie et finance Relations internationales Sciences politiques Organisation sociale Sociologie Biologie évolutive et comportementale Philosophie

L apport du physicien Expérience de la modélisation de phénomènes naturelles (identification des ingrédients essentiels) Retours théorie/expérience (nécessité du caractère robuste et prédictif d un modèle) Recours systématique aux simulations numériques (design/test/solution du modèle) Éventail de techniques mathématiques issues de la physique statistique et non linéaire

La Science du Poker Émile Borel résout un jeu à deux joueurs (1938) : «La Relance» Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une «main» aléatoire c A et c B 2[0,1] A commence A relance R$ si c A >r A A se couche si c A <r A B suit R$ si c B >r B La meilleure main gagne (R+1)$ B se couche si c B <r B A gagne 1$ B gagne 1$ Borel démontre la meilleure stratégie de A et B

La Science du Poker John von Neumann (1944) modifie les règles de «La Relance» pour inclure le bluff Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une «main» aléatoire c A et c B 2[0,1] B se couche A gagne 1$ A relance de R$ si c B <r B A commence si c A >r A ou si c A <s A B suit de R$ if c B >r B La meilleure main gagne (R+1)$ A «check» si s A <c A <r A La meilleure main gagne 1$ La meilleure A-stratégie implique de bluffer aléatoirement avec les mains très faibles

WSOP 2009: 57 tournois (200 6500 joueurs) Main event: 6494 joueurs; 10000$ buy-in ; prix du gagnant: 8.5 M$

Fraction de joueurs F(X) moins riches qu un joueur donné ayant X fois la fortune moyenne

Modélisation des championnats de base-ball Système isolé ; absence de match nul ; aspects psychologiques mineurs ; grande base de données Fraction de victoires vs le rang final durant deux ères identifiées par le modèle (1900-1960; 1961-2012) Distribution du nombre de victoires répétées

Modélisation des championnats de football Nombre de points et fraction de victoires (domicile & extérieur) et de matchs nuls dans les ligues majeures européennes vs le rang final (UK et Allemagne)

Un jeu «en or» (MiniMax) Les histoires possibles du jeu forment un arbre de 2n coups joués, avec un score final : S n 2{x k, k=1,,2 2n } ; x k nombres aléatoires entre 0 et 1 A veut maximiser le score S n et B veut le minimiser n 2 S 5 1 max choix de minchoix de B xk 0.618... 2 n A n

Le «polymère joueur» Jeu en arbre (inspiré d un modèle de polymère en milieu désordonné) avec accumulation de scores locaux (les a i valent 0 ou 1 avec probabilité {1-p, p}) x k i chemin i A veut maximiser le score et B veut le minimiser (importance de la «profondeur d analyse») a

Et maintenant, jouons! Le «dilemme du prisonnier» (Merrill Flood et Melvin Dresher 1950) Placez-vous par 2 et attribuez-vous chacun un nom (A n et B n ) Vous et votre «ami» avez été arrêtés pour un crime et la police vous interroge séparément À chacun d entre vous, le même «marché» est proposé : Aucun de vous ne dénonce l autre : 1 an de prison ferme pour les deux L un des deux dénonce l autre : il repart libre (immunité) et l autre écope de 5 ans de prison Chacun dénonce l autre : les deux écopent de 3 ans fermes À vous de jouer (sans communiquer)!

De la théorie à l expérience Le dilemme du prisonnier a fait l objet d un très grand nombre d études expérimentales, tant en économie qu en psychologie sociale : Certaines études ont montré que les femmes coopèrent davantage que les hommes. Chez des enfants âgés de 6 à 11 ans, on a observé un taux de coopération (c est-à-dire un pourcentage de sujets optant pour la coopération) qui augmente avec l âge, un résultat suggérant, en conformité avec certains principes de la psychologie de l enfant, un apprentissage progressif des normes sociales de coopération. Les étudiants en économie sont moins coopératifs que les autres! Les étudiants anglo-saxons coopèrent moins que les autres. Les traits de personnalité influencent le comportement face au jeu. Les autistes ne se comportent pas différemment des sujets «normaux», mais ont une perception très différente du jeu. La communication entre les joueurs renforce la coopération. La coopération est plus forte lorsque les sujets se connaissent et partagent un esprit de groupe. L introduction d un mécanisme de sanction peut renforcer la coopération, même si elle a parfois des effets pervers en introduisant une suspicion entre les joueurs qui peut inhiber certains comportements coopératifs. La pression sociale (pression par les pairs) est un mécanisme incitatif à la coopération particulièrement puissant.

Et maintenant, jouons! Le «concours de beauté» (John Maynard Keynes 1936 et Hervé Moulin 1986) Écrivez chacun un nombre entier entre 0 et 1000, en secret et sans communiquer entre vous Nous calculerons la moyenne m de vos réponses Le gagnant est celui dont la réponse s approchera le plus des ¾ de la moyenne m Le gagnant recevra un prix mirifique! À vous de jouer!

Merci de votre attention Et de votre participation! Présentation téléchargeable (avec d autres) sur ma page sur le site du LPT Toulouse

Quelques liens http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux_en_relations_i nternationales http://www.math.ens.fr/culturemath/materiaux/eber/prisonnier.htm http://fr.wikipedia.org/wiki/concours_de_beaut%c3%a9_de_keynes http://www.lpt.ups-tlse.fr/spip.php?article239 (avec notamment un texte de vulgarisation en français) http://fr.wikipedia.org/wiki/programme_d%27%c3%a9checs http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux_combinatoires