Théorie des Jeux Et ses Applications De la Guerre Froide au Poker Clément Sire Laboratoire de Physique Théorique CNRS & Université Paul Sabatier, Toulouse www.lpt.ups-tlse.fr
Quelques Définitions de la Théorie des Jeux Branche des mathématiques étudiant des modèles de conflit, coopération, prise de décisions «Ensemble d'outils pour analyser les situations dans lesquelles ce qu'il est optimal de faire pour un agent (personne physique, entreprise, animal, trader...) dépend des anticipations qu'il forme sur ce qu'un ou plusieurs autres agents vont faire» (Wikipédia).
Quelques Définitions de la Théorie des Jeux L'objectif de la théorie des jeux est de modéliser ces situations de choix, de déterminer une stratégie optimale (compétitive ou collaborative!) pour chacun des agents, de prédire l issue du jeu, et de trouver comment aboutir, à «l'équilibre», à une situation «optimale»
Un Peu d Histoire Antoine Augustin Cournot (1801-1877) publie en 1838 ses Recherches sur les principes mathématiques de la théorie des richesses Application à l économie Notion d équilibre d un jeu entre deux agents Première théorie de l offre et la demande Notions de monopole, d oligopole Implications philosophiques (déterminisme physique, liberté, hasard )
Un Peu d Histoire Émile Borel (1871-1956) publie en 1938 ses Applications aux jeux de hasard Théorème du MiniMax (jeux à somme nulle) Liens avec les «vrais» jeux (bridge, la «relance» ) Importance de la théorie des probabilités
Un Peu d Histoire John von Neumann (1903-1957) et Oskar Morgenstern (1902-1977) publient en 1944 leur Theory of games and economic behavior Résolution générale des jeux à somme nulle (théorème mathématique du point fixe) Exemples d applications à la décision économique et politique Quelques contributions de J. Von Neumann : Axiomatisation des mathématiques ; logique mathématique Axiomatisation de la mécanique quantique Théorie de l information Architecture des ordinateurs Manhattan project
Un Peu d Histoire John Nash (1928-) généralise ces travaux aux jeux à somme non nulle et inaugure (1994) la liste des théoriciens des jeux ayant obtenu le «Prix Nobel d économie» : T. Schelling et R. Baumann (2005), L. Hurwicz et al. (2007) Un homme d'exception (A beautiful mind 2001)
Quelques Concepts/Notions Clés Quantifier «objectivement» des questions a priori subjectives Rationalité (ou non!) des agents Coopération (coalition) ou compétition (antagonisme) Intérêt individuel vs collectif Information connue partielle ou complète ; mémoire Jeux simultanés, séquentiels, répétés, finis Jeux à somme nulle ou non nulle Équilibres de Nash (aucun agent n a intérêt à dévier unilatéralement de sa stratégie)
Quelques Domaines d Application Économie et finance Relations internationales Sciences politiques Organisation sociale Sociologie Biologie évolutive et comportementale Philosophie
L Apport du Physicien Expérience de la modélisation de phénomènes naturels (identification des ingrédients essentiels) Retours théorie/expérience (nécessité du caractère robuste et prédictif d un modèle) Recours systématique aux simulations numériques (design/test/solution du modèle) Éventail de techniques mathématiques issues de la physique statistique et non linéaire
La «Science» du Poker Émile Borel résout un jeu à deux joueurs (1938) : la «relance» Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une «main» aléatoire c A et c B 2[0,1] A commence A relance R$ si c A >r A A se couche si c A <r A B suit R$ si c B >r B La meilleure main gagne (R+1)$ B se couche si c B <r B A gagne 1$ B gagne 1$ Borel démontre la meilleure stratégie de A et B
La «Science» du Poker John von Neumann (1944) modifie les règles de la «relance» (plus proche du vrai poker) Les joueurs A et B mettent 1 $ au pot et reçoivent chacun une «main» aléatoire c A et c B 2[0,1] A relance de R$ B se couche si c B <r B A gagne 1$ A commence si c A >r A ou parfois si c A <s A B suit de R$ si c B >r B La meilleure main gagne (R+1)$ A «check» si s A <c A <r A La meilleure main gagne 1$ La meilleure A-stratégie implique de bluffer aléatoirement avec les mains très faibles
WSOP 2009: 57 tournois (200 6500 joueurs) Main event: 6494 joueurs; 10000$ buy-in ; prix du gagnant: 8.5 M$
Fraction de joueurs F(X) moins riches qu un joueur donné ayant X fois la fortune moyenne
Comparaison avec la distribution des salaires bruts de la population salariée française (2007) Le poker moins égalitaire pour X<2, plus pour X>2 1 F ( X) ~ X France 2.5
Rions un peu : les «équations du poker» Equation vérifiée par la dérivée de F( X) La durée d un tournoi de poker en fonction du nombre initial de joueurs
Modélisation des championnats de base-ball Système isolé ; absence de match nul ; aspects psychologiques mineurs ; grande base de données Fraction de victoires vs le rang final durant deux ères identifiées par le modèle (1900-1960 ; 1961-2012) Distribution du nombre de victoires répétées 1 2 n
Modélisation des championnats de football Nombre de points et fraction de victoires (domicile & extérieur) et de matchs nuls dans les ligues majeures européennes vs le rang final (UK et Allemagne)
Mouvements collectifs dans les bancs de poissons
Expériences du CRCA Toulouse (G. Theraulaz et al.) Ces expériences (1, 2, 5 30 poissons) permettent d identifier les règles individuelles de prise de décisions, les «forces élémentaires» (alignement attraction), et les paramètres microscopiques conduisant à la modélisation mathématique
Modèle validé expérimentalement Expériences vs simulations sur ordinateur du modèle Transition vers un banc ordonné quand on augmente la vitesse individuelle (et donc la force d alignement)
Mouvements collectifs de groupes humains a. Dispositif expérimental utilisé pour l'étude des déplacements collectifs de piétons. Un système de capture de mouvement en 3D permet de suivre les positions de chaque piéton. b. Lorsque deux groupes de piétons se déplacent en directions opposées, le trafic se structure en files distinctes après une vingtaine de secondes. Cette organisation collective est instable et peut disparaître quelques instants plus tard, puis réapparaître. c. Densité de piétons dans le couloir et vitesse radiale des piétons dans une expérience (haut) et une simulation numérique (bas) du modèle heuristique de déplacement de piétons (N=60 piétons). Le modèle montre que l'instabilité de la dynamique de ségrégation résulte de la variabilité des vitesses de marche.
Mouvements collectifs de groupes humains Modélisation du mouvement individuel (prises de décisions) et des interactions entre individus testée expérimentalement Formation spontanée de files et corrélations observées expérimentalement bien reproduites dans les simulations numériques Expérience Modèle
Un jeu «en or» (MiniMax) Les histoires possibles du jeu forment un arbre de 2n coups joués, avec un score final : S n 2{x k, k=1,,2 2n } ; x k nombres aléatoires entre 0 et 1 A veut maximiser le score S n et B veut le minimiser n 2 3 5 Sn max choix de A minchoix de B xk 0.382... n 2
Le «polymère joueur» Jeu en arbre (inspiré d un modèle de polymère en milieu désordonné) avec accumulation de scores locaux (les a i valent 0 ou 1 avec probabilité {1-p, p}) x k i chemin i A veut maximiser le score et B veut le minimiser (importance de la «profondeur d analyse») a
Et maintenant, jouons! Le «dilemme du prisonnier» Merrill Flood et Melvin Dresher 1950 Placez-vous par 2 et attribuez-vous chacun un nom (A n et B n, n=1, 2, 3, ) Vous et votre «ami» avez été arrêtés pour un crime et la police vous interroge séparément À chacun d entre vous, le même «marché» est proposé : Aucun de vous ne dénonce l autre : 1 an de prison ferme pour les deux L un des deux dénonce l autre : il repart libre (immunité) et l autre écope de 5 ans de prison Chacun dénonce l autre : les deux écopent de 3 ans fermes À vous de jouer (sans communiquer)! Dénoncez-vous votre «ami»? (oui/non)
De la théorie à l expérience Le dilemme du prisonnier a fait l objet d un très grand nombre d études expérimentales, tant en économie qu en psychologie sociale : Certaines études ont montré que les femmes coopèrent davantage que les hommes. Chez des enfants âgés de 6 à 11 ans, on a observé un taux de coopération (c està-dire un pourcentage de sujets optant pour la coopération) qui augmente avec l âge, un résultat suggérant, en conformité avec certains principes de la psychologie de l enfant, un apprentissage progressif des normes sociales de coopération. Les étudiants en économie sont moins coopératifs que les autres! Les étudiants anglo-saxons coopèrent moins que les autres. Les traits de personnalité influencent le comportement face au jeu. Les autistes ne se comportent pas différemment des sujets «normaux», mais ont une perception très différente du jeu. La communication entre les joueurs renforce la coopération. La coopération est plus forte lorsque les sujets se connaissent et partagent un esprit de groupe. L introduction d un mécanisme de sanction peut renforcer la coopération, même si elle a parfois des effets pervers en introduisant une suspicion entre les joueurs qui peut inhiber certains comportements coopératifs. La pression sociale (pression par les pairs) est un mécanisme incitatif à la coopération particulièrement puissant.
Et maintenant, jouons! Le «concours de beauté» John Maynard Keynes 1936, Alain Ledoux (Jeux & Stratégie) 1981, et Hervé Moulin 1986 Écrivez chacun un nombre entier entre 0 et 1000, en secret et sans communiquer entre vous Nous calculerons la moyenne m de vos réponses Le gagnant est celui dont la réponse s approchera le plus de la moitié de la moyenne m Le gagnant recevra un prix mirifique! À vous de jouer!
Merci de votre attention Et de votre participation! Présentation téléchargeable (avec d autres séminaires de vulgarisation) sur ma page sur le site du LPT Toulouse
Quelques liens http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux_en_relations_i nternationales http://www.math.ens.fr/culturemath/materiaux/eber/prisonnier.htm http://fr.wikipedia.org/wiki/concours_de_beaut%c3%a9_de_keynes http://www.lpt.ups-tlse.fr/spip.php?article239 (avec notamment un texte de vulgarisation en français) http://fr.wikipedia.org/wiki/programme_d%27%c3%a9checs http://fr.wikipedia.org/wiki/th%c3%a9orie_des_jeux_combinatoires