COURS 8 : INTRODUCTION A LA THEORIE DES JEUX

Dimension: px
Commencer à balayer dès la page:

Download "COURS 8 : INTRODUCTION A LA THEORIE DES JEUX"

Transcription

1 Université Pierre et Marie Curie Licence Informatique Cours LI Industrie Informatique et son Environnement Économique Responsable : Jean-Daniel Kant COURS 8 : INTRODUCTION A LA THEORIE DES JEUX 1 Jeux Le comportement des oligopoles montrent la forte interdépendance entre les firmes. Quand la marché est contrôlé par un petit nombre d entreprises, chaque firme analyse les comportements des autres et peaufine sa stratégie en partie en fonction de celles des autres. Ainsi, ces comportements interdépendants peuvent apparaître comme des jeux, où chaque firme jouerait un coup, puis recevrait la réponse d une autre en riposte, etc. C est pourquoi la théorie des jeux est souvent utilisée en économie pour modéliser les comportements oligopolistiques. Elle est aussi utilisée dans d autres domaines de l économie industrielle, en économie du travail, des échanges internationaux, etc. Elle est cependant plus normative que descriptive, car rien ne prouve que les acteurs raisonnent exactement comme la théorie des jeux le prescrit. C est plus une abstraction de comportement, une vision stylisée qu un véritable modèle. La théorie des jeux étudie des situations (les jeux) où des agents (les joueurs) ont à choisir des stratégies et obtiendront chacun un résultat (paiement, gain) qui dépendra des stratégies jouées par l ensemble des joueurs. Une stratégie peut se réduire à une décision élémentaire, mais peut aussi consister en un plan d action complexe, comme nous le verrons plus loin. Un jeu est non-coopératif lorsque les joueurs choisissent leurs stratégies à l insu les uns des autres. La théorie des jeux coopératifs étudie au contraire les avantages que peuvent tirer les joueurs de la possibilité de former entre eux des coalitions. 2 Jeux non-coopératifs 2.1 Jeux sous forme normale Un jeu est présenté sous forme normale (on dit encore sous forme stratégique) lorsqu il est défini par la donnée : d un ensemble de joueurs N = {1,.., i,.., n} ; pour chaque joueur i, d un ensemble de stratégies A i = {a i 1,.., ai l,.., ai m i } ; et d une fonction(vectorielle) de paiement : u = (u 1,..u i,..u n ) : n i=1 Ai R n 1

2 a = (a 1,..a i,..a n ) u(a) = (u 1 (a),.., u i (a),.., u n (a)), où u i (a) = u i (a 1,.., a i,.., a n ) est le paiement du joueur i (ce peut être aussi bien un gain monétaire qu un niveau d utilité) lorsque les joueurs jouent le profil de stratégies a, c- à-d, lorsque le joueur i joue la stratégie a i et les autres joueurs jouent les stratégies a j, j N \{i}. Notations : Il sera commode de noter i l ensemble N \{i}, d où a i = (a 1,.., a i 1, a i+1,..a n ), a = (a i, a i ), u i (a) = (u 1 (a),.., u i 1 (a), u i+1 (a),.., u n (a)), u(a) = (u i (a), u i (a)), A i = j i Aj, A = A i A i, etc. Cette définition peut être étendue à un nombre infini de joueurs ou de stratégies. Dans le cas de deux joueurs (n = 2), on peut représenter un tel jeu à l aide de la matrice du jeu, dont les lignes et colonnes sont respectivement identifiées aux stratégies de chacun des joueurs et l élément de ligne a 1 et colonne a 2 est le couple (u 1 (a 1, a 2 ), u 2 (a 1, a 2 )). Ainsi le jeu est décrit par la matrice U de terme U ij = u i (a j ). N.B. Dans un jeu sous forme normale on suppose toujours que les deux joueurs connaissent la matrice U du jeu. Exemples La bataille du couple Kevin et Kevina doivent aller au spectacle ce soir et acheter leur billet à l avance, chacun séparément ; ils n ont pas la possibilité de communiquer ; ils n aiment l une que les chanteuses américaines décolorées, l autre que le football ; enfin, leur soirée à tous deux sera gâchée s ils ne sont pas ensemble. Kevina \ Kevin concert f oot concert 2, 1 1, 1 foot 1, 1 1, 2 Peut-on dire ce que doivent faire, prédire ce que vont faire, Kevin et Kevina? S ils sont rationnels, chacun a intérêt à choisir sa préférence, car il vaut mieux gagner 2 ou perdre -1, que gagner 1 ou perdre -1. Mais dans ce cas, ils vont perdre à coup sûr. Il vaudrait mieux jouer (concert,concert) ou (foot,foot). Mais cela ne donnera des gains que s ils jouent le même. La bataille du couple est difficile à résoudre! Le dilemme du prisonnier P ris. I \ P ris. II nier avouer nier 3, 3 10, 1 avouer 1, 10 6, 6 Ce jeu tire son nom de l interprétation suivante : deux criminels présumés sont interrogés séparément par la police ; s ils nient tous les deux ils seront condamnés à une faible peine (3 ans) et s ils avouent tous les deux ils seront condamnés à une peine plus forte (6 ans) ; si l un 2

3 des deux avoue tandis que l autre nie, le premier n aura qu une peine de principe (1 an) alors que le second aura la peine maximale (10 ans). La matrice ci-dessus représente donc des pertes (gains négatifs). Que vont faire, que doivent faire, les deux prisonniers? Quel que soit l action de l autre, chacun a intérêt à avouer, car les gains seront toujours meilleurs (peines moindres) que nier. Cependant si on change maintenant la matrice des gains : P ris. I \ P ris. II nier avouer nier 3, 3 10, 30 avouer 30, 10 30, 30 Il vaut alors mieux nier, vu qu avouer entraîne la peine maximale à chaque fois. 2.2 Analyse d un jeu sous forme normale Considérations de dominance Dominances La stratégie a i du joueur i domine faiblement sa stratégie b i lorsque : u i (a i, a i ) u i (b i, a i ), a i A i ; (quelque soient les stratégies a i des autres joueurs, la stratégie a i est meilleure ou égale que b i.) elle la domine si elle la domine faiblement et que, de plus : c i A i t.q. u i (a i, c i ) > u i (b i, c i ) ; (il y a au moins un cas, i.e. une réponse des autres joueurs, pour lequel a i est meilleure que b i ) enfin, a i domine strictement b i lorsque : u i (a i, a i ) > u i (b i, a i ), a i A i. (quelque soient les stratégies a i des autres joueurs, la stratégie a i est meilleure strictement que b i.) La stratégie a i est dite faiblement dominante (resp. dominante, resp. strictement dominante) si elle domine faiblement (resp. domine, resp. domine strictement) tous les b i A i \{a i }. Equilibre en stratégies strictement dominantes On peut penser qu un joueur rationnel ne choisira jamais une stratégie s il dispose d une autre stratégie lui assurant un gain supérieur quel que soit le comportement des autres joueurs. Si chaque joueur a une stratégie strictement dominante, il doit donc la jouer et le jeu est résolu. On dit alors qu il existe un équilibre en stratégies strictement dominantes. C est le cas pour (avouer, avouer) dans le premier dilemme du prisonnier ci-dessus. Remarquons que les joueurs obtiendraient tous deux plus qu à cet équilibre en jouant (nier, nier) ; il n est donc pas efficace du point de vue de la rationalité collective, qui se caractérise par l optimalité au sens de Pareto. 3

4 Optimum de Pareto Une suite de stratégies a = (a 1,..a i,..a n ) est un optimum de Pareto lorsqu aucun des joueurs ne peut obtenir un paiement plus élevé sans que le paiement d un des autres diminue : [ u i (a i, a i ) u i (a i, a i ), i ] = [ u i (a i, a i ) = u i (a i, a i ), i ]. L optimum de Pareto exprime bien l idée que collectivement on ne peut pas améliorer la situation. Souvent il fournit une solution plus efficace que quand chaque joueur raisonne individuellement. Equilibre itératif en stratégies strictement dominantes Quand il n en existe pas, le jeu peut souvent être simplifié par un processus itératif où chaque joueur, tablant sur la rationalité de ses adversaires, écarte les stratégies apparues comme dominées à cette étape de son raisonnement. Exemple Matrice du jeu : H M B G C D (2, 5) (4, 8) (1, 3) (1, 4) (2, 5) (3, 6) (3, 7) (5, 8) (2, 9) Il n existe pas d équilibre en stratégies strictement dominantes car aucune ligne ne donne strictement plus, composante par composante, que toutes les autres lignes (il n existe d ailleurs pas non plus de colonne dominant strictement toutes les autres colonnes). Dans la recherche d un équilibre itéré en stratégies strictement dominantes, on élimine successivement : G strictement dominé par C M B C D (2, 5) (3, 6) (5, 8) (2, 9) H M B C D (4, 8) (1, 3) (2, 5) (3, 6) (5, 8) (2, 9) ; C strictement dominé par D ; H strictement dominé par B M B D (3, 6) (2, 9) ; B strictement dominé par M strictement dominées cherché. D M (3, 6). (M, D) est l équilibre itéré en stratégies 4

5 Equilibre et équilibre itératif en stratégies dominantes On peut penser qu un joueur rationnel ne devrait jamais jouer non plus une stratégie s il en existe une autre assurant un gain supérieur ou égal quoi qu il arrive et strictement supérieur pour certaines stratégies des autres joueurs. Ici encore si chaque joueur a une stratégie dominante (il ne peut en avoir plus d une), il doit la jouer. On dit alors qu il existe un équilibre en stratégies dominantes. En revanche, le concept d équilibre itératif en stratégies dominantes pose des problèmes. En effet, contrairement au cas de la dominance stricte, selon l ordre d élimination de stratégies dominées adopté, on peut aboutir à des résultats différents Equilibre de NASH Lorsque, comme dans la bataille du couple, il n existe pas d équilibre, même itératif, en stratégies strictement dominantes, il faut examiner l intérêt présenté pour les joueurs par des stratégies aux propriétés plus faibles : Meilleure réponse La stratégie a i du joueur i est une meilleure réponse à des stratégies données b i A i des autres joueurs lorsque : u i (a i, b i ) u i (a i, b i ), a i A i. Equilibre de NASH Un profil de stratégies a = (a 1,..a i,..a n ) est un équilibre de Nash lorsque chacune de ses composantes constitue une meilleure réponse aux autres : u i (a i, a i ) u i (a i, a i ), a i A i, i = 1,.., n. Un équilibre de Nash est donc un profil de stratégies (c est-à-dire la donnée d une stratégie d équilibre pour chaque joueur) dans laquelle chaque stratégie est une meilleure réponse à toute autre stratégie jouée. Un équilibre de Nash a la propriété de stabilité suivante : si, pour une raison quelconque, un des joueurs pense que tous ses adversaires vont jouer leurs stratégies d équilibre, alors il n a aucune incitation à jouer lui-même autre chose que sa stratégie d équilibre. Par exemple, les joueurs peuvent parfois se mettre d accord avant le jeu pour jouer un équilibre ; une trahison reste toujours possible ; cependant chacun a intérêt à respecter cet accord si les autres le respectent aussi. La multiplicité des équilibres de Nash peut poser des problèmes. Dans la bataille du couple, il y a deux équilibres de Nash (concert, concert) et (foot, foot) ; sans entente préalable, Kevina peut vouloir jouer l un et Kevin l autre, avec pour résultat les paiements ( 1, 1) ; les jeux où se rencontre cette difficulté sont appelés jeux de coordination. Enfin, un équilibre de Nash n est pas forcément souhaitable. Dans le premier dilemme du prisonnier ci-dessus (avouer, avouer) étant un équilibre en stratégies (strictement) dominantes est aussi équilibre de Nash ; comme nous l avons remarqué, (nier, nier) est strictement meilleur pour chacun des deux joueurs ; un équilibre de Nash n est donc pas en général Pareto-optimal. 5

6 On voit facilement qu un équilibre itératif en stratégies strictement dominées et même en stratégies dominées est nécessairement un équilibre de Nash. L inverse n est pas vrai et le processus itératif d élimination de stratégies dominées peut écarter un équilibre de Nash attractif comme dans l exemple suivant. Exemple J. I \ J. II G D H 10, 0 5, 2 B 10, 11 2, 0 Si le joueur II pense que le joueur I éliminera la stratégie B, dominée (mais pas strictement) par H, il jouera D et l issue du jeu sera (5, 2) ; (H, D) est bien un équilibre de Nash, mais un deuxième équilibre, (B, G), qui domine strictement (H, D) au sens de Pareto a été éliminé! L étude d un jeu sous sa forme extensive, qui contient en général plus d information sur le jeu, permettra d identifier les équilibres de Nash qui sont crédibles, c-à-d susceptibles d être joués par des joueurs rationnels. 3 Jeux sous forme extensive Certaines situations où les agents prennent des décisions à tour de rôle peuvent être décrites commodément à l aide d un arbre de jeu (en fait, une arborescence) : 3.1 Exemple : attaque publicitaire Deux entreprises E 1 et E 2 sont en duopole sur un produit et font des bénéfices respectifs (1, 5) ; E 1 peut ou non lancer une campagne publicitaire (coûteuse) pour agrandir sa part de marché, ce qui réussira si E 2 ne réagit pas et les amènera alors à (2, 3) ; en revanche, si E 2 réagit en lançant sa propre campagne, les bénéfices deviendront (0, 2). L arbre que l on associe à ce jeu est le suivant : Figure 1 arbre du jeu 6

7 Chacun des joueurs a deux stratégies, pub et statu quo, mais celles de E 2 n ont d influence sur le déroulement et l issue du jeu que si E 1 a choisi la stratégie pub. Le jeu a pour forme normale : E 1 \ E 2 pub statu quo pub 0, 2 2, 3 statu quo 1, 5 1, 5 Il y a deux équilibres de Nash, (pub, statu quo) et (statu quo, pub) ; seule l analyse de la forme extensive nous assure que le second ne sera pas joué : si E 1 choisit pub, E 2 jouera statu quo qui lui rapporte alors à coup sûr plus que pub ; le prévoyant, E 1 doit préférer pub à statu quo. (On peut arriver à la même conclusion sur la forme normale en raisonnant que E 2 ne jouera pas pub, dominée par statu quo, mais cette dominance n étant pas stricte, la conclusion resterait douteuse). 3.2 Information Le jeu de l exemple ci-dessus est un jeu à information parfaite, c.-à-d. qu à l instant de prendre une décision les joueurs connaissent toutes les décisions passées (les leurs et celles des autres joueurs) et, de plus, s il y a de l incertitude, tous les joueurs ont les mêmes informations. On parlera au contraire, de jeu à information imparfaite lorsque certains des joueurs ne savent pas toujours exactement à quel sommet de l arbre de décision ils se trouvent (par exemple quand l un d eux ne saura pas exactement ce que vient de jouer l un de ses adversaires). L information (imparfaite) est symétrique lorsque chaque joueur en sait au moins autant que les autres au moment où il joue ; elle est dite asymétrique sinon. L information est dite incomplète lorsque certains joueurs ne savent pas exactement quels sont les paiements de la matrice de jeu (ils ne savent pas à quel jeu ils jouent). Le jeu de l Attaque publicitaire est un jeu à information parfaite. Les jeux d échec, de dames et de Go aussi. Si dans l un de ces jeux on fait précéder la partie d un coup de la nature - tirage à P ile ouf ace - pour savoir qui aura les Blancs (les Noirs au Go) et commencera la partie, le jeu complété reste à information parfaite. Le poker, dans toutes ses variantes, est un jeu en environnement incertain (la répartition des cartes est aléatoire) à information imparfaite. Voyons un exemple avec environnement certain. Dans le Bonneteau, le Manipulateur place une bille sous l une de 3 coupes renversées : la G(auche), celle du C(entre) ou la D(roite) ; le Gogo mise m e, choisit une des coupes (g(auche),c(entre) ou d(roite)) et gagne M e s il a désigné celle qui cache la bille. Sur l arbre de décision (Fig. 2) on a indiqué l ensemble d information du Gogo au moment de jouer ( ellipse en pointillés) : il ne sait pas où se trouve la bille, donc est incapable de distinguer les 3 sommets où il peut avoir à jouer. Le dilemme du prisonnier Dans ce jeu, les deux joueurs jouent simultanément ; on peut pourtant le représenter sous forme extensive en plaçant dans l arbre du jeu l action de l un avant celle de l autre ; ce dernier ne connaissant pas le choix de l autre ne sait où il se trouve dans l arbre : c est un jeu à information imparfaite. 7

8 Figure 2 arbre du jeu du Bonneteau 3.3 Stratégies Stratégies pures Une stratégie du joueur i (que nous appellerons plus tard stratégie pure quand nous introduirons les stratégies mixtes) est une règle sélectionnant une action parmi les actions réalisables en chacun des sommets de décision qui lui sont associés. Dans les jeux à information imparfaite, un joueur ne sachant pas distinguer deux sommets appartenant au même ensemble d information, une stratégie doit vérifier la condition suivante : sélectionner la même action à tous les sommets d un même ensemble d information. N.B. Cette condition n apporte aucune restriction dans les jeux à information parfaite puisque tous les ensembles d information y sont des singletons. Un profil de stratégies est une suite a = (a 1,.., a i,..a n ), c-à-d consiste en la donnée d une stratégie a i pour chaque joueur i. Dans un jeu en environnement certain, un profil de stratégies a détermine complètement le déroulement du jeu ; il sélectionne un chemin de la racine vers l une des feuilles f, que l on appelle la trajectoire du jeu. Les paiements sont alors eux-même déterminés et valent : U(a) = (U 1 (a),.., U i (a),.., U n (a)) = u(f) = (u 1 (f),.., u i (f),.., u n (f)). Dans un jeu en environnement incertain, le déroulement du jeu dépend conjointement des stratégies des joueurs et des événement réalisés ; la trajectoire est alors aléatoire ; à profil de 8

9 stratégies a donné, chaque feuille f est atteinte avec une probabilité P (f) (déterminée par la loi de probabilité des divers événements) ; a donne donc au joueur i une espérance d utilité U i (a) = f P (f) ui (f). La donnée d un jeu sous forme extensive permet donc d obtenir sa forme normale. On a le résultat suivant : Theorem 3.1 (Kuhn). Tout jeu fini à n personnes, sous forme extensive, à information parfaite a une solution qui est un équilibre de Nash en stratégies pures. 3.4 Stratégies mixtes Une stratégie mixte en théorie des jeux est une stratégie où le joueur choisit au hasard le coup qu il joue parmi les coups possibles. Cela revient à attribuer une certaine distribution de probabilité sur l ensemble des stratégies pures du jeu. Dans certains jeux, seules les stratégies mixtes sont optimales. Exemple : McDonald s vs. Quick Prenons l exemple de l affrontement entre les 2 géants du fast food, McDonald s et Quick, et modélisons le avec la matrice de jeu suivante : MD \ QK prix bas (LP) publicité forte (HA) prix bas (LP) 60, 35 55, 45 publicité forte (HA) 55, 50 60, 40 Ce jeu n admet pas d équilibre de Nash en stratégie pure. Par exemple si MD = LP, QK = HA, alors MD va essayer HA mais du coup QK, à partir de (HA, HA), préfère jouer LP. En (HA, LP ), MD préfère LP et alors QK joue HA : nous voilà revenus à la case départ. En stratégie mixte, on introduit les probabilités p LM que Mc Do joue prix bas et p LQK que Quick joue prix bas. Pour Mc Do, il faut maximiser le profit espéré : E MD = p LM (60.p LQK + 55.(1 p LQK )) + (1 p LM )(55.p LQK + 60.(1 p LQK )) = 10.p LM.p LQK 5.p LM 5.p LQK + 60 Pour maximiser il faut : E MD p LM = E MD p LQK = 0 p LM = p LQK = 0, 5 Pour Quick, il faut maximiser le profit espéré : E QK = p LQK (35.p LM + 50.(1 p LM )) + (1 p LQK )(45.p LM + 40.(1 p LM )) = 20.p LM.p LQK + 10.p LQK + 5.p LM + 60 Pour maximiser il faut : E QK p LM = E QK p QK = 0 p LQK = 0, 5 ; p LM = 0, 25 9

10 La stratégie optimale pour les 2 entreprises est donc de jouer chaque stratégie avec une probabilité de 50%. Ce jeu mixte n est pas représentable sous forme extensive, car, chaque joueur y ayant une infinité de stratégies, ce n est plus un jeu fini (or un graphe est fini). On continue donc à raisonner sur l arbre du jeu initial, de même que, sous forme normale, on continue à utiliser la matrice du jeu initial. Nash a démontré que : Theorem 3.2 (Nash). Tout jeu fini à n personnes sous forme normale a un équilibre [de Nash] en stratégies mixtes. 4 Jeux répétés 4.1 Introduction Reprenons l exemple du dilemme du prisonnier (ici on représente des gains positifs) : P ris. I \ P ris. II nier avouer nier 1, 1 1, 2 avouer 2, 1 0, 0 L analyse de ce jeu nous a conduit à une conclusion peu satisfaisante : Si les joueurs sont rationnels, chacun doit éliminer la stratégie nier qui est strictement dominée ; la solution du jeu est donc (avouer, avouer) ; c est nécessairement un équilibre de Nash et c est en fait le seul. Or cette solution est dominée au sens de Pareto par le profil (nier, nier), plus avantageux pour chacun des joueurs. Il y a donc conflit entre la rationalité individuelle et la rationalité collective. Quand pourrait-on observer de la coopération de la part des joueurs? Une hypothèse possible est que dans la réalité les agents n ont pas affaire à une situation de jeu isolée, mais à une succession de jeux, sinon identiques du moins de structures semblables, et que la stratégie choisie dans l un d eux n est qu une composante de leur stratégie globale dans le super-jeu constitué de l ensemble de leurs jeux. Nous allons examiner cette hypothèse. 4.2 Etude du dilemme du prisonnier répété Comportement rationnel dans le dilemme du prisonnier répété un nombre fini de fois N.B. On écrira A et N pour les stratégies avouer et nier du jeu élémentaire. Deux joueurs jouent le super-jeu consistant à jouer T fois au dilemme du prisonnier, à des dates t = 1, 2,, t,, T. Les gains des différentes parties s additionnent pour constituer les paiements du super-jeu. Ce super-jeu est un jeu fini à information imparfaite (comme d ailleurs le jeu élémentaire) puisqu à chaque date t les deux joueurs jouent à l insu l un de l autre. A la date t, chaque joueur sait ce que son adversaire et lui-même ont joué aux (t 1) premières parties et il peut en faire dépendre son action à cette date. Une stratégie S de l un des 10

11 joueurs dans le super-jeu est donc caractérisable par une suite S = (S 1,, S t,, S T ) dont les composantes, toutes à valeurs dans {A, N}, sont déterminées récursivement par la donnée de S 1 et de fonctions φ t, t = 2,, T, par S t = φ t (S 1, R 1,, S t 1, R t 1 ) où R 1,, R t 1 sont les actions de l autre joueur qu il aura déjà observées à t. Il y a donc un très grand nombre de stratégies (pures) possibles pour chacun des joueurs. Montrons qu une stratégie optimale pour chacun des joueurs est d avouer à chaque étape, stratégie que nous noterons A rep. A la date T, quel qu ait été le déroulement du jeu jusque là et le total des gains de chacun, il reste à jouer un jeu élémentaire ayant sous forme normale la matrice de gains totaux finaux P ris. I \ P ris. II nier avouer nier m I + 1, m II + 1 m I 1, m II + 2 avouer m I + 2, m II 1 m I, m II où les sommes m I et m II dépendent du sommet atteint après (T 1) étapes. Quelles que soient ces sommes, jouer A est strictement dominant pour chacun des deux joueurs : tous deux prévoient donc que l autre jouera A à T. Mais alors, à (T 1), au moment de jouer dans le jeu élémentaire à cette date, chacun doit seulement comparer les paiements dans le sous-jeu formé de deux jeux élémentaires les sous-stratégies A suivi de A et N suivi de A ; la matrice des gains finaux étant du type précédent (avec pour m I et m II les sommes acquises après T 2 étapes), les deux joueurs prévoient que l autre jouera A à (T 1) comme à T. Par récurrence, on montrerait que tous les deux doivent jouer A rep. Le couple (A rep, A rep ) est clairement Pareto-dominé par de nombreuses autres couples de stratégies du super-jeu, comme par exemple (N rep, N rep ). On reste donc devant la même incohérence entre rationalité individuelle et collective que dans le jeu élémentaire! Introduction de présupposés de comportement dans le dilemme du prisonnier répété un nombre fini de fois Un joueur peut être rationnel et pourtant avoir un comportement coopératif, s il prend en compte d autres éléments que la simple description du jeu, par exemple s il a des idées a priori sur le comportement l autre joueur. Nous prendrons l exemple suivant : on appelle Tit for Tat ( oeil pour oeil, dent pour dent ) la stratégie suivante : Jouer N (nier) à t = 1, puis, à tout t > 1, jouer ce que l autre a joué à (t 1). Supposons que le joueur I pense que son adversaire peut avec une probabilité ɛ jouer la stratégie Tit for Tat au lieu de la stratégie rationnelle non-coopérative A rep. Si I joue lui-même A rep, avec probabilité ɛ, II jouant Tit for Tat, I gagnera 2 la première fois puis plus rien et avec probabilité (1 ɛ), II jouant A rep, les paiements (de I comme de II) seront toujours nuls ; d où un gain espéré égal à 2ɛ. Si maintenant I joue lui-même Tit for Tat, avec probabilité ɛ, II jouant lui-même Tit for Tat avec probabilité ɛ, I réalisera T fois un gain de 1. Avec probabilité (1 ɛ), II jouant A rep, et donc I perdra 1 à t = 1, puis tous les paiements seront nuls. D où un gain espéré égal à ɛ.t + (1 ɛ)( 1) = ɛ (T + 1) 1. 11

12 Tit for Tat est donc préférable pour lui à la stratégie rationnelle A rep dès que ɛ (T + 1) 1 > 2ɛ ɛ > 1 T 1. Cela dit, Tit for Tat n est pourtant pas sa stratégie optimale car, par exemple, il a toujours intérêt à jouer A à la dernière période) Comportement dans le dilemme du prisonnier répété une infinité de fois On peut aussi penser qu il y a un effet d horizon dans le jeu répété un nombre fini de fois, dû au fait que l on sait que tout s arrête à la date T ; un tel effet est irréaliste, puisque dans le monde réel il y a presque toujours de l incertitude sur la date de fin des relations marchandes ou autres des agents. Pour se débarrasser de l horizon, on peut étudier le super-jeu formé par le jeu simple répété une infinité de fois. Pour que le paiement global ne risque pas de devenir infini, on introduit un taux d escompte (= taux d actualisation ou taux d intérêt) ρ > 0, d où un facteur d escompte δ = 1 1+ρ < 1. Le paiement global est alors la somme actualisée, à t = 1 par exemple, des paiements g t à t : G = t=1 δt 1 g t. On montre alors qu une coopération parfaite, les deux joueurs jouant constammentn (nier), peut apparaitre ; elle pourrait être induite par le choix par chacun de la stratégie coopérative à déclenchement Σ : Jouer N tant que l autre le joue aussi ; jouer A à tout jamais dès que l autre a joué une fois A. Le résultat précis est le suivant : Le couple de stratégies coopératives à déclenchement (Σ, Σ) constitue un équilibre de Nash parfait du jeu répété une infinité de fois, à condition que δ soit suffisamment proche de 1. Démonstration : (Σ, Σ) assure à chacun des deux joueurs un gain de 1 à chaque date t. Supposons que le joueur II pense que I joue la stratégie Σ mais choisit lui-même une stratégie différente de Σ, qui le fait jouer A pour la première fois à une date t 0, lui donnant un gain de 2 ; il sait que I jouera alors A à toutes les dates suivantes t > t 0 et que quoiqu il fasse lui-même, il n aura plus que des paiements 0, d où une somme de ses gains à partir de t 0 (actualisée à t 0 ) G 2 à comparer avec celle que lui assurerait Σ, G = 1 + δ + + δ t + = 1 1 δ aucun intérêt à devier de Σ si 1 1 δ 2, c-à-d si δ 1 2. ; il n a donc Ce résultat pourrait être considéré comme une validation normative de la coopération dans le dilemme du prisonnier s il existe pas d autres équilibres parfaits dans le super-jeu ; malheureusement, il en existe de nombreux autres. Simulation du Tit-for-Tat 1 Robert Axelrod, dans son ouvrage The Evolution of Cooperation (1984), cherche à répondre à la question suivante : Under what conditions will cooperation emerge in a world of egoists without central authority? Pour tester la stabilité de cet équilibre, R. Axelrod demande à des collègues, qui ont étudié le dilemme du prisonnier dans leurs différentes disciplines (psychologie, biologie, économie, physique, mathématique, science politique, sociologie etc.), de proposer un programme, qu ils estiment susceptible de remporter le plus de points, pour jouer à un jeu du dilemme du prisonnier répété 200 fois. Chaque programme contient la stratégie d un joueur. Le jeu s apparente à un tournoi dans lequel chaque stratégie est confrontée à tous les autres, à lui-même et à un programme aléatoire jouant au hasard. Le programme vainqueur est celui totalisant le plus de points. Le premier tournoi impliquant 14 programmes donna le programme gagnantgagnant ou Tit for Tat d Anatol Rapoport vainqueur. R. Axelrod décide de renouveler 1. D après Wikipedia, http ://fr.wikipedia.org/wiki/théorie des jeux en relations internationales. 12

13 l expérience avec 62 programmes et de nouveau le programme gagnant-gagnant d A.Rapoport l emporte. Or la stratégie gagnant-gagnant ou Tit for Tat d A. Rapoport n emporte aucun match du tournoi! R. Axelrod (1984) (1) en déduit, que [le dilemme du prisonnier] est simplement une formulation abstraite de quelques situations très courantes et intéressantes dans lesquelles ce qui est le meilleur pour une personne individuellement conduit à une situation d échec mutuel tandis que chacune pourrait mieux s en tirer avec une coopération mutuelle. L interprétation de ces résultats qui impliquent la supériorité du comportement coopératif dans un environnement de dilemmes du prisonnier répétés a été sujette à de nombreuses discussions. Selon Eber (2004), les résultats d Axelrod montrent que, dans un monde de conflits permanents, il serait optimal de se comporter de la façon suivante : être a priori coopératif avec les autres (jouer [la stratégie de coopération (C)] lors du premier dilemme du prisonnier auquel on se trouve confronté), punir son partenaire lorsqu il n a pas coopéré (jouer [la stratégie de noncoopération (D)] chaque fois que le joueur à jouer D au tour précédent) pardonner et revenir à la coopération lorsque le partenaire se remet à coopérer (jouer C à chaque fois qu il a joué C le coup précédent). Cette philosophie politique, certes plaisante, est très débattue. Les conclusions auxquelles Axelrod aboutit sont en particulier liées à la simplification du modèle comparé à la situation réelle analysée. Référence : Milgrom P. R. (1984), Book review : Axelrod s The Evolution of Cooperation The Evolution of Cooperation. R. Axelrod Review author[s] : Paul R. Milgrom, The RAND Journal of Economics, Vol. 15, No. 2. (Summer, 1984), pp Applications Les champs d application de la Théorie des Jeux sont très variés par exemples : Défense, Relations Internationales la crise des missiles de Cuba en octobre 1962 : On peut la représenter par le jeu suivant : Kennedy \ Kroutchev retrait maintenir blocus naval Compromis (3, 3) V ictoire U RSS (2, 4) raid aérien V ictoire US (4, 2) Guerre Nucléaire ( 3, 3) A priori, personne ne veut la pire situation, mais il s agit de ne pas perdre la face. Cela s apparente à ce que les américains ont appelé le game of chicken, un jeu très à la mode dans les années 1950 (voir le film La fureur de vivre). Deux automobilistes roulent en sens inverse dans une rue étroite, le perdant qualifié de poule mouillée est celui qui donne un coup de volant pour éviter son concurrent. Ce jeu représente bien des situations de crise dans le domaine des relations internationales. Analyse par Steven Brams 2 : Needless to say, the strategy choices, probable outcomes, and associated payoffs shown in Figure 1 provide only a skeletal picture of the crisis as it developed over a period of thirteen days. Both sides considered more than the two alternatives listed, as well as several variations on each. The Soviets, for example, demanded withdrawal of American missiles from Turkey as a quid pro quo for withdrawal of their own missiles from Cuba, a demand publicly ignored by the United States. 2. http ://plus.maths.org/content/game-theory-and-cuban-missile-crisis 13

14 Nevertheless, most observers of this crisis believe that the two superpowers were on a collision course, which is actually the title of one book describing this nuclear confrontation. They also agree that neither side was eager to take any irreversible step, such as one of the drivers in Chicken might do by defiantly ripping off the steering wheel in full view of the other driver, thereby foreclosing the option of swerving. Although in one sense the United States won by getting the Soviets to withdraw their missiles, Premier Nikita Khrushchev of the Soviet Union at the same time extracted from President Kennedy a promise not to invade Cuba, which seems to indicate that the eventual outcome was a compromise of sorts. But this is not game theory s prediction for Chicken, because the strategies associated with compromise do not constitute a Nash equilibrium. les politiques de constitution de convois de bateaux en temps de guerre ; la façon de gérer un coup de surprise politique (Nasser à Suez, de Gaulle au Québec, Eltsine lors du putsch, annonces électorales...) ou marketing ; la lutte contre le terrorisme. Sociologie et génétique : des chercheurs ont utilisé la stratégie des jeux pour mieux comprendre l évolution du comportement des espèces face à la modification de leur environnement Marketing et stratégie entreprise Economie ; notamment les travaux de Jean Tirole en économie industrielle Les résultats peuvent être appliqués à des divertissements (comme le jeu télévisé Friend or Foe 3 sur une chaîne câblée spécialisée aux États-Unis, Game Show Network). Le Professeur Thomas Schelling, prix Nobel d économie 2005, s est spécialisé dans l explication des diverses stratégies utilisées (à utiliser) dans les conflits internationaux, tels la guerre froide et la guerre nucléaire (dissuasion..) Albert W. Tucker a par exemple diffusé de nombreuses interprétations du dilemme du prisonnier dans la vie courante. Des biologistes ont utilisé la théorie des jeux pour comprendre et prévoir les résultats de l évolution, en particulier la notion d équilibre évolutivement stable introduit par John Maynard Smith dans son essais La théorie des jeux et l évolution de la lutte (Game Theory and the Evolution of Fighting). Voir aussi son livre Evolution and the Theory of Games. Dans le domaine de la science politique appliquée à l environnement, on peut citer la tragédie des communs 4. Il faut noter cependant des critiques fortes adressées aux partisans de la théorie des jeux, parmi lesquels on peut citer celle de Bernard Guerrien objectant que les visions très abstraites de la théorie des jeux ont du mal à représenter adéquatement le réel, qu on ne sait pas s il y a des équilibres de Nash dans la Nature, ni si cette notion même d équilibre de Nash est la prédiction issue de la théories des jeux, le résultat du comportement rationnel des joueurs ou la solution du jeu (Cf. B. Guerrien, Can we espect anything from Game Theory, in E. Fullbrook (ed.), A Guide to What s wrong with Economics, Anthem Press, 2004,pp Le débat est loin d être clos. 3. http ://en.wikipedia.org/wiki/friend or Foe%3F 4. G. Hardin, The tragedy of the Commons, Science,

Simulation centrée individus

Simulation centrée individus Simulation centrée individus Théorie des jeux Bruno BEAUFILS Université de Lille Année 4/5 Ce document est mis à disposition selon les termes de la Licence Creative Commons Attribution - Partage dans les

Plus en détail

Jeux sous forme extensive (Jeux dynamiques)

Jeux sous forme extensive (Jeux dynamiques) (Jeux dynamiques) Plan du chapitre ( juillet 008) / éfinitions, exemples et équivalences Arbres de jeux, information et mémoire tratégies et réduction en forme normale Équilibre de Nash parfait en sous-jeux

Plus en détail

Jeux sous forme normale

Jeux sous forme normale CHAPITRE 4 Jeux sous forme normale Dans les problèmes de décision, nous avons relié les choix qui pouvaient être faits par un agent avec les utilités qu il pouvait en dériver. L idée qu un agent rationnel

Plus en détail

THEORIE DES JEUX : Introduction. Fabien Prieur (UM1, INRA) Premier semestre L3, 5 septembre 2013

THEORIE DES JEUX : Introduction. Fabien Prieur (UM1, INRA) Premier semestre L3, 5 septembre 2013 THEORIE DES JEUX : Introduction Premier semestre L3, 5 septembre 2013 Propos liminaires Organisation du cours 20h de CM + 15h de TD CM : Séances de 2 heures le mercredi Evaluation (pondération) : Un contrôle

Plus en détail

Economie de l Incertain et des Incitations

Economie de l Incertain et des Incitations Economie de l Incertain et des Incitations CHAPITRE 2 Eléments de théorie des jeux en information symétrique et asymétrique Equilibres Bayesiens - Université de Tours - M1 AGE - Arnold Chassagnon - Automne

Plus en détail

Introduction à la Théorie des Jeux p.1/77

Introduction à la Théorie des Jeux p.1/77 Introduction à la Théorie des Jeux Sébastien Konieczny konieczny@cril.univ-artois.fr CRIL-CNRS Université d Artois - Lens Introduction à la Théorie des Jeux p.1/77 Théorie des Jeux Définition La théorie

Plus en détail

La théorie des jeux. Les jeux séquentiels. Les jeux simultanés. Les jeux répétés. Simon Porcher 1

La théorie des jeux. Les jeux séquentiels. Les jeux simultanés. Les jeux répétés. Simon Porcher 1 La théorie des jeux Les jeux séquentiels Les jeux simultanés Les jeux répétés 1 La théorie des jeux Les jeux séquentiels Les jeux simultanés Les jeux répétés 2 Les jeux séquentiels Théorie des jeux Opposition

Plus en détail

A quoi sert la théorie des jeux? Introduction à la Théorie des Jeux p.4/75. Un peu d histoire... Théorie des Jeux

A quoi sert la théorie des jeux? Introduction à la Théorie des Jeux p.4/75. Un peu d histoire... Théorie des Jeux A quoi sert la théorie des jeux? Introduction à la Théorie des Jeux Sébastien Konieczny konieczny@cril.univ-artois.fr CRIL-CNRS Université d Artois - Lens Jeux de société (échecs, dames, go,...), Jeux

Plus en détail

5) Extension : Équilibre de Cournot Nash en information incomplète. . 2 T y 2 2 ) B. > (a 2 ) H. k y

5) Extension : Équilibre de Cournot Nash en information incomplète. . 2 T y 2 2 ) B. > (a 2 ) H. k y 5) Extension : Équilibre de Cournot Nash en information incomplète Supposons désormais que la firme 2 connaît avec perfection la fonction de coût de la firme, mais que celle - ci en revanche est imparfaitement

Plus en détail

Théorie des Jeux Et ses Applications

Théorie des Jeux Et ses Applications Théorie des Jeux Et ses Applications De la Guerre Froide au Poker Clément Sire Laboratoire de Physique Théorique CNRS & Université Paul Sabatier www.lpt.ups-tlse.fr Quelques Définitions de la Théorie des

Plus en détail

chaque entreprise choisi un prix p. Le prix le plus bas attire les clients. Les entreprises maximisent leur profit q

chaque entreprise choisi un prix p. Le prix le plus bas attire les clients. Les entreprises maximisent leur profit q 5. e modèle de Bertrand En 1883, Joseph Bertrand a critiqué le modèle de Cournot en disant qu en pratique les firmes ne choisissent pas les quantités, mais les prix. Il propose le modèle alternatif: Etant

Plus en détail

CHAPITRE 5. Stratégies Mixtes

CHAPITRE 5. Stratégies Mixtes CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,

Plus en détail

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

Jeux-Langages-Logique Jeux extensifs, jeux stratégiques

Jeux-Langages-Logique Jeux extensifs, jeux stratégiques Université de Bordeaux Master Informatique, 2015/2016 Jeux extensifs, à information complète Jeux-Langages-Logique Jeux extensifs, jeux stratégiques Exercice 2.1 Th. de Von Neumann Soit un graphe orienté

Plus en détail

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5. Deuxième partie Les jeux non-coopératifs avec information complète 3. Équilibre de Nash (1951) 35 4. Dynamique et rétroduction 61 5. Jeux répétés 85 3. Équilibre de Nash (1951) John Nash a généralisé

Plus en détail

Marchés, réseaux et politique de la concurrence. Claude Crampes (claude.crampes@tse-fr.eu)

Marchés, réseaux et politique de la concurrence. Claude Crampes (claude.crampes@tse-fr.eu) Marchés, réseaux et politique de la concurrence Claude Crampes (claude.crampes@tse-fr.eu) Toulouse, avril 2015 2. Comportements anti-concurentiels 2.1. Choix stratégiques 2.2. Abus de position dominante

Plus en détail

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0) CORRECTION D EXAMEN CONTROLE CONTINU n 1 Question de cours Question 1 : Les équilibres de Cournot et de Stackelberg sont des équilibres de situation de duopole sur un marché non coopératif d un bien homogène.

Plus en détail

Intelligence artificielle & intelligence collective. Théorie des jeux

Intelligence artificielle & intelligence collective. Théorie des jeux Intelligence artificielle & intelligence collective Théorie des jeux Laboratoire d Informatique Fondamentale de Lille Année 2006-2007 Bruno Beaufils (beaufils@lifl.fr) Partie A Introduction à la théorie

Plus en détail

Jeux à somme nulle : le cas fini

Jeux à somme nulle : le cas fini CHAPITRE 2 Jeux à somme nulle : le cas fini Les jeux à somme nulle sont les jeux à deux joueurs où la somme des fonctions de paiement est nulle. Dans ce type d interaction stratégique, les intérêts des

Plus en détail

Chaînes de Markov au lycée

Chaînes de Markov au lycée Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat

Plus en détail

KBB 16, PLACE LONGEMALLE CH-1204 GENÈVE. L avocat et la psychologie du risque Juillet 2013

KBB 16, PLACE LONGEMALLE CH-1204 GENÈVE. L avocat et la psychologie du risque Juillet 2013 KBB 16, PLACE LONGEMALLE CH-1204 GENÈVE L avocat et la psychologie du risque Juillet 2013 Résumé : Les conflits juridiques s inscrivent en principe dans une situation d incertitude qui n est pas sans effet

Plus en détail

Mathématiques financières

Mathématiques financières Mathématiques financières Arnaud Triay Table des matières 1 Introduction Position du problème.1 Pricing des options........................................... Formalisme..............................................

Plus en détail

La théorie des jeux et l hypothèse de rationalité

La théorie des jeux et l hypothèse de rationalité La théorie des jeux et l hypothèse de Michael Eisermann www-fourier.ujf-grenoble.fr/ eiserm 8 novembre 2007 ir Séminaire Mathématiques et Applications Dans la série «comment écrire une thèse en maths puis

Plus en détail

Fondements de l informatique: Examen Durée: 3h

Fondements de l informatique: Examen Durée: 3h École polytechnique X2013 INF412 Fondements de l informatique Fondements de l informatique: Examen Durée: 3h Sujet proposé par Olivier Bournez Version 3 (corrigé) L énoncé comporte 4 parties (sections),

Plus en détail

Exercices théoriques

Exercices théoriques École normale supérieure 2008-2009 Département d informatique Algorithmique et Programmation TD n 9 : Programmation Linéaire Avec Solutions Exercices théoriques Rappel : Dual d un programme linéaire cf.

Plus en détail

Economie Industrielle 09

Economie Industrielle 09 Economie Industrielle 09 Economie de l innovation et de la propriété intellectuelle 1 1 Doctorant Département SES Télécom ParisTech La place de l innovation dans les économies développées L innovation

Plus en détail

Introduction à la théorie des jeux A 1

Introduction à la théorie des jeux A 1 Intelligence artificielle & intelligence collective Théorie des jeux Laboratoire d Informatique Fondamentale de Lille Année 2003-2004 Bruno Beaufils (beaufils@lifl.fr) Partie A Introduction à la théorie

Plus en détail

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires Chapitre I Probabilités Bcpst 1 2 novembre 2015 I Exemples d expériences aléatoires Une expérience aléatoire est une expérience dont on ne peut pas prédire le résultat avant de l avoir réalisée... ce qui

Plus en détail

Parcours d un arbre Arbres de recherche CHAPITRE 6. Arbres binaires. Karelle JULLIAN. MPSI, Option Info 2014/2015. Karelle JULLIAN

Parcours d un arbre Arbres de recherche CHAPITRE 6. Arbres binaires. Karelle JULLIAN. MPSI, Option Info 2014/2015. Karelle JULLIAN CHAPITRE 6 Arbres binaires Lycée Kléber MPSI, Option Info 2014/2015 1 Définitions 2 Parcours en largeur Parcours en profondeur Parcours préfixe, infixe, postfixe Reconstitution 3 Recherche Complexité Insertion

Plus en détail

Exercices : Probabilités

Exercices : Probabilités Exercices : Probabilités Partie : Probabilités Exercice Dans un univers, on donne deux événements et incompatibles tels que =0, et =0,7. Calculer,, et. Exercice Un dé (à faces) est truqué de la façon suivante

Plus en détail

TD 2 Exercice 1. Un bûcheron a 100 hectares de bois de feuillus. Couper un hectare de bois et laisser la zone se régénérer naturellement coûte 10 kf par hectares, et rapporte 50 kf. Alternativement, couper

Plus en détail

COUPLES DE VARIABLES ALÉATOIRES

COUPLES DE VARIABLES ALÉATOIRES CHAPITRE 13 COUPLES DE VARIABLES ALÉATOIRES Dans tout le chapitre, (Ω, P) désignera un espace probabilisé fini. 1 Couple de variables aléatoires Définition 13.1 On appelle couple de variables aléatoires

Plus en détail

Espace de probabilité, indépendance et probabilité conditionnelle

Espace de probabilité, indépendance et probabilité conditionnelle Chapter 2 Espace de probabilité, indépendance et probabilité conditionnelle Sommaire 2.1 Tribu et événements........................................... 15 2.2 Probabilité................................................

Plus en détail

Exercices de simulation 1

Exercices de simulation 1 Licence MIA 2ème année Année universitaire 2009-2010 Simulation stochastique C. Léonard Exercices de simulation 1 Les simulations qui suivent sont à effectuer avec Scilab. Le générateur aléatoire de Scilab.

Plus en détail

Factorisation des matrices creuses

Factorisation des matrices creuses Chapitre 5 Factorisation des matrices creuses 5.1 Matrices creuses La plupart des codes de simulation numérique en mécanique des fluides ou des structures et en électromagnétisme utilisent des discrétisations

Plus en détail

StatEnAction 2009/10/30 11:26 page 111 #127 CHAPITRE 10. Machines à sous

StatEnAction 2009/10/30 11:26 page 111 #127 CHAPITRE 10. Machines à sous StatEnAction 2009/0/30 :26 page #27 CHAPITRE 0 Machines à sous Résumé. On étudie un problème lié aux jeux de hasard. Il concerne les machines à sous et est appelé problème de prédiction de bandits à deux

Plus en détail

ENSE3 - API/CSPI et Master Automatique - 2008/2009

ENSE3 - API/CSPI et Master Automatique - 2008/2009 ENSE3 - API/CSPI et Master Automatique - 28/29 DS Commande robuste - - 19 janvier 29 Nom Prénom Signature ATTENTION: Mettre votre nom et répondre directement sur les feuilles de l énoncé. Justifiez vos

Plus en détail

Concurrence imparfaite Département Économie HEC

Concurrence imparfaite Département Économie HEC Concurrence imparfaite Département Économie HEC Avant de commencer Où en sommes nous? Détermination des prix dans un marché concurrentiel Chapitre 2 Interventions Chapitre 3 Monopole Chapitre 4 Théorie

Plus en détail

Modèles et simulations informatiques des problèmes de coopération entre agents

Modèles et simulations informatiques des problèmes de coopération entre agents Modèles et simulations informatiques des problèmes de coopération entre agents Bruno Beaufils LIFL Axe CIM Équipe SMAC Laboratoire d'informatique Plan 1. Motivations 2. Dilemme itéré du prisonnier 3. Simulations

Plus en détail

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years.

2 players Ages 8+ Note: Please keep these instructions for future reference. WARNING. CHOKING HAZARD. Small parts. Not for children under 3 years. Linja Game Rules 2 players Ages 8+ Published under license from FoxMind Games NV, by: FoxMind Games BV Stadhouderskade 125hs Amsterdam, The Netherlands Distribution in North America: FoxMind USA 2710 Thomes

Plus en détail

À propos des matrices échelonnées

À propos des matrices échelonnées À propos des matrices échelonnées Antoine Ducros appendice au cours de Géométrie affine et euclidienne dispensé à l Université Paris 6 Année universitaire 2011-2012 Introduction Soit k un corps, soit E

Plus en détail

Théorie des jeux, Master AE2 et magistère 2, 1ère série d exercices, Solutions

Théorie des jeux, Master AE2 et magistère 2, 1ère série d exercices, Solutions Théorie des jeux, Master AE2 et magistère 2, 1ère série d exercices, Solutions December 9, 2013 Question 1 Démontrer heuristiquement les énoncés suivants: (1) S il existe une unique combinaison de stratégies

Plus en détail

Outline. Introduction. Structuration d un problème de décision

Outline. Introduction. Structuration d un problème de décision Outline Introduction Structuration d un problème de décision Décision en avenir incertain Incertain strict (non probabilisé) Analyse axiomatique des critères (Milnor) Incertain probabiliste La théorie

Plus en détail

NC8 THEORIE DE L OLIGOPOLE (1 ère partie)

NC8 THEORIE DE L OLIGOPOLE (1 ère partie) NC8 THEORIE DE L OLIGOPOLE (1 ère partie) D après la définition de VARIAN dans Analyse microéconomique, «l oligopole est l étude des interactions d un petit nombre d entreprises sur un marché». Ce concept

Plus en détail

Définitions Approches managériales Approches psychologiques

Définitions Approches managériales Approches psychologiques Séminaire [CID] : Créativité, Innovation, Décision Partie B : DECISION Définitions Approches managériales Approches psychologiques www.evoreg.eu M2i : Management International de l Innovation Emmanuel

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Algorithmique et Programmation Projets 2012/2013

Algorithmique et Programmation Projets 2012/2013 3 Dames 3. Objectif Il s agit d écrire un programme jouant aux Dames selon les règles. Le programme doit être le meilleur possible. Vous utiliserez pour cela l algorithme α β de recherche du meilleur coup

Plus en détail

Economie de l incertain et de l information Partie 2 : Asymétrie de l information Chapitre 4 : Sélection adverse et théorie du signal

Economie de l incertain et de l information Partie 2 : Asymétrie de l information Chapitre 4 : Sélection adverse et théorie du signal Economie de l incertain et de l information Partie 2 : Asymétrie de l information Chapitre 4 : Sélection adverse et théorie du signal Olivier Bos olivier.bos@u-paris2.fr Introduction Importance de l information

Plus en détail

Appendice N Modèle de plan de travail de recherche

Appendice N Modèle de plan de travail de recherche 1 Appendice N Modèle de plan de travail de recherche Par Yannick Queau La théorie des régimes face aux difficultés de la coopération internationale : le cas du régime sur la biodiversité (titre provisoire)

Plus en détail

Doctorat en économique. Examen de synthèse en Théorie micro-économique 8 août 2011. Durée : 4 heures exactement

Doctorat en économique. Examen de synthèse en Théorie micro-économique 8 août 2011. Durée : 4 heures exactement Département d économie agroalimentaire et des sciences de la consommation Département d économique Université Laval NOM: Doctorat en économique Examen de synthèse en Théorie micro-économique 8 août 211

Plus en détail

Economie de l information

Economie de l information 1 Introduction Economie de l information Les méthodes de la microéconomie peuvent être appliquées à tout problème particulier de la vie économique De nombreuses études sont consacrées à des marchés ou

Plus en détail

La notion de comportement optimal

La notion de comportement optimal Leçon d Option B La notion de comportement optimal Jean-Olivier Irisson irisson@normalesup.org http ://jo.irisson.free.fr/work/ Table des matières 1 La théorie du comportement optimal tente de prédire

Plus en détail

le Rôle de l Information M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2012

le Rôle de l Information M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2012 6 le Rôle de l Information - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2012 Plan du cours 1. Probabilités subjectives 2. Arrivée symétrique de l information 3. Information asymétrique

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard

Plus en détail

Reputation, Prix Limite et Prédation

Reputation, Prix Limite et Prédation Reputation, Prix Limite et Prédation Economie Industrielle Laurent Linnemer Thibaud Vergé Laboratoire d Economie Industrielle (CREST-INSEE) 13 et 20 janvier 2009 Linnemer - Vergé (CREST-LEI) Reputation,

Plus en détail

Incertain, Marché financier, M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2015

Incertain, Marché financier, M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2015 Incertain, Marché financier, - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2015 Plan du cours 1. Incertain, actifs financiers et marché financier 2. Les conditions d un marché sans arbitrage

Plus en détail

La détection de spams : un jeu d enfant?

La détection de spams : un jeu d enfant? La détection de spams : un jeu d enfant? Tristan Mary-Huard, chargé de recherche INRA à INRA-AgroParisTech Comment distinguer automatiquement un spam d un message normal? Les filtres anti-spams analysent

Plus en détail

Couplages et colorations d arêtes

Couplages et colorations d arêtes Couplages et colorations d arêtes Complément au chapitre 5 «Une employée mécontente» et au chapitre 9 «L apprentie sudokiste» Considérons n équipes de hockey qui doivent s affronter lors d un tournoi.

Plus en détail

L oligopole ESCP 2012 2103

L oligopole ESCP 2012 2103 Structures de marché L oligopole Anne Yvrande Billon ESCP 2012 2103 1 Plan du cours (1/2) 1. Introduction : qu est ce qu un oligopole? 2. L oligopole de Cournot 3. Le «paradoxe de Bertrand» 2 1. Introduction

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

QUI VEUT JOUER AVEC MOI?

QUI VEUT JOUER AVEC MOI? QUI VEUT JOUER AVEC MOI? Michel Rigo (Université de Liège) http://www.discmath.ulg.ac.be/ JOUER SÉRIEUSEMENT, POURQUOI? Jeux coopératifs : marché boursier, économie, émergence de réseaux sociaux,... Mise

Plus en détail

Feuille 1 : représentation d interactions stratégiques, connaissance commune

Feuille 1 : représentation d interactions stratégiques, connaissance commune Université Paris-Dauphine, Departement MIDO. Théorie des jeux, L3, 2009/2010. Feuille 1 : représentation d interactions stratégiques, connaissance commune Exercice 1 ( Il y a deux joueurs. A la période

Plus en détail

MICROSTRUCTURE DES MARCHES FINANCIERS. Comportements stratégiques Production de liquidité

MICROSTRUCTURE DES MARCHES FINANCIERS. Comportements stratégiques Production de liquidité MCROSTRUCTURE DES MARCHES FNANCERS Comportements stratégiques Production de liquidité Plan du cours Préambule : Comportements stratégiques et modèles de stock Le modèle de Ho et Stoll Le modèle de Kyle

Plus en détail

Fonctions homographiques

Fonctions homographiques Fonctions homographiques On donne ci-dessous deux définitions des fonctions homographiques, et on montre que ces deux définitions sont équivalentes. On décrit la courbe représentative d une fonction homographique.

Plus en détail

Jean-Louis CAYATTE jlcayatte@free.fr http://jlcayatte.free.fr/

Jean-Louis CAYATTE jlcayatte@free.fr http://jlcayatte.free.fr/ Chapitre 14 Marché du travail avec salaire négocié Supposer que le salaire est négocié entre l employeur et le salarié, c est remplacer l équation w( t) = w par une équation de détermination de ce salaire

Plus en détail

Mathématiques appliquées à l informatique

Mathématiques appliquées à l informatique Mathématiques appliquées à l informatique Jean-Etienne Poirrier 15 décembre 2005 Table des matières 1 Matrices 3 1.1 Définition......................................... 3 1.2 Les différents types de matrices.............................

Plus en détail

THEORIE DES JEUX : UNE INTRODUCTION. Jacques-François Thisse

THEORIE DES JEUX : UNE INTRODUCTION. Jacques-François Thisse THEORIE DES JEUX : UNE INTRODUCTION Jacques-François Thisse 1 1. Introduction 1.1. Qu est-ce qu un jeu? La théorie des jeux est la discipline mathématique qui étudie les situations où le sort de chaque

Plus en détail

5. Options américaines Une option américaine peut être exercée à n importe quelle instant compris entre

5. Options américaines Une option américaine peut être exercée à n importe quelle instant compris entre 5. Options américaines Une option américaine peut être exercée à n importe quelle instant compris entre 0 et l échéance N. Définition 5.1. Une option américaine est définie par une suite (h n ) n=0..n,

Plus en détail

avec des nombres entiers

avec des nombres entiers Calculer avec des nombres entiers Effectuez les calculs suivants.. + 9 + 9. Calculez. 9 9 Calculez le quotient et le rest. : : : : 0 :. : : 9 : : 9 0 : 0. 9 9 0 9. Calculez. 9 0 9. : : 0 : 9 : :. : : 0

Plus en détail

ECO L1 - - Qu est-ce que l économie? modèles micro et macroéconomiques. ECO L1 - Université de Tours, Arnold Chassagnon, Septembre 2013

ECO L1 - - Qu est-ce que l économie? modèles micro et macroéconomiques. ECO L1 - Université de Tours, Arnold Chassagnon, Septembre 2013 ECO L1 - - Qu est-ce que l économie? modèles micro et macroéconomiques - ECO L1 - Université de Tours, Arnold Chassagnon, Septembre 2013 PLAN DE LA CONFERENCE Introduction à l Analyse économique - Maximisation

Plus en détail

ANALYSE DES INTERACTIONS MULTI-AGENTS: THÉORIE DES JEUX

ANALYSE DES INTERACTIONS MULTI-AGENTS: THÉORIE DES JEUX ANALYSE DES INTERACTIONS MULTI-AGENTS: THÉORIE DES JEUX Cours 4 Présentation Utiliser des agents pour maximiser leur objectif en interagissant Pour quoi faire? Prise de décision collective Quel est l état

Plus en détail

Correction de l épreuve intermédiaire de mai 2009.

Correction de l épreuve intermédiaire de mai 2009. Licence de Gestion. 3ème Année Année universitaire 8-9 Optimisation Appliquée C. Léonard Correction de l épreuve intermédiaire de mai 9. Exercice 1 Avec les notations du cours démontrer que la solution

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire Variables aléatoires. Exemple 1. (Jeu d argent) Exemple 2. Loi de

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

CALCUL SCIENTIFIQUE. 1 Erreur absolue et erreur relative 2. 2 Représentation des nombres sur ordinateur 3

CALCUL SCIENTIFIQUE. 1 Erreur absolue et erreur relative 2. 2 Représentation des nombres sur ordinateur 3 MTH1504 2011-2012 CALCUL SCIENTIFIQUE Table des matières 1 Erreur absolue et erreur relative 2 2 Représentation des nombres sur ordinateur 3 3 Arithmétique flottante 4 3.1 Absorption........................................

Plus en détail

Statistique descriptive : Exercices supplémentaires Introduction à la théorie des probabilités

Statistique descriptive : Exercices supplémentaires Introduction à la théorie des probabilités Statistique descriptive : Exercices supplémentaires Introduction à la théorie des probabilités 1. Lors du lancer d un dé équilibré dont les faces sont numérotées de 1 à 6, quelle est la probabilité d obtenir

Plus en détail

Exercice I. On considère un monopole sur un marché caractérisé par les données suivantes:

Exercice I. On considère un monopole sur un marché caractérisé par les données suivantes: TD n 7 OLIGOPOLE, STRATEGIES CONCURRENTIELLES ET THEORIE DES JEUX. Lecture obligatoire: Pindyck et Rubinfeld Chapitre pp. 493-56 et Chapitre 3 pp. 535-57 Exercice I. On considère un monopole sur un marché

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2 Probabilités Table des matières I Petits rappels sur le vocabulaire des ensembles 2 I.1 s................................................... 2 I.2 Propriétés...................................................

Plus en détail

1. Utilisation d un nom ou d une enseigne communs et une présentation uniforme des locaux et/ou moyens de transport visés au contrat.

1. Utilisation d un nom ou d une enseigne communs et une présentation uniforme des locaux et/ou moyens de transport visés au contrat. 1 Les contrats de franchise Jean Magnan de Bornier Les contrats de franchise ont fait l objet de nombreux travaux théoriques et aussi économétriques, permettant de confronter les différentes théories du

Plus en détail

Le raisonnement par récurrence

Le raisonnement par récurrence Le raisonnement par récurrence Nous notons N l ensemble des entiers naturels : N = {0,,, } Nous dirons naturel au lieu de entier naturel Le principe du raisonnement par récurrence Soit A une partie de

Plus en détail

VIII Relations d ordre

VIII Relations d ordre VIII Relations d ordre 20 février 2015 Dans tout ce chapitre, E est un ensemble. 1. Relations binaires Définition 1.0.1. On appelle relation binaire sur E tout triplet R = (E, E, Γ) où Γ est une partie

Plus en détail

Introduction aux modèles financiers

Introduction aux modèles financiers Notes pour le module spécifique Introduction aux modèles financiers Ecole Centrale de Lyon Option Mathématiques 1 2 Introduction Quelques références Pour comprendre les marchés financiers, avoir un apreçu

Plus en détail

Terminale S-SI Probabilités conditionnelles

Terminale S-SI Probabilités conditionnelles robabilités conditionnelles Table des matières 1 Introduction 2 2 Définitions 2 3 Formule des probabilités totales 3 4 Indépendance et principe du produit 5 5 Exercices 5 1 1 Introduction Lorsque 7 élèves

Plus en détail

Cours de spécialité mathématiques en Terminale ES

Cours de spécialité mathématiques en Terminale ES Cours de spécialité mathématiques en Terminale ES O. Lader 2014/2015 Lycée Jean Vilar Spé math terminale ES 2014/2015 1 / 51 Systèmes linéaires Deux exemples de systèmes linéaires à deux équations et deux

Plus en détail

Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien)

Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien) Finance des matières premières (6b) De la formation des prix sur les marchés financiers à la possibilité d un équilibre (non walrasien) Alain Bretto & Joël Priolon - 25 mars 2013 Question Dans un équilibre

Plus en détail

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES Cours 6c Principe Protocole centralisé, un commissaire-priseur/vendeur (auctioneer) et plusieurs enchérisseurs/acheteurs (bidders) Le commissaire-priseur

Plus en détail

SESSION 2006. NOM, Prénom : PROBABILITES 2006 T ES. France septembre 2005 (5 points)

SESSION 2006. NOM, Prénom : PROBABILITES 2006 T ES. France septembre 2005 (5 points) SESSION 2006 France septembre 2005 (5 points) Parmi les stands de jeux d une fête de village, les organisateurs ont installé une machine qui lance automatiquement une bille d acier lorsque le joueur actionne

Plus en détail

Fonction polynôme du second degré : Forme canonique

Fonction polynôme du second degré : Forme canonique Fonction polynôme du second degré : Forme canonique I) Introduction. Soit g(x) = a(x - s)²+h. Toute fonction polynôme du second degré peut s écrire sous cette forme. Le passage de la forme développée à

Plus en détail

Chapitre 20. Les options

Chapitre 20. Les options Chapitre 20 Les options Introduction Les options financières sont des contrats qui lient deux parties. Les options existent dans leur principe depuis plusieurs millénaires, mais elles connaissent depuis

Plus en détail

Finance des matières premières (2) Les options, marchés complets, AOA

Finance des matières premières (2) Les options, marchés complets, AOA Finance des matières premières (2) Les options, marchés complets, AOA Joël Priolon - 12 mars 2014 Définition générale Une option est un contrat financier qui lie : l émetteur de l option et le détenteur

Plus en détail

Sur l algorithme RSA

Sur l algorithme RSA Sur l algorithme RSA Le RSA a été inventé par Rivest, Shamir et Adleman en 1978. C est l exemple le plus courant de cryptographie asymétrique, toujours considéré comme sûr, avec la technologie actuelle,

Plus en détail

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher. Lycée Jean Bart PCSI Année 2013-2014 17 février 2014 Probabilités Probabilités basiques Exercice 1. Vous savez bien qu un octet est une suite de huit chiffres pris dans l ensemble {0; 1}. Par exemple 01001110

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur

Plus en détail

Document1 - Un SI est composé de 2 sous-systèmes : Document2 Les ERP Un point sur l ERP Gaëlle Maindron

Document1 - Un SI est composé de 2 sous-systèmes : Document2 Les ERP Un point sur l ERP Gaëlle Maindron Document1 - Un SI est composé de 2 sous-systèmes : Document2 Les ERP Un point sur l ERP Gaëlle Maindron Définir l Entreprise Resources Planning mieux connu sous le nom d ERP Cette solution informatique

Plus en détail

Principes de Finance

Principes de Finance Principes de Finance 12. Théorie des options I Daniel Andrei Semestre de printemps 211 Principes de Finance 12. Théorie des options I Printemps 211 1 / 43 Plan I Introduction II Comprendre les options

Plus en détail

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan Exo7 Systèmes linéaires Vidéo partie 1. Introduction aux systèmes d'équations linéaires Vidéo partie 2. Théorie des systèmes linéaires Vidéo partie 3. Résolution par la méthode du pivot de Gauss 1. Introduction

Plus en détail