COURS 8 : INTRODUCTION A LA THEORIE DES JEUX

Dimension: px
Commencer à balayer dès la page:

Download "COURS 8 : INTRODUCTION A LA THEORIE DES JEUX"

Transcription

1 Université Pierre et Marie Curie Licence Informatique Cours LI Industrie Informatique et son Environnement Économique Responsable : Jean-Daniel Kant COURS 8 : INTRODUCTION A LA THEORIE DES JEUX 1 Jeux Le comportement des oligopoles montrent la forte interdépendance entre les firmes. Quand la marché est contrôlé par un petit nombre d entreprises, chaque firme analyse les comportements des autres et peaufine sa stratégie en partie en fonction de celles des autres. Ainsi, ces comportements interdépendants peuvent apparaître comme des jeux, où chaque firme jouerait un coup, puis recevrait la réponse d une autre en riposte, etc. C est pourquoi la théorie des jeux est souvent utilisée en économie pour modéliser les comportements oligopolistiques. Elle est aussi utilisée dans d autres domaines de l économie industrielle, en économie du travail, des échanges internationaux, etc. Elle est cependant plus normative que descriptive, car rien ne prouve que les acteurs raisonnent exactement comme la théorie des jeux le prescrit. C est plus une abstraction de comportement, une vision stylisée qu un véritable modèle. La théorie des jeux étudie des situations (les jeux) où des agents (les joueurs) ont à choisir des stratégies et obtiendront chacun un résultat (paiement, gain) qui dépendra des stratégies jouées par l ensemble des joueurs. Une stratégie peut se réduire à une décision élémentaire, mais peut aussi consister en un plan d action complexe, comme nous le verrons plus loin. Un jeu est non-coopératif lorsque les joueurs choisissent leurs stratégies à l insu les uns des autres. La théorie des jeux coopératifs étudie au contraire les avantages que peuvent tirer les joueurs de la possibilité de former entre eux des coalitions. 2 Jeux non-coopératifs 2.1 Jeux sous forme normale Un jeu est présenté sous forme normale (on dit encore sous forme stratégique) lorsqu il est défini par la donnée : d un ensemble de joueurs N = {1,.., i,.., n} ; pour chaque joueur i, d un ensemble de stratégies A i = {a i 1,.., ai l,.., ai m i } ; et d une fonction(vectorielle) de paiement : u = (u 1,..u i,..u n ) : n i=1 Ai R n 1

2 a = (a 1,..a i,..a n ) u(a) = (u 1 (a),.., u i (a),.., u n (a)), où u i (a) = u i (a 1,.., a i,.., a n ) est le paiement du joueur i (ce peut être aussi bien un gain monétaire qu un niveau d utilité) lorsque les joueurs jouent le profil de stratégies a, c- à-d, lorsque le joueur i joue la stratégie a i et les autres joueurs jouent les stratégies a j, j N \{i}. Notations : Il sera commode de noter i l ensemble N \{i}, d où a i = (a 1,.., a i 1, a i+1,..a n ), a = (a i, a i ), u i (a) = (u 1 (a),.., u i 1 (a), u i+1 (a),.., u n (a)), u(a) = (u i (a), u i (a)), A i = j i Aj, A = A i A i, etc. Cette définition peut être étendue à un nombre infini de joueurs ou de stratégies. Dans le cas de deux joueurs (n = 2), on peut représenter un tel jeu à l aide de la matrice du jeu, dont les lignes et colonnes sont respectivement identifiées aux stratégies de chacun des joueurs et l élément de ligne a 1 et colonne a 2 est le couple (u 1 (a 1, a 2 ), u 2 (a 1, a 2 )). Ainsi le jeu est décrit par la matrice U de terme U ij = u i (a j ). N.B. Dans un jeu sous forme normale on suppose toujours que les deux joueurs connaissent la matrice U du jeu. Exemples La bataille du couple Kevin et Kevina doivent aller au spectacle ce soir et acheter leur billet à l avance, chacun séparément ; ils n ont pas la possibilité de communiquer ; ils n aiment l une que les chanteuses américaines décolorées, l autre que le football ; enfin, leur soirée à tous deux sera gâchée s ils ne sont pas ensemble. Kevina \ Kevin concert f oot concert 2, 1 1, 1 foot 1, 1 1, 2 Peut-on dire ce que doivent faire, prédire ce que vont faire, Kevin et Kevina? S ils sont rationnels, chacun a intérêt à choisir sa préférence, car il vaut mieux gagner 2 ou perdre -1, que gagner 1 ou perdre -1. Mais dans ce cas, ils vont perdre à coup sûr. Il vaudrait mieux jouer (concert,concert) ou (foot,foot). Mais cela ne donnera des gains que s ils jouent le même. La bataille du couple est difficile à résoudre! Le dilemme du prisonnier P ris. I \ P ris. II nier avouer nier 3, 3 10, 1 avouer 1, 10 6, 6 Ce jeu tire son nom de l interprétation suivante : deux criminels présumés sont interrogés séparément par la police ; s ils nient tous les deux ils seront condamnés à une faible peine (3 ans) et s ils avouent tous les deux ils seront condamnés à une peine plus forte (6 ans) ; si l un 2

3 des deux avoue tandis que l autre nie, le premier n aura qu une peine de principe (1 an) alors que le second aura la peine maximale (10 ans). La matrice ci-dessus représente donc des pertes (gains négatifs). Que vont faire, que doivent faire, les deux prisonniers? Quel que soit l action de l autre, chacun a intérêt à avouer, car les gains seront toujours meilleurs (peines moindres) que nier. Cependant si on change maintenant la matrice des gains : P ris. I \ P ris. II nier avouer nier 3, 3 10, 30 avouer 30, 10 30, 30 Il vaut alors mieux nier, vu qu avouer entraîne la peine maximale à chaque fois. 2.2 Analyse d un jeu sous forme normale Considérations de dominance Dominances La stratégie a i du joueur i domine faiblement sa stratégie b i lorsque : u i (a i, a i ) u i (b i, a i ), a i A i ; (quelque soient les stratégies a i des autres joueurs, la stratégie a i est meilleure ou égale que b i.) elle la domine si elle la domine faiblement et que, de plus : c i A i t.q. u i (a i, c i ) > u i (b i, c i ) ; (il y a au moins un cas, i.e. une réponse des autres joueurs, pour lequel a i est meilleure que b i ) enfin, a i domine strictement b i lorsque : u i (a i, a i ) > u i (b i, a i ), a i A i. (quelque soient les stratégies a i des autres joueurs, la stratégie a i est meilleure strictement que b i.) La stratégie a i est dite faiblement dominante (resp. dominante, resp. strictement dominante) si elle domine faiblement (resp. domine, resp. domine strictement) tous les b i A i \{a i }. Equilibre en stratégies strictement dominantes On peut penser qu un joueur rationnel ne choisira jamais une stratégie s il dispose d une autre stratégie lui assurant un gain supérieur quel que soit le comportement des autres joueurs. Si chaque joueur a une stratégie strictement dominante, il doit donc la jouer et le jeu est résolu. On dit alors qu il existe un équilibre en stratégies strictement dominantes. C est le cas pour (avouer, avouer) dans le premier dilemme du prisonnier ci-dessus. Remarquons que les joueurs obtiendraient tous deux plus qu à cet équilibre en jouant (nier, nier) ; il n est donc pas efficace du point de vue de la rationalité collective, qui se caractérise par l optimalité au sens de Pareto. 3

4 Optimum de Pareto Une suite de stratégies a = (a 1,..a i,..a n ) est un optimum de Pareto lorsqu aucun des joueurs ne peut obtenir un paiement plus élevé sans que le paiement d un des autres diminue : [ u i (a i, a i ) u i (a i, a i ), i ] = [ u i (a i, a i ) = u i (a i, a i ), i ]. L optimum de Pareto exprime bien l idée que collectivement on ne peut pas améliorer la situation. Souvent il fournit une solution plus efficace que quand chaque joueur raisonne individuellement. Equilibre itératif en stratégies strictement dominantes Quand il n en existe pas, le jeu peut souvent être simplifié par un processus itératif où chaque joueur, tablant sur la rationalité de ses adversaires, écarte les stratégies apparues comme dominées à cette étape de son raisonnement. Exemple Matrice du jeu : H M B G C D (2, 5) (4, 8) (1, 3) (1, 4) (2, 5) (3, 6) (3, 7) (5, 8) (2, 9) Il n existe pas d équilibre en stratégies strictement dominantes car aucune ligne ne donne strictement plus, composante par composante, que toutes les autres lignes (il n existe d ailleurs pas non plus de colonne dominant strictement toutes les autres colonnes). Dans la recherche d un équilibre itéré en stratégies strictement dominantes, on élimine successivement : G strictement dominé par C M B C D (2, 5) (3, 6) (5, 8) (2, 9) H M B C D (4, 8) (1, 3) (2, 5) (3, 6) (5, 8) (2, 9) ; C strictement dominé par D ; H strictement dominé par B M B D (3, 6) (2, 9) ; B strictement dominé par M strictement dominées cherché. D M (3, 6). (M, D) est l équilibre itéré en stratégies 4

5 Equilibre et équilibre itératif en stratégies dominantes On peut penser qu un joueur rationnel ne devrait jamais jouer non plus une stratégie s il en existe une autre assurant un gain supérieur ou égal quoi qu il arrive et strictement supérieur pour certaines stratégies des autres joueurs. Ici encore si chaque joueur a une stratégie dominante (il ne peut en avoir plus d une), il doit la jouer. On dit alors qu il existe un équilibre en stratégies dominantes. En revanche, le concept d équilibre itératif en stratégies dominantes pose des problèmes. En effet, contrairement au cas de la dominance stricte, selon l ordre d élimination de stratégies dominées adopté, on peut aboutir à des résultats différents Equilibre de NASH Lorsque, comme dans la bataille du couple, il n existe pas d équilibre, même itératif, en stratégies strictement dominantes, il faut examiner l intérêt présenté pour les joueurs par des stratégies aux propriétés plus faibles : Meilleure réponse La stratégie a i du joueur i est une meilleure réponse à des stratégies données b i A i des autres joueurs lorsque : u i (a i, b i ) u i (a i, b i ), a i A i. Equilibre de NASH Un profil de stratégies a = (a 1,..a i,..a n ) est un équilibre de Nash lorsque chacune de ses composantes constitue une meilleure réponse aux autres : u i (a i, a i ) u i (a i, a i ), a i A i, i = 1,.., n. Un équilibre de Nash est donc un profil de stratégies (c est-à-dire la donnée d une stratégie d équilibre pour chaque joueur) dans laquelle chaque stratégie est une meilleure réponse à toute autre stratégie jouée. Un équilibre de Nash a la propriété de stabilité suivante : si, pour une raison quelconque, un des joueurs pense que tous ses adversaires vont jouer leurs stratégies d équilibre, alors il n a aucune incitation à jouer lui-même autre chose que sa stratégie d équilibre. Par exemple, les joueurs peuvent parfois se mettre d accord avant le jeu pour jouer un équilibre ; une trahison reste toujours possible ; cependant chacun a intérêt à respecter cet accord si les autres le respectent aussi. La multiplicité des équilibres de Nash peut poser des problèmes. Dans la bataille du couple, il y a deux équilibres de Nash (concert, concert) et (foot, foot) ; sans entente préalable, Kevina peut vouloir jouer l un et Kevin l autre, avec pour résultat les paiements ( 1, 1) ; les jeux où se rencontre cette difficulté sont appelés jeux de coordination. Enfin, un équilibre de Nash n est pas forcément souhaitable. Dans le premier dilemme du prisonnier ci-dessus (avouer, avouer) étant un équilibre en stratégies (strictement) dominantes est aussi équilibre de Nash ; comme nous l avons remarqué, (nier, nier) est strictement meilleur pour chacun des deux joueurs ; un équilibre de Nash n est donc pas en général Pareto-optimal. 5

6 On voit facilement qu un équilibre itératif en stratégies strictement dominées et même en stratégies dominées est nécessairement un équilibre de Nash. L inverse n est pas vrai et le processus itératif d élimination de stratégies dominées peut écarter un équilibre de Nash attractif comme dans l exemple suivant. Exemple J. I \ J. II G D H 10, 0 5, 2 B 10, 11 2, 0 Si le joueur II pense que le joueur I éliminera la stratégie B, dominée (mais pas strictement) par H, il jouera D et l issue du jeu sera (5, 2) ; (H, D) est bien un équilibre de Nash, mais un deuxième équilibre, (B, G), qui domine strictement (H, D) au sens de Pareto a été éliminé! L étude d un jeu sous sa forme extensive, qui contient en général plus d information sur le jeu, permettra d identifier les équilibres de Nash qui sont crédibles, c-à-d susceptibles d être joués par des joueurs rationnels. 3 Jeux sous forme extensive Certaines situations où les agents prennent des décisions à tour de rôle peuvent être décrites commodément à l aide d un arbre de jeu (en fait, une arborescence) : 3.1 Exemple : attaque publicitaire Deux entreprises E 1 et E 2 sont en duopole sur un produit et font des bénéfices respectifs (1, 5) ; E 1 peut ou non lancer une campagne publicitaire (coûteuse) pour agrandir sa part de marché, ce qui réussira si E 2 ne réagit pas et les amènera alors à (2, 3) ; en revanche, si E 2 réagit en lançant sa propre campagne, les bénéfices deviendront (0, 2). L arbre que l on associe à ce jeu est le suivant : Figure 1 arbre du jeu 6

7 Chacun des joueurs a deux stratégies, pub et statu quo, mais celles de E 2 n ont d influence sur le déroulement et l issue du jeu que si E 1 a choisi la stratégie pub. Le jeu a pour forme normale : E 1 \ E 2 pub statu quo pub 0, 2 2, 3 statu quo 1, 5 1, 5 Il y a deux équilibres de Nash, (pub, statu quo) et (statu quo, pub) ; seule l analyse de la forme extensive nous assure que le second ne sera pas joué : si E 1 choisit pub, E 2 jouera statu quo qui lui rapporte alors à coup sûr plus que pub ; le prévoyant, E 1 doit préférer pub à statu quo. (On peut arriver à la même conclusion sur la forme normale en raisonnant que E 2 ne jouera pas pub, dominée par statu quo, mais cette dominance n étant pas stricte, la conclusion resterait douteuse). 3.2 Information Le jeu de l exemple ci-dessus est un jeu à information parfaite, c.-à-d. qu à l instant de prendre une décision les joueurs connaissent toutes les décisions passées (les leurs et celles des autres joueurs) et, de plus, s il y a de l incertitude, tous les joueurs ont les mêmes informations. On parlera au contraire, de jeu à information imparfaite lorsque certains des joueurs ne savent pas toujours exactement à quel sommet de l arbre de décision ils se trouvent (par exemple quand l un d eux ne saura pas exactement ce que vient de jouer l un de ses adversaires). L information (imparfaite) est symétrique lorsque chaque joueur en sait au moins autant que les autres au moment où il joue ; elle est dite asymétrique sinon. L information est dite incomplète lorsque certains joueurs ne savent pas exactement quels sont les paiements de la matrice de jeu (ils ne savent pas à quel jeu ils jouent). Le jeu de l Attaque publicitaire est un jeu à information parfaite. Les jeux d échec, de dames et de Go aussi. Si dans l un de ces jeux on fait précéder la partie d un coup de la nature - tirage à P ile ouf ace - pour savoir qui aura les Blancs (les Noirs au Go) et commencera la partie, le jeu complété reste à information parfaite. Le poker, dans toutes ses variantes, est un jeu en environnement incertain (la répartition des cartes est aléatoire) à information imparfaite. Voyons un exemple avec environnement certain. Dans le Bonneteau, le Manipulateur place une bille sous l une de 3 coupes renversées : la G(auche), celle du C(entre) ou la D(roite) ; le Gogo mise m e, choisit une des coupes (g(auche),c(entre) ou d(roite)) et gagne M e s il a désigné celle qui cache la bille. Sur l arbre de décision (Fig. 2) on a indiqué l ensemble d information du Gogo au moment de jouer ( ellipse en pointillés) : il ne sait pas où se trouve la bille, donc est incapable de distinguer les 3 sommets où il peut avoir à jouer. Le dilemme du prisonnier Dans ce jeu, les deux joueurs jouent simultanément ; on peut pourtant le représenter sous forme extensive en plaçant dans l arbre du jeu l action de l un avant celle de l autre ; ce dernier ne connaissant pas le choix de l autre ne sait où il se trouve dans l arbre : c est un jeu à information imparfaite. 7

8 Figure 2 arbre du jeu du Bonneteau 3.3 Stratégies Stratégies pures Une stratégie du joueur i (que nous appellerons plus tard stratégie pure quand nous introduirons les stratégies mixtes) est une règle sélectionnant une action parmi les actions réalisables en chacun des sommets de décision qui lui sont associés. Dans les jeux à information imparfaite, un joueur ne sachant pas distinguer deux sommets appartenant au même ensemble d information, une stratégie doit vérifier la condition suivante : sélectionner la même action à tous les sommets d un même ensemble d information. N.B. Cette condition n apporte aucune restriction dans les jeux à information parfaite puisque tous les ensembles d information y sont des singletons. Un profil de stratégies est une suite a = (a 1,.., a i,..a n ), c-à-d consiste en la donnée d une stratégie a i pour chaque joueur i. Dans un jeu en environnement certain, un profil de stratégies a détermine complètement le déroulement du jeu ; il sélectionne un chemin de la racine vers l une des feuilles f, que l on appelle la trajectoire du jeu. Les paiements sont alors eux-même déterminés et valent : U(a) = (U 1 (a),.., U i (a),.., U n (a)) = u(f) = (u 1 (f),.., u i (f),.., u n (f)). Dans un jeu en environnement incertain, le déroulement du jeu dépend conjointement des stratégies des joueurs et des événement réalisés ; la trajectoire est alors aléatoire ; à profil de 8

9 stratégies a donné, chaque feuille f est atteinte avec une probabilité P (f) (déterminée par la loi de probabilité des divers événements) ; a donne donc au joueur i une espérance d utilité U i (a) = f P (f) ui (f). La donnée d un jeu sous forme extensive permet donc d obtenir sa forme normale. On a le résultat suivant : Theorem 3.1 (Kuhn). Tout jeu fini à n personnes, sous forme extensive, à information parfaite a une solution qui est un équilibre de Nash en stratégies pures. 3.4 Stratégies mixtes Une stratégie mixte en théorie des jeux est une stratégie où le joueur choisit au hasard le coup qu il joue parmi les coups possibles. Cela revient à attribuer une certaine distribution de probabilité sur l ensemble des stratégies pures du jeu. Dans certains jeux, seules les stratégies mixtes sont optimales. Exemple : McDonald s vs. Quick Prenons l exemple de l affrontement entre les 2 géants du fast food, McDonald s et Quick, et modélisons le avec la matrice de jeu suivante : MD \ QK prix bas (LP) publicité forte (HA) prix bas (LP) 60, 35 55, 45 publicité forte (HA) 55, 50 60, 40 Ce jeu n admet pas d équilibre de Nash en stratégie pure. Par exemple si MD = LP, QK = HA, alors MD va essayer HA mais du coup QK, à partir de (HA, HA), préfère jouer LP. En (HA, LP ), MD préfère LP et alors QK joue HA : nous voilà revenus à la case départ. En stratégie mixte, on introduit les probabilités p LM que Mc Do joue prix bas et p LQK que Quick joue prix bas. Pour Mc Do, il faut maximiser le profit espéré : E MD = p LM (60.p LQK + 55.(1 p LQK )) + (1 p LM )(55.p LQK + 60.(1 p LQK )) = 10.p LM.p LQK 5.p LM 5.p LQK + 60 Pour maximiser il faut : E MD p LM = E MD p LQK = 0 p LM = p LQK = 0, 5 Pour Quick, il faut maximiser le profit espéré : E QK = p LQK (35.p LM + 50.(1 p LM )) + (1 p LQK )(45.p LM + 40.(1 p LM )) = 20.p LM.p LQK + 10.p LQK + 5.p LM + 60 Pour maximiser il faut : E QK p LM = E QK p QK = 0 p LQK = 0, 5 ; p LM = 0, 25 9

10 La stratégie optimale pour les 2 entreprises est donc de jouer chaque stratégie avec une probabilité de 50%. Ce jeu mixte n est pas représentable sous forme extensive, car, chaque joueur y ayant une infinité de stratégies, ce n est plus un jeu fini (or un graphe est fini). On continue donc à raisonner sur l arbre du jeu initial, de même que, sous forme normale, on continue à utiliser la matrice du jeu initial. Nash a démontré que : Theorem 3.2 (Nash). Tout jeu fini à n personnes sous forme normale a un équilibre [de Nash] en stratégies mixtes. 4 Jeux répétés 4.1 Introduction Reprenons l exemple du dilemme du prisonnier (ici on représente des gains positifs) : P ris. I \ P ris. II nier avouer nier 1, 1 1, 2 avouer 2, 1 0, 0 L analyse de ce jeu nous a conduit à une conclusion peu satisfaisante : Si les joueurs sont rationnels, chacun doit éliminer la stratégie nier qui est strictement dominée ; la solution du jeu est donc (avouer, avouer) ; c est nécessairement un équilibre de Nash et c est en fait le seul. Or cette solution est dominée au sens de Pareto par le profil (nier, nier), plus avantageux pour chacun des joueurs. Il y a donc conflit entre la rationalité individuelle et la rationalité collective. Quand pourrait-on observer de la coopération de la part des joueurs? Une hypothèse possible est que dans la réalité les agents n ont pas affaire à une situation de jeu isolée, mais à une succession de jeux, sinon identiques du moins de structures semblables, et que la stratégie choisie dans l un d eux n est qu une composante de leur stratégie globale dans le super-jeu constitué de l ensemble de leurs jeux. Nous allons examiner cette hypothèse. 4.2 Etude du dilemme du prisonnier répété Comportement rationnel dans le dilemme du prisonnier répété un nombre fini de fois N.B. On écrira A et N pour les stratégies avouer et nier du jeu élémentaire. Deux joueurs jouent le super-jeu consistant à jouer T fois au dilemme du prisonnier, à des dates t = 1, 2,, t,, T. Les gains des différentes parties s additionnent pour constituer les paiements du super-jeu. Ce super-jeu est un jeu fini à information imparfaite (comme d ailleurs le jeu élémentaire) puisqu à chaque date t les deux joueurs jouent à l insu l un de l autre. A la date t, chaque joueur sait ce que son adversaire et lui-même ont joué aux (t 1) premières parties et il peut en faire dépendre son action à cette date. Une stratégie S de l un des 10

11 joueurs dans le super-jeu est donc caractérisable par une suite S = (S 1,, S t,, S T ) dont les composantes, toutes à valeurs dans {A, N}, sont déterminées récursivement par la donnée de S 1 et de fonctions φ t, t = 2,, T, par S t = φ t (S 1, R 1,, S t 1, R t 1 ) où R 1,, R t 1 sont les actions de l autre joueur qu il aura déjà observées à t. Il y a donc un très grand nombre de stratégies (pures) possibles pour chacun des joueurs. Montrons qu une stratégie optimale pour chacun des joueurs est d avouer à chaque étape, stratégie que nous noterons A rep. A la date T, quel qu ait été le déroulement du jeu jusque là et le total des gains de chacun, il reste à jouer un jeu élémentaire ayant sous forme normale la matrice de gains totaux finaux P ris. I \ P ris. II nier avouer nier m I + 1, m II + 1 m I 1, m II + 2 avouer m I + 2, m II 1 m I, m II où les sommes m I et m II dépendent du sommet atteint après (T 1) étapes. Quelles que soient ces sommes, jouer A est strictement dominant pour chacun des deux joueurs : tous deux prévoient donc que l autre jouera A à T. Mais alors, à (T 1), au moment de jouer dans le jeu élémentaire à cette date, chacun doit seulement comparer les paiements dans le sous-jeu formé de deux jeux élémentaires les sous-stratégies A suivi de A et N suivi de A ; la matrice des gains finaux étant du type précédent (avec pour m I et m II les sommes acquises après T 2 étapes), les deux joueurs prévoient que l autre jouera A à (T 1) comme à T. Par récurrence, on montrerait que tous les deux doivent jouer A rep. Le couple (A rep, A rep ) est clairement Pareto-dominé par de nombreuses autres couples de stratégies du super-jeu, comme par exemple (N rep, N rep ). On reste donc devant la même incohérence entre rationalité individuelle et collective que dans le jeu élémentaire! Introduction de présupposés de comportement dans le dilemme du prisonnier répété un nombre fini de fois Un joueur peut être rationnel et pourtant avoir un comportement coopératif, s il prend en compte d autres éléments que la simple description du jeu, par exemple s il a des idées a priori sur le comportement l autre joueur. Nous prendrons l exemple suivant : on appelle Tit for Tat ( oeil pour oeil, dent pour dent ) la stratégie suivante : Jouer N (nier) à t = 1, puis, à tout t > 1, jouer ce que l autre a joué à (t 1). Supposons que le joueur I pense que son adversaire peut avec une probabilité ɛ jouer la stratégie Tit for Tat au lieu de la stratégie rationnelle non-coopérative A rep. Si I joue lui-même A rep, avec probabilité ɛ, II jouant Tit for Tat, I gagnera 2 la première fois puis plus rien et avec probabilité (1 ɛ), II jouant A rep, les paiements (de I comme de II) seront toujours nuls ; d où un gain espéré égal à 2ɛ. Si maintenant I joue lui-même Tit for Tat, avec probabilité ɛ, II jouant lui-même Tit for Tat avec probabilité ɛ, I réalisera T fois un gain de 1. Avec probabilité (1 ɛ), II jouant A rep, et donc I perdra 1 à t = 1, puis tous les paiements seront nuls. D où un gain espéré égal à ɛ.t + (1 ɛ)( 1) = ɛ (T + 1) 1. 11

12 Tit for Tat est donc préférable pour lui à la stratégie rationnelle A rep dès que ɛ (T + 1) 1 > 2ɛ ɛ > 1 T 1. Cela dit, Tit for Tat n est pourtant pas sa stratégie optimale car, par exemple, il a toujours intérêt à jouer A à la dernière période) Comportement dans le dilemme du prisonnier répété une infinité de fois On peut aussi penser qu il y a un effet d horizon dans le jeu répété un nombre fini de fois, dû au fait que l on sait que tout s arrête à la date T ; un tel effet est irréaliste, puisque dans le monde réel il y a presque toujours de l incertitude sur la date de fin des relations marchandes ou autres des agents. Pour se débarrasser de l horizon, on peut étudier le super-jeu formé par le jeu simple répété une infinité de fois. Pour que le paiement global ne risque pas de devenir infini, on introduit un taux d escompte (= taux d actualisation ou taux d intérêt) ρ > 0, d où un facteur d escompte δ = 1 1+ρ < 1. Le paiement global est alors la somme actualisée, à t = 1 par exemple, des paiements g t à t : G = t=1 δt 1 g t. On montre alors qu une coopération parfaite, les deux joueurs jouant constammentn (nier), peut apparaitre ; elle pourrait être induite par le choix par chacun de la stratégie coopérative à déclenchement Σ : Jouer N tant que l autre le joue aussi ; jouer A à tout jamais dès que l autre a joué une fois A. Le résultat précis est le suivant : Le couple de stratégies coopératives à déclenchement (Σ, Σ) constitue un équilibre de Nash parfait du jeu répété une infinité de fois, à condition que δ soit suffisamment proche de 1. Démonstration : (Σ, Σ) assure à chacun des deux joueurs un gain de 1 à chaque date t. Supposons que le joueur II pense que I joue la stratégie Σ mais choisit lui-même une stratégie différente de Σ, qui le fait jouer A pour la première fois à une date t 0, lui donnant un gain de 2 ; il sait que I jouera alors A à toutes les dates suivantes t > t 0 et que quoiqu il fasse lui-même, il n aura plus que des paiements 0, d où une somme de ses gains à partir de t 0 (actualisée à t 0 ) G 2 à comparer avec celle que lui assurerait Σ, G = 1 + δ + + δ t + = 1 1 δ aucun intérêt à devier de Σ si 1 1 δ 2, c-à-d si δ 1 2. ; il n a donc Ce résultat pourrait être considéré comme une validation normative de la coopération dans le dilemme du prisonnier s il existe pas d autres équilibres parfaits dans le super-jeu ; malheureusement, il en existe de nombreux autres. Simulation du Tit-for-Tat 1 Robert Axelrod, dans son ouvrage The Evolution of Cooperation (1984), cherche à répondre à la question suivante : Under what conditions will cooperation emerge in a world of egoists without central authority? Pour tester la stabilité de cet équilibre, R. Axelrod demande à des collègues, qui ont étudié le dilemme du prisonnier dans leurs différentes disciplines (psychologie, biologie, économie, physique, mathématique, science politique, sociologie etc.), de proposer un programme, qu ils estiment susceptible de remporter le plus de points, pour jouer à un jeu du dilemme du prisonnier répété 200 fois. Chaque programme contient la stratégie d un joueur. Le jeu s apparente à un tournoi dans lequel chaque stratégie est confrontée à tous les autres, à lui-même et à un programme aléatoire jouant au hasard. Le programme vainqueur est celui totalisant le plus de points. Le premier tournoi impliquant 14 programmes donna le programme gagnantgagnant ou Tit for Tat d Anatol Rapoport vainqueur. R. Axelrod décide de renouveler 1. D après Wikipedia, http ://fr.wikipedia.org/wiki/théorie des jeux en relations internationales. 12

13 l expérience avec 62 programmes et de nouveau le programme gagnant-gagnant d A.Rapoport l emporte. Or la stratégie gagnant-gagnant ou Tit for Tat d A. Rapoport n emporte aucun match du tournoi! R. Axelrod (1984) (1) en déduit, que [le dilemme du prisonnier] est simplement une formulation abstraite de quelques situations très courantes et intéressantes dans lesquelles ce qui est le meilleur pour une personne individuellement conduit à une situation d échec mutuel tandis que chacune pourrait mieux s en tirer avec une coopération mutuelle. L interprétation de ces résultats qui impliquent la supériorité du comportement coopératif dans un environnement de dilemmes du prisonnier répétés a été sujette à de nombreuses discussions. Selon Eber (2004), les résultats d Axelrod montrent que, dans un monde de conflits permanents, il serait optimal de se comporter de la façon suivante : être a priori coopératif avec les autres (jouer [la stratégie de coopération (C)] lors du premier dilemme du prisonnier auquel on se trouve confronté), punir son partenaire lorsqu il n a pas coopéré (jouer [la stratégie de noncoopération (D)] chaque fois que le joueur à jouer D au tour précédent) pardonner et revenir à la coopération lorsque le partenaire se remet à coopérer (jouer C à chaque fois qu il a joué C le coup précédent). Cette philosophie politique, certes plaisante, est très débattue. Les conclusions auxquelles Axelrod aboutit sont en particulier liées à la simplification du modèle comparé à la situation réelle analysée. Référence : Milgrom P. R. (1984), Book review : Axelrod s The Evolution of Cooperation The Evolution of Cooperation. R. Axelrod Review author[s] : Paul R. Milgrom, The RAND Journal of Economics, Vol. 15, No. 2. (Summer, 1984), pp Applications Les champs d application de la Théorie des Jeux sont très variés par exemples : Défense, Relations Internationales la crise des missiles de Cuba en octobre 1962 : On peut la représenter par le jeu suivant : Kennedy \ Kroutchev retrait maintenir blocus naval Compromis (3, 3) V ictoire U RSS (2, 4) raid aérien V ictoire US (4, 2) Guerre Nucléaire ( 3, 3) A priori, personne ne veut la pire situation, mais il s agit de ne pas perdre la face. Cela s apparente à ce que les américains ont appelé le game of chicken, un jeu très à la mode dans les années 1950 (voir le film La fureur de vivre). Deux automobilistes roulent en sens inverse dans une rue étroite, le perdant qualifié de poule mouillée est celui qui donne un coup de volant pour éviter son concurrent. Ce jeu représente bien des situations de crise dans le domaine des relations internationales. Analyse par Steven Brams 2 : Needless to say, the strategy choices, probable outcomes, and associated payoffs shown in Figure 1 provide only a skeletal picture of the crisis as it developed over a period of thirteen days. Both sides considered more than the two alternatives listed, as well as several variations on each. The Soviets, for example, demanded withdrawal of American missiles from Turkey as a quid pro quo for withdrawal of their own missiles from Cuba, a demand publicly ignored by the United States. 2. http ://plus.maths.org/content/game-theory-and-cuban-missile-crisis 13

14 Nevertheless, most observers of this crisis believe that the two superpowers were on a collision course, which is actually the title of one book describing this nuclear confrontation. They also agree that neither side was eager to take any irreversible step, such as one of the drivers in Chicken might do by defiantly ripping off the steering wheel in full view of the other driver, thereby foreclosing the option of swerving. Although in one sense the United States won by getting the Soviets to withdraw their missiles, Premier Nikita Khrushchev of the Soviet Union at the same time extracted from President Kennedy a promise not to invade Cuba, which seems to indicate that the eventual outcome was a compromise of sorts. But this is not game theory s prediction for Chicken, because the strategies associated with compromise do not constitute a Nash equilibrium. les politiques de constitution de convois de bateaux en temps de guerre ; la façon de gérer un coup de surprise politique (Nasser à Suez, de Gaulle au Québec, Eltsine lors du putsch, annonces électorales...) ou marketing ; la lutte contre le terrorisme. Sociologie et génétique : des chercheurs ont utilisé la stratégie des jeux pour mieux comprendre l évolution du comportement des espèces face à la modification de leur environnement Marketing et stratégie entreprise Economie ; notamment les travaux de Jean Tirole en économie industrielle Les résultats peuvent être appliqués à des divertissements (comme le jeu télévisé Friend or Foe 3 sur une chaîne câblée spécialisée aux États-Unis, Game Show Network). Le Professeur Thomas Schelling, prix Nobel d économie 2005, s est spécialisé dans l explication des diverses stratégies utilisées (à utiliser) dans les conflits internationaux, tels la guerre froide et la guerre nucléaire (dissuasion..) Albert W. Tucker a par exemple diffusé de nombreuses interprétations du dilemme du prisonnier dans la vie courante. Des biologistes ont utilisé la théorie des jeux pour comprendre et prévoir les résultats de l évolution, en particulier la notion d équilibre évolutivement stable introduit par John Maynard Smith dans son essais La théorie des jeux et l évolution de la lutte (Game Theory and the Evolution of Fighting). Voir aussi son livre Evolution and the Theory of Games. Dans le domaine de la science politique appliquée à l environnement, on peut citer la tragédie des communs 4. Il faut noter cependant des critiques fortes adressées aux partisans de la théorie des jeux, parmi lesquels on peut citer celle de Bernard Guerrien objectant que les visions très abstraites de la théorie des jeux ont du mal à représenter adéquatement le réel, qu on ne sait pas s il y a des équilibres de Nash dans la Nature, ni si cette notion même d équilibre de Nash est la prédiction issue de la théories des jeux, le résultat du comportement rationnel des joueurs ou la solution du jeu (Cf. B. Guerrien, Can we espect anything from Game Theory, in E. Fullbrook (ed.), A Guide to What s wrong with Economics, Anthem Press, 2004,pp Le débat est loin d être clos. 3. http ://en.wikipedia.org/wiki/friend or Foe%3F 4. G. Hardin, The tragedy of the Commons, Science,

Simulation centrée individus

Simulation centrée individus Simulation centrée individus Théorie des jeux Bruno BEAUFILS Université de Lille Année 4/5 Ce document est mis à disposition selon les termes de la Licence Creative Commons Attribution - Partage dans les

Plus en détail

Jeux sous forme normale

Jeux sous forme normale CHAPITRE 4 Jeux sous forme normale Dans les problèmes de décision, nous avons relié les choix qui pouvaient être faits par un agent avec les utilités qu il pouvait en dériver. L idée qu un agent rationnel

Plus en détail

Jeux sous forme extensive (Jeux dynamiques)

Jeux sous forme extensive (Jeux dynamiques) (Jeux dynamiques) Plan du chapitre ( juillet 008) / éfinitions, exemples et équivalences Arbres de jeux, information et mémoire tratégies et réduction en forme normale Équilibre de Nash parfait en sous-jeux

Plus en détail

La théorie des jeux. Les jeux séquentiels. Les jeux simultanés. Les jeux répétés. Simon Porcher 1

La théorie des jeux. Les jeux séquentiels. Les jeux simultanés. Les jeux répétés. Simon Porcher 1 La théorie des jeux Les jeux séquentiels Les jeux simultanés Les jeux répétés 1 La théorie des jeux Les jeux séquentiels Les jeux simultanés Les jeux répétés 2 Les jeux séquentiels Théorie des jeux Opposition

Plus en détail

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

5) Extension : Équilibre de Cournot Nash en information incomplète. . 2 T y 2 2 ) B. > (a 2 ) H. k y

5) Extension : Équilibre de Cournot Nash en information incomplète. . 2 T y 2 2 ) B. > (a 2 ) H. k y 5) Extension : Équilibre de Cournot Nash en information incomplète Supposons désormais que la firme 2 connaît avec perfection la fonction de coût de la firme, mais que celle - ci en revanche est imparfaitement

Plus en détail

CHAPITRE 5. Stratégies Mixtes

CHAPITRE 5. Stratégies Mixtes CHAPITRE 5 Stratégies Mixtes Un des problèmes inhérents au concept d équilibre de Nash en stratégies pures est que pour certains jeux, de tels équilibres n existent pas. P.ex.le jeu de Pierre, Papier,

Plus en détail

THEORIE DES JEUX : Introduction. Fabien Prieur (UM1, INRA) Premier semestre L3, 5 septembre 2013

THEORIE DES JEUX : Introduction. Fabien Prieur (UM1, INRA) Premier semestre L3, 5 septembre 2013 THEORIE DES JEUX : Introduction Premier semestre L3, 5 septembre 2013 Propos liminaires Organisation du cours 20h de CM + 15h de TD CM : Séances de 2 heures le mercredi Evaluation (pondération) : Un contrôle

Plus en détail

THÉORIE DES JEUX : ÉQUILIBRES DE NASH

THÉORIE DES JEUX : ÉQUILIBRES DE NASH THÉORIE DES JEUX : ÉQUILIBRES DE NASH INDEX 1) INTRODUCTION 1.1)Définition d'un jeu 1.2)Historique et applications 2)LES JEUX MATRICIELS 2.1)Définition 2.2)Le Théorème fondamental 2.3)Principe de la preuve

Plus en détail

Introduction à la Théorie des Jeux p.1/77

Introduction à la Théorie des Jeux p.1/77 Introduction à la Théorie des Jeux Sébastien Konieczny konieczny@cril.univ-artois.fr CRIL-CNRS Université d Artois - Lens Introduction à la Théorie des Jeux p.1/77 Théorie des Jeux Définition La théorie

Plus en détail

chaque entreprise choisi un prix p. Le prix le plus bas attire les clients. Les entreprises maximisent leur profit q

chaque entreprise choisi un prix p. Le prix le plus bas attire les clients. Les entreprises maximisent leur profit q 5. e modèle de Bertrand En 1883, Joseph Bertrand a critiqué le modèle de Cournot en disant qu en pratique les firmes ne choisissent pas les quantités, mais les prix. Il propose le modèle alternatif: Etant

Plus en détail

A quoi sert la théorie des jeux? Introduction à la Théorie des Jeux p.4/75. Un peu d histoire... Théorie des Jeux

A quoi sert la théorie des jeux? Introduction à la Théorie des Jeux p.4/75. Un peu d histoire... Théorie des Jeux A quoi sert la théorie des jeux? Introduction à la Théorie des Jeux Sébastien Konieczny konieczny@cril.univ-artois.fr CRIL-CNRS Université d Artois - Lens Jeux de société (échecs, dames, go,...), Jeux

Plus en détail

Jeux-Langages-Logique Jeux extensifs, jeux stratégiques

Jeux-Langages-Logique Jeux extensifs, jeux stratégiques Université de Bordeaux Master Informatique, 2015/2016 Jeux extensifs, à information complète Jeux-Langages-Logique Jeux extensifs, jeux stratégiques Exercice 2.1 Th. de Von Neumann Soit un graphe orienté

Plus en détail

Appendice N Modèle de plan de travail de recherche

Appendice N Modèle de plan de travail de recherche 1 Appendice N Modèle de plan de travail de recherche Par Yannick Queau La théorie des régimes face aux difficultés de la coopération internationale : le cas du régime sur la biodiversité (titre provisoire)

Plus en détail

Exercices théoriques

Exercices théoriques École normale supérieure 2008-2009 Département d informatique Algorithmique et Programmation TD n 9 : Programmation Linéaire Avec Solutions Exercices théoriques Rappel : Dual d un programme linéaire cf.

Plus en détail

Théorie des Jeux Et ses Applications

Théorie des Jeux Et ses Applications Théorie des Jeux Et ses Applications De la Guerre Froide au Poker Clément Sire Laboratoire de Physique Théorique CNRS & Université Paul Sabatier www.lpt.ups-tlse.fr Quelques Définitions de la Théorie des

Plus en détail

Economie de l Incertain et des Incitations

Economie de l Incertain et des Incitations Economie de l Incertain et des Incitations CHAPITRE 2 Eléments de théorie des jeux en information symétrique et asymétrique Equilibres Bayesiens - Université de Tours - M1 AGE - Arnold Chassagnon - Automne

Plus en détail

StatEnAction 2009/10/30 11:26 page 111 #127 CHAPITRE 10. Machines à sous

StatEnAction 2009/10/30 11:26 page 111 #127 CHAPITRE 10. Machines à sous StatEnAction 2009/0/30 :26 page #27 CHAPITRE 0 Machines à sous Résumé. On étudie un problème lié aux jeux de hasard. Il concerne les machines à sous et est appelé problème de prédiction de bandits à deux

Plus en détail

avec des nombres entiers

avec des nombres entiers Calculer avec des nombres entiers Effectuez les calculs suivants.. + 9 + 9. Calculez. 9 9 Calculez le quotient et le rest. : : : : 0 :. : : 9 : : 9 0 : 0. 9 9 0 9. Calculez. 9 0 9. : : 0 : 9 : :. : : 0

Plus en détail

Reputation, Prix Limite et Prédation

Reputation, Prix Limite et Prédation Reputation, Prix Limite et Prédation Economie Industrielle Laurent Linnemer Thibaud Vergé Laboratoire d Economie Industrielle (CREST-INSEE) 13 et 20 janvier 2009 Linnemer - Vergé (CREST-LEI) Reputation,

Plus en détail

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0) CORRECTION D EXAMEN CONTROLE CONTINU n 1 Question de cours Question 1 : Les équilibres de Cournot et de Stackelberg sont des équilibres de situation de duopole sur un marché non coopératif d un bien homogène.

Plus en détail

Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini.

Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini. Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini. 1 Introduction Des actions comme lancer un dé, tirer une carte d un jeu, observer la durée de vie d une ampoule électrique, etc...sont

Plus en détail

Exercices : Probabilités

Exercices : Probabilités Exercices : Probabilités Partie : Probabilités Exercice Dans un univers, on donne deux événements et incompatibles tels que =0, et =0,7. Calculer,, et. Exercice Un dé (à faces) est truqué de la façon suivante

Plus en détail

Le raisonnement par récurrence

Le raisonnement par récurrence Le raisonnement par récurrence Nous notons N l ensemble des entiers naturels : N = {0,,, } Nous dirons naturel au lieu de entier naturel Le principe du raisonnement par récurrence Soit A une partie de

Plus en détail

Modèles et simulations informatiques des problèmes de coopération entre agents

Modèles et simulations informatiques des problèmes de coopération entre agents Modèles et simulations informatiques des problèmes de coopération entre agents Bruno Beaufils LIFL Axe CIM Équipe SMAC Laboratoire d'informatique Plan 1. Motivations 2. Dilemme itéré du prisonnier 3. Simulations

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Fonctions homographiques

Fonctions homographiques Fonctions homographiques On donne ci-dessous deux définitions des fonctions homographiques, et on montre que ces deux définitions sont équivalentes. On décrit la courbe représentative d une fonction homographique.

Plus en détail

Couplages et colorations d arêtes

Couplages et colorations d arêtes Couplages et colorations d arêtes Complément au chapitre 5 «Une employée mécontente» et au chapitre 9 «L apprentie sudokiste» Considérons n équipes de hockey qui doivent s affronter lors d un tournoi.

Plus en détail

Espace de probabilité, indépendance et probabilité conditionnelle

Espace de probabilité, indépendance et probabilité conditionnelle Chapter 2 Espace de probabilité, indépendance et probabilité conditionnelle Sommaire 2.1 Tribu et événements........................................... 15 2.2 Probabilité................................................

Plus en détail

le Rôle de l Information M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2012

le Rôle de l Information M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2012 6 le Rôle de l Information - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2012 Plan du cours 1. Probabilités subjectives 2. Arrivée symétrique de l information 3. Information asymétrique

Plus en détail

UNE GENERALISATION DU THEOREME DE REPONSE RAPIDE DE BASKAR AVEC UNE APPLICATION AU CHOIX DU NIVEAU DE CAPITALISATION DES FIRMES

UNE GENERALISATION DU THEOREME DE REPONSE RAPIDE DE BASKAR AVEC UNE APPLICATION AU CHOIX DU NIVEAU DE CAPITALISATION DES FIRMES UNE GENERALISATION DU THEOREME DE REPONSE RAPIDE DE BASKAR AVEC UNE APPLICATION AU CHOIX DU NIVEAU DE CAPITALISATION DES FIRMES Patrick GUY* Dans cet article, nous développons un modèle de duopole qui

Plus en détail

IAE Master 2 Gestion de Portefeuille Année 2011 2012. Feuille 3 Pricing et couverture Modèles discret

IAE Master 2 Gestion de Portefeuille Année 2011 2012. Feuille 3 Pricing et couverture Modèles discret Université de Paris Est Créteil Mathématiques financières IAE Master 2 Gestion de Portefeuille Année 2011 2012 1. Le problème des partis 1 Feuille 3 Pricing et couverture Modèles discret Le chevalier de

Plus en détail

b) Exprimer B à l aide des événements A n et en déduire la probabilité de B Exercice 1.4. Inégalité de Bonferroni.

b) Exprimer B à l aide des événements A n et en déduire la probabilité de B Exercice 1.4. Inégalité de Bonferroni. MP 205/6 Feuille d exercices - Probabilités généralités). Univers, généralités Exercice.. Langage des probabilités. Soit Ω, A) un espace probabilisable. Soit A n ) n N une famille d événements et A, B,

Plus en détail

1 Questionnaire à choix multiples

1 Questionnaire à choix multiples EXAMEN FINAL mercredi 19 janvier 2011, Durée h00 Pierre Fleckinger Une attention particulière doit être portée à la rédaction et à l explication des calculs faits. Utiliser un feuillet simple pour le QCM

Plus en détail

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2 Probabilités Table des matières I Petits rappels sur le vocabulaire des ensembles 2 I.1 s................................................... 2 I.2 Propriétés...................................................

Plus en détail

Recherche opérationnelle. Programmation linéaire et recherche opérationnelle. Programmation linéaire. Des problèmes de RO que vous savez résoudre

Recherche opérationnelle. Programmation linéaire et recherche opérationnelle. Programmation linéaire. Des problèmes de RO que vous savez résoudre Recherche opérationnelle Programmation linéaire et recherche opérationnelle Ioan Todinca Ioan.Todinca@univ-orleans.fr tél. 0 38 41 7 93 bureau : en bas à gauche Tentative de définition Ensemble de méthodes

Plus en détail

Algorithmique et Programmation Projets 2012/2013

Algorithmique et Programmation Projets 2012/2013 3 Dames 3. Objectif Il s agit d écrire un programme jouant aux Dames selon les règles. Le programme doit être le meilleur possible. Vous utiliserez pour cela l algorithme α β de recherche du meilleur coup

Plus en détail

La pratique des décisions dans les affaires

La pratique des décisions dans les affaires Association Française Edwards Deming Une philosophie de l action pour le XXIème siècle Conférence annuelle, Paris, 8 juin 1999 Jean-Marie Gogue, Président de l AFED La pratique des décisions dans les affaires

Plus en détail

L oligopole ESCP 2012 2103

L oligopole ESCP 2012 2103 Structures de marché L oligopole Anne Yvrande Billon ESCP 2012 2103 1 Plan du cours (1/2) 1. Introduction : qu est ce qu un oligopole? 2. L oligopole de Cournot 3. Le «paradoxe de Bertrand» 2 1. Introduction

Plus en détail

Introduction à l étude des Corps Finis

Introduction à l étude des Corps Finis Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur

Plus en détail

Cours 1: lois discrétes classiques en probabilités

Cours 1: lois discrétes classiques en probabilités Cours 1: lois discrétes classiques en probabilités Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module: Stat inférentielles Définition Quelques exemples loi d une v.a

Plus en détail

Erreurs les plus classiques en Bourse. TradMaker.com - 2013 Tous droits réservés Tel: 01 79 97 46 16 - CS@TRADMAKER.COM

Erreurs les plus classiques en Bourse. TradMaker.com - 2013 Tous droits réservés Tel: 01 79 97 46 16 - CS@TRADMAKER.COM 20 Erreurs les plus classiques en Bourse TradMaker.com - 2013 Tous droits réservés Tel: 01 79 97 46 16 - CS@TRADMAKER.COM De ne jours, la Bourse est à la portée de tous, le volume d échange et le nombre

Plus en détail

Chapitre 2 - choix efficace et non-efficace des

Chapitre 2 - choix efficace et non-efficace des Chapitre 2 - choix efficace et non-efficace des firmes Arnold Chassagnon Université Paris-Dauphine (LEDA-SDFi) DU1 - Université Paris-Dauphine, 2009-2010 1 Analyse positive - analyse normative 1 Objectif

Plus en détail

Terminale S-SI Probabilités conditionnelles

Terminale S-SI Probabilités conditionnelles robabilités conditionnelles Table des matières 1 Introduction 2 2 Définitions 2 3 Formule des probabilités totales 3 4 Indépendance et principe du produit 5 5 Exercices 5 1 1 Introduction Lorsque 7 élèves

Plus en détail

CAC, DAX ou DJ : lequel choisir?

CAC, DAX ou DJ : lequel choisir? CAC, DAX ou DJ : lequel choisir? 1. Pourquoi cette question Tout trader «travaillant 1» sur les indices s est, à un moment ou un autre, posé cette question : «je sais que la tendance est bien haussière

Plus en détail

PROBABILITÉS. I) Introduction, aperçu historique. Loi de probabilité

PROBABILITÉS. I) Introduction, aperçu historique. Loi de probabilité Table des matières PROBABILITÉS Résumé de cours I) Introduction, aperçu historique 1 II) Loi de probabilité 1 III)Probabilité d évènement 2 1. Le vocabulaire des probabilités................................

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire Variables aléatoires. Exemple 1. (Jeu d argent) Exemple 2. Loi de

Plus en détail

MODÉLISATION DES STRATÉGIES DES ACTEURS DU MARCHÉ DE L ASSURANCE DIRECTE

MODÉLISATION DES STRATÉGIES DES ACTEURS DU MARCHÉ DE L ASSURANCE DIRECTE MODÉLISATION DES STRATÉGIES DES ACTEURS DU MARCHÉ DE L ASSURANCE DIRECTE Thèse CIFRE en collaboration avec DIRECT ASSURANCE Claire Mouminoux Directeur de thèse: Stéphane Loisel Co-directeur: Christophe

Plus en détail

Nous concluons au travers de quatre axes principaux qui ont guidé la. 1) La théorie du regret de Loomes et Sugden comme théorie de la décision

Nous concluons au travers de quatre axes principaux qui ont guidé la. 1) La théorie du regret de Loomes et Sugden comme théorie de la décision Conclusion générale Nous concluons au travers de quatre axes principaux qui ont guidé la rédaction de cette thèse. 1) La théorie du regret de Loomes et Sugden comme théorie de la décision rationnelle compatible

Plus en détail

ORDRE DE RÉACTION : MÉTHODES DE

ORDRE DE RÉACTION : MÉTHODES DE ORDRE DE RÉACTION : MÉTHODES DE RÉSOLUTION Table des matières 1 Méthodes expérimentales 2 1.1 Position du problème..................................... 2 1.2 Dégénérescence de l ordre...................................

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Cours de Mathématiques Seconde. Généralités sur les fonctions

Cours de Mathématiques Seconde. Généralités sur les fonctions Cours de Mathématiques Seconde Frédéric Demoulin 1 Dernière révision : 16 avril 007 Document diffusé via le site www.bacamaths.net de Gilles Costantini 1 frederic.demoulin (chez) voila.fr gilles.costantini

Plus en détail

CONCLUSIONS. Par rapport aux résultats obtenus, on peut conclure les idées suivantes :

CONCLUSIONS. Par rapport aux résultats obtenus, on peut conclure les idées suivantes : CONCLUSIONS L application de la PNL à l entreprise est confrontée aux besoins des leaders d équipe, tels que: la gestion de son propre développement, du stress, la résolution des problèmes tels que les

Plus en détail

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan Exo7 Systèmes linéaires Vidéo partie 1. Introduction aux systèmes d'équations linéaires Vidéo partie 2. Théorie des systèmes linéaires Vidéo partie 3. Résolution par la méthode du pivot de Gauss 1. Introduction

Plus en détail

Intelligence Artificielle Jeux

Intelligence Artificielle Jeux Intelligence Artificielle Jeux Bruno Bouzy http://web.mi.parisdescartes.fr/~bouzy bruno.bouzy@parisdescartes.fr Licence 3 Informatique UFR Mathématiques et Informatique Université Paris Descartes Programmation

Plus en détail

Initiation aux probabilités.

Initiation aux probabilités. Initiation aux probabilités. On place dans une boite trois boules identiques à l exception de leur couleur : une boule est noire, une est blanche, la troisième est grise. On tire une des boules sans regarder,

Plus en détail

Canevas théoriques du projet sur le poker Partie A

Canevas théoriques du projet sur le poker Partie A Partie A Dans une partie de poker, particulièrement au Texas Hold em Limit, il est possible d effectuer certains calculs permettant de prendre la meilleure décision. Quelques-uns de ces calculs sont basés

Plus en détail

Doctorat en économique. Examen de synthèse en Théorie micro-économique 8 août 2011. Durée : 4 heures exactement

Doctorat en économique. Examen de synthèse en Théorie micro-économique 8 août 2011. Durée : 4 heures exactement Département d économie agroalimentaire et des sciences de la consommation Département d économique Université Laval NOM: Doctorat en économique Examen de synthèse en Théorie micro-économique 8 août 211

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

CONDITIONS NÉCESSAIRES ET DÉPENDANCE EXISTENTIELLE

CONDITIONS NÉCESSAIRES ET DÉPENDANCE EXISTENTIELLE CONDITIONS NÉCESSAIRES ET DÉPENDANCE EXISTENTIELLE Introduction Le concept de condition nécessaire est largement utilisé en philosophie, quelquefois explicitement pour définir d autres concepts importants.

Plus en détail

Correction de l épreuve intermédiaire de mai 2009.

Correction de l épreuve intermédiaire de mai 2009. Licence de Gestion. 3ème Année Année universitaire 8-9 Optimisation Appliquée C. Léonard Correction de l épreuve intermédiaire de mai 9. Exercice 1 Avec les notations du cours démontrer que la solution

Plus en détail

Théorie des jeux, Master AE2 et magistère 2, 1ère série d exercices, Solutions

Théorie des jeux, Master AE2 et magistère 2, 1ère série d exercices, Solutions Théorie des jeux, Master AE2 et magistère 2, 1ère série d exercices, Solutions December 9, 2013 Question 1 Démontrer heuristiquement les énoncés suivants: (1) S il existe une unique combinaison de stratégies

Plus en détail

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5.

Deuxième partie es jeux non-coopératifs avec information complète 3. É quilibre de Nash (1951) 4. D ynamique et rétroduction 5. Deuxième partie Les jeux non-coopératifs avec information complète 3. Équilibre de Nash (1951) 35 4. Dynamique et rétroduction 61 5. Jeux répétés 85 3. Équilibre de Nash (1951) John Nash a généralisé

Plus en détail

Assainissement de ponts rôle. dans la conservation des ponts

Assainissement de ponts rôle. dans la conservation des ponts Assainissement de ponts rôle des inspections et des interventions dans la conservation des ponts Cet exposé a pour objectif de rappeler, dans un moment de débat accru sur la durabilité et la pérennité

Plus en détail

AES 1 - Economie générale -

AES 1 - Economie générale - AES 1 - Economie générale - Chapitre 0 - Analyse des comportements modèles micro et macroéconomiques - AES L1 - Université de Tours, Arnold Chassagnon, Septembre 2012 PLAN DU COURS Introduction à l Analyse

Plus en détail

Incertain, Marché financier, M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2015

Incertain, Marché financier, M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2015 Incertain, Marché financier, - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2015 Plan du cours 1. Incertain, actifs financiers et marché financier 2. Les conditions d un marché sans arbitrage

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Licence de Sciences et Technologies. Fiche de cours 1 - Nombres réels.

Licence de Sciences et Technologies. Fiche de cours 1 - Nombres réels. Licence de Sciences et Technologies EM21 - Analyse Fiche de cours 1 - Nombres réels. On connaît les ensembles suivants, tous munis d une addition, d une multiplication, et d une relation d ordre compatibles

Plus en détail

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal III CHOIX OPTIMAL DU CONSOMMATEUR A - Propriétés et détermination du choix optimal La demande du consommateur sur la droite de budget Résolution graphique Règle (d or) pour déterminer la demande quand

Plus en détail

Définitions Approches managériales Approches psychologiques

Définitions Approches managériales Approches psychologiques Séminaire [CID] : Créativité, Innovation, Décision Partie B : DECISION Définitions Approches managériales Approches psychologiques www.evoreg.eu M2i : Management International de l Innovation Emmanuel

Plus en détail

PRIX DE VENTE À L EXPORTATION GESTION ET STRATÉGIES

PRIX DE VENTE À L EXPORTATION GESTION ET STRATÉGIES PRIX DE VENTE À L EXPORTATION GESTION ET STRATÉGIES Direction du développement des entreprises et des affaires Préparé par Jacques Villeneuve, c.a. Conseiller en gestion Publié par la Direction des communications

Plus en détail

III- Raisonnement par récurrence

III- Raisonnement par récurrence III- Raisonnement par récurrence Les raisonnements en mathématiques se font en général par une suite de déductions, du style : si alors, ou mieux encore si c est possible, par une suite d équivalences,

Plus en détail

KIT DE SURVIE EN RECHERCHE D EXTREMA LIÉS

KIT DE SURVIE EN RECHERCHE D EXTREMA LIÉS KIT DE SURVIE EN RECHERCHE D EXTREMA LIÉS Remarques préliminaires : Ce court document n a nullement la prétention de présenter la question de la recherche d extrema liés avec toute la rigueur qui lui serait

Plus en détail

BASES DU RAISONNEMENT

BASES DU RAISONNEMENT BASES DU RAISONNEMENT P. Pansu 10 septembre 2006 Rappel du programme officiel Logique, différents types de raisonnement. Ensembles, éléments. Fonctions et applications. Produit, puissances. Union, intersection,

Plus en détail

Cours de terminale S Suites numériques

Cours de terminale S Suites numériques Cours de terminale S Suites numériques V. B. et S. B. Lycée des EK 13 septembre 2014 Introduction Principe de récurrence Exemple En Mathématiques, un certain nombre de propriétés dépendent d un entier

Plus en détail

QUI VEUT JOUER AVEC MOI?

QUI VEUT JOUER AVEC MOI? QUI VEUT JOUER AVEC MOI? Michel Rigo (Université de Liège) http://www.discmath.ulg.ac.be/ JOUER SÉRIEUSEMENT, POURQUOI? Jeux coopératifs : marché boursier, économie, émergence de réseaux sociaux,... Mise

Plus en détail

Étapes du développement et de l utilisation d un modèle de simulation

Étapes du développement et de l utilisation d un modèle de simulation Étapes du développement et de l utilisation d un modèle de simulation Étapes du développement et de l utilisation d un modèle de simulation Formulation du problème Cueillette et analyse de données Conception

Plus en détail

Exercices sur le chapitre «Probabilités»

Exercices sur le chapitre «Probabilités» Arnaud de Saint Julien - MPSI Lycée La Merci 2014-2015 1 Pour démarrer Exercices sur le chapitre «Probabilités» Exercice 1 (Modélisation d un dé non cubique) On considère un parallélépipède rectangle de

Plus en détail

Supplément théorique Inférence dans les réseaux bayésiens. Rappel théorique. Les processus aléatoires. Les réseaux bayésiens

Supplément théorique Inférence dans les réseaux bayésiens. Rappel théorique. Les processus aléatoires. Les réseaux bayésiens DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2011 Supplément théorique Inférence dans les réseaux bayésiens Rappel théorique Les processus aléatoires La plupart des processus

Plus en détail

Cours de spécialité mathématiques en Terminale ES

Cours de spécialité mathématiques en Terminale ES Cours de spécialité mathématiques en Terminale ES O. Lader 2014/2015 Lycée Jean Vilar Spé math terminale ES 2014/2015 1 / 51 Systèmes linéaires Deux exemples de systèmes linéaires à deux équations et deux

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

Obligation : transfert dans le temps

Obligation : transfert dans le temps Obligation : transfert dans le temps Dans ce premier chapitre nous introduirons les principales notions concernant les obligations. Les principes élémentaires de la notion d arbitrage y sont décrits. Une

Plus en détail

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck) Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck) Stéphane Cardon Nathalie Chetcuti-Sperandio Fabien Delorme Sylvain agrue CRI - Université d Artois {cardon,chetcuti,delorme,lagrue}@cril.univ-artois.fr

Plus en détail

Algorithmes probabilistes. Références: Fundamentals of Algortihms de Gilles Brassard et Paul Bratley Note de cours de Pierre McKenzie

Algorithmes probabilistes. Références: Fundamentals of Algortihms de Gilles Brassard et Paul Bratley Note de cours de Pierre McKenzie Algorithmes probabilistes Références: Fundamentals of Algortihms de Gilles Brassard et Paul Bratley Note de cours de Pierre McKenzie Mise en contexte: Indices: Vous êtes à la recherche d un trésor légendaire

Plus en détail

LE GUIDE COMPLET PRETS A PARIER

LE GUIDE COMPLET PRETS A PARIER LE GUIDE COMPLET PRETS A PARIER Ce guide va vous proposer deux manières de profiter des jeux «Prêts à Parier» disponibles sur le site Promoturf. Ces pronostics sont le résultat d une amélioration majeure

Plus en détail

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales Transparents Philippe Lambert http : //www.statsoc.ulg.ac.be/quali.html Institut des Sciences Humaines et Sociales

Plus en détail

Machine de Turing. Informatique II Algorithmique 1

Machine de Turing. Informatique II Algorithmique 1 Machine de Turing Nous avons vu qu un programme peut être considéré comme la décomposition de la tâche à réaliser en une séquence d instructions élémentaires (manipulant des données élémentaires) compréhensibles

Plus en détail

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications Université Paris-Dauphine DUMI2E 1ère année, 2009-2010 Applications 1 Introduction Une fonction f (plus précisément, une fonction réelle d une variable réelle) est une règle qui associe à tout réel x au

Plus en détail

Apprendre la stratégie de l adversaire

Apprendre la stratégie de l adversaire M1 Master d informatique 28/29 Apprentissage à Partir d Exemples janvier 29 Apprendre la stratégie de l adversaire 1 But Soit un jeu à deux joueurs quelconque. Supposons que l un des deux joueurs suive

Plus en détail

L oligopole ESCP 2012 2103

L oligopole ESCP 2012 2103 Structures de marché L oligopole Anne Yvrande Billon ESCP 2012 2103 1 Plan du cours (2/2) 1. Introduction : qu est ce qu un oligopole? 2. L oligopole de Cournot 3. Le «paradoxe de Bertrand» 4. Le modèle

Plus en détail

Exercices : VAR discrètes

Exercices : VAR discrètes Exercices : VAR discrètes Exercice 1: Une urne contient 2 boules blanches et 4 boules noires. On tire les boules une à une sans les remettre jusqu à ce qu il ne reste que des boules d une seule couleur

Plus en détail

Master Modélisation Statistique M2 Finance - chapitre 3 Modèles financiers discrets

Master Modélisation Statistique M2 Finance - chapitre 3 Modèles financiers discrets Master Modélisation Statistique M2 Finance - chapitre 3 Modèles financiers discrets Clément Dombry, Laboratoire de Mathématiques de Besançon, Université de Franche-Comté. C.Dombry (Université de Franche-Comté)

Plus en détail

Chapitre II LES MONOPOLES NATURELS

Chapitre II LES MONOPOLES NATURELS Chapitre II LES MONOPOLES NATURELS 1) Rappels sur le monopole i) Hypothèses et notations Définition : Une entreprise est en position de monopole si elle est seule à fournir le marché d un bien pour lequel

Plus en détail

Introduction aux modèles financiers

Introduction aux modèles financiers Notes pour le module spécifique Introduction aux modèles financiers Ecole Centrale de Lyon Option Mathématiques 1 2 Introduction Quelques références Pour comprendre les marchés financiers, avoir un apreçu

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

La théorie des jeux et l hypothèse de rationalité

La théorie des jeux et l hypothèse de rationalité La théorie des jeux et l hypothèse de Michael Eisermann www-fourier.ujf-grenoble.fr/ eiserm 8 novembre 2007 ir Séminaire Mathématiques et Applications Dans la série «comment écrire une thèse en maths puis

Plus en détail