Jeux dynamiques en économie, compétition et coopération

Jeux dynamiques en économie, compétition et coopération Tristan Tomala, HEC Paris Séminaire In-Tech, INRIA Grenoble 30-06-2015

Outline 1 2 3

Concurrence parfaite Le modèle standard en économie est le marché de concurrence parfaite. Un bien homogène est vendu sur un marché ou les consommateurs sont agrégés en une fonction de demande D(p). Il y a un grand nombre n d entreprises identiques qui produisent le bien pour un coût c(q).

Concurrence parfaite Le modèle standard en économie est le marché de concurrence parfaite. Un bien homogène est vendu sur un marché ou les consommateurs sont agrégés en une fonction de demande D(p). Il y a un grand nombre n d entreprises identiques qui produisent le bien pour un coût c(q). Etant donné une quantité totale Q, le prix de marché est p tel que Q = D(p). Le bénéfice net d une entreprise est donc pq c(q). L optimum est de choisir q tel que p = c (q) (courbe d offre). L équilibre concurrentiel est (p, Q) tel que Q = D(p) (demande), Q = nq avec p = c (q) (offre).

Concurrence parfaite Le modèle standard en économie est le marché de concurrence parfaite. Un bien homogène est vendu sur un marché ou les consommateurs sont agrégés en une fonction de demande D(p). Il y a un grand nombre n d entreprises identiques qui produisent le bien pour un coût c(q). Etant donné une quantité totale Q, le prix de marché est p tel que Q = D(p). Le bénéfice net d une entreprise est donc pq c(q). L optimum est de choisir q tel que p = c (q) (courbe d offre). L équilibre concurrentiel est (p, Q) tel que Q = D(p) (demande), Q = nq avec p = c (q) (offre). Allocation efficace: maximise le surplus total (en fait le surplus des consommateurs).

Concurrence imparfaite L analyse précédente néglige la manipulation stratégique des prix. Le jeu de Bertrand considère les entreprises comme des joueurs qui choisissent leur prix de vente. On reprend les données précédentes avec c(q) = Cq.

Concurrence imparfaite L analyse précédente néglige la manipulation stratégique des prix. Le jeu de Bertrand considère les entreprises comme des joueurs qui choisissent leur prix de vente. On reprend les données précédentes avec c(q) = Cq. Chaque firme i affiche un prix p i. Le bien étant homogène, les mieux disants (p i = min j p j ) se partagent le marché et servent toute la demande. Les autres sont exclus.

Concurrence imparfaite L analyse précédente néglige la manipulation stratégique des prix. Le jeu de Bertrand considère les entreprises comme des joueurs qui choisissent leur prix de vente. On reprend les données précédentes avec c(q) = Cq. Chaque firme i affiche un prix p i. Le bien étant homogène, les mieux disants (p i = min j p j ) se partagent le marché et servent toute la demande. Les autres sont exclus. Paradoxe de Bertrand: Le seul équilibre de Nash est tel que p = C (prix = coût marginal) et réplique l équilibre concurrentiel (même avec n = 2).

Concurrence imparfaite L analyse précédente néglige la manipulation stratégique des prix. Le jeu de Bertrand considère les entreprises comme des joueurs qui choisissent leur prix de vente. On reprend les données précédentes avec c(q) = Cq. Chaque firme i affiche un prix p i. Le bien étant homogène, les mieux disants (p i = min j p j ) se partagent le marché et servent toute la demande. Les autres sont exclus. Paradoxe de Bertrand: Le seul équilibre de Nash est tel que p = C (prix = coût marginal) et réplique l équilibre concurrentiel (même avec n = 2). Guerre des prix!

Concurrence imparfaite L analyse précédente néglige la manipulation stratégique des prix. Le jeu de Bertrand considère les entreprises comme des joueurs qui choisissent leur prix de vente. On reprend les données précédentes avec c(q) = Cq. Chaque firme i affiche un prix p i. Le bien étant homogène, les mieux disants (p i = min j p j ) se partagent le marché et servent toute la demande. Les autres sont exclus. Paradoxe de Bertrand: Le seul équilibre de Nash est tel que p = C (prix = coût marginal) et réplique l équilibre concurrentiel (même avec n = 2). Guerre des prix! Sous-optimal du point de vue de firmes (collusion).

Concurrence imparfaite L analyse précédente néglige la manipulation stratégique des prix. Le jeu de Bertrand considère les entreprises comme des joueurs qui choisissent leur prix de vente. On reprend les données précédentes avec c(q) = Cq. Chaque firme i affiche un prix p i. Le bien étant homogène, les mieux disants (p i = min j p j ) se partagent le marché et servent toute la demande. Les autres sont exclus. Paradoxe de Bertrand: Le seul équilibre de Nash est tel que p = C (prix = coût marginal) et réplique l équilibre concurrentiel (même avec n = 2). Guerre des prix! Sous-optimal du point de vue de firmes (collusion). Efficace du point de vue des consommateurs.

Concurrence imparfaite L analyse précédente néglige la manipulation stratégique des prix. Le jeu de Bertrand considère les entreprises comme des joueurs qui choisissent leur prix de vente. On reprend les données précédentes avec c(q) = Cq. Chaque firme i affiche un prix p i. Le bien étant homogène, les mieux disants (p i = min j p j ) se partagent le marché et servent toute la demande. Les autres sont exclus. Paradoxe de Bertrand: Le seul équilibre de Nash est tel que p = C (prix = coût marginal) et réplique l équilibre concurrentiel (même avec n = 2). Guerre des prix! Sous-optimal du point de vue de firmes (collusion). Efficace du point de vue des consommateurs. (Abstraction faite de bien des aspects: sociaux, environnementaux,...)

Le Dilemme du prisonnier La même tension entre coopération et compétition se voit sur ce jeu. C D C (3,3) (0,4) D (4,0) (1,1)

Le Dilemme du prisonnier La même tension entre coopération et compétition se voit sur ce jeu. C D C (3,3) (0,4) D (4,0) (1,1) Deux concurrents peuvent faire de la collusion et partager le profit de monopole (C). Un des deux peut dévier en baissant le prix et servir tout le marché (D). Le seul équilibre est la guerre des prix.

Le Dilemme du prisonnier La même tension entre coopération et compétition se voit sur ce jeu. C D C (3,3) (0,4) D (4,0) (1,1) Deux concurrents peuvent faire de la collusion et partager le profit de monopole (C). Un des deux peut dévier en baissant le prix et servir tout le marché (D). Le seul équilibre est la guerre des prix. Autre situation: tragédie des communs. Il est couteux de fournir de l effort (C dominé par D) mais socialement bénéfique.

Outline 1 2 3

Le Folk Theorem Soit un jeu (I,A i,u i ) qui est répété indéfiniment avec observation parfaite. Le paiement d un joueur est t (1 δ)δ t 1 u i (a t ). On définit:

Le Folk Theorem Soit un jeu (I,A i,u i ) qui est répété indéfiniment avec observation parfaite. Le paiement d un joueur est t (1 δ)δ t 1 u i (a t ). On définit: L ensemble réalisable F = co u(a). Le niveau de rationalité individuelle v i = min x i max ai u i (a i,x i ). L ensemble individuellement rationel IR = {v R n : i N, v i v i }.

Le Folk Theorem Soit un jeu (I,A i,u i ) qui est répété indéfiniment avec observation parfaite. Le paiement d un joueur est t (1 δ)δ t 1 u i (a t ). On définit: L ensemble réalisable F = co u(a). Le niveau de rationalité individuelle v i = min x i max ai u i (a i,x i ). L ensemble individuellement rationel IR = {v R n : i N, v i v i }. 4 E 1 0 1 4

Le Folk Theorem On a le théorème suivant: Theorem (Aumann Shapley 76, Sorin 86, Fudenberg-Maskin 86) L ensemble des paiements d équilibre du jeu répété converge vers F IR quand δ 1.

Le Folk Theorem On a le théorème suivant: Theorem (Aumann Shapley 76, Sorin 86, Fudenberg-Maskin 86) L ensemble des paiements d équilibre du jeu répété converge vers F IR quand δ 1. Si F IR est d intérieur non-vide, on peut obtenir des équilibres sous-jeu parfaits (Fudenberg-Maskin).

Le Folk Theorem On a le théorème suivant: Theorem (Aumann Shapley 76, Sorin 86, Fudenberg-Maskin 86) L ensemble des paiements d équilibre du jeu répété converge vers F IR quand δ 1. Si F IR est d intérieur non-vide, on peut obtenir des équilibres sous-jeu parfaits (Fudenberg-Maskin). La construction d équilibre comporte: coopération, punitions, récompenses.

Le Folk Theorem Du point de vue de la théorie économique le message est mitigé.

Le Folk Theorem Du point de vue de la théorie économique le message est mitigé. Multiplicité d équilibres. Existence d équilibres coopératifs, de paiements d équilibres efficaces.

Le Folk Theorem Du point de vue de la théorie économique le message est mitigé. Multiplicité d équilibres. Existence d équilibres coopératifs, de paiements d équilibres efficaces. Permet d expliquer la coopération de long-terme (tragédie des communs),

Le Folk Theorem Du point de vue de la théorie économique le message est mitigé. Multiplicité d équilibres. Existence d équilibres coopératifs, de paiements d équilibres efficaces. Permet d expliquer la coopération de long-terme (tragédie des communs), mais aussi la collusion. Dans le jeu de Bertrand répété, l équilibre de collusion est au détriment des consommateurs (lois anti-trust, autorités de la concurrence).

Outline 1 2 3

Observation imparfaite Est-ce que restreindre l information ou la communication,

Observation imparfaite Est-ce que restreindre l information ou la communication, -empêche la coopération, -limite la collusion?

Observation imparfaite Est-ce que restreindre l information ou la communication, -empêche la coopération, -limite la collusion? Dans le modèle avec signaux, chaque joueur i observe un signal y i Q( a) qui dépend de façon imparfaite et bruitée des actions. Problème théorique: caractériser les paiement d équilibres. Déterminer quand la coopération est possible.

Possibilités de coopération Quand les paiements efficaces peuvent-ils être obtenus à l équilibre?

Possibilités de coopération Quand les paiements efficaces peuvent-ils être obtenus à l équilibre? Avec anonymous random matching (Kandori 1992).

Possibilités de coopération Quand les paiements efficaces peuvent-ils être obtenus à l équilibre? Avec anonymous random matching (Kandori 1992). Argument de contagion.

Possibilités de coopération Quand les paiements efficaces peuvent-ils être obtenus à l équilibre? Avec anonymous random matching (Kandori 1992). Argument de contagion. Si les signaux sont publics et révèlent statistiquement quand il y a une déviation et qui a dévié. (Fudenberg Levine Maskin 1994). Méthodes de programmation dynamiques.

Possibilités de coopération Quand les paiements efficaces peuvent-ils être obtenus à l équilibre? Avec anonymous random matching (Kandori 1992). Argument de contagion. Si les signaux sont publics et révèlent statistiquement quand il y a une déviation et qui a dévié. (Fudenberg Levine Maskin 1994). Méthodes de programmation dynamiques. Avec signaux presque parfaits (Horner Olszewski, 2006).

Possibilités de coopération Quand les paiements efficaces peuvent-ils être obtenus à l équilibre? Avec anonymous random matching (Kandori 1992). Argument de contagion. Si les signaux sont publics et révèlent statistiquement quand il y a une déviation et qui a dévié. (Fudenberg Levine Maskin 1994). Méthodes de programmation dynamiques. Avec signaux presque parfaits (Horner Olszewski, 2006). Obtenir des équilibres coopératifs sous-jeu parfaits dans ce cadre peut être techniquement difficile (Sugaya, 2015).

Caractérisations Dans le cas limite (δ = 1, limite des moyennes de Césaro), des résultats de caractérisations permettent de comprendre quand la coopération est, ou n est pas, possible.

Caractérisations Dans le cas limite (δ = 1, limite des moyennes de Césaro), des résultats de caractérisations permettent de comprendre quand la coopération est, ou n est pas, possible. On considère le jeu non-escompté avec médiateur (Lehrer 1992, Renault-Tomala 2004). Le médiateur peut servir à corréler (coordonner) les actions (Lehrer), ou de plus, à centraliser l information (Renault-Tomala).

Caractérisations Dans le cas limite (δ = 1, limite des moyennes de Césaro), des résultats de caractérisations permettent de comprendre quand la coopération est, ou n est pas, possible. On considère le jeu non-escompté avec médiateur (Lehrer 1992, Renault-Tomala 2004). Le médiateur peut servir à corréler (coordonner) les actions (Lehrer), ou de plus, à centraliser l information (Renault-Tomala). On obtient alors des propriétés qualitatives. A l équilibre, toute déviation profitable doit être détectable.

Caractérisations Dans le cas limite (δ = 1, limite des moyennes de Césaro), des résultats de caractérisations permettent de comprendre quand la coopération est, ou n est pas, possible. On considère le jeu non-escompté avec médiateur (Lehrer 1992, Renault-Tomala 2004). Le médiateur peut servir à corréler (coordonner) les actions (Lehrer), ou de plus, à centraliser l information (Renault-Tomala). On obtient alors des propriétés qualitatives. A l équilibre, toute déviation profitable doit être détectable. Exemple: la coopération n est pas possible dans le DP si un joueur n a pas d observation et que l autre a observation parfaite. (Si l observation est partielle, c est plus délicat.)

Observation parfaite des actions du joueur 1: C D C (3,3) (0,4) D (4,0) (1,1) C D C (*,C1) (*,C1) D (*,D1) (*,D1)

Observation parfaite des actions du joueur 1: C D C (3,3) (0,4) D (4,0) (1,1) C D C (*,C1) (*,C1) D (*,D1) (*,D1) Pas de coopération, même avec médiateur.

Observation parfaite des actions du joueur 1: C D C (3,3) (0,4) D (4,0) (1,1) C D C (*,C1) (*,C1) D (*,D1) (*,D1) Pas de coopération, même avec médiateur. Observation partielle des actions du joueur 1: C D C (3,3) (0,4) D (4,0) (1,1) C D C (*,C1) (*,D1) D (*,D1) (*,D1)

Observation parfaite des actions du joueur 1: C D C (3,3) (0,4) D (4,0) (1,1) C D C (*,C1) (*,C1) D (*,D1) (*,D1) Pas de coopération, même avec médiateur. Observation partielle des actions du joueur 1: C D C (3,3) (0,4) D (4,0) (1,1) C D C (*,C1) (*,D1) D (*,D1) (*,D1) Coopération possible avec médiateur.

Caractérisations Dans ce jeu, on observe seulement l action et le paiement du joueur 3. W S W (1,1,10) (1,4,0) S (4,1,0) (4,4,0) W S W (3,0,0) (3,0,0) S (3,0,0) (3,0,0) W S W (0,3,0) (0,3,0) S (0,3,0) (0,3,0)

Caractérisations Dans ce jeu, on observe seulement l action et le paiement du joueur 3. W S W (1,1,10) (1,4,0) S (4,1,0) (4,4,0) W S W (3,0,0) (3,0,0) S (3,0,0) (3,0,0) W S W (0,3,0) (0,3,0) S (0,3,0) (0,3,0) Une condition nécéssaire d équilibre est u 1 + u 2 3.

Caractérisations Dans ce jeu, on observe seulement l action et le paiement du joueur 3. W S W (1,1,10) (1,4,0) S (4,1,0) (4,4,0) W S W (3,0,0) (3,0,0) S (3,0,0) (3,0,0) W S W (0,3,0) (0,3,0) S (0,3,0) (0,3,0) Une condition nécéssaire d équilibre est u 1 + u 2 3. L orthant négatif sous un paiement d équilibre doit être approchable.

Autres perspectives Information incomplète sur les paiements (Hart 83, Shalev 94, Horner-Lovo 09, Tomala 13). Phénomènes de réputation (Mailath-Samuelson 06) Paramètres Markoviens (Horner et al. 11). Implémentation dynamique (Lee-Sabourian 11, Renou-Mezetti 13, Renou-Tomala 15).

MERCI DE VOTRE ATTENTION (source: Redouan Bshary, Univ. Neufchatel)