La théorie des jeux peut-elle rendre compte des formes de rationalité économique collective ou sociale?

Documents pareils

Les indices à surplus constant

Simulation centrée individus

LE CADRE COMMUN DE REFERENCE LA CONVERGENCE DES DROITS 3 e forum franco-allemand

Economie de l Incertain et des Incitations

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

Théorie des Jeux Et ses Applications

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

CHAPITRE 5. Stratégies Mixtes

Nathalie Bulle (1998), Compte-rendu de Rainer Hegselmann, Ulrich Mueller, Klaus G. Troitzsch (eds.).- Modelling and simulation in the social sciences

Le management des risques de l entreprise Cadre de Référence. Synthèse

LES PROBLEMES D ASYMETRIE D INFORMATION AU SEIN DE L ENTREPRISE

Assurance maladie publique et «Opting out» - Réflexions théoriques

FONDEMENTS ÉPISTÉMIQUES DE CONCEPTS D ÉQUILIBRE EN THÉORIE DES JEUX

LES CONDITIONS D ACCÈS AUX SERVICES BANCAIRES DES MÉNAGES VIVANT SOUS LE SEUIL DE PAUVRETÉ

Jeux sous forme extensive (Jeux dynamiques)

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

QUATRE ÉLÉMENTS À NE PAS SOUS-ESTIMER DANS LE CONTEXTE D UNE TRANSMISSION D ENTREPRISE

Chapitre 2/ La fonction de consommation et la fonction d épargne

Avis n sur la méthodologie relative aux comptes combinés METHODOLOGIE RELATIVE AUX COMPTES COMBINES

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Le coloriage virtuel multiple et ses applications

Problématique / Problématiser / Problématisation / Problème

Introduction à la Théorie des Jeux p.1/77

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal

Chapitre 1 : Notions. Partie 9 - Rente viagère. Qu est-ce q u u n e «r e n t e v i a g è r e»?

La microéconomie est-elle utile?

NORME INTERNATIONALE D AUDIT 330 REPONSES DE L AUDITEUR AUX RISQUES EVALUES

Efficience des marchés et finance comportementale

Projet de Loi no 98 Loi modifiant la Loi sur l assurance médicament et d autres dispositions législatives

Université de Lorraine Licence AES LIVRET DE STAGE LICENCE

Réduire la pauvreté : comment les collectivités territoriales peuvent-elles être des catalyseurs du développement économique pro-pauvre?

MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ DES CONSEILS DE DÉVELOPPEMENT FONDÉS

I. Une nouvelle loi anti-discrimination

La délégation de pouvoirs

PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?

Le scoring est-il la nouvelle révolution du microcrédit?

Les contrats : leur origine et leur type. M1 - Arnold Chassagnon, Université de Tours, PSE - Hiver 2013

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Le parcours professionnel des chômeurs de longue durée en Suisse

quelles sont les spécificités du système de gouvernance des PME - PMI?

PRIME D UNE OPTION D ACHAT OU DE VENTE

Groupe Eyrolles, 2006, ISBN :

Direction des Ressources Humaines 14/10/04 CLASSIFICATION DU GROUPE CREDIT COOPERATIF

Pascal Engel. Si l une des marques de l époque moderne a été le désenchantement. vis à vis des valeurs, et en particulier vis à vis des valeurs de la

LES HABILETÉS POLITIQUES ET LE LEADERSHIP EN ÉDUCATION

Info-assurance Séance d information de l IASB du 19 mars 2015

Tirer parti des renseignements sur les clients : leçons tirées des réalisations en matière de services bancaires au consommateur

Guide de la pratique sur les réserves aux traités 2011

ANNEXE A LA CIRCULAIRE SUR LE CONTROLE INTERNE ET L AUDIT INTERNE TABLE DES MATIERES

INTRANET: Pédagogie générale

Systèmes de transport public guidés urbains de personnes

Chapitre 5. Équilibre concurrentiel et bien-être

Chapitre 2 LE CAS PRATIQUE

Qu est-ce qu une problématique?

sentée e et soutenue publiquement pour le Doctorat de l Universitl

Tableau synoptique du chapitre 5

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

T : F : info@cms-bfl.com Neuilly-sur-Seine, le 14 décembre 2011

Loïc Blondiaux Le Nouvel Esprit de la démocratie Actualité de la démocratie participative Le Seuil, coll. «La République des Idées», 2008

Méthode universitaire du commentaire de texte

Sylvie Guessab Professeur à Supélec et responsable pédagogique du Mastère Spécialisé en Soutien Logistique Intégré des Systèmes Complexes

CHAPITRE 4. APPLICATION DE LA NOTION D ETABLISSEMENT STABLE

Ressources APIE. La comptabilisation des frais de R&D. de l immatériel. Pour agir. En bref. Agence du patrimoine immatériel de l État

Intérêt pour les personnes Club social. 5.5 Compromis Laisser-faire. Intérêt pour la tâche. Travail équipe.

MAÎTRISE DES ACHATS D INVESTISSEMENTS

10 REPÈRES «PLUS DE MAÎTRES QUE DE CLASSES» JUIN 2013 POUR LA MISE EN ŒUVRE DU DISPOSITIF

«L impact de l interculturel sur la négociation» construire des intérêts matériels ou des enjeux quantifiables

Rémunération des Professionnels du Capital Investissement Lignes Directrices

L oligopole ESCP

Exemple d utilisation des outils MicroSave-Africa au Brésil

UN DISPOSITIF DE FORMATION PARENTALE DANS UN MUSEE

Chapitre 1 : Introduction au contrôle de gestion. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 1

Les Français et les nuisances sonores. Ifop pour Ministère de l Ecologie, du Développement Durable et de l Energie

Norme ISA 330, Réponses de l auditeur à l évaluation des risques

Concevoir et déployer un data warehouse

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Politique de gestion des risques

Modèles et simulations informatiques des problèmes de coopération entre agents

Avis légal. I 2 FISCALLIANCE 2011 L Incorporation des Courtiers Immobiliers du Québec

«LES PRINCIPES ET OUTILS ESSENTIELS DU CONTRÔLE DE GESTION»

RAPPORT DE 2010 SUR L ATTRIBUTION DE BÉNÉFICES AUX ÉTABLISSEMENTS STABLES

MANAGER POUR LA PREMIÈRE FOIS

Formation à la systémique pour consultants et personnels RH

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Introduction au datamining

A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti

COMMENTAIRE. Services économiques TD

L ACQUISITION DU LANGAGE CHEZ LE TOUT PETIT EN VIE COLLECTIVE INSTITUTIONNELLE

Présentation du Système d Administration Générale des Projets (Agape )

Une stratégie d enseignement de la pensée critique

Partenaires: w w w. c o g m a s t e r. n e t

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

L art de la reconnaissance en gestion

LE CONTENU DES MODALITÉS DE SERVICE

L externalisation des activités bancaires en France et en Europe

ATELIER DROIT DES CONTRATS, DE LA CONSOMMATION ET DU COMMERCE ELECTRONIQUE

La création d une agence autonome présenterait les avantages et inconvénients suivants, recensés à travers l étude:

Transcription:

La théorie des jeux peut-elle rendre compte des formes de rationalité économique collective ou sociale? Richard Arena * Lauren Larrouy XIVème Colloque de l Association Charles Gide pour l Etude le Pensée Economique Université de Nice Sophia-Antipolis, 7-9 Juin 2012 L un des problèmes principaux auxquels sont confrontées les sciences et la philosophie sociales est celui de comprendre comment s articulent les croyances, les intentions, les décisions et les actions des agents. Ce problème prend une dimension particulière dès que cette articulation n est pas envisagée seulement du point de vue de l agent isolé (comme c est le cas au sein de ce que les micro-économistes appellent la théorie de la décision) mais dans le cadre de ses interactions sociales. Dans ce contexte, les représentations auxquelles on recourt usuellement se heurtent à des obstacles persistants. Les approches économiques privilégiant une démarche strictement individualiste des agents caractérisent le résultat de certaines de ces interactions les comportements des groupes, des équipes ou des organisations comme l agrégation des engagements individuels, ignorent les conséquences inattendues d actions volontaires et sous-estiment les problèmes complexes de la coordination inter-individuelle. C est évidemment le cas au sein de la théorie de l équilibre économique général dans laquelle la figure de la concurrence pure et parfaite conduit à retenir un ensemble de marché anonymes et interdit a priori toute forme d interaction stratégique des agents. C est aussi le cas dans le cadre de la version standard de la théorie des jeux où l hypothèse de non coopération et l adoption d une forme de rationalité fondée sur l intérêt propre au sens strict (ce que Peter et Schmid, s inspirant de A. Sen, caractérisent par le terme * Université de Nice Sophia-Antipolis, GREDEG/CNRS et ISHSN Université de Nice Sophia-Antipolis, ISEM

de «narrow self-interest» in Peter et Schmid, 2007 : 4) conduisent généralement à conclure que, sous certaines conditions usuelles, les comportements a priori non coopératifs engendrent a posteriori la domination de l absence de coopération entre agents De leur côté, les approches retenant une perspective holiste se fondent sur l existence supposée a priori d entités collectives absorbant les individus qui les composent et les interactions qui les créent et ne laissent pas de véritable place au rôle joué par les motivations des agents dans l explication de la signification de l action collective. Pour le dire autrement, les démarches holistes n expliquent pas la coopération puisqu elles la considèrent généralement comme un présupposé analytique. Ces obstacles désormais familiers sont particulièrement gênants lorsque l on se rend compte que les comportements les plus répandus en économie sont précisément ceux qui sous-tendent le fonctionnement des marchés, des organisations ou des réseaux, c est-à-dire ceux qui supposent l existence d interactions sociales effectives de type divers. Toutefois, de nos jours, la situation s avère plus complexe que ce qui vient d être rappelé. La théorie des jeux s est beaucoup transformée depuis le début de son utilisation en analyse économique dans les années 1950 et ses développements ne la cantonnent plus au cas d une rationalité fondée sur l intérêt propre au sens strict. En clair, l approche de type individualiste aujourd hui prédominante en analyse économique, incarnée, pour l essentiel, par les applications de la théorie des jeux s est enrichie et mérite d être examinée du double point de vue de son évolution historique et des formes de rationalité qu elle a induites. Plus précisément, notre objectif dans cette contribution est de faire porter l attention sur une question particulière mais transversale des réflexions relatives à la prise en compte des interactions sociales par la théorie économique : les avancées de la théorie de jeux permettent aujourd hui d utiliser les concepts d intentionnalité et de rationalité collectives (respectivement, en langue anglaise, collective intentionality et We-rationality ) tels qu ils ont été introduits dans les dernières décennies en philosophie analytique (notamment Gilbert, 1989 et 1996 ; Tuomela, 1995 ; Searle, 1995 et 2001) et en philosophie économique (notamment Sen, 1977, 2002 et 2007 ; Bacharach, 1997, 1999, 2001 et 2006 ; Sugden, 1993, 2000, 2005 et 2007). Pour ce faire, nous distinguerons les avancées des applications de la théorie des jeux en économie en tenant compte à la fois de l histoire de son évolution conceptuelle pendant le deuxième vingtième siècle et de sa diversité méthodologique. 2

1. La version standard de la théorie des jeux et la notion de rationalité collective Le recours de la théorie des jeux dans l analyse des comportements économiques décentralisés offre une représentation du monde très particulière fondée avant tout sur la prise en compte des seules interactions stratégiques, sur une certaine conception de l individu et de sa rationalité et sur une appréhension spécifique du concept d équilibre. 1.1. La prise en compte des seules interactions stratégiques A la différence de la théorie de la décision et de la théorie de l équilibre économique général, la théorie des jeux y compris celle qui se situe en dehors des hypothèses de sa version standard se limite à rendre compte d une forme très particulière d interaction sociale et exclut a priori toutes les autres. En situation d interaction stratégique, l individu mu par les choix rationnels qu il est conduit à opérer doit former des croyances sur les comportements ou stratégies des autres joueurs afin de maximiser son utilité espérée. Dans ce contexte, on suppose que les préférences sont strictement distinctes des croyances des individus et des moyens employés par eux pour atteindre une issue optimale du jeu. L utilité d une action ne dépend donc que des conséquences de celle-ci, indépendamment des croyances, intentions et autres phénomènes psychologiques. Pour mieux caractériser la notion d interaction stratégique, il convient de définir ce qu est la structure informationnelle d un joueur. Celle-ci peut être appréhendée à partir d une fonction d information ou «partition d information» servant elle-même de support à la modélisation de la fonction de connaissance du joueur. La partition d information ne doit pas seulement être une description exhaustive de l ensemble des états du monde et des évènements en ces états du monde, de la structure du jeu, des stratégies possibles des joueurs en ces états du monde et de leurs conséquences, des gains relatifs à la combinaison des différentes stratégies ; mais avant tout, elle doit décrire les croyances de chaque joueur. Ce dernier point est central pour la maximisation de l utilité espérée. Car, en situation d interaction stratégique, ses croyances sur le choix des autres influencent son propre choix de stratégie; mais également, en fonction de celles-ci, il influence le comportement et les croyances des autres joueurs et ainsi de suite Comme nous pouvons le constater, c est une structure informationnelle extrêmement forte qui est imposée dans le cadre d un jeu ; elle implique que les croyances sur les comportements des autres joueurs, c est-à-dire, leurs stratégies soient définies a priori, 3

sans expérience du jeu ; en d autres termes, avant même que l information sur l état du monde ne soit révélée. C est ce que l on appelle un fondement divinatoire (Ménager et Tercieux, 2006 : 82) ; les joueurs sont capables d utiliser au mieux l information dont ils disposent pour former des croyances vraies sur les stratégies d autrui, afin d y répondre de manière optimale du point de vue de l utilité espérée. La fonction d information partitionnelle n est cependant qu un simple support à la définition de la fonction de connaissance, qui elle-même, va permettre de formaliser un concept central dans la version standard de la théorie des jeux: la connaissance commune (Ménager, 2006 : 41). La fonction de connaissance doit néanmoins remplir un certain nombre de conditions. Si elle vérifie les axiomes de conscience, d omniscience, de vérité et d introspection (ibid. : 44); alors, on peut définir une structure de connaissance commune informationnelle. Ce modèle de connaissance commune représente l union des partitions d information de tous les joueurs et implique donc que «tous les joueurs savent l évènement, tous les joueurs savent que les joueurs savent cet évènement, tous les joueurs savent que les joueurs savent que les joueurs savent l évènement.» ad infinitum. On comprend ainsi aisément pourquoi cette représentation a pu être qualifiée de «modèle épistémique fort», par Bacharach (1985) notamment. Ces remarques permettent de mettre en évidence la double spécificité de la forme d interaction sociale retenue par la théorie des jeux et ses applications à l économie. D un côté, cette forme ne suppose pas une véritable mise en relation des agents autour d un objectif, d un artefact ou d une entreprise communes. Ainsi la seule motivation des agents reste l intérêt propre au sens strict et n admet aucune intentionnalité ou rationalité collective. D ailleurs, les agents d un jeu non coopératif ne sont pas supposés se rencontrer mais ils se contentent de former des croyances sur les comportements effectifs de l autre. Cette conception est d ailleurs au cœur même du processus d émergence de la théorie des jeux en économie, c est-à-dire explicite dans l ouvrage de 1944 de J. Von Neumann et O. Morgenstern. La conception de l interaction stratégique qu introduisent ces deux auteurs le montre bien. Elle est en effet fondée sur la notion de minimax, c est-à-dire sur une vision qui suppose l indépendance absolue du calcul de chaque agent impliquée dans le jeu. Dans ce contexte, une action est en effet dite rationnelle si elle permet de minimiser la perte maximale possible ou, pour le dire autrement, de maximiser le gain minimal qu un joueur peut obtenir et ce, quel que puisse être le comportement de l autre joueur. Ainsi, l interdépendance stratégique est en réalité fondée sur l idée que les décisions des joueurs sont indépendantes de leurs actions stratégiques. On connaît les deux origines de cette étrange conception de 4

l interaction stratégique. La première est la réitération par nos deux auteurs de la vieille idée de Pareto selon laquelle l analyse microéconomique doit en permanence se garder de toute référence à ou de toute utilisation de la psychologie. La seconde est l importance que leur ouvrage attribue au cas des jeux à somme nulle. En second lieu, toutes les formes d interaction sociale effectives (et non pas stratégiques) qui exercent une influence sur les actions économiques ne sont pas prises en considération par la théorie des jeux. Ainsi, des formes telles que l influence sociale, l engagement (c est-à-dire le «committment» au sens de Sen, 1977), la confiance dans une institution, la reconnaissance ou les processus imitatifs par exemple sont absentes de la version standard de la théorie des jeux. La raison de ce choix est probablement liée là aussi à la volonté d éviter toute référence à la psychologie et à la sociologie. Ainsi, sont exclues de l analyse les interactions sociales qui résultent soit de l application de règles ou de normes, du respect des institutions ou encore de ce que Wieser appelait le «pouvoir social» ou les «forces de la contrainte» (cf Arena, ). 1.2. La conception de l individu Comme on a pu le noter, au sein de la version standard de la théorie des jeux, seul l individu est reconnu comme unité d analyse de la théorie. Il est isolé à l intérieur de paramètres le définissant et agit indépendamment de son environnement. Les choix du joueur sont conformes à ce que préconisent une rationalité instrumentale et une rationalité cognitive parfaites. A cet effet, il est doté de préférences exogènes représentées par une fonction d utilité. Il a pour seul objectif de choisir la stratégie compte tenu de la structure du jeu qui maximisera sa fonction d utilité. Précisons que dans le cadre d un jeu, la matrice des paiements est associée à des «utils» ; en d autres termes, chaque issue du jeu ou chaque paiement peut être représenté par cette fonction d utilité. Il existe une hypothèse implicite en théorie des jeux selon laquelle le contexte n influence pas la décision d un joueur ; plus précisément, la structure du jeu n influence en aucun cas ses motivations. Cette hypothèse est particulièrement importante car elle exclut à elle seule une évolution contextuelle des règles du jeu. Par ailleurs, comme l a noté Sen, l attribution à l agent d une rationalité économique fondée sur l intérêt propre au sens strict suppose la réalisation simultanée de trois conditions : le «bien-être auto-centré» («self-centered welfare), l «objectif centré sur son bien-être propre» («self-centered goal») et le «choix centré sur son objectif propre» («self-goal 5

choice») (Sen, in Peter et Schmid (eds.), 2007 : 18). Dès lors, on peut qualifier le joueur d égoïste dans la vision la plus restrictive ceci impliquant que seule sa propre consommation de biens matériels appréhendée par les préférences gouverne son comportement. L énoncé de cette forme très auto-centrée suffit à montrer comment la seule manière de poser la question de l existence de formes collectives ou sociales au sein de la version standard de la théorie des jeux consiste à se demander sous quelles conditions deux agents peuvent être conduits a posteriori à coopérer. La réponse à cette interrogation est bien connue et il n est pas nécessaire d y revenir ici, ni de souligner les problèmes qu elle pose si on la compare aux résultats constants de l économie expérimentale. Elle montre surtout l incapacité de la version standard de la théorie des jeux à bâtir une approche satisfaisante des interactions sociales et/ou collectives. 1.3. Une appréhension spécifique du concept d équilibre Pour qu un équilibre si possible unique et pareto-optimal puisse être obtenu dans un jeu, l hypothèse de connaissance commune déjà évoquée est utile mais elle n est pas suffisante. Une deuxième hypothèse souvent sous-estimée, la connaissance commune de la rationalité, s avère nécessaire. Ce postulat impose que tous les joueurs possèdent la même rationalité, que tous savent que tous possèdent la même rationalité et ainsi de suite ad infinitum. De cette propriété découle ce que l on appelle l alignement des croyances. Si chacun des joueurs possède la même information et la même rationalité, il ne peut se former de croyances divergentes. Or, l hypothèse d alignement des croyances permet aux anticipations des agents d être auto réalisatrices et, de ce fait, sous-tend une convergence vers l équilibre de Nash équilibre central en théorie des jeux correspondant à la meilleure réponse d un joueur face à la meilleure réponse de l autre. En effet, le théorème d Aumann (1976) (explicitement, Aumann formalise la notion de connaissance commune à partir des travaux de Harsanyi(1967)) stipule qu en présence de croyances a priori communes et d une même information, les croyances a posteriori sont identiques. Cela induit alors l impossibilité d être d accord sur un désaccord, et l atteinte de l équilibre. En même temps, l analyse à l équilibre s impose comme un axiome. Par conséquent, une fois l ensemble des équilibres déterminé, seuls les comportements cohérents avec l atteinte de l équilibre sont analysés et acceptés. Ainsi, quelque soit le processus d atteinte de l équilibre, seule l analyse de ce dernier est mise en avant. C est ce que l on appelle un processus éductif ; il permet, en partant de l équilibre, de 6

connaitre les actions des joueurs. Si les hypothèses de connaissance commune et d alignement des croyances sont nécessaires, elles sont cependant loin d être suffisantes. On sait que, malgré ces hypothèses, certains jeux restent malgré tout inexplicables : il s agit principalement des dilemmes sociaux et des jeux de coordination pour lesquels la solution d équilibre peut ne pas être pareto-optimale (dilemme du prisonnier, par exemple), être multiple (jeu de coordination de type head and tails, par exemple) ou indéterminée (jeu de coordination de type Hi-Lo, par exemple, malgré l existence d une solution paretooptimale). 2. Une version élargie de la théorie des jeux? Nous avons supposé jusque là que les comportements individuels étaient dictés par l égoïsme. Or, cela impose une vision très restrictive de la rationalité. Beaucoup de théoriciens des jeux et de micro économistes, ont signalé que la théorie du choix rationnel avait, pendant longtemps, à tort, assimilé le programme de maximisation à la poursuite de préférences égoïstes. Le simple fait d admettre que les préférences sont le reflet de comportements dictés par l intérêt personnel comme la théorie le spécifie pourrait rendre compte des déviances constatées. Une des manières d y parvenir réside dans l étude et la formalisation du caractère rationnel des comportements réciproques à travers les préférences ; l autre étant la prise en compte des croyances dans la fonction d utilité. En d autres termes, les anticipations interviennent dans le programme de maximisation, et, modifient les paiements. Ce que l on qualifie de préférences duales ou «other regarding preferences» correspond à une structure formelle de préférences qui rend compte de la réciprocité des agents c'est-àdire que les joueurs tiennent désormais compte des autres et de leur bien être, dans leur programme de maximisation. Ainsi, Sobel définit-il la réciprocité comme «la tendance à répondre de manière altruiste à quelqu un qui s est comporté de manière altruiste et avec méchanceté à quelqu un qui s est mal comporté». Il existe plusieurs types de réciprocité et, en particulier la réciprocité instrumentale et la réciprocité intrinsèque (selon la terminologie utilisée par Sobel (2005)). Et, à l intérieur de ces deux conceptions existent plusieurs types de modèles. Toutefois, d autres classifications des modèles existent. Par exemple, Fehr et Fischbacher différencient les modèles de réciprocité forte équivalents à ceux de Rabin, de Levine et les modèles d aversion pour l inéquité de Fehr et Schmidt, et Bolton et Ockenfels. Nous retiendrons cependant ici celle de Sobel. 7

2.1. Réciprocité instrumentale et préférences interdépendantes Dans le cas de la réciprocité instrumentale, les agents ne possèdent pas de qualité intrinsèque à réciproquer. Cependant, dans certains contextes, en vertu de leur programme de maximisation, ils peuvent avoir intérêt à le faire ; les individus ne réciproquent que dans l optique d atteindre une solution optimale compte tenu de leur système de préférences. Les préférences dépendent alors des gains des autres ; les joueurs ne tiennent donc plus simplement compte de leurs propres gains matériels. La forme générique de la fonction d utilité, traduisant les préférences interdépendantes, représente une somme de deux «sous fonctions d utilité». Les différents modèles expliquant cette forme de réciprocité se distinguent, par la manière dont les joueurs prennent en compte les gains des autres, ainsi que par le poids relatif accordé à ceux-ci dans la fonction d utilité. Nous allons détailler, successivement un certain nombre d entre eux. Ainsi, en 1999, Fehr et Schmidt modélisent-ils l altruisme à travers l aversion pour l iniquité ; en d autres termes, les joueurs sont prêts à donner une partie de leur paiement pour arriver à un résultat plus équitable. Dans leur modèle, les individus ne sont concernés que par leur aversion pour l iniquité et non par celle des autres, ils n attachent d importance qu à l altruisme de leur paiement en comparaison à ceux des autres (Fehr et Schmid, 1999 : 819). Nos deux auteurs mettent en évidence que l aversion pour l iniquité peut justifier à la fois la coopération dans certaines circonstances, comme la non coopération dans d autres. Ils révèlent qu en présence d agents hétérogènes, le contexte de l expérience n est plus anodin. C est la présence d agents adverses à l iniquité dans la population des joueurs qui permettra d orienter le résultat final (ibidem). Même si ces auteurs admettent l importance des intentions ils ne modélisent pas leur rôle explicitement ; ils ne veulent pas se départir du cadre standard de la théorie des jeux pour tomber dans les jeux psychologiques, beaucoup plus complexes à formaliser (ibid. : 820). L aversion à l iniquité des joueurs se traduit formellement dans la fonction d utilité comme suit : { } { } n correspond au nombre de joueurs, { } à la mesure de la perte d utilité du joueur i lorsque son paiement est inférieur à celui de j qui équivaut à et, 8

{ } est la perte consécutive à un paiement du joueur j inférieur au sien. Il est également supposé que ce qui signifie que la perte d utilité du joueur i sera supérieure dans le cas ou c est son gain qui est inférieur à celui de j. De ce modèle, on peut déduire qu il est rationnel pour un joueur : (i) dans un «jeu de l ultimatum», de refuser des montants proposés en dessous de ceux équivalents à la moitié de la somme à partager, ou pour le recevant de rejeter des offres en dessous de ce même montant ; tous deux obtiennent une utilité plus grande lorsque que dans les autres situations de partage ; ou alors, (ii) de contribuer au financement d un bien public. De même, l équilibre de coopération mutuelle dans un «dilemme du prisonnier» est justifiable. Cela dépend néanmoins des valeurs des paramètres.toutefois, dans le cadre de jeu où la compétition prévaut, l altruisme ne peut être une stratégie dominante. Dans certaines conditions seulement, l altruisme conduit à la coopération ; par exemple, dans le cas de jeux asymétriques, la propension à coopérer est plus faible. Il semble que leur modèle permette d expliquer et de justifier les déviances de comportement par rapport à la conception standard de la rationalité ; et ceci dans une grande majorité de jeux ; le «dilemme du prisonnier», le «jeu de l ultimatum», le «jeu du dictateur», et le «jeu des biens publics». Malgré un certain nombre d avancées, les auteurs admettent l existence d une limite majeure à leur modèle : l analyse des stratégies des joueurs à l équilibre ; (ibid. : 851). Ainsi, le processus d atteinte de l équilibre via une tendance à l altruisme ne peut être appréhendé. Par ailleurs, une critique rapportée par Kirman et Teschl (2010 : 311) de Binmore et Shaked stipule que la portée explicative de leur modèle est limitée ; ils soulignent le fait que leur modèle ne permet de justifier que quelques situations spécifiques. Bolton et Ockenfels en 2000 ont construit un modèle nommé ERC «A theory of equity, reciprocity, and competition» dans lequel la fonction d utilité est appelée «fonction de motivation» ; ce modèle caractérise une aversion pour l inégalité de la part des joueurs. La «fonction de motivation» v i est telle que: { 9

où n est le nombre de joueur, y i le paiement du jouer i, y j celui du joueur j (j i) et c la somme des gains des joueurs qui ne sont pas i ; i correspondant à la prise en compte de la somme des gains des autres joueurs dans la «fonction de motivation» de i. Cette fonction v i traduit le fait que les joueurs sont motivés à la fois par leurs propres gains à l issue du jeu, mais également par leurs gains relatifs c'est-à-dire le montant qu ils remportent en comparaison avec la somme totale gagnée par les autres joueurs du jeu. Ils maximisent une fonction d utilité espérée qui correspond à un arbitrage entre leur intérêt propre correspondant à un gain matériel le plus élevé possible et le gain des autres. Cela se traduit par ce qu ils qualifient d «effet de comparaison» (terminologie employé par Bolton et Ockenfels). Cette «fonction de motivation» est croissante, en fonction du gain matériel propre du joueur, mais également en fonction de son gain relatif ; ceci, jusqu à ce que le gain propre du joueur corresponde à la somme équivalente au partage égal des gains entre tous les joueurs. Précisons toutefois qu un joueur préfère avoir plus pour lui-même que moins, pour des montants de gains relatifs équivalents (Bolton et Ockenfels, 2000 : 171). Dans leur conception de la réciprocité instrumentale, tous les agents sont hétérogènes ; aucun n arbitre de la même manière entre égoïsme et partage. L influence de cet «effet de comparaison» dans la fonction d utilité n est donc pas le même pour tous (ibid. : 172). Leur modèle et la structure de la fonction d utilité telle qu ils la définissent sont cohérents avec les résultats déviants obtenus lors d expériences sur le jeu de l ultimatum» et le «jeu du dictateur». Il explique également l atteinte d équilibres Pareto supérieurs à l équilibre de Nash dans le dilemme du prisonnier dans le cas où la probabilité de la coopération de l autre joueur est suffisamment élevée (explicitement, cela dépend de la distribution des préférences des joueurs, en fonction de l arbitrage entre le poids accordé à leurs gains propres et à leurs gains relatifs) (ibid. : 182). Le modèle de Levine, présenté en 1998, se distingue des deux modèles précédents ; il symbolise une avancée qui réside dans la prise en compte de facteurs psychologiques. Il se veut être dans la lignée des travaux de Rabin relatifs aux jeux dits psychologiques mais s en distingue par le fait qu il ne veut pas abandonner les hypothèses de la version standard de la théorie des jeux (Levine, 1998 : 594). Néanmoins, le comportement des joueurs dépend également de ce qu ils ressentent quant à la manière dont les autres agents les traitent. Ainsi le poids que les joueurs accordent aux paiements des autres dépend de leur coefficient d altruisme ou de méchanceté et de ce qu ils pensent de la valeur de ce même coefficient chez les autres. Précisons que dans sa conception de l altruisme, Levine admet que tous les agents 10

sont hétérogènes (ibid. : 595) ; il existe plusieurs types de joueurs et l utilité d un joueur dépend de ce type mais également du type de l autre joueur. Par exemple, un poids plus important est donné à de l argent reçu venant d un joueur estimé altruiste et inversement. Les préférences altruistes sont de la forme: La fonction d utilité d un joueur i est une fonction d utilité «ajustée» correspondant à la somme de l utilité directe liée à sa propre consommation et l utilité liée à la consommation des autres joueurs j. Dans le cas ou le joueur est considéré comme altruiste, et inversement si ; enfin, si alors le joueur n est intéressé que par sa propre consommation. Quant au paramètre, il est interprété comme signifiant un comportement altruiste mais cette fois en regard du comportement de l autre ; en d autres termes, un joueur sera plus altruiste envers un autre joueur qui lui manifeste également de l altruisme. C est le reflet d une forme de réciprocité. Il semble opportun de préciser ici que la conceptualisation qu offre Levine reste une analyse à l équilibre ; elle ne permet de rendre compte que des résultats finaux des interactions et non du processus d atteinte de l équilibre (c est une limite que Levine reconnait lui-même (1998 : 599)). Charness et Rabin établissent, eux, en 2002, un modèle de préférences qu ils qualifient de «préférences sociales». C est un modèle dans lequel les préférences sociales sont présentes à travers la valeur des paramètres définissant la fonction d utilité ; elles peuvent rendre compte de nombreux comportements, mais avant tout de la recherche du bien-être social. Formellement, dans un jeu à deux joueurs, la fonction d utilité correspond à la somme pondérée du gain monétaire du joueur et de celui de l autre. La manière dont un joueur accorde de l importance au gain de l autre dépend de, si celui-ci est supérieur au sien ou inférieur, et dans quelle mesure la différence est importante. Donc la propension d un individu à sacrifier une partie de son gain matériel dépend du poids de cette différence. Elle est définie de la manière suivante: ( ) { 11

Les paramètres p, se réfèrent aux paiements alors que est lié à la réciprocité ; et, r et s indiquent le poids accordé aux paiement de l autre joueur en comparaison au sien. Pour certaines valeurs des paramètres dits de «préférences distributionnelles» (Charness et Rabin, 2002 : 823) r, s, q leur modélisation peut rendre compte de comportements égoïstes pour lesquels le joueur préfère avoir le plus possible au détriment de l autre, mais également d une aversion pour la différence. Ils mettent en évidence que les joueurs ne sont pas indifférents à la distribution des revenus parmi les autres joueurs. Les préférences sociales montrent que les individus sont prêts à sacrifier une partie de leurs gains pour aider les plus démunis. Contrairement à la conception de Bolton et Ockenfels, ce n est donc pas la moyenne des paiements des autres joueurs qui est prise en compte pour orienter les comportements, mais la distribution de ces mêmes paiements. Pour ces auteurs et en tenant compte également de leurs résultats expérimentaux, ce qui explique principalement les comportements est une tendance psychologique que possèdent les joueurs à réciproquer ; d où un élargissement de leur modèle à la réciprocité. Les comportements réciproques jouent donc un rôle plus important que les comportements non réciproques ; ils doivent être combinés avec des préférences orientées vers le bien être social. La prise en compte du rôle de la réciprocité correspond à une avancée sensible dans la prise en compte d une forme sociale ou collective de rationalité. Ainsi, les joueurs sont prêts à sacrifier une partie de leurs gains en fonction du comportement estimé et anticipé des autres joueurs. Un joueur sera par exemple prêt à sacrifier une partie de ses gains pour punir celui qui se comporte mal et inversement, s il a manifesté de la bonté, il réciproquera et sera prêt à faire des sacrifices pour augmenter les gains de ce joueur. Cependant, la réciprocité négative joue un rôle plus important que la réciprocité positive, selon nos auteurs (ibid. : 846,850). Plus un joueur sent que l autre sera mesquin, plus il aura la volonté de le blesser ; or, le degré d animosité du joueur varie en fonction du montant de la perte encourue par la méchanceté de l autre. Enfin, contrairement à tous les autres modèles évoqués, une sévère limite de celui-ci réside dans la non prise en compte de l hétérogénéité des joueurs (les auteurs le reconnaissent d ailleurs). Tous ces modèles permettent de justifier les comportements de coopération, de coordination ; les comportements déviants dans le «jeu du dictateur» ou le «jeu de l ultimatum» ou encore, la contribution au financement de biens publics. Mais ceci n est pas toujours vrai : encore une fois, les résultats dépendent des valeurs prises par les paramètres dans les 12

différents modèles considérés. Ils mettent en évidence que le contexte compte, et que les agents ne sont plus indifférenciés. Selon le type de joueur identifié dans le jeu, l issue ne sera pas la même ; la présence d un certain nombre de joueurs altruistes, change les prédictions économiques. Tout ceci constitue une avancée majeure par comparaison avec la version standard de la théorie des jeux dans laquelle: (i) l agent est entièrement indépendant de son environnement, (ii) il effectue son calcul de maximisation isolément, sans aucune considération pour autrui. Pour Fehr et Schmid, cette étape est suffisante «aucune autre déviation de l approche économique standard n est nécessaire pour rendre compte de ce qui est évident» («no other deviations from the standard economic approach are necessary to account for the evidence») (Fehr et Schmid, 1999 : 818 et 819). On ne peut cependant suivre le point de vue de Fehr et Schmid. Dans les jeux précédents, on conserve d abord une bonne partie de la version standard dans laquelle l intérêt propre des agents prime. Les agents ne prennent en compte les autres joueurs que parce que leurs préférences leur dictent, dans leur propre intérêt, de ne pas les négliger. Il ne s agit pas pour eux de mettre sur pied un projet ou une activité effective partagée avec d autres agents mais simplement de prendre en compte une forme de sympathie pour d autres agents. En outre, toutes les déviances ne peuvent être justifiées ; ce sont, majoritairement, les comportements rencontrés lors de «jeux du dictateur» ou de «jeux de l ultimatum» qui font l objet d une analyse systématique, en ayant parfois recours à des jeux non simultanés. D autre part, pour Sobel (2005 : 406), on notera que la réciprocité instrumentale n est qu un cas particulier de la réciprocité intrinsèque. Par ailleurs, la version élargie fondée sur la réciprocité instrumentale se donne des préférences altruistes comme la version standard se donnait des préférences égoïstes; on a ainsi l impression que la référence à une forme collective et sociale de la rationalité ne fonctionne que pour une catégorie donnée a priori de la population et non pour une autre ; l altruisme n est jamais le résultat d un apprentissage interactif mais une caractéristique exogène, inexpliquée et quasi génétique. Enfin, les derniers modèles présentés semblent constituer un pas intéressant, mais un pas parmi beaucoup d autres sur le chemin qui conduit à l approche des jeux psychologiques. 2.2. Réciprocité intrinsèque et processus d atteinte de l équilibre Dans ce cadre d étude, plus que les préférences interdépendantes, c est le processus d atteinte de l équilibre et la structure du jeu qui importent. Intégrer des facteurs psychologiques dans 13

les décisions des agents économiques pour dépasser les formes usuelles de rationalité économique revient à accorder de l importance aux processus décisionnels en tant que tels. Les préférences, envers la matrice du jeu, dépendent désormais, de la manière dont est joué le jeu. Par exemple, l éventualité de rajouter une troisième stratégie dans un jeu à deux joueurs et deux stratégies entrainerait un autre équilibre. C est donc la perception du jeu par le joueur qui oriente son choix et non un système prédéfini de préférences. Comme le stipulent Falk, Fehr et Fischbacher, des modèles d équité basés uniquement sur les préférences interdépendantes, et seulement du point de vue matériels sont insuffisants ; le rôle des intentions et croyances est primordial, il compte autant dans la réciprocité négative que positive. Le modèle emblématique théorisant la réciprocité intrinsèque est celui de Rabin en 1993. Son modèle n est plus tout à fait concevable dans le cadre standard car l utilité d un joueur dépend désormais des croyances de premier et de second ordre qu il formule à propos d un ou plusieurs autres agents. Rabin définit les croyances des joueurs à partir des paiements ; elles ne sont donc pas incorporées dans ces mêmes paiements, comme dans le cas des jeux psychologiques, traditionnellement définis par Geanakoplos, Pearce et Stacchetti. Son modèle peut ainsi être inclus dans les versions élargies de la théorie des jeux. L objectif de Rabin est d intégrer la réciprocité négative les joueurs sacrifient leur gains pour blesser l autre tout comme la réciprocité positive ils font des sacrifices pour contribuer à améliorer leur bien-être. Pour lui, c est une manière d introduire les émotions dans la théorie des jeux ; émotions qui ont un impact non négligeable dans les décisions économiques (Rabin, 1993 : 1281) et plus particulièrement en cas d interactions stratégiques. Rabin développe le concept de «fairness equilibrium» traduisant la prise en compte de l altruisme dans la fonction d utilité des joueurs. Cet équilibre peut à la fois être un sous ensemble des équilibres de Nash comme un ensemble distinct de ceux-ci. Enfin, il peut correspondre à une issue du jeu pour laquelle, les joueurs maximisent mutuellement leurs gains (cas d un mutual-max outcome ) ou inversement, les minimisent mutuellement (cas d un mutual-min outcome ). La fonction d utilité d un joueur est définie par : ( ) ( ) ( ) [ ( )] Explicitement : correspond à la stratégie choisie par l agent i, les croyances de l agent i à propos de la stratégie que choisira j et les croyances de l agent i à propos des croyances de j sur la stratégie qu il choisira. ( ) correspond à la «fonction de gentillesse» de i et ( ) représente ce que i croit de la manière dont va se comporter j, à savoir s il pense 14

qu il fera ou non preuve de bonté (c est donc l estimation par i de la «fonction de gentillesse» de j). Ces deux dernières fonctions tiennent compte des différentes stratégies possibles des joueurs, du gain de chaque stratégie à l équilibre, du gain maximal et minimal de chaque joueur et de la différence entre ces deux gains en comparaison à un paiement équitable : précisons que la notion d équité dans le modèle de Rabin ne sera pas jugée par rapport à une comparaison interpersonnelle des gains mais une comparaison entre le gain maximal et minimal que peut obtenir un même joueur ; ainsi le gain équitable d un joueur correspond à la moyenne de son gain minimal et maximal. Par exemple, si le joueur i essaye de faire en sorte que j ait un paiement équitable alors ; si i fait en sorte que j ait moins que le paiement équitable et enfin, si j recevra un montant supérieur au paiement équitable. Si le joueur i pense que le joueur j se comportera mal envers lui, dans ce cas, il estime que, alors, il le traitera mal en retour en choisissant une stratégie entrainant une valeur de négative ; et inversement dans le cas ou i anticipe. Tout comme dans le cadre des préférences interdépendantes, Falk, Fehr et Fischbacher pensent que le modèle de Rabin est insuffisant ; il est exclusivement basé sur les intentions comme justificatifs des comportements réciproques. Or, selon ces auteurs, un modèle doit pouvoir combiner à la fois l importance accordée aux gains matériels, d une part, et d autre part, aux intentions elles-mêmes ; c est la combinaison des deux qui permet d attribuer de réelles capacités de prédictions à un modèle, et non la prédominance d une explication au détriment de l autre. Les modèles basés sur l altruisme que nous venons de recenser sont également considérés comme insuffisamment convaincants par Sugden (1993); ce dernier estime impossible une appréhension satisfaisante de la coopération à l intérieur de ce cadre théorique. De plus, selon lui, concevoir l altruisme à travers la seule rationalité économique ne peut que conduire à des résultats contre-intuitifs. Cette conception instrumentaliste de l altruisme suppose, par exemple, que les dons d une personne dans le financement d un bien public sont substituables ; en d autres termes, si une personne diminue son financement, les autres sont supposés devoir l augmenter ; or, en réalité il n en est rien (Sugden 1993). 2.3. «Other regarding motives» et jeux psychologiques Le modèle de Rabin évoqué à l instant est très proche du concept de jeu psychologique, dans le sens où il intègre les anticipations et croyances formées par les joueurs à l égard des autres 15

joueurs ; cependant, il ne les incorpore pas dans la fonction de paiement des joueurs. On a ainsi affaire à une version «améliorée» du cadre de préférences duales. Les paiements dépendent donc des croyances que les joueurs forment sur les stratégies éventuellement choisies par les autres ; ce ne sont plus uniquement des paiements matériels mais des paiements psychologiques, qui sont inscrits dans la matrice des paiements; il y a alors transformation de la signification de la matrice, en conséquence de cet ajout. En revanche, pour qu il y ait modification, les chiffres définis dans la matrice doivent être des paiements monétaires et non des «utils» contrairement à ce qui est supposé de manière générale dans la version standard des applications économiques de la théorie des jeux. Ainsi, le paiement du joueur dépendra désormais de la hiérarchie de ses croyances. Il s agit d un classement des croyances qui s effectue à partir de «ce que le joueur pense qu il se passera, de ce qu il pense que l autre pense qu il se passera, de ce qu il pense que l autre pense que les autres pensent» ad infinitum (Geanakoplos et al., 1989 : 61). Comme dans le cadre standard, dans les jeux psychologiques, il y a connaissance commune de la stratégie d équilibre ; ce qui implique qu un profil unique de stratégie engendre les croyances de tous les joueurs et à tous les niveaux. De plus, il y a connaissance commune que tous les joueurs sont rationnels. De ce fait, il y a cohérence entre les croyances des joueurs à tous les niveaux ; et cette cohérence est connaissance commune. Supposer l alignement des croyances est extrêmement important pour résoudre le jeu car, dans le cadre des jeux psychologiques, les croyances sont endogènes elles ne correspondent pas à une distribution préétablie ex ante. L équilibre est alors défini comme un équilibre de Nash psychologique : les croyances sont supposées être conformes à une réalité, partagée par tous (ibid. : 65), et s il existe une stratégie d équilibre, tous supposent que les autres s y conformeront, tous supposent que tous supposent que tous s y conformeront ad infinitum. Geanakopolos, Pearce et Stacchetti en déduisent la structure de la fonction d utilité suivante: Soit le joueur correspond au profil de stratégies à l équilibre, à ses croyances, est la distribution de probabilité à propos des issues du jeu caractérisée en fonction du profil de stratégie, et correspond à l issue du jeu (en cas de jeux sous forme extensive cela correspond à l équilibre atteint au nœud final). Précisons que appartient à l ensemble des croyances «collectivement cohérent» (ibidem) noté. 16

Ainsi, l équilibre de Nash psychologique correspond à une paire de croyances et de stratégies ( ) tel que, pour tout joueur i, et ( ) ( ). En d autres termes il équivaut à la stratégie qui maximise l utilité de i compte tenu de la stratégie des autres joueurs et des croyances de i. Il n existe donc qu une seule différence avec la version usuelle de l équilibre de Nash : la prise en compte des croyances du joueur. L atout principal de cette formalisation est que la matrice des paiements est modifiée de telle sorte que, dans un «dilemme du prisonnier» ou dans un jeu de type «Stag Hunt», l équilibre Pareto dominant est un équilibre de Nash psychologique. S il y a connaissance commune que chacun des joueurs croient que le profil de coopération est choisi dans un «dilemme du prisonnier», que les croyances sont mutuellement cohérentes et correspondent à la réalité en sachant que choisir de coopérer maximise l utilité de chaque joueurs dans ce cadre là, alors, il est rationnel que l équilibre d un «dilemme du prisonnier» psychologique corresponde à la double coopération. Toutefois, ce résultat dépend des croyances quant au choix des stratégies d autrui c'est-à-dire, explicitement, de la valeur que les agents accordent à la distribution de probabilité des stratégies de l autre ou des autres joueurs. Dans un certain nombre de cas, les jeux psychologiques ne résolvent donc pas le problème habituel de l indétermination. Ils mettent en évidence toutefois qu il ne s agit pas là d un problème intrinsèque au type de rationalité retenu mais au rôle central attribué aux préférences. En effet, si l on prenait en compte la hiérarchie de croyances que forment les joueurs au sein de la fonction d utilité, on sortirait du cadre usuel de la version standard de la théorie des jeux et de sa manière de définir la rationalité. Toutefois, les préférences étant liées aux croyances c est finalement un problème d indétermination des croyances qui est à l origine de cette impasse (Hargreaves Heap et Varoufakis, 2004). La théorie des jeux psychologiques continue cependant à rencontrer des limites dont certaines nous sont désormais familières : (i) dans la mesure où les croyances exercent une influence sur les paiements, elles doivent être connues avant le jeu ; cette nécessité semble être curieuse puisque, dans le même temps, il est stipulé que les croyances ne peuvent être ordonnées selon une distribution préétablie ex ante, mais s avèrent endogènes au jeu (ii) les hypothèses héroïques usuelles imposées aux joueurs, telles que l alignement des croyances ou la connaissance commune prévalent toujours et démontrent que l approche des jeux psychologiques demeure relativement proche de la version standard. 17

2.4. Remarques conclusives Pour conclure, même si l on admet que les différents modèles de réciprocité ont changé l analyse de la notion de coopération, pour autant, ils n aboutissent pas à la conclusion selon laquelle les équilibres coopératifs ou de coordination seraient systématiques ; ainsi, la double coopération n apparaît que dans certains des cas correspondant à un «dilemme du prisonnier» ou un équilibre de type (H,H) dans le jeu du «Hi-Lo», que ce soit dans les analyses de Bolton et Ockenfels, Fehr et Schmid, Charness et Rabin ou encore dans le modèle de réciprocité intrinsèque de Rabin dans lequel la double défection est un équilibre. Pourtant, du fait de leur Pareto supériorité ils devraient être les seules issues rationnelles du jeu. Comment est-il alors possible d étendre la prédominance de ces équilibres à toutes les situations de jeu possibles? En réalité, dans le cadre de l hypothèse de préférences interdépendantes, la nature de l interaction stratégique et la conception de l individu et de sa rationalité n ont pas fondamentalement changé. De nouveaux arguments ont simplement été introduits dans la fonction d utilité. Les préférences restent exogènes et définies a priori comme cela était le cas dans la version standard des applications économiques de la théorie des jeux. On peut tout à fait imaginer un ensemble d arguments induisant des comportements spécifiques, susceptibles d être inclus dans les préférences. Dès lors que ces arguments rentrent dans le programme de maximisation des joueurs, des comportements considérés comme irrationnels dans le cadre standard deviennent alors rationnels. Un problème apparait : comment restreindre le nombre d arguments intégrable dans les préférences ; en effet, n importe quel type de rationalité comportementale peut alors être justifié dès lors que des arguments supplémentaires sont pris en compte par le programme de maximisation du joueur. Ainsi, même des comportements qui paraissent a priori contre-intuitifs peuvent devenir rationnels. De plus, de nombreux modèles de préférences duales font appel à des jeux non simultanés. Intuitivement, on peut penser qu il est raisonnable d atteindre la meilleure issue possible lorsqu on est mu par la rationalité instrumentale, avec une connaissance commune du jeu et de la rationalité de chacun. Il ne semble pas nécessaire de faire appel à des jeux en information incomplète, ou des jeux bayésiens ou sous forme extensive. Il ne semble pas non plus nécessaire, comme le stipule Rabin, de faire appel à l intervention d émotions dans la prise de décision ; ce qui sous entend que les individus ne sont pas parfaitement rationnels. Comme le notent Kirman et Teschl (2010b : 305), «les préférences tournées vers les autres 18

[ ] sont clairement compatibles avec les versions standard en économie («other regarding preferences [ ] this is clearly consistent with standard procedure in economics»). On ne saurait donc être surpris de retrouver les mêmes critiques que celles qui prévalent à l encontre de la version standard. 3. Peut-on échapper à la version standard de la théorie des jeux? Deux tentatives originales ont essayé de dépasser au moins partiellement les limites des versions standard et élargie de la théorie des jeux. Il s agit des travaux de Sugden (1993) et Bacharach. 3.1. L approche de Sugden L approche de Sugden est la première que nous rencontrons dans laquelle l intérêt de l agent individuel ne coïncide pas avec celui de son groupe d appartenance. Comment cette distinction a-t-elle été rendue possible par cet auteur? Deux éléments essentiels l ont permis. Le premier consiste dans l introduction des raisons communes de croire. Sugden définit ces raisons à partir des règles de la logique formelle. Ce en quoi une personne a raison de croire dépend alors de ces standards de raisonnement que le modélisateur impose ainsi comme efficients et justes. En plus d être des raisons de croire logiques, dans le cadre d interactions stratégiques propres à la théorie des jeux, elles doivent être communes à un groupe d individus. Elles sont communes si chaque individu les endosse et reconnait que chacun les endosse. Pour être plus précis, les raisons communes de croire doivent obéir à des propriétés telles que la conscience, l autorité et la connaissance commune. Si ces propriétés sont respectées, les raisons communes de croire permettent de faire des prédictions sur ce que l agent va ou devrait choisir. Elles expliquent également qu un joueur endosse telle ou telle règle d inférence ou qu il ait raison de croire en telle ou telle proposition. Le problème demeure cependant qu un joueur ne regarde que ses raisons à lui ; or, le fait est que dans un cadre d interactions stratégiques, les solutions aux problèmes concernent tous les joueurs. C est pourquoi des phénomènes d indétermination et d apparente irrationalité des prédictions demeurent. Si la logique d analyse est inversée ; si les joueurs d un jeu sont considérés comme un ensemble, un groupe jouant à l unisson, le problème peut être résolu. Il y a simplement un déplacement d unité d analyse de l individuel au collectif et, de ce fait, un glissement de l orientation du raisonnement du joueur qui ne prend plus, désormais, de décisions liées à son propre intérêt, sans considération d autrui. A partir de là, chaque membre 19

du groupe agit dans l intérêt du groupe et accomplit sa part dans les objectifs qui sont ceux du groupe, en suivant une sorte de plan directeur fictif ou non. Le mode de raisonnement implicite correspond à ce que Sugden appelle le «team maximising». C est une règle d inférence, et par extension de raisonnement pratique que tout le monde peut endosser unilatéralement, en tant que membre d un groupe. A la suite de ce schéma de raisonnement, on peut alors considérer que deux individus, voire plusieurs autant qu il y a des joueurs peuvent rationnellement coopérer ou, par extension, se coordonner ; simplement par l acte de se reconnaitre comme membre d un groupe et par la connaissance commune de la rationalité et de la structure du jeu. Les raisons rationnelles de coopérer existent donc mais seulement si l on conçoit les groupes comme unité d analyse de la théorie des jeux. Une question inévitable se pose alors : comment définir les préférences d un groupe, c est-àdire, des procédures collectives? Pour Sugden, les préférences d un groupe ne sont pas réductibles à la somme des préférences individuelles. L auteur prend l exemple du choix d une destination de vacances en famille et montre que chacun fait des concessions pour aboutir à un consensus ; de sorte que le choix de la destination finale ne correspond en fait à aucun des choix individuels. Dès lors que les préférences collectives sont distinctes des préférences individuelles il faut permettre à un groupe de former son propre raisonnement d où l introduction de la notion de «team reasoning»; étant donné que dans une logique instrumentale, les préférences ne sont que le support de processus décisionnel. Désormais cependant, les choix et préférences des groupes ne relèvent plus d une problématique individuelle comme dans les versions standard et élargie de la théorie des jeux. Pour autant, les préférences collectives jouent le même rôle que les préférences individuelles et continuent à orienter les choix. La différence avec les versions standard et élargie n est donc pas aussi considérable que l on pourrait d abord le penser. Si l on reprend en effet les caractéristiques constitutives de la version standard, l idée que les interactions traitées sont purement stratégiques demeure, même si ces interactions peuvent désormais mettre en relation des individus qui adoptent des comportements de groupe. La conception de l individu que l on trouve chez Sugden est donc différente de celle que défend la version standard puisqu un individu peut ici abandonner ses préférences individuelles au profit de préférences collectives. Les notions d objectif, d intentionnalité et d activité communes à plusieurs individus sont alors intégrables dans le modèle et il s agit là d une avancée substantielle que les modèles de la version élargie étaient incapables de mettre en lumière auparavant. Toutefois, l introduction du «team reasoning» se fait sur la base de préférences collectives données et tout aussi inexpliquées que les préférences individuelles. 20