Théorie des jeux algorithmique. (algorithmic game theory)

Documents pareils
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

FIMA, 7 juillet 2005

introduction Chapitre 5 Récursivité Exemples mathématiques Fonction factorielle ø est un arbre (vide) Images récursives

Annexe 6. Notions d ordonnancement.

COORDINATION NON COOPÉRATIVE: MÉTHODES D ENCHÈRES

Théorie des Jeux Et ses Applications

Optimisation for Cloud Computing and Big Data

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

AVERTISSEMENT. D'autre part, toute contrefaçon, plagiat, reproduction encourt une poursuite pénale. LIENS

Cours de Master Recherche

Programmation linéaire

Programmation Linéaire - Cours 1

Optimisation for Cloud Computing and Big Data

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Introduction à la Théorie des Jeux p.1/77

La tarification d options

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Limites finies en un point

Resolution limit in community detection

4.2 Unités d enseignement du M1

ALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Architecture des Systèmes d Information Architecture des Systèmes d Information

Réplication des données

Optimisation et programmation mathématique. Professeur Michel de Mathelin. Cours intégré : 20 h

Filtrage stochastique non linéaire par la théorie de représentation des martingales

INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : MOBILITE ET CLOUD COMPUTING

Gestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE

Programmation linéaire

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Ordonnancement temps réel

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

En vue de l'obtention du. Présentée et soutenue par Abir BEN HMIDA SAKLY Le 12/12/2009

Arbres binaires de décision

Algorithmique et systèmes répartis

RÉPUBLIQUE ET CANTON DE GENÈVE Echelle des traitements 2015 Valable dès le Office du personnel de l'etat Indexation de 0.

Cours de Recherche Opérationnelle IUT d Orsay. Nicolas M. THIÉRY. address: Nicolas.Thiery@u-psud.fr URL:

Jean-Philippe Préaux

Architecture distribuée

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Application de K-means à la définition du nombre de VM optimal dans un cloud

MABioVis. Bio-informatique et la

Raisonnement par récurrence Suites numériques

Echantillonnage Non uniforme

Conception des systèmes répartis

Simulation centrée individus

Algorithmes de recherche d itinéraires en transport multimodal

Amphi 3: Espaces complets - Applications linéaires continues

ENS de Lyon TD septembre 2012 Introduction aux probabilités. A partie finie de N

Canevas théoriques du projet sur le poker Partie A

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

OUTILS EN INFORMATIQUE

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

THÈSE. En vue de l obtention du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE. Touria CHAFQANE BEN RAHHOU

Efficacité énergétique des réseaux de cœur et d accès

INFO-F-425 Modèles mathématiques et algorithmes pour l ordonnancement. Bernard Fortz

SEO Campus 2009 : Pagerank et optimisation

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Corrigé des TD 1 à 5

Conception d une infrastructure «Cloud» pertinente

La classification automatique de données quantitatives

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

IBM Business Process Manager

Recherche locale pour un problème d optimisation de tournées de véhicules avec gestion des stocks

ANNEXE 2. L interconnexion REFDOC-SUPEB (Web services)

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Touch PC tébis: L écran tactile pour le montage encastré et en paroi creuse

Optimisation Discrète

Parallélisme et Répartition

La sécurité dans les grilles

Tout le matériel (actif) qui sert à produire: boulons, capteurs, automates, vérins, câblage, éclairage, etc.

Hela Boukef. To cite this version: HAL Id: tel

Dans une année, il y a 12 mois. Dans une année, il y a 52 semaines. Dans une année, il y a 4 trimestres. Dans une année, il y a 365 jours.

Citrix XenDesktop avec la technologie FlexCast. Citrix XenDesktop : la virtualisation des postes de travail pour tous.

1 de 46. Algorithmique. Trouver et Trier. Florent Hivert. Mél : Florent.Hivert@lri.fr Page personnelle : hivert

QUI VEUT JOUER AVEC MOI?

Mlle Yasmin A. RÍOS SOLÍS

Résolution du RCPSP avec production et consommation de ressources : modèles PLNE basés sur les événements

Introduction. Adresses

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Cours des Méthodes de Résolution Exactes Heuristiques et Métaheuristiques

Contrainte de flot pour RCPSP avec temps de transfert

LICENCE : INFORMATIQUE GENERALE

Algorithmes d'apprentissage

Programmation Par Contraintes

LES PROBLEMES D ASYMETRIE D INFORMATION AU SEIN DE L ENTREPRISE

Principe de symétrisation pour la construction d un test adaptatif

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription

UN ALGORITHME COOPÉRATIF POUR UN PROBLÈME D ATELIER JOB SHOP MULTI-AGENT

Résumés des projets de GMM5-2014/2015

Matrice d accès. Master SEMS, Pierre Paradinas. October 16, 2013

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich

Secteur Finance - Assurance

Introduction à l analyse numérique : exemple du cloud computing

= constante et cette constante est a.

Transcription:

Théorie des jeux algorithmique (algorithmic game theory) Exposé «Eco et Opti», Nanterre, le 16/12/2008

La TJA : motivations Fin 20 e siècle : développement d internet => changement du rôle d un ordinateur. Avant: entité isolée, exécutant des logiciels. Maintenant: interaction avec d autres ordinateurs, partage de ressources et informations, commerce.

La TJA : motivations Informatique (théorique) : nouveaux problèmes, buts, techniques d analyse et de conception de protocoles compatibles avec cette nouvelle réalité. Théorie des jeux : étude approfondie des interactions entre individus en compétition (ou qui coopèrent) : rôle crucial. Interface info et TJ => Théorie des jeux algorithmique.

Différences avec la théorie des jeux Applications : réseaux liés à internet; enchères non traditionnelles. Approche : on modélise des applications via des problèmes d optimisation concrets et on cherche: Solution optimale Résultats d impossibilité Bornes inf, sup sur le rapport d approximation, etc. Contrainte: Complexité raisonnable (polynomiale).

Connexion avec l info théorique Analyse d équilibres : outils de la conception d algorithmes approchés, programmation mathématique, fonctions potentielles. Complexité de calcul d équilibre : regain d intérêt pour certaines classes de complexité relatives par ex. à la recherche locale. Systèmes d enchères: techniques usuelles en info théorique (par ex algorithmes primal-dual).

Plan 1. Mesure de la qualité des équilibres 2. Complexité de calcul des équilibres 3. «Algorithmic mechanism design» 4. Conclusion et perspectives

Plan 1. Mesure de la qualité des équilibres Problème d optimisation combinatoire Rapport d approximation Equilibre de Nash Jeu Prix de l anarchie Prix de la stabilité

Problème d optimisation combinatoire On a : Un ensemble d instances (données) Pour chaque instance : un ensemble de solutions réalisables Une fonction objectif But : Trouver un algorithme qui retourne la meilleure solution pour la fonction objectif.

Problème d optimisation combinatoire Exemple : un problème d ordonnancement m machines identiques n tâches de longueurs différentes Ordonnancements réalisables : M 1 M 1 M 2 M 2 But: minimiser la date de fin maximale (le makespan).

Algorithmes d approximation Rapport d approximation : max instances Valeur de la fonction objectif dans la solution retournée Valeur de la fonction objectif dans une solution optimale Un algorithme 2-approché retournera, pour chaque instance, une solution au pire 2 fois moins bonne que la solution optimale.

Algorithmes d approximation Exemple : SPT: ordonnance les tâches de la plus petite à la plus grande 2 machines, tâches de longueur 1, 2, 2, 3, 4 : M 1 1 2 4 M 2 2 3 Algorithme 2-1/m approché.

Equilibre de Nash Ensemble d agents, chacun ayant un but (fonction objectif individuelle) et un ensemble de stratégies possibles. On suppose que chacun connait les stratégies des autres. Equilibre de Nash (EN): situation dans laquelle aucun agent n a intérêt à changer unilatéralement de stratégie.

Jeu Un ensemble d agents. (éventuellement) des règles qui gèrent les ressources utilisées par les agents. Une fonction obj. globale («social welfare») Exemple : Agents= tâches. Leur but : être exécuté sur la machine la moins chargée. Fonction obj. globale : minimiser le makespan. M 1 1 4 M 1 2 4 M 2 3 2 M 3 1 2

Prix de l anarchie But: Analyser la qualité de la solution obtenue quand les agents se conduisent de façon individualiste. Définition :[Koutsoupias et Papadimitriou, STACS 99] max instances Valeur de la fonction objectif dans le pire EN Valeur de la fonction objectif dans une solution optimale

Prix de l anarchie Motivation : Analyse de la perte de performance due au comportement égoïste des agents (si prix de l anarchie faible: un équilibre optimise presque la fonction obj. globale). Fixer des règles au système (aux ressources) de façon à diminuer le prix de l anarchie. Exemple : routage de tâches dans un réseau, ordonnancement

Prix de la stabilité On utilise un algorithme qui suggère une stratégie à chaque agent. But: obtenir une solution bonne vis-à-vis de la fonction obj. globale et stable. Prix à payer: prix de la stabilité [Schultz et al, SODA 03] et [Anshelevich et al, FOCS 04] : max instances Valeur de la fonction objectif dans le meilleur EN Valeur de la fonction objectif dans une solution optimale

Plan 1. Mesure de la qualité des équilibres 2. Complexité de calcul des équilibres 3. «Algorithmic mechanism design» 4. Conclusion et perspectives

Motivation En combien de temps les participants à un jeu convergent vers un équilibre? En combien de temps un algorithme centralisé peut retourner un équilibre? En effet: Utilité de savoir construire un équilibre Doute possible sur la crédibilité du modèle s il n est pas possible de construire un équilibre en un temps polynomial.

Complexité du calcul d un équilibre En informatique théorique : problèmes partitionnés dans des classes de complexité (par ex. P, NP) Calcul des équilibres de Nash mixtes dans des jeux finis : appartient à la classe PPAD. [Chen et al, J. of the ACM 2008] et [Daskalakis et al, SIAM J. of Computing 2008]. Autres résultats pour d autres équilibres ou pour des jeux plus spécifiques.

Plan 1. Mesure de la qualité des équilibres 2. Complexité de calcul des équilibres 3. «Algorithmic mechanism design» 4. Conclusion et perspectives

Algorithmic Mechanism Design Etude de problèmes d optimisation dans lequel les données (par ex: valeur d un bien, coût pour effectuer une tâche) sont inconnues du concepteur de l algorithme et sont déclarées par des utilisateurs individualistes. But: construire un protocole (mécanisme) qui interagit avec les agents et t.q. leur comportement individualiste mène a une solution désirable.

Algorithmic Mechanism Design Terme introduit par [Nisan et Ronen, Games and Economic Behavior, 2001] : étude systématique de ce qui peut être efficacement calculé ou approximé quand les données sont détenues par des agents individualistes. AMD: s appuie sur le domaine du «mecanism design», mais s intéresse surtout à savoir à quel point il est plus difficile de concevoir des algorithmes résistant à des données «privées».

Algorithmes à véracité garantie Algorithmes avec lesquels chaque agent a intérêt à déclarer sa vraie valeur. => On est sûr des performances d un algorithme à véracité garantie (truthful)

Mécanisme Chaque agent a une seule valeur secrète ti et déclare bi. Mécanisme M: algorithme d allocation x(b1,,bn) et algorithme de paiement Л(b1,,bn). Détermine une solution s et des paiements p1,,pn. Mécanisme à véracité garantie (incentive compatible) si chaque agent i maximise son utilité en reportant bi=ti.

Algorithme implémentable Algorithme qui, avec une fonction de paiement bien choisie, mène à un mécanisme à véracité garantie. Est-ce que les algorithmes implémentables sont moins puissants que des algorithmes classiques? Question intéressante pour des algorithmes polynomiaux (peu étudié en économie) ou non (déjà beaucoup étudié).

Quelques résultats Résultat 1 (single parameter mechanism design) [Mookherjee et Reichelstein, J. of Economic Theory, 1992] :Un algorithme est implémentable ssi il est monotone. Résultat 2 (problème d ordonnancement) [Dhangwatnotai et al., FOCS 08] : Pour tout >0, il existe un algorithme (1+ )-approché et implémentable.

Mécanismes sans paiement Exemple: problème d ordonnancement Chaque tâche i est détenue par un agent qui seul connaît sa longueur. Les tâches communiquent leur longueur à un protocole qui doit les ordonnancer de sorte à minimiser le makespan.

Mécanismes sans paiement L algorithme d ordonnancement est connu. Le but de chaque tâche est de minimiser sa date de fin d exécution. Chaque tâche i déclare une valeur bi représentant sa longueur. Hyp : bi li bi<li) (exécution incomplète si bi li

Résultats Etude du rapport d approximation d un algorithme à véracité garantie : Déterministe Probabiliste inf. sup. inf. sup. Rapport d approximation m=2: 1.1 m 3: 7/6 4/3-1/(3m) 1 1

Conclusion et Perspectives Nombreux problèmes ouverts en TJA. Domaine en plein essor. Utilisation de modèles plus appropriés pour modéliser le comportement des agents.