Optimisation par réduction d incertitudes

Documents pareils
K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Entreprise et Big Data

Qualité du logiciel: Méthodes de test

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Efficacité énergétique des réseaux de cœur et d accès

Monitoring continu et gestion optimale des performances énergétiques des bâtiments

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

Quantification Scalaire et Prédictive

Principe de symétrisation pour la construction d un test adaptatif

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Représenté par Eric Mamy A22 présenté par CFR & CGL Consulting

Ordonnancement robuste et décision dans l'incertain

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

Programmation par contraintes. Laurent Beaudou

Présentation. Pour. Gilles ALAIS, Country Manager Barloworld Supply Chain Software France 20 Rue des Petits Hôtels, Paris

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Gestion du niveau de la franchise d un contrat avec bonus-malus. Pierre THEROND & Stéphane BONCHE

CAP CAMION A ASSISTANCE PNEUMATIQUE

Modèles bi-dimensionnels de coques linéairement élastiques: Estimations de l écart entre leurs solutions.

Introduction au maillage pour le calcul scientifique

Intégration de la dimension sémantique dans les réseaux sociaux

GRID MIP. Plate-forme de développement de la Simulation Numérique au service de la Région Midi-Pyrénées.

Intérêt du découpage en sous-bandes pour l analyse spectrale

La gestion du poste de travail en 2011 : Panorama des technologies

Cercle de certification GREEN BELT e édition

En face du commanditaire, on met un chef de projet qui connait le domaine (banque, administration, etc.)

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

On ne peut pas entendre la forme d un tambour

BIG Data et R: opportunités et perspectives

FINANCEMENT OPTIMAL DE LA SOLVABILITE D UN ASSUREUR

Apprentissage statistique dans les graphes et les réseaux sociaux

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

«SERVICES D INGENIERIE»

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Conception de réseaux de télécommunications : optimisation et expérimentations

Simulation de systèmes. Logiciel de simulation

Table des matières: Guidelines Fonds de Pensions

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Logiciel Libre Cours 3 Fondements: Génie Logiciel

Quantification des Risques

Programmes des classes préparatoires aux Grandes Ecoles

Dr. Prosper Bernard Tel: // portable

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Identite. Free Reporting Software

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

Ordonnancement sous contraintes de Qualité de Service dans les Clouds

Eléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm)

Analyse des risques financiers

Qualité de la conception de tests logiciels : plate-forme de conception et processus de test

Cours3. Applications continues et homéomorphismes. 1 Rappel sur les images réciproques

INF6304 Interfaces Intelligentes

Théorèmes de Point Fixe et Applications 1

Introduction au datamining

Retour d expériences avec UML

Supports. Images numériques. notions de base [1]

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Les algorithmes de base du graphisme

Pourquoi l apprentissage?

Probabilités III Introduction à l évaluation d options

CHAPITRE I. Modélisation de processus et estimation des paramètres d un modèle

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Espérance conditionnelle

Efficacité énergétique pour les particuliers : une solution pour le monitoring énergétique

Modélisation géostatistique des débits le long des cours d eau.

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Agrégation des portefeuilles de contrats d assurance vie

4.2 Unités d enseignement du M1

Solutions en auto-consommation

Cartographie mobile implantée au service de police de la ville de Québec

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?

Résumés des projets de GMM5-2014/2015

Validation probabiliste d un Système de Prévision d Ensemble

Vérifier la qualité de vos applications logicielle de manière continue

ITIL Gestion de la capacité

Méthodes de Simulation

Une bibliothèque de templates pour CUDA

Développement spécifique d'un système d information

3 Approximation de solutions d équations

Spécialiste en Sublimation Textile et Objet

Fonctions de plusieurs variables

Cours d analyse numérique SMI-S4

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Disparités entre les cantons dans tous les domaines examinés

Joint AAL Information and Networking Day. 21 mars 2012

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Document de formation pour une solution complète d automatisation Totally Integrated Automation (T I A)

Equation LIDAR : exp 2 Equation RADAR :

MCMC et approximations en champ moyen pour les modèles de Markov

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

3. Caractéristiques et fonctions d une v.a.

Comment booster vos applications SAP Hana avec SQLSCRIPT

Transcription:

Optimisation par réduction d incertitudes Victor Picheny 1 Collaborations : R. Faivre, R. Trépos, D. Da Silva, E. Costes AG MIA, Ecully 17 mars 2014 1. INRA - Unité de Mathématiques et Informatique Appliquées de Toulouse

Plan de l exposé 1 Contexte : optimisation à l aide de métamodèles 2 Optimisation par réduction d incertitudes 3 Objectifs multiples, contraintes 4 Application à la conception d idéotypes 2/21

Introduction Contexte : exploitation de simulateurs numériques Entrée vectorielle (d 50), continue, sortie scalaire ou petite dimension Boîte noire : pas d information sur la relation entrée / sortie Temps de calcul élevé Entrées x Modèle Sortie(s) : y(x) Objectif : optimisation Recherche du meilleur jeu de paramètres : x = arg min x X y(x) Echantillonnage adaptatif 3/21

Exemple : recherche d idéotypes performants avec MappleT (Markov Apple Tree) Traits géométriques : Performance : Distance internoeuds Surface feuille Diamètre branche Angle MappleT + VPLANT Interception lumineuse Un calcul = 45min Han, Costes, Boudon, Cokelaer, Pradal, Da Silva, Faivre (2012) Investigating the Influence of Geometrical Traits on Light Interception Efficiency of Apple Trees : a Modelling Study with MAppleT 4/21

Une solution classique : métamodélisation x Simulateur y(x) Plan d'exp. Objectif Métamodèle S... S x 1,..., x N y 1,..., y N S ŷ(x) enrichissement Utiliser au mieux le métamodèle pour piloter les nouvelles expériences y(x) 4000 2000 0 2000 4000 x Prédicteur Observations 5/21

Métamodélisation par processus gaussiens Hypothèse fondamentale y est une réalisation de Y (x) PG ( µ(x), k(x, x ) ) Métamodèle = loi conditionnelle aux observations Métamodèle probabiliste Beaucoup d information exploitable pour l optimisation! Sacks, Welch, Mitchell & Wynn Design and analysis of computer experiments Statistical science, 409-423 (1989) y(x) 4000 2000 0 2000 4000 x Prédicteur Observations 6/21

Stratégies d enrichissement adaptatif Principe : critères d échantillonnage Mesure de l intérêt d une observation potentielle grâce au métamodèle Stratégie : on effectue l observation maximisant le critère Critères pour l optimisation Référence : Amélioration espérée = plus grand gain attendu sur l objectif Jones, Schonlau & Welch, Efficient global optimization of expensive black-box functions Journal of Global optimization 13 (4), 455-492 (1998) 4000 2000 0 2000 4000 0.0 1.0 2.0 Critère 7/21

Défis / limites des méthodes existantes Problèmes complexes Contraintes non explicites Multi-critère Robuste (sous incertitudes) Objectifs Stratégies (critères) adaptées Efficaces Cohérentes statistiquement 8/21

Plan de l exposé 1 Contexte : optimisation à l aide de métamodèles 2 Optimisation par réduction d incertitudes 3 Objectifs multiples, contraintes 4 Application à la conception d idéotypes 9/21

Stepwise uncertainty reduction (SUR) Principe Mesure d incertitude (Γ n ) par rapport à l objectif à atteindre Ajout du point qui diminuera le plus cette incertitude : x n+1 = arg min E(Γ n+1 ) Difficulté majeure : estimer hors ligne l effet d une observation potentielle Processus gaussiens : conditionnement! Chevalier, Bect, Ginsbourger, Vazquez, Picheny, Richet, Fast parallel kriging-based stepwise uncertainty reduction with application to the identification of an excursion set, Technometrics (2014) SUR et optimisation Meilleure observation trouvée : y min = min(y(x 1 ),..., y(x n )) Quelle incertitude sur le résultat d optimisation? 10/21

Probabilité de dépassement Une mesure d incertitude En tout point : proba. cond. d être meilleur : P(Y (x) y min ) Volume sous y min : Γ n = P(Y (x) y min )dx X Γ n incertitude sur l optimum x Futur volume E(Γ n+1 ) calculable! V. Picheny (2014) Multiobjective optimization using Gaussian process emulators via stepwise uncertainty reduction Statistics and Computing (under review) 0.0 0.5 1.0 Modèle GP Volume sous le min 11/21 0.0 0.2 0.4 0.6

Illustration : réduction espérée du volume Modèle GP Volume sous le min 0.0 0.5 1.0 0.0 0.2 0.4 0.6 0.0 0.5 1.0 On dispose d un critère pour choisir les simulations En pratique : compétitif par rapport à l état de l art 12/21

Plan de l exposé 1 Contexte : optimisation à l aide de métamodèles 2 Optimisation par réduction d incertitudes 3 Objectifs multiples, contraintes 4 Application à la conception d idéotypes 13/21

Deux problèmes difficiles Contraintes implicites min x X f 1 (x) s.c. f 2 (x) 0. f p (x) 0 Domaine admissible inconnu Risque de choisir un grand nombre de points non admissibles Multiobjectif. min x X min x X f 1 (x) f p (x) Recherche du front de Pareto Approche par métamodélisation Typiquement : simulateur multi-sorties Modèle PG pour chaque f i stratégie d échantillonnage jointe 14/21

Adaptation au cas contraint Modification de la mesure d incertitude Proba d être meilleur proba d être meilleur ET admissible : Γ n = P(F 1 (x) f min F 2 (x) 0)dx X Réduction du volume si nouveau point meilleur et/ou contrainte mieux estimée Le futur volume reste calculable analytiquement (décompositions en différents cas : nouveau point admissible ou pas, meilleur...) Avantages Compromis automatique entre apprentissage des contraintes et recherche de l optimum Cohérent statistiquement 15/21

Illustration : problème 2D Couleur : fonction objectif (vert sombre : minimum) Trait noir : frontière d admissibilité Symboles : points ajoutés (en gras : optimum) Final Estimated fea 0.0 0.2 0.4 0.6 16/21

Adaptation au cas multicritère Probabilité d être derrière le front Gain restant espéré : Γ n = P (Y(x) non dominé) X Découpage de l espace en hyper-rectangles on se rapporte à des probabilités de dépassement Réduction d incertitude calculable Compromis automatique entre objectifs / couverture du front de Pareto Obj2 0.2 0.4 0.6 0.8 1.0 Obj1 17/21

Plan de l exposé 1 Contexte : optimisation à l aide de métamodèles 2 Optimisation par réduction d incertitudes 3 Objectifs multiples, contraintes 4 Application à la conception d idéotypes 18/21

Conception d idéotypes avec MappleT Traits géométriques : Performance : Distance internoeuds Surface feuille Diamètre branche Angle MappleT + VPLANT Interception lumineuse Un problème multiobjectifs Prise en compte des corrélations et des difficultés à concevoir des variétés : critère coût de conception Coût de conception = proximité d une combinaison de traits à des phénotypes réels (122 observations) Antagoniste avec la performance (interception lumineuse) { min -Performance min Coût de conception 19/21

Résultats : front de Pareto Configuration Initialisation : 50 observations 110 itérations de l algorithme 1 min pour trouver la nouvelle observation (45min par simulation) Résultats Front étendu malgré le faible nombre de simulations Ensemble de variétés potentielles Feasability 5 0 5 10 15 20 Croix : observations initiales Cercles : nouvelles observations 350 250 150 50 Performance 20/21

Conclusion et perspectives Métamodélisation et échantillonnage adaptatif pour l étude de simulateurs coûteux Nombreux problèmes ouverts Multiples heuristiques possibles Approche par réduction d incertitudes : concept flexible, efficace? Travaux en cours et futurs Traitement des incertitudes liées au simulateur (climat?) Transposition à d autres types de métamodèles 21/21

Annexe : fonction coût de conception Coût - densité de probabilité (gaussienne) des 122 observations Area 20 40 60 80 100 20 40 60 80 100 20 40 60 80 100 20 25 30 35 40 45 50 3 4 5 6 7 8 0 20 40 60 80 INL 20 30 40 50 20 30 40 50 3 4 5 6 7 8 0 20 40 60 80 Diameter 3 4 5 6 7 8 0 20 40 60 80 Angle 21/21

Annexe : 3 arbres Pareto-optimaux 21/21