K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau

Documents pareils
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Modélisation géostatistique des débits le long des cours d eau.

Introduction au datamining

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

TABLE DES MATIERES. C Exercices complémentaires 42

Soutenance de stage Laboratoire des Signaux et Systèmes

Quantification Scalaire et Prédictive

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

NON-LINEARITE ET RESEAUX NEURONAUX

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Echantillonnage Non uniforme

Projet ANR. Bruno Capra - OXAND. 04/06/2015 CEOS.fr - Journée de restitution (Paris) B. CAPRA

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

De la mesure à l analyse des risques

Mesure agnostique de la qualité des images.

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Quantification et hiérarchisation des incertitudes dans un processus de simulation numérique

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Introduction au Data-Mining

Ordonnancement robuste et décision dans l'incertain

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Faire un semi variograme et une carte krigée avec surfer

CAPTEURS - CHAINES DE MESURES

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Rapport d'analyse des besoins

Principe de symétrisation pour la construction d un test adaptatif

PROBABILITES ET STATISTIQUE I&II

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Agenda de la présentation

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Avis de l IRSN sur la tenue en service des cuves des réacteurs de 900 MWe, aspect neutronique et thermohydraulique

Résumé des communications des Intervenants

Méthodes de Simulation

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Validation probabiliste d un Système de Prévision d Ensemble

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

ETUDE COMPARATIVE DES MODELISATIONS NUMERIQUE ET PHYSIQUE DE DIFFERENTS OUVRAGES D EVACUATION DES CRUES

Température corporelle d un castor (une petite introduction aux séries temporelles)

Modélisation aléatoire en fiabilité des logiciels

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Introduction aux Statistiques et à l utilisation du logiciel R

We make your. Data Smart. Data Smart

Montrouge, le 9 février Centre national d équipement nucléaire (CNEN) EDF 97 avenue Pierre Brossolette MONTROUGE

Introduction à l approche bootstrap

Programmes des classes préparatoires aux Grandes Ecoles

Couplage efficace entre Optimisation et Simulation stochastique Application à la maintenance optimale d une constellation de satellites

Introduction au Data-Mining

Régression linéaire. Nicolas Turenne INRA

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

ÉTUDE ET DÉVELOPPEMENT D UN SYSTÈME EXPERT BASÉ SUR LES RÉSEAUX DE NEURONES POUR LE DIAGNOSTIC DES DÉFAUTS DE ROULEMENTS

Modélisation 3D par le modèle de turbulence k-ε standard de la position de la tête sur la force de résistance rencontrée par les nageurs.

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

Intérêt du découpage en sous-bandes pour l analyse spectrale

Interception des signaux issus de communications MIMO

ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results

Etude des propriétés empiriques du lasso par simulations

INF6304 Interfaces Intelligentes

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

MODÉLISATION DU FONCTIONNEMENT EN PARALLELE À DEUX OU PLUSIEURS POMPES CENTRIFUGES IDENTIQUES OU DIFFERENTES

CAP CAMION A ASSISTANCE PNEUMATIQUE

1. Étude réalisée par l AFOPE en Hellriegel D., Slocum J. W., Woodman R. W., Management des organisations, Bruxelles, De Boeck, 1992.

FORMULAIRE DE STATISTIQUES

Document d orientation sur les allégations issues d essais de non-infériorité

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

BIG Data et R: opportunités et perspectives

Le data mining et l assurance Mai Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

Maîtriser les mutations

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Projet de Traitement du Signal Segmentation d images SAR

De la mesure à l analyse des risques

Raisonnement probabiliste

Probabilités III Introduction à l évaluation d options

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

Utilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

TSTI 2D CH X : Exemples de lois à densité 1

données en connaissance et en actions?

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Catalogue de formation

Régionalisation des régimes de perturbations et implications pour l aménagement dans un contexte de changement climatique

MCMC et approximations en champ moyen pour les modèles de Markov

Les outils de simulation. Myriam HUMBERT CETE Ouest

BIG DATA en Sciences et Industries de l Environnement

overmind La solution précède le problème 2008 Overmind - All rights reserved

Transcription:

Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des modèles de krigeage à la simulation numérique 1/36

Krigeage Introduction au krigeage Modèle du krigeage par processus gaussiens Krigeage en optimisation Contribution à la validation des codes de calcul Modèle probabiliste des écarts Calculs - Expériences Application Contribution à la validation des simulations Complexité des simulations numériques Détection des erreurs de calcul par Leave One Out Application Conclusions Apport des modèles de krigeage à la simulation numérique 2/36

Introduction au krigeage Développé en géostatistique (D Krige, G Matheron) prospection minière : cartographie à partir de mesures ponctuelles Estimateur linéaire de variance minimale à partir d un modèle de corrélations (spatiales, variogramme) Cadre probabiliste / statistique : prédictions vues comme réalisations d un processus gaussien conditionné par les observations Outil en Simulation Numérique Méthodologie DACE, Design and Analysis of Computer Experiment (2003, Sacks) Méta-modèles des codes de calcul Intérêt : prédictions intervalles de confiance Heuristiques en optimisation (EGO : Efficient Global Optimization, 1998, Jones) Apport des modèles de krigeage à la simulation numérique 3/36

Modèle du krigeage par processus gaussiens Processus gaussiens Un processus gaussien Z(x) est caractérisé par sa fonction moyenne et sa fonction de covariance Fonction moyenne : la fonction x m(x) := E(Z(x)) Fonction de covariance : La fonction (x 1, x 2) K(x 1, x 2) := Cov(Z(x 1), Z(x 2)) K(x 1, x 2 ) grand et positif Z(x 1 ) et Z(x 2 ) fortement corrélés K(x 1, x 2 ) proche de zéro Z(x 1 ) et Z(x 2 ) faiblement corrélés Paramétrée, la fonction de covariance permet à un processus gaussien de s adapter à un grand nombre de fonctions physiques Apport des modèles de krigeage à la simulation numérique 4/36

y y y Modèle du krigeage par processus gaussiens Processus gaussien := émulateur de fonctions déterministes On dispose d une large classe de fonctions de covariance permettant de représenter un large spectre de fonctions plus ou moins régulières 2 1 0 1 2 2 1 0 1 2 x 2 1 0 1 2 2 1 0 1 2 x 2 1 0 1 2 2 1 0 1 2 x En multi-dimensions : prise en compte de l anisotropie Apport des modèles de krigeage à la simulation numérique 5/36

Modèle du krigeage par processus gaussiens Observations y n Apport des modèles de krigeage à la simulation numérique 6/36

Modèle du krigeage par processus gaussiens Observations y n Réalisations Y (x new ) y n Apport des modèles de krigeage à la simulation numérique 6/36

Modèle du krigeage par processus gaussiens Observations y n Réalisations Y (x new ) y n BLUP = E[Y (x new ) y n] Apport des modèles de krigeage à la simulation numérique 6/36

Modèle du krigeage par processus gaussiens Observations y n Réalisations Y (x new ) y n BLUP = E[Y (x new ) y n] Intervalle 95%± := 196 Var[Y (x new ) y n] Apport des modèles de krigeage à la simulation numérique 6/36

Modèle du krigeage par processus gaussiens Observations y n Réalisations Y (x new ) y n BLUP = E[Y (x new ) y n] Intervalle 95%± := 196 Var[Y (x new ) y n] Choix d une moyenne (tendance) et d une fonction de corrélation (régularité) Critères de sélection (hyper-paramètres), plans d expériences optimaux (2013, F Bachoc) Apport des modèles de krigeage à la simulation numérique 6/36

Modèle du krigeage par processus gaussiens Références Ch de Fouquet, Sur quelques aspects de la mise en oeuvre de la geostatistique dans le contexte des géosciences, Kriging and Gaussian Processes for Computers Experiments, CHORUS Workshop, April, 30th 2014, wwwgdr-mascotnumfr/chorusapr14html François Bachoc, Estimation paramétrique de la fonction de covariance dans le modèle de krigeage Application à la quantification des incertitudes en simulation numérique Thèse Paris 7, 3 octobre 2013 Apport des modèles de krigeage à la simulation numérique 7/36

Krigeage en optimisation Krigeage Introduction au krigeage Modèle du krigeage par processus gaussiens Krigeage en optimisation Contribution à la validation des codes de calcul Modèle probabiliste des écarts Calculs - Expériences Application Contribution à la validation des simulations Complexité des simulations numériques Détection des erreurs de calcul par Leave One Out Application Conclusions Apport des modèles de krigeage à la simulation numérique 8/36

Krigeage en optimisation Planification séquentielle des simulations Recherche d une solution optimale d une fonction complexe (code de calcul) x opt = arg min x X f (x) Exploration initiale : spécification de N premiers points et réalisation des calculs X N = {(x i, f (x i )) i=1,2,,n } Comment spécifier un autre calcul X N+1? Apport des modèles de krigeage à la simulation numérique 9/36

Krigeage en optimisation Planification séquentielle des simulations Solution Bayésienne : estimer l information apportée par un nouveau point x new X N Algorithme EGO (Efficient Global Optimisation, D Jones 1998) estimant le critère Expected Improvement (J Mockus 1970) par un prédicteur krigeage Y N (x) de f (x) f min = min(f (x i ) i=1,2,,n ) x new = arg max E[max(f min Y N (x), 0)] x } {{ } Expected Improvment D autres critères en Machine Learning (N Vayatis à suivre) Apport des modèles de krigeage à la simulation numérique 10/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Algorithme EGO (Efficient Global Optimisation) Apport des modèles de krigeage à la simulation numérique 11/36

Krigeage en optimisation Travaux Questions sur la convergence et la vitesse de convergence vers l optimum D Jones, M Schonlau, W Welch Efficient Global Optimization of Expensive Black-Box Functions, Journal of Global Optimization, 13, 445-492, 1998 Julien Bect, Modèles numériques coûteux - de la quantification des incertitudes à la planification séquentielle d expériences LRC Manon, journée 4 mars 2014, INSTN, Saclay wwwljllmathupmcfr/groupes/cea/lrc/journee04032014php Apport des modèles de krigeage à la simulation numérique 12/36

Krigeage Introduction au krigeage Modèle du krigeage par processus gaussiens Krigeage en optimisation Contribution à la validation des codes de calcul Modèle probabiliste des écarts Calculs - Expériences Application Contribution à la validation des simulations Complexité des simulations numériques Détection des erreurs de calcul par Leave One Out Application Conclusions Apport des modèles de krigeage à la simulation numérique 13/36

Modèle probabiliste des écarts Calculs - Expériences Modélisation probabiliste des incertitudes Etat du système dépend d un groupe de paramètres x Données expérimentales Y obs (x) acquises sur le système réel Y reel (x) simulé par le code f (x, β) Y obs (x) = Y reel (x) + ɛ obs (x) := incertitudes aléatoires Y reel (x) = f (x, β) + Z(x) := incertitudes épistémiques β paramètre(s) à calibrer, prise en compte éventuel d un avis d expert via un prior Bayésien : β N (β prior, Γ prior ) Modèle des écarts Expériences - Calculs = Z(x) + ɛ obs (x) Z est l erreur de modélisation modélisée par un processus gaussien (fonction aléatoire de x) ɛ obs erreur sur les observations Apport des modèles de krigeage à la simulation numérique 14/36

Application Code de calcul FLICA IV (thermohydraulique) Variable d intérêt : perte de pression à la traversée d un élément combustible dans un coeur de réacteur nucléairee Y obs (x) : mesure de la perte de charge f (x, β) : code de calcul de la perte de charge x : regroupant deux types de conditions expérimentales Paramètres de système : diamètre hydraulique, hauteur de frottement, entrefer Variables d environnement : pression de sortie, débit, flux pariétal, enthalpie liquide, titre thermodynamique, température d entrée Apport des modèles de krigeage à la simulation numérique 15/36

Application Méthode Prise en compte des erreurs sur les mesures et les paramètres x Familles de fonctions de corrélation testées gaussienne, exponentielle, Matèrn 3/2 et 5/2 Analyse des erreurs par validation croisée (10-fold) RMSE : Root Mean Square Error IC : Intervalle de Confiance Procédures de calibration des paramètres Loi a priori β prior N (β prior, Q prior ) Apport des modèles de krigeage à la simulation numérique 16/36

Application Résultats avec tendance linéaire et Matèrn 3/2 RMSE FLICA IV (best estimate) 740Pa FLICA IV calibré processus gaussiens 296Pa 3000 2000 prediction error 90% confidence intervals 3000 2000 prediction error 90% confidence intervals 1000 1000 0 0-1000 - 1000-2000 - 2000-3000 0 10 20 30 40 50 60 70 80 90 Index - 3000 0 10 20 30 40 50 60 70 80 90 Index Solution obtenue par approximation linéaire ( β f (x, β)) est équivalente à la solution exacte égale à l espérance de la loi a posteriori β post (plus coûteuse en temps de calcul) Apport des modèles de krigeage à la simulation numérique 17/36

Application Conclusions Krigeage : pistes d amélioration des prédictions d un code de calcul (ou modèle numérique) en le complétant par un modèle statistique inféré à partir de résultats expérimentaux nécessité d avoir suffisamment de résultats expérimentaux (en rapport avec la dimension) importance du choix de la fonction de covariance et des critères d analyse de la robustesse des prédictions (pas d extrapolations abusives) Bachoc F, Bois G, Martinez JM and J Garnier, Calibration and improved prediction of computer models by universal Kriging, Nuclear Science Engineering, 176, 81-97, 2014 Guillaume Damblin, Validation de modèles numériques dans un contexte industriel sous incertitudes LRC Manon, journée 4 mars 2014, INSTN, Saclay wwwljllmathupmcfr/groupes/cea/lrc/journee04032014php Apport des modèles de krigeage à la simulation numérique 18/36

Krigeage Introduction au krigeage Modèle du krigeage par processus gaussiens Krigeage en optimisation Contribution à la validation des codes de calcul Modèle probabiliste des écarts Calculs - Expériences Application Contribution à la validation des simulations Complexité des simulations numériques Détection des erreurs de calcul par Leave One Out Application Conclusions Apport des modèles de krigeage à la simulation numérique 19/36

Complexité des simulations numériques Modèles : multi-physiques, multi-échelles Couplages de codes Pré-traitements : spécification des paramètres, des calculs Calculs : maillages (espace, temps), convergence Pré et Post-traitements, extraction de données Impossibilité de vérifier manuellement tous les calculs spécifiés par un gros plan d expériences numériques Apport des modèles de krigeage à la simulation numérique 20/36

Détection des erreurs de calcul par Leave One Out Utiliser un méta-modèle pour une vérification globale de l ensemble des calculs Intérêt des prédicteurs linéaires (en les observations) : le calcul des erreurs par Leave One Out (solution à l interpolation) est immédiat ɛ loo = M y obs Détection des outliers par Leave One Out un mauvais calcul (erreurs, convergence, ) va présenter probablement une erreur Leave One Out importante Distribution statistique des erreurs standardisées doit être proche de la distribution normale centrée réduite Exemple d une détection seuillée à 3 σ : Outlier = {i : ɛ loo (i) > 3 σ loo (i)} Apport des modèles de krigeage à la simulation numérique 21/36

Application Physique des réacteurs nucléaires Code thermomécanique (déterministe) simulant le comportement du combustible Krigeage a fait apparaître un bruit de mesure non physique Visualisation du bruit numérique anormal et de 2 outliers Apport des modèles de krigeage à la simulation numérique 22/36

Application Bruit numérique a été expliqué par la méthode utilisée par le mailleur du préprocesseur Après adaptation du mailleur : Les 2 outliers détectés par le krigegage avaient été identifiés par le code mais pas pris en compte par le postprocesseur Karim Ammar, Conception multi-physiques et multi-objectifs des coeurs de RNR-Na hétérogènes : développement d une méthode d optimisation sous incertitudes, Thèse, Paris Sud, soutenance prévue le 9/12/2014 Apport des modèles de krigeage à la simulation numérique 23/36

Conclusions Réduction de la complexité des codes par des modèles de substitution ne se limite à la réduction des temps de calcul Intérêt des modèles de substitution par krigeage compléter une modélisation physique détecter d éventuelles erreurs de calcul planification feedback : optimisation, apprentissage Problèmes soulevés par la grande dimension, le choix de la fonction de corrélation et par le nombre d exemples Comparaison restant à faire avec les méthodes à noyaux (RKHS) similaires mais sans la difficulté de l estimation des hyper-paramètres de la fonction de corrélation (notamment en grande dimension) Apport des modèles de krigeage à la simulation numérique 24/36

Conclusions Réduction de la complexité des codes par des modèles de substitution ne se limite à la réduction des temps de calcul Intérêt des modèles de substitution par krigeage compléter une modélisation physique détecter d éventuelles erreurs de calcul planification feedback : optimisation, apprentissage Problèmes soulevés par la grande dimension, le choix de la fonction de corrélation et par le nombre d exemples Comparaison restant à faire avec les méthodes à noyaux (RKHS) similaires mais sans la difficulté de l estimation des hyper-paramètres de la fonction de corrélation (notamment en grande dimension) et avec les anciens réseaux de neurones : CE Rasmussen citant MacKay an interesting question whether in moving from neural networks to Gaussian processes we have thrown the baby out with the bathwater C Rasmussen, Ch Williams, Gaussian Processes for Machine Learning, MIT Press 2006 Apport des modèles de krigeage à la simulation numérique 24/36