Analyse de sensibilité globale de sorties spatiales de modèles numériques

Documents pareils
K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

Intérêt du découpage en sous-bandes pour l analyse spectrale

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Probabilités III Introduction à l évaluation d options

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Quantification Scalaire et Prédictive

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Modélisation et simulation

TP N 57. Déploiement et renouvellement d une constellation de satellites

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

De la mesure à l analyse des risques

Equation LIDAR : exp 2 Equation RADAR :

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Introduction à l approche bootstrap

Projet ANR. Bruno Capra - OXAND. 04/06/2015 CEOS.fr - Journée de restitution (Paris) B. CAPRA

données en connaissance et en actions?

Les travaux doivent être remis sous forme papier.

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.

MATHS FINANCIERES. Projet OMEGA

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

Ordonnancement robuste et décision dans l'incertain

Chapitre 3. Les distributions à deux variables

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Vers plus de responsabilités

TD1 Signaux, énergie et puissance, signaux aléatoires

I. Polynômes de Tchebychev

Projet de Traitement du Signal Segmentation d images SAR

Etude de fonctions: procédure et exemple

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Programmes des classes préparatoires aux Grandes Ecoles

Quantification et hiérarchisation des incertitudes dans un processus de simulation numérique

Enjeux mathématiques et Statistiques du Big Data

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Monitoring continu et gestion optimale des performances énergétiques des bâtiments

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Etablissement de cartes de vent sur le pourtour méditerranéen par simulation numérique

Annexe commune aux séries ES, L et S : boîtes et quantiles

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

Évaluation de la régression bornée

Développement de lois et de structures de réglages destinées à la téléopération avec retour d effort

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

Problèmes arithmétiques issus de la cryptographie reposant sur les réseaux

ANALYSE STATISTIQUE PRÉDICTIVE

Coup de Projecteur sur les Réseaux de Neurones

Master of Science in Engineering

CCP PSI Mathématiques 1 : un corrigé

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Application de la méthode de surface de réponse stochastique à l analyse de stabilité d un tunnel pressurisé

Notes du cours MTH1101 Calcul I Partie II: fonctions de plusieurs variables

Object Removal by Exemplar-Based Inpainting

Simulation du transport de polluant dans les nappes par un modèle à faible diffusion numérique

Accélérer l agilité de votre site de e-commerce. Cas client

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Projet SENTINELLE Appel àprojets «CO 2»Déc. 2007

MABioVis. Bio-informatique et la

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

4.2 Unités d enseignement du M1

Solvabilité II Les impacts sur la tarification et l offre produit

Création intuitive des éléments d un paysage

ETUDE COMPARATIVE DES MODELISATIONS NUMERIQUE ET PHYSIQUE DE DIFFERENTS OUVRAGES D EVACUATION DES CRUES

Introduction au Data-Mining

Quantification des Risques

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Eléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm)

aux différences est appelé équation aux différences d ordre n en forme normale.

Utilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air

Apprentissage non paramétrique en régression

Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Cours de méthodes de scoring

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

PROJET MODELE DE TAUX

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Exemples d application

Interception des signaux issus de communications MIMO

De la mesure à l analyse des risques

PROJET ACCLIMATE ETUDE SIM-CLIM THEME 3 Etude bilan des possibilités d une simulation climatique régionale

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Introduction à la statistique non paramétrique

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Algorithmes pour la planification de mouvements en robotique non-holonome

Cours d Analyse. Fonctions de plusieurs variables

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

NON-LINEARITE ET RESEAUX NEURONAUX

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

1. Vocabulaire : Introduction au tableau élémentaire

Le géomarketing - Page 1 sur 7

CAP CAMION A ASSISTANCE PNEUMATIQUE

Transcription:

Analyse de sensibilité globale de sorties spatiales de modèles numériques B. Iooss Travail réalisé avec Amandine Marrel (CEA, IFP), Béatrice Laurent (INSA Toulouse), Elena Volkova (Institut Kurchatov) et Michel Jullien (CEA Cad) CEA Cadarache Direction de l Énergie Nucléaire Département d Études des Réacteurs Laboratoire de Conduite et Fiabilité des Réacteurs 2010 12/01/2010

Quelques enjeux de la prise en compte des incertitudes Modélisation : améliorer le modèle explorer «au mieux» différentes combinaisons des entrées identifier les entrées prépondérantes (afin de prioriser la R&D) Validation : réduire l incertitude de prédiction calibrer les paramètres du modèle Étude de sûreté : calculer un risque de défaillance Étude de conception : optimiser les performances d un système 2

L approche statistique - Y = f (X), X D R p, Y R Échantillonnage Monte Carlo (MC) / Quasi MC / Plan d expériences Propagation Sensibilités globales coût (nb de calculs) élevé pour probas faibles coût α p Avantages de l approche statistique : Simplicité (Monte Carlo bien connue, méthodologie communicable aux non spécialistes), Souplesse (distribution des calculs, changement des lois de proba des entrées, ), Applicable au code de calcul dont les sources sont intouchables, inaccessibles ou incompréhensibles (majorité des codes de l industrie), Mise à disposition des erreurs associées aux estimations, Inconvénients : - perte de la formulation physique, - coût en nb d évaluations, malédiction de la dimension Méthodes proba. et plans d expériences spécifiques pour résoudre ces pbs 3

Plan Analyse de sensibilité et métamodèle Métamodèle pour sortie spatiale Analyse de sensibilité globale pour sortie spatiale Conclusions 4

MARTHE application Computation of the spatio-temporal temporal evolution of in an ancient radwaste disposal site of 90 Goal: Estimate the contamination impact on the environment Numerical modelisation : Hydrogeological transport scenario of 90 Sr between 2002 and 2010 with the MARTHE software 90 Sr concentration [ Volkova et al. 08 ] 20 uncertain inputs : Permeability, dispersivity, Kd, infiltration intensity, Output of interest : Concentration values 30 mn / run Quantity of interest : Distribution, variance 5

Sorties scalaires : analyse d incertitudes en 2010 August 2002 December 2010 Concentration initiale Cartes de concentrations N = 300 calculs de type Monte-Carlo (LHS) distributions des concentrations aux piézomètres (Bq/l) Density 0.00 0.02 0.04 0.06 0.08 0.10 0.12 Histogramme & densité - p23 Histogramme et densité p31k 0 2 4 6 8 10 12 0 2 4 6 8 10 Density 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 6

Indices de sensibilité 1 sortie scalaire Analyse de sensibilité Échantillon ( X, Y (X ) ) de taille N > p, de préférence de taille N >> p Étape préliminaire : visualisation graphique (par ex : scatterplots) Méthodologie d analyse de sensibilité quantitative? Relation linéaire? Oui (R²) Régression linéaire entre X i et Z Coefficients de régression Non? Relation monotone? Oui Régression sur les rangs [ Saltelli et al. 00, Helton et al. 06 ] (R²*) Non Non? Code coûteux? Oui Indices de Sobol Métamodèle 7

Analyse de sensibilité : indices de Sobol Décomposition : f intégrable sur [0,1] p f ( X,..., X p ) = f0 + fi ( X i ) + fij ( X i, X j ) +L+ f12 Lp ( X1,..., X ANOVA fonctionnelle : p Var ( Y ) = V i ( Y ) + V ij ( Y ) +L + V12 V i = Var X i i = 1 S 1 p i= 1 i< j [ E( Y i = X i )] p i < j p Vi ; Sij ;... ; STi = Si + Var ( Y ) j j, 1er ordre 2ème ordre Indice total S + ij Sijk + Évaluations de S i et S Ti par : Monte Carlo [Sobol 93, Saltelli 02] (coût élevé), quasi Monte Carlo, FAST [Saltelli et al. 99] : coût > 100 p Une fonction mathématique à coût négligeable (métamodèle) : coût ~ 10 p Puis : formulations analytiques ou Monte Carlo p L p ( Y ) (hyp. de X i indépendants) k )... 8

Métamodèle = modèle mathématique de coût négligeable, approximant les réponses du modèle étudié, en vue de prédire de nouvelles réponses Utilisations pratiques : analyse de sensibilité, propagation d incertitudes, optimisation de réponses du modèle, calibration de paramètres Exemples : polynômes, splines, réseaux de neurones, SVM, Métamodèle du krigeage (processus gaussien) : [Matheron 63, Sacks al. 89] interpole les réponses (comme en cartographie spatiale), fournit en plus d une prédiction, une estimation de son erreur Exemple en 1D : Y ( X ) = cos + ( 4πX ) sin( 8πX ) Y 8 6 4 Simulation de N = 8 calculs Prédiction sur [0,1] 2 0 2 9 4 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 X

Métamodèle processus gaussien (PG) Hypothèses : Y(x) = h(x) + Z(x) Régression (pol d 1) Partie stochastique β F(x) F( x) = β + β 0 p i= 1 ix i p R( u, v) = R θi i= 1 (cov. factorisable) qi ( u - v) = exp u v Echantillon d apprentissage de N simulations: X LS = (x (1),,x (N) ), Y LS = f (X LS ) i i Processus stochastique stationnaire Z E[Z(x)] = 0 Cov(Z(u), Z(v)) = σ² R (u( - v) où σ² est la variance et R(.) la fonction de corrélation Métamodèle PG : prédicteur et covariance Y ( x), X ~ LS Y LS PG t 1 (1) ( [ Y ( x) ] = βf ( x) + r ( x) R [ Y βf ] ; r ( x) [ R( x, x),..., R( x, x) ] ˆ * N ) LS LS LS Y ( x) = Ε = Cov * t 1 ( Y ( u ), Y ( v ) ) = σ ² ( R ( u, v ) + r ( u ) R r ( v )) MSE [ Yˆ ( x )] X LS, Y LS X LS, Y LS LS Construction du PG : estimation des paramètres du PG par max. de vraisemblance En grande dimension (p > 5), procédure d optimisation coûteuse (+ algo de sélection) 10

Sorties scalaires Résultats de l analyse de sensibilité Entrées les + influentes Groupe 1 : kd1 (coef. de partage de la couche 1) Groupe 2 : kd2 (coef. de partage de la couche 2) Groupe 3 : i3 (intensité d infiltration) - groupe 1 - groupe 3 - groupe 2 Pas d interaction entre les variables d entrée (S i ~ ST i ) 11

Plan Analyse de sensibilité et métamodèle Métamodèle pour sortie spatiale Analyse de sensibilité globale pour sortie spatiale Conclusions 12

Sortie spatiale Quelques exemples de cartes obtenues en sortie du calcul Concentration en 90 Sr prédite en 2010 13

Méthodologies pour sorties fonctionnelles Sortie spatiale de 4096 pixels sortie fonctionnelle 2D Traitement d une d sortie fonctionnelle d un d code de calcul Utilisation de la discrétisation complète de la fonction Construction d un métamodèle puis analyse de sensibilité en chaque point de discrétisation Possible mais peut être très coûteux en fonction du métamodèle Synthèse de l information ou isolement de l info principale Remplacer la fonction par quelques paramètres d intd intérêt (valeur finale, max, moyenne, ) Exploitation réduite Décomposition dans une base fonctionnelle (Fourier, splines, ondelettes, ) Contexte de code de calcul : Bayarri et al., 2007, Shi et al., 2007, Higdon et al., 2008 Krigeage de courbes : Nerini et al., 2009, 14

Problématique spécifique Code de calcul f (.) : Entrée : X = ( X 1,, X p ) vecteur aléatoire [ Marrel et al. 09 ] Sortie pour une entrée x * : y = f (x *, z ), z D z ensemble de R 2 En pratique, D z est discrétisé en n z points (ici 64 x 64 = 4096 points) Décomposition dans une base de fonctions orthogonales Par ex. base d ondelettes (adaptée si discontinuités et phénomènes locaux) Modélisation de chaque coefficient de la base par un métamodèle Prédiction : Analyse de sensibilité obtention de cartes d indices de Sobol Problème : la construction d un métamodèle est coûteuse (car dim. p > 5) Sélection des coefficients à modéliser (pour limiter leur nombre) 15

Une fonction «jouet» : fonction Campbell2D 2 ( 0.8θ + 0.2φ 10X ) g( X, θ, φ) = X + X 5 ( X 3 1 exp 2)exp 60X ( 0.4θ + 0. 6φ 20X ) 40X 2 1 2 5 2 6 2 + ( X + ( X 2 6 + + X X 4 8 (0.5θ + 0.5φ ) X )exp 500 (0.3θ + 0. 7φ ) X )exp 250 p = 8 X i ~ U[-1,5] pour i =1, 8 z = (θ,φ ) D z = [-90,90]² 1 7 n z = 64 x 64 = 4096 points X=(-1) 8 X=(5) 8 X=(5,3,1,-1,5,3,1,-1) 16

Etape 1 : décomposition spatiale & tri des coefficients Décomposition spatiale des N cartes simulées Centrage des cartes (moyenne empirique sur N cartes) [ ( X, )] µ ( z) = E z X Y Décomposition sur une base d ondelettes de Daubechies (K = 4096) K Y = + K ( X, z) µ ( z) α j ( X) φ j ( z) j = 1 Tri des coefficients par variabilité décroissante (variance / X) { α 1,, α K } { α (1),, α (K) } 17

Etape 2 : modélisation des coefficients Modélisation des K coefficients α j (X) en fonction de X 3 modèles : Constante (moyenne empirique) Régression linéaire Processus Gaussien Moy RL PG 3 méthodes : 1. PG pour les k premiers coef., Moy pour le reste 2. RL pour les k premiers coef., Moy pour le reste 3. PG pour les k premiers coef., RL pour k k coef suivants, Moy pour le reste Mesures de qualité : MSE( X) MSE = = D z [ Y ( X, z) Yˆ ( X, z) ] E X K, k [ MSE( X) ] = 1 18 ; 2 dz avecyˆ Q 2 K, k ( X, z) approximation de Y E z MSE { Var [ Y ( X, z) ]} X K ( X, z)

Etape 3 : sélection du nombre de coefficients PG Fonction Campbell2D : Visualisation du MSE en fct de k et de N k = 500 Echantillon test de taille 1000 Méthode 3 avec k = 30 (stabilisation du MSE avérée) Q2 = 93% pour N = 200 ; Q2 = 97% pour N = 500 B. Iooss Séminaire LCFR 19 12/01/10

Plan 1. Analyse de sensibilité et métamodèle 2.Métamodèle pour sortie spatiale 3.Analyse de sensibilité globale pour sortie spatiale 4.Conclusions 20

Indices de Sobol exacts sur Campbell2D : 1 er ordre et total X i ~ U[-1,5] i =1 8 Indices 1 er ordre Formules analytiques Indices totaux Monte Carlo 21

Résultats sur Campbell2D Estimation des indices de Sobol du 1 er ordre et ordre total par Monte Carlo sur le métamodèle fonctionnel X 2 X 6 exacts métamodèle Erreurs absolues moyennes relatives sur les indices du 1 er ordre : X 1 X 2 X 3 X 4 X 6 X 7 X 8 9% 16% 16% 13% 13% 12% 10% 22

Sortie spatiale Analyse de sensibilité sur Kurchatov (1/2) N = 300 simulations p = 20 variables d entrée K = 4096 pixels k = 100 coef. modélisés par PG k = 900 coef. modélisés par régression linéaire Prédictivit dictivité moyenne : Q 2 = 72% Estimation des indices de Sobol du 1 er ordre et ordre total par Monte Carlo (22000 évaluations du métamodèle fonctionnel) 20 cartes d indices de sensibilité 23

Sortie spatiale Analyse de sensibilité sur Kurchatov (2/2) Cartes d indices de Sobol (1 er ordre) pour les entrées kd1, kd2, i3 Kd couche 1 Kd couche 2 Infiltration forte (canalisations rouges) 24

Plan 1. Analyse de sensibilité et métamodèle 2.Métamodèle pour sortie spatiale 3.Analyse de sensibilité globale pour sortie spatiale 4.Conclusions 25

Conclusions principales de l étude du site de Kurchatov 1. Les prédictions de la contamination au bord du modèle ne dépassent pas le seuil réglementaire (jusqu en 2010) 2. Les coefficients de partage sont les paramètres les plus influents et interagissent peu avec les autres paramètres Réduction de leur incertitudes réduction de l incertitude de prédiction 3. L influence de la forme de la 2 ème couche est forte. On peut l étudier en faisant varier la forme par simulation géostatistique Analyse de sensibilité avec champs aléatoires en entrée 4. Si on veut réduire l incertitude de la prédiction au bord du domaine, le paramètre hydrogéologique à re-caractériser en priorité est le Kd de la 2 ème couche 26

Conclusions et perspectives Proposition d un métamodèle fonctionnel Décomposition en ondelettes Modélisation par krigeage des coefficients sélectionnés Obtention de cartes d indices de sensibilité Interprétation globale et locale, aide à la décision Perspectives Extension de l exploitation du métamodèle fonctionnel Sortie 3D voire spatio-temporelle Méthodologie applicable à d autres problématiques Ex : CFD, rejet de polluants atmosphériques, séquestration du CO2 Références : Volkova, Iooss & Van Dorpe, Stoch. Env. Res. Risk Asses., 2008 Marrel, Thèse de l INSA Toulouse, 2008 Marrel, Iooss, Jullien, Laurent & Volkova, Spatial global sensitivity analysis, soumis, dispo sur HAL 27