Planification d expériences séquentielle pour l analyse de sensibilité



Documents pareils
Arrondissage des résultats de mesure. Nombre de chiffres significatifs

Compte-rendu technique complet et détaillé des cookies

Principe de symétrisation pour la construction d un test adaptatif

Voyez la réponse à cette question dans ce chapitre.

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

2.1 Comment fonctionne un site?

Abstract. Key-words: The flowshop problem, Heuristics, Job scheduling, Total flowtime.

Estimations d erreur a priori de la méthode de Lagrange Galerkin pour les équations de type Kazhikhov Smagulov

Tolérance aux fautes-2 Serveurs à haute disponibilité

Mécanique : Cinématique du point. Chapitre 1 : Position. Vitesse. Accélération

Filtrage stochastique non linéaire par la théorie de représentation des martingales

ÉTUDE BDC LES CINQ FACTEURS CLÉS ET LES CINQ PIÈGES À ÉVITER POUR RÉUSSIR EN AFFAIRES

Modélisation géostatistique des débits le long des cours d eau.

EXERCICE II : LE TELEPHONE "POT DE YAOURT" (5 points)

Les bases de données. Historique

L étalonnage par traceur Compton, une nouvelle méthode de mesure primaire d activité en scintillation liquide

Utiliser Internet Explorer

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Réseaux Évidentiels pour la fusion de données multimodales hétérogènes : application à la détection de chutes

DOSSIER SUR LE SECTEUR DES NOMS DE DOMAINE VOLUME 11 - NUMÉRO 4 - JANVIER 2015

Méthodes de Simulation

Autour des nombres et des polynômes de Bernoulli

Application de la méthode de surface de réponse stochastique à l analyse de stabilité d un tunnel pressurisé

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

THESE. Applications des algorithmes d'auto-organisation à la classification et à la prévision

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Simulation numérique de la réponse d un pieu en cours de battage

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

TABLE DES MATIERES. C Exercices complémentaires 42

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

NON-LINEARITE ET RESEAUX NEURONAUX

La mémoire C HAPITRE S EPT. 7.1 Qu est-ce que la mémoire? L utilisation de la mémoire à court terme 169

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

L indice des prix à la consommation

Exemple PLS avec SAS

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Chapitre 3. Les distributions à deux variables

Chapitre 2 Le problème de l unicité des solutions

Quantification Scalaire et Prédictive

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

OBJECTIFS. I. A quoi sert un oscilloscope?

innovation / construction / territoire Crèche modulaire-bois La Rose des Vents GAILLAC (81) COMMUNAUTÉ DE COMMUNES

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

MCMC et approximations en champ moyen pour les modèles de Markov

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Une méthode d apprentissage pour la composition de services web

PHANTOM 3. Guide de démarrage rapide PROFESSIONAL V1.0

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

3 Approximation de solutions d équations

«Des places de jeux pour tous» Formulaire de demande

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

Allocation Robuste et Restrictions sur les Contributions au Risque

3. Conditionnement P (B)

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

Forthcoming Database

Équations générales des milieux continus

Construction bayésienne de prévisions probabilistes à partir des sorties d'un modèle déterministe pluie-débit

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Introduction à l approche bootstrap

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Échafaudage de façade UNI 70/100

Modélisation et simulation

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Prédiction et Big data

Évaluation de la mise en oeuvre des recommandations issues des audits effectués à l Université Nationale du Bénin par la Banque mondiale et l UNESCO

Modélisation multi-agent d allocation des ressources : application à la maintenance

Chapitre 5: Oscillations d un pendule élastique horizontal

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Cl) Cl) I-. >CD CD _.CD. o-q OCD - C, -CD 0C1) CDO CDCD. ( Co. 0c;1. Cl) r%) (31. Cl) C-)

1 Complément sur la projection du nuage des individus

De la mesure à l analyse des risques

MASSE, VOLUME ET QUANTITE DE MATIERE

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Probabilités III Introduction à l évaluation d options

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

AGROBASE : un système de gestion de données expérimentales

Correction du Baccalauréat S Amérique du Nord mai 2007

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Cours de méthodes de scoring

Grandes tendances et leurs impacts sur l acquisition de produits et services TI.

SARM: Simulation of Absorption Refrigeration Machine

Évaluation de la régression bornée

LA MESURE DE MASSE POUR LA DÉTERMINATION DE PÉRIODES RADIOACTIVES

Monitor LRD. Table des matières

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercices sur SQL server 2000

Institut français des sciences et technologies des transports, de l aménagement

5Visualisation. pièges à. éviter... de données : e-book : Visualisation & Ergonomie. Page 1 / 30. Partagez cet e-book :

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

LE FORMAT DES RAPPORTS DU PERSONNEL DES COMMISSIONS DE DISTRICT D AMENAGEMENT FORMAT OF DISTRICT PLANNING COMMISSION STAFF REPORTS

Le modèle de régression linéaire

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Transcription:

Planification d expériences séquentielle pour l analyse de sensibilité Loïc Le Gratiet 1,2 & Mathieu Couplet 1 & Bertrand Iooss 1,3 & Luc Pronzato 2 1 EDF R&D, 6 quai Watier, 78 401 Chatou 2 Laboratoire I3S UNS-CNRS, 2000 route des Lucioles, 06903 Sophia-Antipolis 3 Institut de Mathéatiques de Toulouse, 31062 Toulouse Résué. Les gros codes de calcul sont counéent utilisés en science et en ingénierie pour odéliser des systèes physiques coplexes avec souvent un grand nobre de paraètres d entrée al connus. L analyse de sensibilité globale a pour objectif d identifier les entrées qui ont le plus d influence sur la sortie. Les indices de Sobol perettent d effectuer une telle analyse. Cependant, leur estiation nécessite un grand nobre d appels au code et ne peut pas être effectuée en un teps raisonnable en pratique. Pour traiter ce problèe, un odèle de rigeage est utilisé pour approcher la sortie du siulateur à partir de quelques-unes de ses observations. Ce étaodèle peut ensuite être appelé intenséent pour l estiation des indices. L utilisation de la variance de rigeage peret de ettre en place des stratégies de planification d expériences séquentielle efficace pour enrichir le étaodèle. Ces stratégies doivent s adapter à l objectif de l étude prédiction, optiisation, estiation de probabilité de défaillance,... Ce travail porte sur la planification séquentielle optiale pour l estiation des indices de Sobol. Mots-clés. Analyse de sensibilité, planification séquentielle, rigeage, indices de Sobol. Abstract. Coplex coputer codes are widely used in science and engineering to odel physical systes. It is coon that they have a large nuber of input paraeters. Global sensitivity analysis ais to identify those which have the ost iportant ipact on the odel output. Sobol indices are a popular tool to perfor such analysis. However, their estiations require an iportant nuber of siulations and often cannot be processed under reasonable tie constraint. To deal with this issue, a riging odel is built to approxiate the coputer code fro few of its observations, and then used to estiate Sobol indices are estiated with it. One of the ain strength of riging odels is that they provide through the riging variance an estiate of the etaodel error. This allows the construction of sequential strategies for iproving the etaodel. These strategies depend on the application prediction, optiization, quantile estiation, estiation of a probability of failure. This wor deals with optial sequential experiental design strategies for the estiation of Sobol indices. Keywords. Sensitivity analysis, sequential design, riging, Sobol indices. 1

1 Introduction Les codes de calculs ont souvent un nobre iportant de paraètres d entrée dont nous voulons esurer l influence sur la sortie. Nous nous concentrons ici sur les indices de Sobol qui sont une esure de sensibilité basée sur une décoposition de la variance. Ces indices sont souvent estiés par des éthodes de Monte-Carlo. Elles perettent de quantifier l erreur due aux intégrations nuériques et elles assurent des propriétés intéressantes coe la noralité asyptotique de l estiateur. Cependant, elles nécessitent un grand nobre d appels au code qui est souvent très coûteux en teps de calcul. Pour résoudre ce problèe, une approxiation du code est souvent faite à l aide d un étaodèle. Les indices sont alors estiés à partir de cette approxiation. Dans ce travail, nous utilisons un étaodèle de rigeage. Un de ses avantages est qu il fourni, au travers de la variance de rigeage, une estiation de l erreur de étaodèle. Ceci nous peret de quantifier l erreur d estiation sur l indice de Sobol due au étaodèle. L utilisation du rigeage pour l estiation des indices de Sobol Marrel et al. [1], Oaley et al. [2] peret de propager l erreur de étaodèle sur l erreur d estiation des indices de Sobol. En revanche, l erreur nuérique due aux intégrations ultiples n est pas prise en copte. Dans Le Gratiet et al. [6] il est ontré coent prendre en copte ces deux erreurs en cobinant un odèle de rigeage avec une éthode d intégration Monte-Carlo, ce qui peret de les équilibrer. Supposons aintenant que l on veuille enrichir le éta-odèle afin de diinuer l incertitude sur les indices. La question qui nous intéresse porte sur le choix optial de ces nouveaux points. Il est connu que ces stratégies séquentielles doivent être adaptées à l estiation des quantités d intérêts. Ainsi, les nouveaux points choisis seront différents selon que l on veuille faire de l optiisation Jones et al. [4], de l estiation de probabilité de défaillance Bect et al. [5] ou de la prédiction Le Gratiet et al. [7]. Jusqu à présent le cas de l analyse de sensibilité n a pas été traité. La principale difficulté est que l indice de Sobol n est pas une transforation linéaire du processus Gaussien présent dans le rigeage. Ainsi, on perd la noralité et le calcul de la variance de l estiateur devient coplexe en particulier, elle dépend des observations du processus. Nous proposons dans ce docuent deux éthodes pour effectuer une telle planification d expériences séquentielle. Le résué est organisé coe suit. En Section 2 la définition des indices de Sobol est rappelée ainsi qu un de ses estiateurs Monte-Carlo. En Section 3 nous décrivons les équations du rigeage et présentons l estiateur des indices couplant rigeage et intégration Monte-Carlo. En Section 4 une preière stratégie de planification reposant sur la génération d instances de processus Gaussien est présentée. Enfin en Section 5, la deuxièe stratégie basée sur l expression analytique de la variance du nuérateur de l estiateur de Sobol est proposée. Des tests nuériques sur les deux stratégies de planification sont en cours et seront présentés lors de la conférence. 2

2 Les indices de Sobol Nous présentons ici succincteent la éthode de Sobol pour l analyse de sensibilité. Considérons l espace des paraètres d entrée Q R d. Nous notons zx, X Q la sortie du code de calcul considérée où X est le vecteur des paraètres d entrée. Pour prendre en copte les incertitudes sur les entrées, X est odélisé coe une variable aléatoire. Soit X = X 1,...,X d, l indice de Sobol du preier ordre du paraètre X est défini par: S = Var X EX [ zx X ] /Var X zx. L estiation de S nécessite donc l évaluation de différentes intégrales ultiples. Afin d en contrôler l erreur, nous utilisons une intégration Monte-Carlo présentée ci-dessous. Considérons le couple de variable aléatoire X, X tel que X = X 1,...,X 1,X,X +1,...,X d, X = X 1,..., X 1,X, X +1,..., X d, et X i indépendantdex i pourtouti. Nousavonsl égalités = cov X zx,z X/Var X zx. De cette égalité, nous pouvons naturelleent déduire l estiation suivante de S à partir d un échantillon X i, X i i=1,..., : 1 S = i=1 zx iz X i 1 2 i,j=1 zx iz X j 1 i=1 zx i 2 1 i=1 zx i 2. Coe présenté précédeent, cet estiateur requiert un grand nobre de particules Monte-Carlo. C est pourquoi en pratique nous substituons le code zx par un étaodèle. Ici nous utilisons un odèle de rigeage. 3 Indices de Sobol avec odèle de rigeage Le principe du rigeage est de considérer que notre connaissance a priori du code zx peut être odélisée par un processur gaussien Zx de oyenne f xβ et de noyau de covariance σ 2 rx, x où r est un noyau de corrélation. Le noyau de covariance est généraleent paraétré par un vecteur θ. Par soucis de clarté nous ne le faisons pas apparaître dans ce docuent. Ensuite, nous approchons le code zx par un processus gaussien Z n x suivant la distribution prédictive [Zx ZD = z n ] où z n sont les valeurs connues de zx sur les points du plan d expériences D = {x des 1,...,xdes n et une loi a priori ipropre unifore pour β: }, xdes i Z n x PG Z n x,s 2 n x, x, Q. Nous avons pour σ 2 connu 3

où n x = f xˆβ +r xr z 1 n Fˆβ, s 2 n x = σ2 1 f x r x 0 F 1 fx, F R rx ˆβ = F R 1 F 1 F R 1 z n, R = [rx des i,x des j ] i,j=1,...,n, r = [rx des i,x] i=1,...,n et F = [f x des i ] i=1,...,n. Les indices de Sobol peuvent alors être estiés avec : 1 S,n = i=1 Z nx i Z n X i 1 2 i,j=1 Z nx i Z n X i 1 i=1 Z nx i 2 1 i=1 Z nx i 2 1 Notons que cet estiateur coporte à la fois une erreur Monte-Carlo et une erreur de étaodèle. Le contrôle de ces deux erreurs est traité dans l article Le Gratiet et al. [7], Le Gratiet [8]. Ici nous nous concentrons sur la diinution de l incertitude sur S,n due à l utilisation du étaodèle en enrichissant D d un nouveau point x des n+1. 4 Planification d expériences séquentielle pour l analyse de sensibilité Soient z n,l x l=1,...,n N réalisations du processus conditionnel Z n x. Nous pouvons générer à partir de ces instances un échantillon s,n,l l=1,...,n de S,n coe suit : s,n,l = 1 i=1 z n,lx i z n,l X i 1 2 i,j=1 z n,lx i z n,l X j 1 i=1 z n,lx i 2 1 i=1 z n,lx i 2 A partir de s,n,l l=1,...,n nous pouvons estier Var Z S,n à l aide d un estiateur classique de la variance Var Z désigne la variance selon Z n x. De plus, l estiation de S sera obtenue à partir de la oyenne epirique de ce êe échantillon. Supposons aintenant que l on veuille rajouter un nouveau point x des n+1 au design D. L objectif est d estier la diinution de Var Z S,n si on conditionne Zn x sur un nouveau point x des n+1. Cette estiation devant s effectuer sans connaître la valeur de zx des n+1, nous supposons que Z n+1x PG Z n x,s 2 n+1 x, x. A partir de réalisations de Z n+1 x, nous pouvons de nouveau estier la variance Var Z S,n+1 de l estiateur des indices de Sobol l indice n+1 souligne le fait que l on rajoute un point au design. La stratégie de planification séquentielle sera alors de choisir pari un enseble de points candidats x cand l l=1,...,c celui qui iniise l estiation de Var Z S,n+1. Pour générer des instances de processus gaussiens, nous utilisons la éthode de conditionneent par rigeage couplé à une version propagative de l échantillonnage de Gibbs Lantuéjoul et al. [3]. La génération des instance de Z n+1 x sur X i, X i i=1,..., pour un nobre iportant C de points candidats deeure néanoins coûteuse en particulier 4

parce que est souvent copris entre 10,000 et 100,000 en pratique. Pour pallier ce problèe, nous considérons le processus suivant : Z n+1 x = rx,x des n+1 n x des n+1 Z nx des n+1 /rx des n+1,xdes n+1 +Z nx quisuitbienlaloiprédictive[z n x Zx des n+1 = nx des n+1 ]. L équationdonnéeprécédeent nous peret d obtenir des instances de Z n+1 x à partir de celles de Z n x en un teps de calcul négligeable. 5 Une deuxièe stratégie de planification d expériences séquentielle Nous avons présenté précédeent une approche de planification d expériences séquentielle perettant de choisir pari des points candidats celui diinuant le plus forteent l incertitude sur l estiation des indices de Sobol. Cette éthode nécessite néanoins de générer des instances de processus gaussiens sur un grand nobre de points. Ceci étant coûteux nuériqueent, nous devons restreindre le nobre de points candidats pour la planification séquentielle. Nous soes égaleent aenés à considérer que zx des n+1 = nx des n+1 alors que nous préfèrerions utiliser sa loi coplète : zx des n+1 N n x des n+1,s 2 nx des n+1, Conforéent àcequi estproposédansleséthodessurbectetal. [5]oùl objectif de la planification d expériences est de iniiser l incertitude sur l estiation d une probabilité de défaillance. Le principal point dur qui nous epêche de considérer cette éthode ici est que l on n a pas d estiation analytique de la variance de S,n 1. En revanche, nous pouvons expliciter la variance du nuérateur dans l expression 1. Dans une seconde approche, nous proposons donc de chercher le point x des n+1 apportant la plus forte diinution sur la variance suivante : 1 Var Z Z n X i Z n X i 1 Z 2 n X i Z n X j = A B 2 où i=1 A = 1 X 2 i, X i,x j, X j + 1 4 i,j=1 i,j,,l=1 i,j=1 X i, X j,x, X l 2 3 i,j,=1 X i, X i,x j, X, B = 1 i=1 s 2 n X i, X i + n X i n X i 1 2 i,j=1 s 2 n X i, X j + n X i n X j, 5

et x,y,z,t = s 2 n x,ys2 n z,t+s2 n x,zs2 n y,t+s2 n y,zs2 n x,t s 2 n x,y nz n t s 2 n x,z ny n t s 2 n x,t ny n z s 2 n y,z nx n t s 2 n y,t nx n z s 2 n z,t nx n y + n x n y n z n t. Lors de l ajout d un nouveau point x des n+1 nous avons : s 2 n+1x, x = s 2 nx, x s 2 nx,x des n+1s 2 nx des n+1, x/s 2 nx des F et n+1 x = n x+s 2 n x,xdes n+1 Z n x des n+1 f x des n+1 ˆβ. n+1,x des n+1 Ceci nous peret d évaluer la diinution espérée de l incertitude si l on effectue une nouvelle siulation au point x des n+1 notons que cette quantité ne dépend pas de z x des n+1. Reercieents Le projet a été partielleent financé par le projet ASINCRONE des défis NEEDSCNRS. Bibliographie [1] Marrel A., Iooss B., Laurent B. and Roustant O. 2009, Calculation of Sobol indices for the Gaussian process etaodel, Reliability Engineering & Syste Safety, 79, pp. 229-238. [2] Oaley J.E. and O Hagan A.2004, Probabilistic sensitivity analysis of coplex odels a Bayesian approach, Journal of the Royal Statisitical Society series B, 66, part 3, pp. 751-769. [3] Lantuéjoul C. and Desassis N. 2012, Siulation of a Gaussian rando vector: A propagative version of the Gibbs sapler, 9th International Geostatistics Congress, Oslo, Norway, Hune 11. - 15. [4] Jones D. R., Schonlau M. and Welch W.J. 1998, Efficient global optiization of expensive blac-box functions, Journal of Global optiization, 13, 4, pp. 455-492. [5] Bect J., Ginsbourger D., Li L., Picheny V. and Vazquez E. 2012, Sequential design of coputer experients for the estiation of a probability of failure, Statistics and Coputing, 223, pp. 773-793. [6]LeGratietL., Cannaela C.andIoossB.2013,A Bayesian approach for global sensitivity analysis ofulti-fidelity coputer codes, subitted to SIAM/ASA UQ, arxiv:1307.2223. [7] Le Gratiet L. and Cannaela C. 2013, Kriging-based sequential design strategies using fast cross-validation techniques with extensions to ulti-fidelity coputer codes, subitted to Technoetrics, arxiv:1210.6187. [8] Le Gratiet L. 2013, Multi-fidelity Gaussian process regression for coputer experients, PhD thesis, Université de Paris VII, tel-00866770. 6