Analyse de sensibilité pour données climatiques



Documents pareils
La classification automatique de données quantitatives

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

données en connaissance et en actions?

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Annexe commune aux séries ES, L et S : boîtes et quantiles

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Architecture des Systèmes d Information Architecture des Systèmes d Information

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

De la mesure à l analyse des risques

Validation probabiliste d un Système de Prévision d Ensemble

ECTS CM TD TP. 1er semestre (S3)

Introduction aux Statistiques et à l utilisation du logiciel R

TP N 57. Déploiement et renouvellement d une constellation de satellites

Logiciel XLSTAT version rue Damrémont PARIS

Quelleestlavaleurdel intensitéiaupointm?

Introduction à l approche bootstrap

Chapitre 3. Les distributions à deux variables

STATISTIQUES. UE Modélisation pour la biologie

PROGRAMME (Susceptible de modifications)

Statistique : Résumé de cours et méthodes

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

4. Résultats et discussion

!-.!#- $'( 1&) &) (,' &*- %,!

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Evaluation de la typicité des vins liés au terroir : proposition de méthodes pour les professionnels de la filière

Analyse de la variance Comparaison de plusieurs moyennes

L2T SMS RESELLER MANUEL D UTILISATION ESPACE CLIENT AVERTISSEMENT

Agrégation des portefeuilles de contrats d assurance vie

1. Vocabulaire : Introduction au tableau élémentaire

MABioVis. Bio-informatique et la

Manuel d utilisateur Traceur GPS/GSM/GPRS TK-102

Leçon N 4 : Statistiques à deux variables

CAPTEURS - CHAINES DE MESURES

Introduction au datamining

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Démonstration d utilisation De NesmaCom

TSTI 2D CH X : Exemples de lois à densité 1

Calculs Computional fluide dynamiques (CFD) des serres à membrane de Van der Heide

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Influence du changement. agronomiques de la vigne

Perspectives d applications de la télédétection en grandes culture à court et moyen terme dans le Sud-Ouest

CarrotAge, un logiciel pour la fouille de données agricoles

Projet ANR. Bruno Capra - OXAND. 04/06/2015 CEOS.fr - Journée de restitution (Paris) B. CAPRA

Solution logicielle pour le pilotage et l ERM. Journées d études IARD 26 mars mars 2010

VI. Tests non paramétriques sur un échantillon

De la mesure à l analyse des risques

Évaluation de la régression bornée

QUALITÉ DE L APPRENTISSAGE DE L INTUBATION ORO-TRACHÉALE EN LABORATOIRE DE SIMULATION, SON INTÉRÊT POUR LES PATIENTS.

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

Examen d informatique première session 2004

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Nouveau. TRIMAXX, le raccourcisseur qui en fait un MAXX.

Du Thermostat à l ordinateur climatique. Vincent Aubret Hortimax

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

BILAN HYDRIQUE ET BESOIN D IRRIGATION DE LA CEREALICULTURE EN REGION SEMI-ARIDE.

Initiation à LabView : Les exemples d applications :

Evaluation de la variabilité d'un système de mesure

Introduction à la statistique non paramétrique

Enjeux mathématiques et Statistiques du Big Data

Rendre son installation de chauffage performante grâce à la PEB

Caractérisation de défauts par Magnétoscopie, Ressuage, Courants de Foucault

VITICULTURE 2012 V 12 / PACA 02 STRATEGIE D APPLICATION DU CUIVRE EN VITICULTURE

Apprentissage Automatique

Quelques éléments de statistique multidimensionnelle

Ressources pour l école élémentaire

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Table des matières. I Mise à niveau 11. Préface

Université de Bangui. Modélisons en UML

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining -

Tutoriel première utilisation ICEM-CFD. Couche limite et modification du maillage en 2D

Température corporelle d un castor (une petite introduction aux séries temporelles)

L inégale répartition de l énergie solaire est à l origine des courants atmosphériques

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

T de Student Khi-deux Corrélation

Introduction : Essais de phase I

Comment prouver que les végétaux ont besoin d eau, de minéraux, d air et de lumière pour se développer normalement?

Rapport d évaluation du master

2 Serveurs OLAP et introduction au Data Mining

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Conduite de projets informatiques Développement, analyse et pilotage (2ième édition)

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

FORMULAIRE DE STATISTIQUES

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Plateforme «Inscription en ligne»

Loi binomiale Lois normales

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Le risque Idiosyncrasique

Rapport de Stage. Titre : Clustering à l aide d une représentation supervisée

La nouvelle planification de l échantillonnage

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Transcription:

Analyse de sensibilité pour données climatiques Ronan Trépos (master 2 de Franck Boizard) 1 er octobre 2015 Collaborations : F. Boizard, R. Faivre, R. Trépos et pôle transverse du CATI IUMA (S. Roux, S. Buis).

Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques Classification experte Classification automatique 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe

Analyse de sensibilité pour données climatiques Modèle de culture (dynamique et boîte noire ) : Données climatiques: - température min - température max - pluie... Modèle de culture (sunflo, "jouet",...) Autres paramètres: - traits phénotypique de plante - stress hydrique... Sortie du modèle - rendement - biomasse... Objectif : calculer conjointement des indices de sensibilités pour les entrées climatiques et autres paramètres.

Présentation du modèle jouet y = Entrées climatiques : x = (x rad (t), x tmoy (t), x et0 (t), x rain (t)) Paramètres : θ = (t 1, t 2, τ tmoy, τ FTSW, k c, TTSW ) Equations : t 2 t 1 b t (x, θ) b t = RUE t (x, θ) x rad (t) RUE t = (x tmoy (t) < τ tmoy ) min(1, FTSW t 1 τ FTSW ) ATSW tmp t = ATSW t 1 + x rain (t) k c x et0 (t) min(1, FTSW t 1 τ FTSW ) ATSW t = min(ttsw, max(0, ATSW tmp t )) FTSW t = ATSW t TTSW

Présentation du modèle jouet (données) Domaine de variation des entrées climatiques : séries de Montpellier (début : 14 nov, durée : 365 jours) de 1972 à 2014 avec les variables climatiques (x rad (t), x tmoy (t), x et0 (t), x rain (t)) 42 séries climatiques Domaine de variation des paramètres : paramètre min max τ tmoy 20 30 k c 0.2 0.8 TTSW 50 250 Autres paramètres et valeurs initiales fixés : ATSW (0) 50 t 1 180 t 2 280 τ FTSW 0.4

Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe

AS pour la série de 1972 (FAST, 3000 pts) 0.0 0.2 0.4 0.6 0.8 1.0 cond.values_tau_tmoy cond.values_kc cond.values_ttsw main effect interactions

Variabilité des indices de 1er ordre selon la série FAST (3000 pts) Sobol2002 (5000 pts) SobolJansen (5000 pts) 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy kc ttsw

Détails des AS (FAST) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011

Détails des AS (Sobol 2002) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011

Détails des AS (Sobol Jansen) 0e+00 1e+09 2e+09 3e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011

Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques Classification experte Classification automatique 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe

Classification experte Une première classification experte est basée directement sur la somme des pluies en période de production de biomasse (entre t 1 = 180 et t 2 = 280). Classe1 : 1972 1978 1981 1982 1983 1984 1985* 1986 1989 1993 2002 2005 2010 2013 peu humide Classe2 : 1974 1975 1987 1988 1990 1994 1997 1999 2000 2003* 2004 2008 2009 2012 moyennement humide Classe3 : 1973 1976 1977 1979 1980 1991 1992 1995 1996 1998 2001 2006* 2007 2011 très humide

Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques Classification experte Classification automatique 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe

Méthodologie de classification Définition d une distance entre séries temporelles (dtw) distance tmoy entre 1972 et 2013= 883.900000000001 Mean temperature of the day 0 5 10 15 20 25 5 10 15 20 25 30 0 100 200 300 day Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes

Méthodologie de classification Définition d une distance entre séries temporelles (dtw) Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques ETPP RG RR TMC 0 50000 150000 avant normalisation ETPP RG RR TMC 30000 40000 50000 après normalisation Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes

Méthodologie de classification Définition d une distance entre séries temporelles (dtw) Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes

Méthodologie de classification Définition d une distance entre séries temporelles (dtw) Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes R2(k) = I inter (k) F (k) = k t = n 2 I tot R2(k) 1 R2(k) n k k 1

Résultats de classification Height 40000 45000 50000 55000 60000 65000 70000 75000 80000 20 21 18 26 17 22 23 24 25 iuma/mtpellier_1981_1982.txt iuma/mtpellier_2005_2006.txt iuma/mtpellier_1994_1995.txt 31 29 35 42 33 34 19 38 41 40 14 37 1 32 36 39 30 27 28 2 16 7 12 8 5 6 3 9 4 10 15 11 13 PseudoF R2 0 1 2 3 4 5 0.0 0.1 0.2 0.3 0.4 K= 3 PseudoF= 3 thumb= 4 0 10 20 30 40 nb clusters 0 10 20 30 40

Caractérisation des classes (apprentissage supervisé) Arbre de décision : moyenne des vars clim. + année vs classe. 1 mean_rg 1387.746 > 1387.746 3 year 1984 > 1984 1 0.8 0.6 0.4 0.2 0 Node 2 (n = 9) 1 2 3 1 0.8 0.6 0.4 0.2 0 Node 4 (n = 13) 1 2 3 1 0.8 0.6 0.4 0.2 0 Node 5 (n = 20) 1 2 3 Classe1 : 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981* 1982 1983 1984 1987 2006 2007 2010 très lumineuse avant 84 Classe2 : 1985 1986 1990 1998 1999 2000 2001 2002 2004 2005* 2008 2009 2012 2013 très lumineuse après 84 Classe3 : 1988 1989 1991 1992 1993 1994* 1995 1996 1997 2003 2011 peu lumineuse

Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe

Réarrangement des indices (FAST, classif experte) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1972 1982 1985 1993 2010 1975 1990 1999 2004 2012 1977 1991 1996 2006

Réarrangement des indices (FAST, classif automatique) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1972 1975 1978 1981 1984 2007 1986 1999 2002 2008 2013 1991 1994 1997

Analyse de variance des indices de sensibilités Test de Turkey (p_value à 0.2) sur une aov des indices de sensibilités issus de FAST pour la classification experte. class 1 class 2 class 3 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy moins influent sur la biomasse en situation peu humide? kc moins influent sur la biomasse en situation très humide?

Analyse de variance des indices de sensibilités Test de Turkey (p_value à 0.2) sur une aov des indices de sensibilités issus de FAST pour la classification automatique. class 1 class 2 class 3 0.0 0.2 0.4 0.6 0.8 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.2 0.4 0.6 0.8 tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy moins influent sur la biomasse en situation très lumineuse avant 84? kc moins influent sur la biomasse en situation peu lumineuse?

Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe

Analyse de sensibilité conjointe Problématique : intégrer dans l AS la série climatique comme un paramètre d entrée discret non ordonné : C {1972, 1973,..., 2013} Morris et fast non adaptées pour ce type de données utilisation du pick and freeze de Sobol. L utilisateur fournit 2 matrices : A := (a i,j ), B := (b i,j ) 1 i n, 1 j M, où n est choisi et M est le nbre de params. Plan simulé : A B X = C 1. C M où : a 1,1 a 1,j 1 b 1,j a 1,j+1 a 1,M C j =..... a n,1 a n,j 1 b n,j a n,j+1 a n,m

Introduction de la variable climat la méthode proposée consiste à ajouter une colonne ds A et B pour la variable climat. on chercher à construire ces deux colonnes (dans A et B) de manière orthogonale. On part de A et B définies comme précédemment (sur les M paramètres continus) en utilisant un hypercube latin de taille n. a 1,1 a 1,M b 1,1 b 1,M A =.. B =.. a n,1 a n,m b n,1 b n,m Par la suite, on identifie une série climatique par un indice k, 1 k K = 42.

Introduction de la variable climat k a 1,1 a 1,M A k :=... k a n,1 a n,m A k := A k. A k (K 1) n k b 1,1 b 1,M B k :=... k b n,1 b n,m B k := B 1. B k 1 B k+1. B K (K 1) n A := A 1. A K K (K 1) n B := B 1. B K K (K 1) n

Résultats : comparaison avec et sans classif (jansen) a sans classif (K = 42, M = 4), n = 10 K (K 1) n (M + 2) = 103320 b classif experte (K = 3, M = 4), n = 2000 K (K 1) n (M + 2) = 72000 c classif auto (K = 3, M = 4), n = 2000 K (K 1) n (M + 2) = 72000 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect climate tau_tmoy kc ttsw clust tau_tmoy kc ttsw clust tau_tmoy kc ttsw

Résultats : impact de l intervalle des variables Expe : intervalle de variation des paramètres {tau_tmoy, kc, ttsw} divisé par 2. 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect climate tau_tmoy kc ttsw clust tau_tmoy kc ttsw clust tau_tmoy kc ttsw plus d effet du climat, lorsque les autres paramètres varient moins?

Conclusion/Perpectives Aspects méthodologiques : reproduction des AS pour plus de robustesse (plusieurs graines aléatoires) vérifications à apporter sur l utilisation de Sobol 2002 (et Sobol Jansen) justification méthodologique plus poussée pour l AS conjointe classification : choix d un représentant ou tirage dans la classe de climats étude intéractions climat / autres paramètres Aspects informatiques : genération de tutoriels R pour les plateformes du CATI IUMA (OpenFluid, Sol virtuel, OpenAlea, Capsis, RECORD) dans la cadre du pari scientifique : Approches multi-plateformes pour la résolution de problèmes avancés en Analyse de Sensibilité intégration avec le paquet R mtk (Mexico Toolkit) déjà sur le CRAN.