Analyse de sensibilité pour données climatiques Ronan Trépos (master 2 de Franck Boizard) 1 er octobre 2015 Collaborations : F. Boizard, R. Faivre, R. Trépos et pôle transverse du CATI IUMA (S. Roux, S. Buis).
Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques Classification experte Classification automatique 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe
Analyse de sensibilité pour données climatiques Modèle de culture (dynamique et boîte noire ) : Données climatiques: - température min - température max - pluie... Modèle de culture (sunflo, "jouet",...) Autres paramètres: - traits phénotypique de plante - stress hydrique... Sortie du modèle - rendement - biomasse... Objectif : calculer conjointement des indices de sensibilités pour les entrées climatiques et autres paramètres.
Présentation du modèle jouet y = Entrées climatiques : x = (x rad (t), x tmoy (t), x et0 (t), x rain (t)) Paramètres : θ = (t 1, t 2, τ tmoy, τ FTSW, k c, TTSW ) Equations : t 2 t 1 b t (x, θ) b t = RUE t (x, θ) x rad (t) RUE t = (x tmoy (t) < τ tmoy ) min(1, FTSW t 1 τ FTSW ) ATSW tmp t = ATSW t 1 + x rain (t) k c x et0 (t) min(1, FTSW t 1 τ FTSW ) ATSW t = min(ttsw, max(0, ATSW tmp t )) FTSW t = ATSW t TTSW
Présentation du modèle jouet (données) Domaine de variation des entrées climatiques : séries de Montpellier (début : 14 nov, durée : 365 jours) de 1972 à 2014 avec les variables climatiques (x rad (t), x tmoy (t), x et0 (t), x rain (t)) 42 séries climatiques Domaine de variation des paramètres : paramètre min max τ tmoy 20 30 k c 0.2 0.8 TTSW 50 250 Autres paramètres et valeurs initiales fixés : ATSW (0) 50 t 1 180 t 2 280 τ FTSW 0.4
Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe
AS pour la série de 1972 (FAST, 3000 pts) 0.0 0.2 0.4 0.6 0.8 1.0 cond.values_tau_tmoy cond.values_kc cond.values_ttsw main effect interactions
Variabilité des indices de 1er ordre selon la série FAST (3000 pts) Sobol2002 (5000 pts) SobolJansen (5000 pts) 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy kc ttsw
Détails des AS (FAST) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011
Détails des AS (Sobol 2002) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011
Détails des AS (Sobol Jansen) 0e+00 1e+09 2e+09 3e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011
Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques Classification experte Classification automatique 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe
Classification experte Une première classification experte est basée directement sur la somme des pluies en période de production de biomasse (entre t 1 = 180 et t 2 = 280). Classe1 : 1972 1978 1981 1982 1983 1984 1985* 1986 1989 1993 2002 2005 2010 2013 peu humide Classe2 : 1974 1975 1987 1988 1990 1994 1997 1999 2000 2003* 2004 2008 2009 2012 moyennement humide Classe3 : 1973 1976 1977 1979 1980 1991 1992 1995 1996 1998 2001 2006* 2007 2011 très humide
Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques Classification experte Classification automatique 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe
Méthodologie de classification Définition d une distance entre séries temporelles (dtw) distance tmoy entre 1972 et 2013= 883.900000000001 Mean temperature of the day 0 5 10 15 20 25 5 10 15 20 25 30 0 100 200 300 day Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes
Méthodologie de classification Définition d une distance entre séries temporelles (dtw) Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques ETPP RG RR TMC 0 50000 150000 avant normalisation ETPP RG RR TMC 30000 40000 50000 après normalisation Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes
Méthodologie de classification Définition d une distance entre séries temporelles (dtw) Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes
Méthodologie de classification Définition d une distance entre séries temporelles (dtw) Normalisation quantile et somme des distances sur les variables climatiques distance entre 2 séries climatiques Classification ascendante hiérarchique (CAH) Détermination des centres de classes à partir de la CAH pour initialiser une méthode de K-medoïdes R2(k) = I inter (k) F (k) = k t = n 2 I tot R2(k) 1 R2(k) n k k 1
Résultats de classification Height 40000 45000 50000 55000 60000 65000 70000 75000 80000 20 21 18 26 17 22 23 24 25 iuma/mtpellier_1981_1982.txt iuma/mtpellier_2005_2006.txt iuma/mtpellier_1994_1995.txt 31 29 35 42 33 34 19 38 41 40 14 37 1 32 36 39 30 27 28 2 16 7 12 8 5 6 3 9 4 10 15 11 13 PseudoF R2 0 1 2 3 4 5 0.0 0.1 0.2 0.3 0.4 K= 3 PseudoF= 3 thumb= 4 0 10 20 30 40 nb clusters 0 10 20 30 40
Caractérisation des classes (apprentissage supervisé) Arbre de décision : moyenne des vars clim. + année vs classe. 1 mean_rg 1387.746 > 1387.746 3 year 1984 > 1984 1 0.8 0.6 0.4 0.2 0 Node 2 (n = 9) 1 2 3 1 0.8 0.6 0.4 0.2 0 Node 4 (n = 13) 1 2 3 1 0.8 0.6 0.4 0.2 0 Node 5 (n = 20) 1 2 3 Classe1 : 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981* 1982 1983 1984 1987 2006 2007 2010 très lumineuse avant 84 Classe2 : 1985 1986 1990 1998 1999 2000 2001 2002 2004 2005* 2008 2009 2012 2013 très lumineuse après 84 Classe3 : 1988 1989 1991 1992 1993 1994* 1995 1996 1997 2003 2011 peu lumineuse
Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe
Réarrangement des indices (FAST, classif experte) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1972 1982 1985 1993 2010 1975 1990 1999 2004 2012 1977 1991 1996 2006
Réarrangement des indices (FAST, classif automatique) 0.0e+00 1.0e+09 2.0e+09 3.0e+09 cond.values_tau_tmoy cond.values_kc cond.values_ttsw interactions 1972 1975 1978 1981 1984 1987 1990 1993 1996 1999 2002 2005 2008 2011 0.0 0.2 0.4 0.6 0.8 1972 1975 1978 1981 1984 2007 1986 1999 2002 2008 2013 1991 1994 1997
Analyse de variance des indices de sensibilités Test de Turkey (p_value à 0.2) sur une aov des indices de sensibilités issus de FAST pour la classification experte. class 1 class 2 class 3 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 0.0 0.2 0.4 0.6 0.8 tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy moins influent sur la biomasse en situation peu humide? kc moins influent sur la biomasse en situation très humide?
Analyse de variance des indices de sensibilités Test de Turkey (p_value à 0.2) sur une aov des indices de sensibilités issus de FAST pour la classification automatique. class 1 class 2 class 3 0.0 0.2 0.4 0.6 0.8 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.2 0.4 0.6 0.8 tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy kc ttsw tau_tmoy moins influent sur la biomasse en situation très lumineuse avant 84? kc moins influent sur la biomasse en situation peu lumineuse?
Sommaire 1 Présentation du stage 2 Analyse de sensibilité par climat 3 Classification non supervisée des séries climatiques 4 Visualiser les résultats d AS en utilisant la classification 5 Analyse de sensibilité conjointe
Analyse de sensibilité conjointe Problématique : intégrer dans l AS la série climatique comme un paramètre d entrée discret non ordonné : C {1972, 1973,..., 2013} Morris et fast non adaptées pour ce type de données utilisation du pick and freeze de Sobol. L utilisateur fournit 2 matrices : A := (a i,j ), B := (b i,j ) 1 i n, 1 j M, où n est choisi et M est le nbre de params. Plan simulé : A B X = C 1. C M où : a 1,1 a 1,j 1 b 1,j a 1,j+1 a 1,M C j =..... a n,1 a n,j 1 b n,j a n,j+1 a n,m
Introduction de la variable climat la méthode proposée consiste à ajouter une colonne ds A et B pour la variable climat. on chercher à construire ces deux colonnes (dans A et B) de manière orthogonale. On part de A et B définies comme précédemment (sur les M paramètres continus) en utilisant un hypercube latin de taille n. a 1,1 a 1,M b 1,1 b 1,M A =.. B =.. a n,1 a n,m b n,1 b n,m Par la suite, on identifie une série climatique par un indice k, 1 k K = 42.
Introduction de la variable climat k a 1,1 a 1,M A k :=... k a n,1 a n,m A k := A k. A k (K 1) n k b 1,1 b 1,M B k :=... k b n,1 b n,m B k := B 1. B k 1 B k+1. B K (K 1) n A := A 1. A K K (K 1) n B := B 1. B K K (K 1) n
Résultats : comparaison avec et sans classif (jansen) a sans classif (K = 42, M = 4), n = 10 K (K 1) n (M + 2) = 103320 b classif experte (K = 3, M = 4), n = 2000 K (K 1) n (M + 2) = 72000 c classif auto (K = 3, M = 4), n = 2000 K (K 1) n (M + 2) = 72000 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect climate tau_tmoy kc ttsw clust tau_tmoy kc ttsw clust tau_tmoy kc ttsw
Résultats : impact de l intervalle des variables Expe : intervalle de variation des paramètres {tau_tmoy, kc, ttsw} divisé par 2. 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect 0.0 0.2 0.4 0.6 0.8 1.0 main effect total effect climate tau_tmoy kc ttsw clust tau_tmoy kc ttsw clust tau_tmoy kc ttsw plus d effet du climat, lorsque les autres paramètres varient moins?
Conclusion/Perpectives Aspects méthodologiques : reproduction des AS pour plus de robustesse (plusieurs graines aléatoires) vérifications à apporter sur l utilisation de Sobol 2002 (et Sobol Jansen) justification méthodologique plus poussée pour l AS conjointe classification : choix d un représentant ou tirage dans la classe de climats étude intéractions climat / autres paramètres Aspects informatiques : genération de tutoriels R pour les plateformes du CATI IUMA (OpenFluid, Sol virtuel, OpenAlea, Capsis, RECORD) dans la cadre du pari scientifique : Approches multi-plateformes pour la résolution de problèmes avancés en Analyse de Sensibilité intégration avec le paquet R mtk (Mexico Toolkit) déjà sur le CRAN.