Modèles d extrêmes et prédicteurs

Documents pareils
Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Données longitudinales et modèles de survie

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

TABLE DES MATIERES. C Exercices complémentaires 42

EVALUATION DES RISQUES D EXPOSITION À UN CONTAMINANT ALIMENTAIRE : QUELQUES OUTILS STATISTIQUES.

Simulation de variables aléatoires

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Modélisation aléatoire en fiabilité des logiciels


Principe de symétrisation pour la construction d un test adaptatif

Probabilités III Introduction à l évaluation d options

Fonctions de plusieurs variables

République Algérienne Démocratique et Populaire

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

TP N 57. Déploiement et renouvellement d une constellation de satellites

Théorie des Jeux Et ses Applications

Tout le matériel (actif) qui sert à produire: boulons, capteurs, automates, vérins, câblage, éclairage, etc.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Introduction à la statistique non paramétrique

Le projet DRIAS : premières études et documents

La gestion opérationnelle de la météosensibilité. La prévision météorologique et hydrologique au cœur de l Économie et de la Société

Mesure et gestion des risques d assurance

Introduction à l approche bootstrap

Méthodes de Simulation

Résumé des communications des Intervenants

Arbres binaires de décision

Limites finies en un point

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Coup de Projecteur sur les Réseaux de Neurones


Quantification Scalaire et Prédictive

Programmes des classes préparatoires aux Grandes Ecoles

Modélisation des risques

MATHS FINANCIERES. Projet OMEGA

Annexe commune aux séries ES, L et S : boîtes et quantiles

Amphi 3: Espaces complets - Applications linéaires continues

BUSINESS FORECASTING SYSTEM

Dynamique des protéines, simulation moléculaire et physique statistique

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

En face du commanditaire, on met un chef de projet qui connait le domaine (banque, administration, etc.)

Trafic aérien de passagers au Canada : une analyse exploratoire du modèle origine-destination de Transports Canada pour le marché intérieur

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Statistique Descriptive Élémentaire

3 Approximation de solutions d équations

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Température corporelle d un castor (une petite introduction aux séries temporelles)

Modélisation du risque opérationnel Approche Bâle avancée

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Intérêt du découpage en sous-bandes pour l analyse spectrale

CAPTEURS - CHAINES DE MESURES

ANALYSE NUMERIQUE ET OPTIMISATION. Une introduction à la modélisation mathématique et à la simulation numérique

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

4. Martingales à temps discret

Variables Aléatoires. Chapitre 2

Mission des sociétés d assurances pour la connaissance et la prévention des risques naturels

PRODIGUER un noeud français de distribution de données GIEC/IPCC

Applications of Earth Observation for Disaster Risk Management

2. Quelle est la valeur de la prime de l option américaine correspondante? Utilisez pour cela la technique dite de remontée de l arbre.

PROJET ACCLIMATE ETUDE SIM-CLIM THEME 3 Etude bilan des possibilités d une simulation climatique régionale

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48


La persistance des nombres

Test de terrain ou test de laboratoire pour la performance en endurance?

Experts efficience informatique

La simulation probabiliste avec Excel

L olivier Assurances Licence 3 Econométrie Lyon II

" Gestion des données issues du réseau de mesures limnimétriques des cours d eau non navigables "

O, i, ) ln x. (ln x)2

Incertitudes expérimentales

Cours Météo, Club Alpin Suisse, Section de Neuchâtel

Intégration des paramètres de maintenance dans la conception du Health Monitoring. Saintis Laurent Laboratoire LASQUO (futur LARIS)

Valorisation d es des options Novembre 2007

Notes de cours Statistique avec le logiciel R

Contrôle par commande prédictive d un procédé de cuisson sous infrarouge de peintures en poudre.

La gestion du risque chez AXA

TSTI 2D CH X : Exemples de lois à densité 1

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

MODELES DE DUREE DE VIE

Projet Etienne Marceau Méthodes statistiques en assurance non vie

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

3. Conditionnement P (B)

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Projet SENTINELLE Appel àprojets «CO 2»Déc. 2007

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Production des Services d Assurance non-vie selon le SCN 2008

Modèle de Climat de Titan

Programmation Linéaire - Cours 1

Moments des variables aléatoires réelles

LA GESTION DES EVENEMENTS PLUVIEUX

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

MCMC et approximations en champ moyen pour les modèles de Markov


Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Installations de production d Eau Chaude Sanitaire Collective. La Garantie de Résultats Solaires (GRS)

Transcription:

Modèles d extrêmes et prédicteurs Olivier Mestre (1,2) (1) Météo-France, Ecole Nationale de la Météorologie, Toulouse, France (2) Université Paul Sabatier, LSP, Toulouse, France Basé sur des études réalisées en collaboration avec : Stéphane Hallegatte (CIRED, Météo-France) Sébastien Denvil (IPSL/LMD) Fabrice Chauvin (CNRM/GMGEC)

Extrêmes Une réponse à des problèmes concrets dimensionnement d ouvrages de BTP hydrologie, crues, inondations assurances pollution Paramètres : précipitations, vitesse du vent, température, hauteurs de neige Un problème délicat à traiter : estimation d événements très rares ou qui n ont jamais eu lieu! estimation de quantiles d ordre très élevé, extrapolation

Risque RISQUE X x r : variable étudiée, de loi : seuil de dimensionnement : Risque=P[X>x] Commanditaire : fixe le risque r Météo-France : estime x x = Quantile d ordre 1-r de la loi de la variable X

Durée de retour DUREE DE RETOUR Usuellement, le risque r est exprimé comme comme une durée moyenne entre deux événements {X>x} Echantillon de données quotidiennes Seuil de durée de retour 20 ans = Quantile d ordre 0,99983 de la distribution de X

Théorème des valeurs extrêmes Illustration par l exemple

Théorème des valeurs extrêmes Weibull Gamma Gumbel Exp Gauss Weibull U Béta Fréchet Pareto Cauchy

ATTENTION Il existe des contre-exemples. En particulier : LE THEORÊME DES VALEURS EXTRÊMES NE S APPLIQUE PAS AUX LOIS DISCRETES Les paramètres géophysiques ne sont pas distribués comme des lois pures Vérifier l adéquation du modèle basé sur les lois d extrêmes!

Loi GEV PRESENTATION UNIFIEE : GEV(µ,σ,ξ) On introduit le paramètre de forme ξ ξ=0 Gumbel lois non bornées queues légères ( exponentielle) ξ>0 Fréchet lois non bornées, queues lourdes ( puissance) ξ<0 Weibull lois bornées

Petite manip! La GEV par l exemple

Fonction de répartition Fonction de répartition G [ < x] = G( x) P M exp Quantile associé à la durée de retour T = x µ σ Avantages Max annuels: seuil de durée de retour 20 ans = quantile 0,95=1-1/20 La loi est théoriquement connue N 1 x T = µ σ ξ 1 + ξ ln 1 1 T ξ 1 ξ

Estimons un seuil de durée de retour Librairie «extremes» sous R Précipitations au pas de temps quotidien à Toulouse

Alternatives METHODES A SEUIL Loi des dépassement d un seuil (seuil élevé) K plus grandes valeurs Processus de points

Extrêmes et covariables BUT Etudier l influence de covariables sur les extrêmes Etudier l évolution des extrêmes (covariable = temps) Principe Modéliser les paramètres en fonction des covariables Giacomo Parsimoni (1725-1755) «De deux modèles d égale beauté, choisir le moins compliqué»

Maxima annuels de températures à Toulouse

Exemple : Minima annuels de températures à Toulouse

Problème Variations conjointes de paramètres non indépendants modèles paramétriques difficiles à formuler a priori

Modèles additifs Philosophie Approche basée sur les données Plutôt que basée sur un modèle Technique exploratoire Inférence : approximations uniquement

Modèles additifs Modèles additifs: Une manière efficace de faire de la régression non-linéaire ATTENTION! ADAPTE A UN FAIBLE NOMBRE DE PREDICTEURS 2, 3 au maximum

Modèles linéaires et additifs Modèle linéaire gaussien : IE[Y]=β o +β 1 X 1 +β 2 X 2 Modèle additif gaussien : IE[Y]=S 1 (X 1 )+S 2 (X 2 ) S 1, S 2 fonctions «lisses» des prédicteurs X 1, X 2, (LOESS, SPLINE) PRINCIPE DU BACKFITTING Estimation de S 1, S 2 : «Backfitting» Y=S 1 (X 1 )+e estimation S 1 * Y-S 1 *(X 1 )=S 2 (X 2 )+e estimation S 2 * Y-S 2 *(X 2 )=S 1 (X 1 )+e estimation S 1 ** Y-S 1 **(X 1 )=S 2 (X 2 )+e estimation S 2 ** Y-S 2 **(X 2 )=S 1 (X 1 )+e estimation S 1 *** Etc jusqu à convergence

Modèles Additifs Généralisés (GAM) Extension à des variables non gaussiennes Modèles additifs généralises (GAM) : modèles additifs du paramètre naturel de lois de la famille exponentielle (Poisson, Binomial, Gamma, Gauss ). g[µ]=θ=s 1 (X 1 )+S 2 (X 2 ) Modèles «Vecteurs Additifs Généralisés» (VGAM): généralisation du concept de régression

Modélisation VGAM de la GEV Comment? Modélisation VGAM : Yee & Wild, 1996 Implémentation : package VGAM sous R (Yee, 2006) Algorithme vector backfitting et vector spline. Attention Peu de prédicteurs Intervalles de confiance ponctuels : pas de matrice de covariance des estimateurs Convergence parfois difficile à obtenir. Utiliser des fonctions de lien: log(σ)

Exemple Evolution des maxima de températures dans un GCM Avec Sébastien Denvil, LMD

Données Maxima annuels de température Période 1860-2100 Modèle IPSL GCM (5ème IPCC) Concentration des gaz à effet de serre et des aérosols avant 2000 : observations 2000-2100 : SRES-A2 IPCC

Exemple : point de grille sur la France Rôle majeur joué par le CO2. Légère modulation au cours du temps. µ=f1(co2)+f2(year) σ=g1(co2)+g2(year) ξ=constant

Exemple : point de grille sur la France Evolution du quantile 0,90 sur la France

Paramètres de la GEV

Paramètres de la GEV

Paramètres de la GEV

µ:2100-2000 différence

Paramètres de la GEV

Paramètres de la GEV

σ:2100-2000 différence

Paramètres de la GEV

Quantile 0,90 du TX annuel

Quantile 0,90 du TX annuel

Quantile 0,90 du TX annuel

Quantile 0,90 du TX annuel : Différence 2100-2000

Exemple Energie intégrée maximale (PDI) des cyclones sur l Atlantique Nord Avec Stéphane Hallegatte, CIRED, ENM

Période : 1880-2005 PDI maximale annuelle Prédicteurs potentiels : NAO, SOI, AMO, SST, Température Globale

Modélisation VGAM de la GEV Pourquoi? Variations conjointes de paramètres non indépendants: les modèles paramétriques sont difficiles à formuler µ, σ modélisés comme des fonctions souples de covariables ξ reste constant µ=µ o +f 1 (X 1 )+f 2 (X 2 ) σ=σ o +g 3 (X 3 )+g 4 (X 4 ) ξ= ξ o

Estimation des effets additifs

Modèle VGLM de la PDI Modèle paramétrique suggéré par les résultats du VGAM µ modélisé comme une fonction linéaire de SOI et SST σ modélisé comme une fonction linéaire de SST+modèle à rupture en SOI Inférence (tests de déviance) Approximation Gumbel valide (p value : 0.36) Rupture autour de -0.55hPa

Paramètres de la distribution Gumbel

Quantile 0.90 de la PDI max annuelle

Erreur-type (méthode Delta)

Model fit

Prediction

Reliability plots Learning Cross validation

CONCLUSION GAM & VGAM Basé sur les données Technique exploratoire flexible Inférences moins précises Pas beaucoup de prédicteurs Problèmes de convergence possibles

Bibliographie GAM Hastie & Tibshirani, 1990 Generalized Additive Models, Monographs on statistics and applied probability 43, Chapman & Hall/CRC, 335 p. VGAM Yee & Wild, 1996 Vector Generalized Additive Models JRSS series B, Vol. 58, n 3, pp. 481-493

Bibliographie VGAM et extremes Yee & Stephenson, 2007 Vector Generalized and Additive Extreme Value Models. Chavez-Demoulin & Davison, 2005 Generalized Additive Modelling of sample extremes Applied Statistics 54, 207-222.

Calcul Librairies R «gam» Hastie «VGAM» Yee, 2006

Nombre annuel de Cyclones Nombre de cyclones ~ distribution Poisson

Facteurs influençant le nombre de cyclones Modélisation GAM, prédicteurs (YEAR,SST,SOI,NAO)

Log(λ)= β o +S 1 (SST)+S 2 (SOI) Modèle GAM

Modèle paramétrique Modèle à ruptures (avec contrainte de continuité) en SOI mis en évidence par le GAM log(λ) = βo+β SOI (1) SOI+β SST SST SOI<K = βo+β SOI (1) SOI+β SOI (2) (SOI-K)+β SST SST SOI K Meilleur ajustement obtenu pour K=1 log-likelihood=-316.16, à comparer avec -318.71 (linéarité) p value=0.02 L estimation du nombre de cyclones s en déduit directement en fonction de SOI et SST

Nombre de cyclones prévu

Observé vs prévu: r=0.6