Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.



Documents pareils
Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Principe de symétrisation pour la construction d un test adaptatif

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

NON-LINEARITE ET RESEAUX NEURONAUX

Équation de Langevin avec petites perturbations browniennes ou

Économétrie, causalité et analyse des politiques

Tests exacts d indépendance sérielle dans les cas de distributions continues et discrètes

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

EVALUATION DES RISQUES D EXPOSITION À UN CONTAMINANT ALIMENTAIRE : QUELQUES OUTILS STATISTIQUES.

Mesure et gestion des risques d assurance

C. R. Acad. Sci. Paris, Ser. I

FIMA, 7 juillet 2005

Introduction à la statistique non paramétrique

Modélisation géostatistique des débits le long des cours d eau.

Prédiction et Big data

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Exemple PLS avec SAS

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Provisions techniques et capital de solvabilité d'une compagnie d'assurance : méthodologie d'utilisation de Value-at-Risk

Résumé des communications des Intervenants

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

TABLE DES MATIERES. C Exercices complémentaires 42

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

UNIVERSITY OF MALTA FACULTY OF ARTS. French as Main Area in an ordinary Bachelor s Degree

Louis Laurencelle, a vol. 11 no. 1. Introduction

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

3 Approximation de solutions d équations

Scénarios économiques en assurance

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

Évaluation de la régression bornée

Introduction à l approche bootstrap

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Population responses to environmental forcing : approaches to model and monitor habitat characteristics

Travail en collaboration avec F.Roueff M.S.Taqqu C.Tudor

aux différences est appelé équation aux différences d ordre n en forme normale.

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

FINANCEMENT OPTIMAL DE LA SOLVABILITE D UN ASSUREUR

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

Une méthode d apprentissage pour la composition de services web

Modèles pour données répétées

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Correction du Baccalauréat S Amérique du Nord mai 2007

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Christian BONTEMPS né le 08 juillet 1969

ÉTUDE DE L EFFICACITÉ DE GÉOGRILLES POUR PRÉVENIR L EFFONDREMENT LOCAL D UNE CHAUSSÉE

Improving the breakdown of the Central Credit Register data by category of enterprises

Ingénierie et gestion des connaissances

Cours d Analyse. Fonctions de plusieurs variables

The UNITECH Advantage. Copyright UNITECH International Society All rights reserved. Page 1

Démonstration de la conjecture de Dumont

Chapitre 2 Le problème de l unicité des solutions

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

Programming Server-Side Web Applications with Object-Oriented PHP NC Group Syllabus. Duration: 75 hours 1-2-2

Élue Correspondant le 25 avril 1994, puis Membre le 30 novembre 2004 dans la section Sciences mécaniques et informatiques

Chapitre 3. Les distributions à deux variables

IPSAS 32 «Service concession arrangements» (SCA) Marie-Pierre Cordier Baudouin Griton, IPSAS Board

Théorèmes de Point Fixe et Applications 1

«Rénovation des curricula de l enseignement supérieur - Kazakhstan»

De la mesure à l analyse des risques

Introduction aux Statistiques et à l utilisation du logiciel R

Modélisation aléatoire en fiabilité des logiciels

Correction de l examen de la première session

Application de l'analyse multifractale à l'estimation des crues extrêmes en Tunisie

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

OPTIMISATION À UNE VARIABLE

MCMC et approximations en champ moyen pour les modèles de Markov

Journées d études IARD de l Institut des Actuaires Risques de souscription / provisionnement

Modélisation des risques

BILAN du projet PEPS 1 EOLIN (Eolien LMI INSA)

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Corps des nombres complexes, J Paul Tsasa

Méthodes de Simulation

Université Paris-Dauphine DUMI2E 1ère année, Applications

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Une approche non paramétrique Bayesienne pour l estimation de densité conditionnelle sur les rangs

Le modèle de Black et Scholes

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

TRACER LE GRAPHE D'UNE FONCTION

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

Joints de grains : couplage entre modélisation et microscopie électronique haute résolution

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Econométrie et applications

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

Data issues in species monitoring: where are the traps?

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Transcription:

E Laurence Lescourret & Christian Y. Robert Centre de Recherche en Economie et Statistique LaboratoiredeFinanceetd Assurance 5 Boulevard Gabriel Peri, 92245 Malakoff Résumé: De par leur nature, les événements catastrophiques sont peu observés. Il est donc très délicat de les prévoir. Ce papier utilise la théorie des valeurs extrêmes pour estimer la probabilité de survenance de deux événements catastrophiques. Les distributions extrêmales bivariées sont utilisées pour décrire les distributions limites des maxima de deux composantes, mais elles permettent aussi de caractériser les quantiles extrêmaux. Il n existe pas de familles paramétriques générales, comme dans le cas univarié, pour décrire la forme de ces distributions, mais il y a cependant de nombreuses restrictions sur la forme de la dépendance entre les marginales. Nous considérons divers familles paramétriques que nous estimons à l aide d une méthode de type moindres carrés asymptotiques. Des tests d indépendance asymptotique, de spécification et de discrimination entre modèles sont aussi donnés. Enfin, nous proposons des estimateurs pour les quantiles extrêmaux bivariés et nous appliquons notre méthodologie pour l estimation du montant des dommages en assurance habitation et automobile occasionés lors des tempêtes. Mots clés: Probabilité de survenance de deux évènements catastrophiques, Théorie des valeurs extrêmes bivariées, Distributions à queues épaisses, Moindres carrés asymptotiques Abstract: The paper deals with the estimation of the probability that two dependent catastrophic events occur. Because of their nature such events are not often observed. In a twodimensional space as in a one-dimensional space, the extreme value theory is a powerful tool to do inference in the tail of a distribution outside the range of the observations. This paper considers parametric bivariate extreme value distributions which arise as the limiting distribution of two normalized maxima to estimate the probability of exceedances over high thresholds. The parameter of the extreme value distribution is estimated by using Asymptotic Least Squares (ALS) methods. In case the parameter is a scalar, we derive a new and very simple estimator. Tests for asymptotic independence and overidentifying restrictions are also given. The theory is applied to the problem of storm damages assessment (motor claim amounts and household claim amounts). Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Depuis quelques années, la théorie des valeurs extrêmes pour les distributions bivariées et multivariées a reçu beaucoup d attention aussi bien sur le plan théorique (Resnick [987], Galambos [987], Joe [997], par exemple) que sur le plan pratique (Ledford et Tawn [996] [997], Coles et Tawn [994], de Haan et de Ronde [998], parmi d autres). Les domaines d applications sont en effet très variés : hydrologie, météorologie, biologie, ingénierie mécanique, gestion de l environnement, finance, assurance, etc; car la gestion des risques est devenue aujourd hui fondamentale dans tous ces domaines. La théorie des valeurs extrêmes s intéresse à la loi multivariée limite, non-dégénérée, des maxima, correctement normalisés, de chaque composante du vecteur initial. Considérons (X,Y ),..., (X n,y n ) une suite de vecteurs aléatoires dans R 2 indépendants et identiquement distribués de loi F. On dit qu il y a convergence des maxima s il existe des suites réelles a n > 0, c n > 0, b n et d n, et une fonction de distribution G avec des marginales non dégénérées telle que : lim P max(x,..., X n ) b n a n = lim F n (a n x + b n,c n y + d n )=G(x, y) x, max(y,..., Y n ) d n c n y Naturellement, cette fonction G est définie à des paramètres d échelle et de position près. Par ailleurs, la relation précédente implique la convergence des marginales et G(x, ) et G(,y) sont des distributions extrêmales univariées qui sont définies à l aide de trois familles de lois paramétriques. Contrairement au cas univarié, il n existe pas de familles générales paramétriques pour la loi G, mais il est possible de les caractériser à l aide d une fonction. Pour décrire leur forme, nous effectuons une transformation de manière à ce que les marginales de la distribution extrêmale soient de la forme Φ (x) = exp { x } (loi de Fréchet de paramètre ). On définit pour cela : F (x, y) =F (U X (x),u Y (y)), avec : U X (t) = (t), U Y (t) = (t). F X F Y Nous obtenons alors la relation asymptotique suivante : lim P max ( F X(X i )) nx, max ( F Y (Y i )) ny,...,n,...,n = lim F n (nx, ny) =G (x, y). G peut être caractérisée de la manière suivante : G (x, y) =exp x y + y y x χ, 2

où χ est une fonction continue et concave qui satisfait 0 χ(t) min(,t). Pour une étude des formes de ces fonctions χ et d autres théorèmes de représentation, nous proposons aux lecteurs de se référer à Joe [993] et [997] et Klüppelberg et May [998]. L estimation des distributions bivariées G est apparue comme une nécessité pour évaluer les risques extrêmes, mais aussi pour quantifier l erreur de cette évaluation. Dans la littérature, deux approches classiques d estimation ont été utilisées. La première consiste à modéliser la structure de dépendance à l aide de modèles paramétriques et a été initiée par Tawn [988] [990]. Diverses méthodes ont été proposées : estimation par maximum de vraisemblance (Tawn [988]), méthodes à seuils (Joe, Smith et Weissman [992], Coles et Tawn [99]), ou des méthodes plus spécifiques à chaque modélisation (Csörgo et Welch [989]). La seconde approche consiste à estimer la fonction de dépendance de manière non paramétrique (Einhmal, de Haan et Huang [993], de Haan et Resnick [993], Einhmal, de Haan et Sinha [997], Einhmal, de Haan et Piterbag [998], Abdous, Ghoudi et Khoudraji [998]). Nous faisons l hypothèse supplémentaire (mais peu restrictive) que la loi marginale de X, F X, est de type Weibull et que celle de Y, F Y, est de type Pareto, c est-à-dire : ln( F X (x)) = x τ l X (x), F Y (y) =y α l Y (y), où l X et l Y sont des fonctions à variations lentes et τ > 0, α > 0. Ceci nous conduit aux lois extrêmales univariées et aux choix des suites de normalisation suivants : G(x, ) = exp{ exp { x}}, a n = U X (n)/(τ log(n)), b n = U X (n), G(,y) = exp y α, c n = U Y (n), d n =0, Dans ce papier, nous nous intéressons à l estimation statistique des distributions extrêmales bivariées dans un cadre paramétrique (χ θ sera indicée par le paramètre θ). Nous recourons à une méthode d estimation du type moindres carrés asymptotiques. Pour cela, nous utilisons la théorie des processus ponctuels qui a été introduite par de Haan et Resnick [993]. Il existe des mesures ν et ν sur [, ] [0, ]\{0, 0} et sur [0, ] [0, ]\{0, 0} telles que : lim nx + b n,c n y + d n )) = log G(x, y) =:ν (([,x] [0,y]) c ), log G(log x, y α ) = log G (x, y) =:ν (([0,x] [0,y]) c ). Nous introduisons de plus la mesure de liaison sur [0, ] [0, ]\{0, 0} suivante : µ ((x, ] (y, ]) := y y χ θ. x 3

Nous avons alors que la condition de convergence des maxima est équivalente à la convergencevaguedesmesuressur[0, ] [0, ]\{0, 0} : np {(X b n )/a n log x} (Y d n )/c n y v α ν (([0,x] [0,y]) c ), np {(X b n )/a n log x} (Y d n )/c n y v α µ ((x, ] (y, ]). Estimer G est donc équivalent à estimer ν ou µ. Des estimateurs naturels sont les mesures empiriques. Pour (x, y) [0, ] [0, ]\{0, 0} et A [0, ] [0, ]\{0, 0}, on définit : si (x, y) A, (x,y) (A) = 0 si (x, y) A c. La mesure empirique de queue non normalisée peut être estimée par: ˆν n (([0,x] [0,y]) c ):= k n X i Û X (n/k), Y i Û X (n/k)/ log(n/k) Û X (n/k) ([0,x] [0,y]) c, où : Û X (n/k) =X (k), Û Y (n/k) =Y (k). Enfin, on peut donner des estimateurs des mesures de queue normalisées : ˆν n(([0,x] [0,y]) c ) : = k ˆµ n((x, ] (y, ]) : = k n n exp ˆτ exp ˆτ X i Û X (n/k) Û X (n/k)/ log(n/k) X i ÛX (n/k) Û X (n/k)/ log(n/k),, Y i Û X (n/k) Y i Û X (n/k) ˆα([0,x] [0,y]) c, ˆα(x, ] (y, ]. On utilisera les estimateurs de Beirlant et al. l estimateur de Hill pour l indice de Pareto : [995] pour l indice de Weibull et ˆτ = log(n/k) X (k) k k X(i) X (k+), ˆα = k k log Y(i) log Y (k+). Dans le papier, nous montrons les convergences des mesures de queue normalisées et nous donnons leur loi asymptotique. Le paramètre θ est estimé par une technique de moindres carrés asymptotiques. Etant donnée une matrice symétrique définie positive S n de dimension (H,H) dépendant éventuellement des observations, on appelle estimateur de moindres carrés asympotiques associé à S n une solution θ n (S n ) du problème : min θ ˆµ n((x, ] (y, ]) y y χ θ x S n ˆµ n((x, ] (y, ]) y y χ θ. x 4

Nous caractérisons alors la convergence de l estimateur et spécifions le choix optimal de la matrice S n. Des tests d indépendance asymptotique, de spécification et de discrimination entre modèles sont aussi donnés. Enfin, nous proposons des estimateurs pour les quantiles extrêmaux bivariées et nous appliquons notre méthodologie pour l estimation du montant des dommages en assurance habitation et automobile occasionnés lors des tempêtes. Bibliographie [] ABDOUS, B.,GHOUDI, K.etKHOUDRAJI, A. (998). Nonparametric estimation of the limit dependence function of multivariate extremes. Extremes 2, 243-265. [2] BEIRLANT, J., BRONIATOWSKI, M., TEUGELS, J.L., et VYNCKIER, P. (995). The mean residual life function at great age : Applications to tails estimation. J. Stat. Plann. Inf. 45 : 2-48. [3] COLES, S.G. et TAWN, J.A. (99). Modelling extreme multivariate events. J. R. Statist. Soc. B. 53 : 377-392. [4] COLES, S.G. et TAWN, J.A. (99). Statistical methods formultivariate extremes : an application to structural design. Appli. Statist. 43 : -48. [5] CSÖRGO, S. et WELSH, A.H. (989). Testing for exponential and Marshall-Olkin distributions. J Statist. Plan. Inference. 23 : 287-300. [6] DEHEUVELS, P.,HAEUSLER, E.deetMASSON, M.D. (988). Almost sure convergence of the Hill estimator. Math.Camb.Phil.Soc. 04 : 37-38. [7] EINMAHL, J.H.J., HAAN, L. de et HUANG, X. (993). Estimating a multidimensional extreme value distribution. J. Mult. Analysis. 47 : 35-47. [8] EINMAHL, J.H.J., HAAN, L. de et PITERBARG, V.I. (998). Nonparametric estimation of the spectral measure of an extreme value distribution. Document de travail, Erasmus University. [9] EINMAHL, J.H.J., HAAN, L.deetSINHA, A.K. (997). Estimating the spectral mesure of an extreme value distribution. Stoch. Porc. Models. 70 : 43-7. [0] GALAMBOS, J. (987). The Asymptotic Theory of Extreme Order Statistic. 2nd ed. Melbourne : Krieger. [] GEFFROY, J. (958). Contribution à la théorie des valeurs extrêmes, Publication de l ISUP. 7:37-2, 8:23-84. [2] HAAN, L. de et RESNICK, S. (977). Limit theory for multivariate samples extremes. Z. Wahrscheinlichkeitstheorie verw. Gebiete. 40 : 37-337. [3] HAAN, L. de et RESNICK, S. (993). Estimating the limiting distribution of multivariate extremes. Comm.Statist.Stoch.Models.9:275-309. [4] HAAN, L. de et RESNICK, S. (996). On asymptotic normality of the Hill estimator. Document de travail, Cornell University. 5

[5] HAAN, L. de et RONDE, J. (998). Sea and Wind : multivariate extremes at work. Extremes. :7-45. [6] HAAN, L. de et STADTMÜLLER, U. (994). Generalized regular variation of second order. J. Australian Math. Soc. [6] JOE, H. (993). Parametric Families of multivariate distributions with given margin. J. Mult. Analysis. 46 : 262-282. [7] JOE, H. (997). Multivariate Models and Dependece Concepts. Monographs on Statistics an Applied Probability 73, Chapman & Hall. [8] JOE, H., SMITH, R.L. et WEISSMAN, I. (992). Bivariate threshold methods for extremes. J. R. Statist. Soc. B. 59 : 7-83. [9] KLÜPPELBERG, C., et MAY, A. (998). The dependence function for bivariate extreme value distributions. Document de travail, Muenchen University. [20] LEDFORD, A.W. et TAWN, J.A. (996). Statistics for near independence in multivariate extreme values. Biometrika. 83 : 69-87. [2] LEDFORD, A.W. et TAWN, J.A. (997). Modelling Dependence within joint tail regions. J. R. Statist. Soc. B. 59 : 475-499. [22] RESNICK, S. (986). Point processes, regular variation and weak convergence. Adv. Appl. Probab. 8 : 66-38. [23] RESNICK, S. (987). Extreme Values, Regular Variation, and Point Processes. Springer, New-York. [24] RESNICK, S.etSTARICA, C. (999). Smoothing the moment estimator of the extreme value parameter. Extremes. :263-293. [25] TAWN, J.A. (988). Bivariate extreme value theory: Models and estimation. Biometrika. 75 : 397 45. [26] TAWN, J.A. (988). Modelling multivariate extreme value distributions. Biometrika. 77 : 245 253. [27] SIBUYA, M. (960). Bivariate extreme statistics. I, Annals of the Institute of Statistical Mathematics, Tokyo. 9 : 95 20. 6