E Laurence Lescourret & Christian Y. Robert Centre de Recherche en Economie et Statistique LaboratoiredeFinanceetd Assurance 5 Boulevard Gabriel Peri, 92245 Malakoff Résumé: De par leur nature, les événements catastrophiques sont peu observés. Il est donc très délicat de les prévoir. Ce papier utilise la théorie des valeurs extrêmes pour estimer la probabilité de survenance de deux événements catastrophiques. Les distributions extrêmales bivariées sont utilisées pour décrire les distributions limites des maxima de deux composantes, mais elles permettent aussi de caractériser les quantiles extrêmaux. Il n existe pas de familles paramétriques générales, comme dans le cas univarié, pour décrire la forme de ces distributions, mais il y a cependant de nombreuses restrictions sur la forme de la dépendance entre les marginales. Nous considérons divers familles paramétriques que nous estimons à l aide d une méthode de type moindres carrés asymptotiques. Des tests d indépendance asymptotique, de spécification et de discrimination entre modèles sont aussi donnés. Enfin, nous proposons des estimateurs pour les quantiles extrêmaux bivariés et nous appliquons notre méthodologie pour l estimation du montant des dommages en assurance habitation et automobile occasionés lors des tempêtes. Mots clés: Probabilité de survenance de deux évènements catastrophiques, Théorie des valeurs extrêmes bivariées, Distributions à queues épaisses, Moindres carrés asymptotiques Abstract: The paper deals with the estimation of the probability that two dependent catastrophic events occur. Because of their nature such events are not often observed. In a twodimensional space as in a one-dimensional space, the extreme value theory is a powerful tool to do inference in the tail of a distribution outside the range of the observations. This paper considers parametric bivariate extreme value distributions which arise as the limiting distribution of two normalized maxima to estimate the probability of exceedances over high thresholds. The parameter of the extreme value distribution is estimated by using Asymptotic Least Squares (ALS) methods. In case the parameter is a scalar, we derive a new and very simple estimator. Tests for asymptotic independence and overidentifying restrictions are also given. The theory is applied to the problem of storm damages assessment (motor claim amounts and household claim amounts). Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.
Depuis quelques années, la théorie des valeurs extrêmes pour les distributions bivariées et multivariées a reçu beaucoup d attention aussi bien sur le plan théorique (Resnick [987], Galambos [987], Joe [997], par exemple) que sur le plan pratique (Ledford et Tawn [996] [997], Coles et Tawn [994], de Haan et de Ronde [998], parmi d autres). Les domaines d applications sont en effet très variés : hydrologie, météorologie, biologie, ingénierie mécanique, gestion de l environnement, finance, assurance, etc; car la gestion des risques est devenue aujourd hui fondamentale dans tous ces domaines. La théorie des valeurs extrêmes s intéresse à la loi multivariée limite, non-dégénérée, des maxima, correctement normalisés, de chaque composante du vecteur initial. Considérons (X,Y ),..., (X n,y n ) une suite de vecteurs aléatoires dans R 2 indépendants et identiquement distribués de loi F. On dit qu il y a convergence des maxima s il existe des suites réelles a n > 0, c n > 0, b n et d n, et une fonction de distribution G avec des marginales non dégénérées telle que : lim P max(x,..., X n ) b n a n = lim F n (a n x + b n,c n y + d n )=G(x, y) x, max(y,..., Y n ) d n c n y Naturellement, cette fonction G est définie à des paramètres d échelle et de position près. Par ailleurs, la relation précédente implique la convergence des marginales et G(x, ) et G(,y) sont des distributions extrêmales univariées qui sont définies à l aide de trois familles de lois paramétriques. Contrairement au cas univarié, il n existe pas de familles générales paramétriques pour la loi G, mais il est possible de les caractériser à l aide d une fonction. Pour décrire leur forme, nous effectuons une transformation de manière à ce que les marginales de la distribution extrêmale soient de la forme Φ (x) = exp { x } (loi de Fréchet de paramètre ). On définit pour cela : F (x, y) =F (U X (x),u Y (y)), avec : U X (t) = (t), U Y (t) = (t). F X F Y Nous obtenons alors la relation asymptotique suivante : lim P max ( F X(X i )) nx, max ( F Y (Y i )) ny,...,n,...,n = lim F n (nx, ny) =G (x, y). G peut être caractérisée de la manière suivante : G (x, y) =exp x y + y y x χ, 2
où χ est une fonction continue et concave qui satisfait 0 χ(t) min(,t). Pour une étude des formes de ces fonctions χ et d autres théorèmes de représentation, nous proposons aux lecteurs de se référer à Joe [993] et [997] et Klüppelberg et May [998]. L estimation des distributions bivariées G est apparue comme une nécessité pour évaluer les risques extrêmes, mais aussi pour quantifier l erreur de cette évaluation. Dans la littérature, deux approches classiques d estimation ont été utilisées. La première consiste à modéliser la structure de dépendance à l aide de modèles paramétriques et a été initiée par Tawn [988] [990]. Diverses méthodes ont été proposées : estimation par maximum de vraisemblance (Tawn [988]), méthodes à seuils (Joe, Smith et Weissman [992], Coles et Tawn [99]), ou des méthodes plus spécifiques à chaque modélisation (Csörgo et Welch [989]). La seconde approche consiste à estimer la fonction de dépendance de manière non paramétrique (Einhmal, de Haan et Huang [993], de Haan et Resnick [993], Einhmal, de Haan et Sinha [997], Einhmal, de Haan et Piterbag [998], Abdous, Ghoudi et Khoudraji [998]). Nous faisons l hypothèse supplémentaire (mais peu restrictive) que la loi marginale de X, F X, est de type Weibull et que celle de Y, F Y, est de type Pareto, c est-à-dire : ln( F X (x)) = x τ l X (x), F Y (y) =y α l Y (y), où l X et l Y sont des fonctions à variations lentes et τ > 0, α > 0. Ceci nous conduit aux lois extrêmales univariées et aux choix des suites de normalisation suivants : G(x, ) = exp{ exp { x}}, a n = U X (n)/(τ log(n)), b n = U X (n), G(,y) = exp y α, c n = U Y (n), d n =0, Dans ce papier, nous nous intéressons à l estimation statistique des distributions extrêmales bivariées dans un cadre paramétrique (χ θ sera indicée par le paramètre θ). Nous recourons à une méthode d estimation du type moindres carrés asymptotiques. Pour cela, nous utilisons la théorie des processus ponctuels qui a été introduite par de Haan et Resnick [993]. Il existe des mesures ν et ν sur [, ] [0, ]\{0, 0} et sur [0, ] [0, ]\{0, 0} telles que : lim nx + b n,c n y + d n )) = log G(x, y) =:ν (([,x] [0,y]) c ), log G(log x, y α ) = log G (x, y) =:ν (([0,x] [0,y]) c ). Nous introduisons de plus la mesure de liaison sur [0, ] [0, ]\{0, 0} suivante : µ ((x, ] (y, ]) := y y χ θ. x 3
Nous avons alors que la condition de convergence des maxima est équivalente à la convergencevaguedesmesuressur[0, ] [0, ]\{0, 0} : np {(X b n )/a n log x} (Y d n )/c n y v α ν (([0,x] [0,y]) c ), np {(X b n )/a n log x} (Y d n )/c n y v α µ ((x, ] (y, ]). Estimer G est donc équivalent à estimer ν ou µ. Des estimateurs naturels sont les mesures empiriques. Pour (x, y) [0, ] [0, ]\{0, 0} et A [0, ] [0, ]\{0, 0}, on définit : si (x, y) A, (x,y) (A) = 0 si (x, y) A c. La mesure empirique de queue non normalisée peut être estimée par: ˆν n (([0,x] [0,y]) c ):= k n X i Û X (n/k), Y i Û X (n/k)/ log(n/k) Û X (n/k) ([0,x] [0,y]) c, où : Û X (n/k) =X (k), Û Y (n/k) =Y (k). Enfin, on peut donner des estimateurs des mesures de queue normalisées : ˆν n(([0,x] [0,y]) c ) : = k ˆµ n((x, ] (y, ]) : = k n n exp ˆτ exp ˆτ X i Û X (n/k) Û X (n/k)/ log(n/k) X i ÛX (n/k) Û X (n/k)/ log(n/k),, Y i Û X (n/k) Y i Û X (n/k) ˆα([0,x] [0,y]) c, ˆα(x, ] (y, ]. On utilisera les estimateurs de Beirlant et al. l estimateur de Hill pour l indice de Pareto : [995] pour l indice de Weibull et ˆτ = log(n/k) X (k) k k X(i) X (k+), ˆα = k k log Y(i) log Y (k+). Dans le papier, nous montrons les convergences des mesures de queue normalisées et nous donnons leur loi asymptotique. Le paramètre θ est estimé par une technique de moindres carrés asymptotiques. Etant donnée une matrice symétrique définie positive S n de dimension (H,H) dépendant éventuellement des observations, on appelle estimateur de moindres carrés asympotiques associé à S n une solution θ n (S n ) du problème : min θ ˆµ n((x, ] (y, ]) y y χ θ x S n ˆµ n((x, ] (y, ]) y y χ θ. x 4
Nous caractérisons alors la convergence de l estimateur et spécifions le choix optimal de la matrice S n. Des tests d indépendance asymptotique, de spécification et de discrimination entre modèles sont aussi donnés. Enfin, nous proposons des estimateurs pour les quantiles extrêmaux bivariées et nous appliquons notre méthodologie pour l estimation du montant des dommages en assurance habitation et automobile occasionnés lors des tempêtes. Bibliographie [] ABDOUS, B.,GHOUDI, K.etKHOUDRAJI, A. (998). Nonparametric estimation of the limit dependence function of multivariate extremes. Extremes 2, 243-265. [2] BEIRLANT, J., BRONIATOWSKI, M., TEUGELS, J.L., et VYNCKIER, P. (995). The mean residual life function at great age : Applications to tails estimation. J. Stat. Plann. Inf. 45 : 2-48. [3] COLES, S.G. et TAWN, J.A. (99). Modelling extreme multivariate events. J. R. Statist. Soc. B. 53 : 377-392. [4] COLES, S.G. et TAWN, J.A. (99). Statistical methods formultivariate extremes : an application to structural design. Appli. Statist. 43 : -48. [5] CSÖRGO, S. et WELSH, A.H. (989). Testing for exponential and Marshall-Olkin distributions. J Statist. Plan. Inference. 23 : 287-300. [6] DEHEUVELS, P.,HAEUSLER, E.deetMASSON, M.D. (988). Almost sure convergence of the Hill estimator. Math.Camb.Phil.Soc. 04 : 37-38. [7] EINMAHL, J.H.J., HAAN, L. de et HUANG, X. (993). Estimating a multidimensional extreme value distribution. J. Mult. Analysis. 47 : 35-47. [8] EINMAHL, J.H.J., HAAN, L. de et PITERBARG, V.I. (998). Nonparametric estimation of the spectral measure of an extreme value distribution. Document de travail, Erasmus University. [9] EINMAHL, J.H.J., HAAN, L.deetSINHA, A.K. (997). Estimating the spectral mesure of an extreme value distribution. Stoch. Porc. Models. 70 : 43-7. [0] GALAMBOS, J. (987). The Asymptotic Theory of Extreme Order Statistic. 2nd ed. Melbourne : Krieger. [] GEFFROY, J. (958). Contribution à la théorie des valeurs extrêmes, Publication de l ISUP. 7:37-2, 8:23-84. [2] HAAN, L. de et RESNICK, S. (977). Limit theory for multivariate samples extremes. Z. Wahrscheinlichkeitstheorie verw. Gebiete. 40 : 37-337. [3] HAAN, L. de et RESNICK, S. (993). Estimating the limiting distribution of multivariate extremes. Comm.Statist.Stoch.Models.9:275-309. [4] HAAN, L. de et RESNICK, S. (996). On asymptotic normality of the Hill estimator. Document de travail, Cornell University. 5
[5] HAAN, L. de et RONDE, J. (998). Sea and Wind : multivariate extremes at work. Extremes. :7-45. [6] HAAN, L. de et STADTMÜLLER, U. (994). Generalized regular variation of second order. J. Australian Math. Soc. [6] JOE, H. (993). Parametric Families of multivariate distributions with given margin. J. Mult. Analysis. 46 : 262-282. [7] JOE, H. (997). Multivariate Models and Dependece Concepts. Monographs on Statistics an Applied Probability 73, Chapman & Hall. [8] JOE, H., SMITH, R.L. et WEISSMAN, I. (992). Bivariate threshold methods for extremes. J. R. Statist. Soc. B. 59 : 7-83. [9] KLÜPPELBERG, C., et MAY, A. (998). The dependence function for bivariate extreme value distributions. Document de travail, Muenchen University. [20] LEDFORD, A.W. et TAWN, J.A. (996). Statistics for near independence in multivariate extreme values. Biometrika. 83 : 69-87. [2] LEDFORD, A.W. et TAWN, J.A. (997). Modelling Dependence within joint tail regions. J. R. Statist. Soc. B. 59 : 475-499. [22] RESNICK, S. (986). Point processes, regular variation and weak convergence. Adv. Appl. Probab. 8 : 66-38. [23] RESNICK, S. (987). Extreme Values, Regular Variation, and Point Processes. Springer, New-York. [24] RESNICK, S.etSTARICA, C. (999). Smoothing the moment estimator of the extreme value parameter. Extremes. :263-293. [25] TAWN, J.A. (988). Bivariate extreme value theory: Models and estimation. Biometrika. 75 : 397 45. [26] TAWN, J.A. (988). Modelling multivariate extreme value distributions. Biometrika. 77 : 245 253. [27] SIBUYA, M. (960). Bivariate extreme statistics. I, Annals of the Institute of Statistical Mathematics, Tokyo. 9 : 95 20. 6