MASTER ISIFAR 2ème Année Année universitaire 2008-2009 Réassurance et valeurs extrêmes Philippe Soulier Objectif L objectif du cours est l étude statistique de quantités d intérêt pour la réassurance. La réassurance ayant pour but la couverture des sinistres de très grand coût, la théorie statistique utile est la théorie des valeurs extrêmes. Ces notes présentent un bref rappel des éléments essentiels de la théorie des valeurs extrêmes univariées et des méthodes statistiques pour des observations i.i.d. 2 Lois de valeurs extrêmes univariées Définition Soit F une fonction de répartition sur R. On dit que F appartient au domaine d attraction du maximum d une loi G si il existe des suites a n et b n telles que F n b n + a n x = Gx, en tout point de continuité de la loi ite G, ou encore P max i n X i b n x = Gx pour une suite de variables i.i.d. de loi F. a n Caractérisation des lois ites possibles Les lois ites possibles sont les lois de valeurs extrêmes généralisées GEV G γ,µ,σ, γ, µ R, σ > 0, définies par G γ,µ,σ x = exp{ + γx µ/σ /γ }, si γ 0, G 0 x = e e x µ/σ, définies pour x tel que + γx µ/σ > 0. On note G γ = G γ,0, et la loi G 0 est appelée loi de Gumbel. Si X suit la loi G γ,µ,σ, alors X µ/σ suit la loi G γ. Les lois de valeurs extrêmes sont aussi les lois max-stables. Soit G une fonction de répartition telle qu il existe des suites {a n } et {b n } vérifiant pour tout x, alors G est une loi GEV. G n b n + a n x = Gx
Caractérisation des domaines d attraction Soit F une fonction de répartition. On dit que F est dans le domaine d attraction du maximum de la loi G γ, noté F MDAG γ si a lieu avec G = G γ. Soit U la fonction croissante définie sur [, [ par Ut = F /t = t. F Alors F est dans le domaine d attraction de la loi G γ si et seulement si il existe une fonction ψ telle que où t = sup{t R, F t < } et h γ x = Utx Ut = h γ x 2 t t ψ Ut x t γ dt = { t γ γ si γ 0, logt si γ = 0. La fonction ψ est appelée fonction auxiliaire et est définie à équivalence asymptotique près, i.e. si ψ vérifie t ψt/ ψt =, alors on peut remplacer ψ par ψ dans 2. Les suites normalisantes de la condition peuvent être choisies de la façon suivante : b n = Un, a n = ψb n = ψ Un. On distingue les trois domaines γ < 0, γ = 0 et γ > 0. Cas γ > 0. Le support de la loi F est non borné, i.e. t =. La fonction F est alors à variation régulière d indice /γ à l infini et la fonction U est à variation régulière d indice γ à l infini. On peut choisir pour fonction auxiliaire ψx = γx. Cas γ = 0. Le support de la loi F peut-être borné ou non borné. Dans le cas t = loi non bornée, la fonction auxiliaire ψx vérifie x ψx/x = 0 et si F est dérivable, on peut choisir ψ = F /F. Cas γ < 0. Ce cas est ramené au cas γ > 0 car une variable X est dans le domaine d attraction de la loi G γ si et seulement si le support de la loi de X est borné, i.e. t < et t X est dans le domaine d attraction de la loi G γ. Lois de Pareto généralisées La condition est équivalente à la convergence des excès conditionnels qui peut s exprimer de façon équivalente par l une ou l autre des ites suivantes γx, t t 3 γx. 4 La fonction log G γ x est une fonction de répartition. Pour µ R et σ > 0, on définit la loi de Pareto généralisée P γ,µ,σ par P γ,µ,σ x = log G γ x µ/σ 2
Convergence des moments Si γ 0 et p < /γ, E[X x p X > x] x ψx p = Pour 0 γ < et p =, on a = x p d{ log G γ x} = p 0 0 { p! si γ = 0, p 0 x p + γx /γ dx si γ > 0. x p { log G γ x} dx E[X x X > x] = x ψx γ. 5 Statistiques d ordre Soit X,..., X n des variables aléatoires i.i.d. de loi F. Les statistiques d ordre de l échantillon, notées X n:,..., X n:n, sont les observations ordonnées en croissant. Si F appartient au domaine d attraction d une loi de valeurs extrêmes G γ, alors on peut étudier le comportement asymptotique de la k-ème plus grande observation X n:n k+ dans le cas où k est fixe et dans le cas où k pas trop vite. Pour tout entier k fixé, PX n:n k+ Un + ψ Unx = +γx /γ u k e u du k! 0 Si k n est une suite croissante d entiers telle que k n et k n /n 0 une telle suite est appelée suite intermédiaire, alors X n:n kn Un/k n ψ Un/k n 0, la convergence ayant lieu en probabilité. Exemples La loi exponentielle appartient au domaine d attraction de la loi de Gumbel. On le prouve en utilisant la caractérisation 3, car on a pour tout t, x > 0 PX > t + x X > t = e x. La ite 3 est donc une égalité stricte pour tout t. C est la propriété caractéristique de la loi exponentielle. la fonction auxiliaire est donc ψ. La loi normale centrée réduite est dans le domaine d attraction de la loi de Gumbel. On peut choisir pour fonction auxiliaire ψx = /x. 3
Loi de Pareto. Une variable aléatoire positive X est dite de type Pareto si sa fonction de survie F x = PX > x est de la forme t F tx F t = x α pour un α > 0 et pour tout x > 0. On dit que F est à variation régulière à l infini d indice α. Le réel α est appelé l indice de Pareto ou de queue de la loi de X, et X est dans le domaine d attraction de la loi G γ avec γ = /α > 0. Il suffit de vérifier 3 en choisissant pou fonction auxiliaire ψx = γx : t F t + tx F t = + γx /γ. Loi uniforme. La loi uniforme sur [0, ] est dans le domaine d attraction de la loi G. On peut calculer directement P n{ max U i } x = e x i n pour tout x < 0. Soit P max U i /n + x/n i n = G x. On a donc la ite avec a n = /n et b n = /n. On peut aussi voir que 5 U est une loi de type Pareto d indice. 3 Estimation 3. Estimation de l indice des valeurs extrêmes Méthode du maximum de vraisemblance Soit X,..., X n sont des observations i.i.d. de la loi G γ,µ,σ. Si γ 0, la log-vraisemblance est n l n γ, µ, σ = n log σ γ + log + γ X i µ n + γ X i µ /γ. σ σ Pour γ = 0, la log-vraisemblance est l n 0, µ, σ = n log σ i= n exp X i µ/σ i= i= n X i µ/σ. L estimateur du maximum de vraisemblance maximise l. Il est toujours bien défini si γ > et asymptotitiquement normal si γ > /2. Si les observations Y,..., Y n sont issues d une loi F MDAG γ, on les regroupe par blocs de taille k et on définit m = [n/k] et des pseudo-observations X,, X m par X i = max j k Y i k+j, i m. On peut alors appliquer la procédure du maximum de vraisemblance aux pseudo-observations Y i. 4 i=
Méthode des excès Etant données n observations i.i.d. de la loi F MDAG γ, cette méthode dite méthode POT peaks over threshold consiste à ne conserver que les observations dépassant un certain seuil threshold, soit déterministe et le nombre d observation conservées est aléatoire, soit une statistique d ordre X n:n k et le nombre d observations conservées est k. Pour ces observations, on utilise la ite 3 qui justifie l approximation pour x grand et y > x, PX > y PX > x + γy x/σ /γ 6 avec σ = ψx. La loi des observations plus grande que x étant précisément la loi conditionnelle sachant X > x, on applique la méthode du maximum de vraisemblance à ces observations considérées comme suivant la loi de Pareto généralisée P γ,x,σ. Si l on a choisit le seuil X n:n k les observations sont donc Y j = X n:n j+ X n:n k, j k. La log-vraisemblance est donc k lγ, σ = k log σ γ + log + γy j σ j= l0, σ = k log σ k Y j. σ On obtient un estimateur de γ en maximisant la log-vraisemblance. j=, γ 0, Estimateur de Hill Si γ > 0, on définit un estimateur de γ par ˆγ Hill = k k log X n:n j+ log X n:n k. j= Cet estimateur est consistant pour toute suite intermediaire k, et asymptotiquement normal si l on peut convenablement choisir la suite k, en fonction de conditions dites du second ordre. 3.2 Estimation de quantiles extrêmes Soit p ]0, [. Le quantile xp d ordre p est défini par F xp = p. Si p est très petit par rapport au nombre d observations, i.e. p /n, une estimation empirique est impossible. Un modèle semi-paramétrique est nécessaire. Ceci signifie que l on va modéliser la queue de distribution par une loi de valeurs extrêmes, tandis que des probabilités non extrêmes seront estimées empiriquement, soit avec la fonction de répartition empirique F n définie par F n x = n n {Xi x}. 7 i= 5
Si la loi des observations est dans le domaine d attraction d une loi de valeurs extrêmes, on peut utiliser la méthode des excès. On utilise l approximation 6 p = PX > xp + γy x/σ /γ PX > x. 8 On estime les paramètres γ et σ de la loi de Pareto généralisée avec les plus grandes observations, et pour un seuil x choisi en fonction des observations et donc aléatoire x = X n:n k, on estime la probabilité de dépassement du seuil par PX > x = F n X n:n k = k n. Pour des estimateurs ˆγ et ˆσ de γ et σ, l estimateur du quantil extrême ˆxp est caractérisé par p = k n + ˆγˆxp X n:n k/ˆσ /ˆγ, soit ˆxp = X n:n k + ˆσˆγ { } k/npˆγ. Dans le cas γ > 0, on peut choisir ψx = γx. On prend donc ˆσ = ˆγX n:n k et ˆxp = X k/npˆγ n:n k. Si l on a accepté l hypothèse γ = 0, on a l estimateur du quantile ˆxp = X n:n k + ˆσ logk/np. 3.3 Estimation de la prime nette En réassurance une quantité d intérêt est la prime nette, c est-à-dire la fonction ΠR = exp[x R + ] = E[X R X > R]PX > R, où x + = maxx, 0. Si la loi F des sinistres appartient au domaine d attraction d une loi de valeurs extrêmes, Pour R grand et 0 γ <, la relation 5 suggère l approximation ΠR ψr PX > R. 9 γ Si F MDAG γ avec γ > 0, on a ψr = γr. On choisit pour seuil R = X n:n k, on estime la probabilité PX > R empiriquement comme en 8 et on remplace γ par un estimateur ˆγ dans 9. On obtient alors un estimateur de la prime nette pour R = X n:n k défini par ΠX n:n k = ˆγ ˆγ k n X n:n k. 6
3.4 Lois de type Weibull Le domaine d attraction de la loi de Gumbel est très vaste et l approximation peut-être très mauvaise. Pour obtenir de meilleures approximations, on peut se restreindre aux lois de type Weibull. Une fonction de répartition F est dite de type Weibull si F x = e cxβ +ox β, c, β > 0. Le paramètre β est appelé paramètre de forme. Une loi de type Weibull est dans le domaine d attraction de la loi de Gumbel avec pour fonction auxiliaire Un estimateur de β est donné par ψx = cβ x β. ˆβ = k i= {log X n:n i+ log X n:n k } k i= {log logn/i log logn/k + } L estimateur ˆβ est consistant pour toute suite intermédiaire, et asymptotiquement normal si l on peut convenablement choisir la suite k, en fonction de conditions dites du second ordre. Les quantiles extrêmes d ordre /n sont estimés par log/p / ˆβ ˆxp = X n:n k logn/k. 4 Cas de dépendance temporelle Soit X,..., X n,... une suite de variables de même loi F MDAG γ. Si les variables sont de plus indépendantes, il existe des suites a n et b n telles que max i n X i b n /a n converge vers la loi G γ. Que peut-on dire si les observations ne sont pas indépendantes? Dans certains cas, il existe un réel θ ]0, ] appelé indice extrémal de la suite {X i } tel que max i n X i b n /a n converge vers la loi G θ γ, i.e. P max X i b n + a n x = G θ γx. i n Si θ =, la dépendance temporelle ne modifie pas le comportement asymptotique du maximum. Si θ <, la dépendance implique des différences par rapport au cas i.i.d. Par exemple, pour obtenir une approximation des quantiles extrêmes, on doit tenir alors compte de la dépendance. Soit xp le quantile d ordre p de G γ, i.e. G γ xp = p. On a alors l approximation P max X i b n + a n xp G θ γxp = p θ > p. i n Le quantile approché x θ p de max i n X i est donc inférieur à xp. 7
Exemple Soit Y i une suite i.i.d. de loi F MDAG γ et soit X i = maxy i, Y i+. Alors l indice extrémal de la suite {X i } est /2. 5 Lois de valeurs extrêmes multivariées Soit X,..., X d un vecteur aléatoire de loi F. On dit que F est dans le domaine d attraction du maximum d une loi de valeurs extrêmes multivariée G si il existe des suites a i b i n, i d telles que P max i n X i b n a n x,..., max i n X d i a i n b i n pour une suite i.i.d. X i,..., X d i de vecteurs aléatoires de loi F. x d = Gx,..., x d, Par transformation marginale, on peut en théorie toujours se ramener au cas où les lois marginales de F sont identiques et dans le domaine d attraction d une loi G γ avec γ > 0. On peut alors caractériser les lois ites multivariées G possibles. Pour simplifier les notations, on se restreint au cas d = 2. n, Théorème Soit F la fonction de répartition bivariée d un couple X, Y de lois marginales égales H MDAG γ avec γ > 0. Soit a n une suite vérifiant npx > a n =. La loi F est dans un domaine d attraction du maximum si et seulement si il existe une mesure ν sur R d + telle que P max i n X i x, max i n Y i y = exp{ ν[[0, x] [0, y] c ]}, a n a n ou de façon équivalente X np > x ou Y > y a n a n et la mesure ν a les propriétés suivantes : P X > tx ou Y > ty = = ν[[0, x] [0, y] c ], t PX > t νa < si A est séparé de 0, 0 t > 0, νta = t /γ νa. Plus généralement, on a, pour tout ensemble A séparé de 0, X, Y np P X, Y ta A = = νa, 2 t PX > t a n Exemples Si X et Y sont indépendantes, alors X np > x ou Y X > y = np > x a n a n a n x /γ + y /γ. Y X + np > y np > x et Y > y a n a n a n 8
La mesure ν ind est donc portée par les axes [0, ] {0} et {0} [0, ], c est-à-dire que pour tout A R 2 +, séparé de 0, si l on pose A = A [0, [ {0} et A 2 = A {0} [0, [, ν ind A = x /γ dx + y /γ dy. γ A γ A 2 En particulier, si A ne touche pas les axes, i.e. A = A 2 =, alors ν ind A = 0. Si X = Y comonotonie, alors la mesure ite ν c est portée par la diagonale = {x, y R 2 + x = y} et pour tout A, on a ν c A = y /γ dy. γ A Soit U, V, W trois variables i.i.d. dans le domaine d attraction de la loi G γ et soit Y = U +V et Y = V + W. Alors X, Y est dans le domaine d attraction d une loi bivariée et la mesure ν est caractérisée par ν[0, x] [0, c] c = 2 {x /γ + x y /γ + y /γ }. On en déduit la relation ν = 2 {ν ind + ν c }. Applications Probabilité de défaut simultané. Soit X et Y deux variables aléatoires représentés des risques actifs financiers, coûts de sinistres, etc. On s intérésse à la probabilité de défaut simultané : PX > D et Y > D 2 lorsque les seuils D et D 2 sont grands, ce que l on formalise en considérant des seuils dilatés a n D et a n D 2, avec npx > a n. On a alors npx > a nd et a n Y > D 2 = ν]d, [ ]D 2, [. Il reste donc à calculer ν]d, [ ]D 2, [ dans chacun des trois exemples précédents. Indépendance. On a vu que ν]d, [ ]D 2, [ = 0 et donc npx > a nd et a n Y > D 2 = 0. En première approximation, la probabilité de défault simultané est négligeable devant la probabilité d un seul défaut. Comonotonie. npx > a nd et Y > a n D 2 = ν]d, [ ]D 2, [ = D D 2 α. Cas X = U + V, Y = V + W, U, V, W i.i.d. npx > a nd et Y > a n D 2 = ν]d, [ ]D 2, [ = 2 D D 2 α. Portefeuille. Soit X et Y les coûts unitaires de deux contrats détenus en quantité a et b dans un portefeuille. Le coût total du portefeuille est ax + by. On s intéresse à la probabilité 9
que le coût total dépasse un seuil D : PaX + by > D. Soit A = {x, y R 2 + ax + by > }. On a alors npax + by > a nd = D /γ νa. On va déterminer dans les trois exemples précédents la valeur de νa pour quantifier l influence de la dépendance. Indépendance. Comonotonie. Cas X = U + V, Y = V + W, U, V, W i.i.d. ν ind A = a /γ + b /γ. ν c A = a + b /γ. νa = 2 {a/γ + b /γ + a + b /γ }. Prime nette. Si γ <, on peut calculer la prime nette pour un contrat où le réassureur intervient si X + Y dépasse la rétention R, soit ΠR = E[X + Y R + ] = R PX + Y > x dx = R PX + Y > Rt dt En posant A t = {x, y R 2 + x + y > t}, la ite 2 et la propriété d homogénéité permettent l approximation PX + Y > Rt ΠR = RPX > R dt PX > R RPX > R νa t dt = RPX > RνA t /γ RPX > R dt = νa. γ Il reste à calculer νa dans les trois exemples précédents. Indépendance. Comonotonicité. Cas X = U + V, Y = V + W, U, V, W i.i.d. ν ind A = 2. ν c A = 2 /γ. νa = + 2 /γ. La prime est minimale dans le cas de l indépendance et maximale pour la comonotonicité. 0