Réassurance et valeurs extrêmes

Documents pareils
Amphi 3: Espaces complets - Applications linéaires continues

Commun à tous les candidats

Probabilités sur un univers fini

Capes Première épreuve

Température corporelle d un castor (une petite introduction aux séries temporelles)

Simulation de variables aléatoires

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Le modèle de Black et Scholes

3 Approximation de solutions d équations

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Image d un intervalle par une fonction continue

Programmes des classes préparatoires aux Grandes Ecoles

Espérance conditionnelle

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Moments des variables aléatoires réelles

Cours d Analyse. Fonctions de plusieurs variables

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Projet Etienne Marceau Méthodes statistiques en assurance non vie

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Probabilités sur un univers fini

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

MATHS FINANCIERES. Projet OMEGA

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Probabilités III Introduction à l évaluation d options

3. Conditionnement P (B)

Limites finies en un point

Texte Agrégation limitée par diffusion interne

Introduction à la statistique non paramétrique

MODELES DE DUREE DE VIE

Structures algébriques

Méthodes de Simulation

MÉTHODE DE MONTE CARLO.

4. Martingales à temps discret

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.


Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Quantification Scalaire et Prédictive

Correction du Baccalauréat S Amérique du Nord mai 2007

Théorème du point fixe - Théorème de l inversion locale

TIQUE DE FRANCE NILSYSTÈMES D ORDRE 2 ET PARALLÉLÉPIPÈDES

CCP PSI Mathématiques 1 : un corrigé

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

EVALUATION DES RISQUES D EXPOSITION À UN CONTAMINANT ALIMENTAIRE : QUELQUES OUTILS STATISTIQUES.

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

I. Polynômes de Tchebychev

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

M2 IAD UE MODE Notes de cours (3)

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

PRECISION - REJET DE PERTURBATIONS T.D. G.E.I.I.

Mesure et gestion des risques d assurance

EXERCICE 4 (7 points ) (Commun à tous les candidats)

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Erreur statique. Chapitre Définition

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Sur certaines séries entières particulières

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Fonctions de plusieurs variables

Continuité en un point

TSTI 2D CH X : Exemples de lois à densité 1

Propriétés des options sur actions

Suites numériques 3. 1 Convergence et limite d une suite

Analyse Numérique : SMA-SMI S4 Cours, exercices et examens

Chapitre 7 : Intégration sur un intervalle quelconque

PRIME D UNE OPTION D ACHAT OU DE VENTE

Modélisation des risques

Travaux dirigés d introduction aux Probabilités

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Chapitre 2 Le problème de l unicité des solutions

Calcul intégral élémentaire en plusieurs variables

Loi binomiale Lois normales

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Algorithmes pour la planification de mouvements en robotique non-holonome

Introduction à l étude des Corps Finis

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Cours d analyse numérique SMI-S4

ALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII

Pierre Thérond Année universitaire

Cours Fonctions de deux variables

FIMA, 7 juillet 2005

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Chapitre 2. Eléments pour comprendre un énoncé

Baccalauréat ES Amérique du Nord 4 juin 2008

Modèles et Méthodes de Réservation

Travail en collaboration avec F.Roueff M.S.Taqqu C.Tudor

Cours de méthodes de scoring

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Programmation linéaire

Comparaison de fonctions Développements limités. Chapitre 10

Transcription:

MASTER ISIFAR 2ème Année Année universitaire 2008-2009 Réassurance et valeurs extrêmes Philippe Soulier Objectif L objectif du cours est l étude statistique de quantités d intérêt pour la réassurance. La réassurance ayant pour but la couverture des sinistres de très grand coût, la théorie statistique utile est la théorie des valeurs extrêmes. Ces notes présentent un bref rappel des éléments essentiels de la théorie des valeurs extrêmes univariées et des méthodes statistiques pour des observations i.i.d. 2 Lois de valeurs extrêmes univariées Définition Soit F une fonction de répartition sur R. On dit que F appartient au domaine d attraction du maximum d une loi G si il existe des suites a n et b n telles que F n b n + a n x = Gx, en tout point de continuité de la loi ite G, ou encore P max i n X i b n x = Gx pour une suite de variables i.i.d. de loi F. a n Caractérisation des lois ites possibles Les lois ites possibles sont les lois de valeurs extrêmes généralisées GEV G γ,µ,σ, γ, µ R, σ > 0, définies par G γ,µ,σ x = exp{ + γx µ/σ /γ }, si γ 0, G 0 x = e e x µ/σ, définies pour x tel que + γx µ/σ > 0. On note G γ = G γ,0, et la loi G 0 est appelée loi de Gumbel. Si X suit la loi G γ,µ,σ, alors X µ/σ suit la loi G γ. Les lois de valeurs extrêmes sont aussi les lois max-stables. Soit G une fonction de répartition telle qu il existe des suites {a n } et {b n } vérifiant pour tout x, alors G est une loi GEV. G n b n + a n x = Gx

Caractérisation des domaines d attraction Soit F une fonction de répartition. On dit que F est dans le domaine d attraction du maximum de la loi G γ, noté F MDAG γ si a lieu avec G = G γ. Soit U la fonction croissante définie sur [, [ par Ut = F /t = t. F Alors F est dans le domaine d attraction de la loi G γ si et seulement si il existe une fonction ψ telle que où t = sup{t R, F t < } et h γ x = Utx Ut = h γ x 2 t t ψ Ut x t γ dt = { t γ γ si γ 0, logt si γ = 0. La fonction ψ est appelée fonction auxiliaire et est définie à équivalence asymptotique près, i.e. si ψ vérifie t ψt/ ψt =, alors on peut remplacer ψ par ψ dans 2. Les suites normalisantes de la condition peuvent être choisies de la façon suivante : b n = Un, a n = ψb n = ψ Un. On distingue les trois domaines γ < 0, γ = 0 et γ > 0. Cas γ > 0. Le support de la loi F est non borné, i.e. t =. La fonction F est alors à variation régulière d indice /γ à l infini et la fonction U est à variation régulière d indice γ à l infini. On peut choisir pour fonction auxiliaire ψx = γx. Cas γ = 0. Le support de la loi F peut-être borné ou non borné. Dans le cas t = loi non bornée, la fonction auxiliaire ψx vérifie x ψx/x = 0 et si F est dérivable, on peut choisir ψ = F /F. Cas γ < 0. Ce cas est ramené au cas γ > 0 car une variable X est dans le domaine d attraction de la loi G γ si et seulement si le support de la loi de X est borné, i.e. t < et t X est dans le domaine d attraction de la loi G γ. Lois de Pareto généralisées La condition est équivalente à la convergence des excès conditionnels qui peut s exprimer de façon équivalente par l une ou l autre des ites suivantes γx, t t 3 γx. 4 La fonction log G γ x est une fonction de répartition. Pour µ R et σ > 0, on définit la loi de Pareto généralisée P γ,µ,σ par P γ,µ,σ x = log G γ x µ/σ 2

Convergence des moments Si γ 0 et p < /γ, E[X x p X > x] x ψx p = Pour 0 γ < et p =, on a = x p d{ log G γ x} = p 0 0 { p! si γ = 0, p 0 x p + γx /γ dx si γ > 0. x p { log G γ x} dx E[X x X > x] = x ψx γ. 5 Statistiques d ordre Soit X,..., X n des variables aléatoires i.i.d. de loi F. Les statistiques d ordre de l échantillon, notées X n:,..., X n:n, sont les observations ordonnées en croissant. Si F appartient au domaine d attraction d une loi de valeurs extrêmes G γ, alors on peut étudier le comportement asymptotique de la k-ème plus grande observation X n:n k+ dans le cas où k est fixe et dans le cas où k pas trop vite. Pour tout entier k fixé, PX n:n k+ Un + ψ Unx = +γx /γ u k e u du k! 0 Si k n est une suite croissante d entiers telle que k n et k n /n 0 une telle suite est appelée suite intermédiaire, alors X n:n kn Un/k n ψ Un/k n 0, la convergence ayant lieu en probabilité. Exemples La loi exponentielle appartient au domaine d attraction de la loi de Gumbel. On le prouve en utilisant la caractérisation 3, car on a pour tout t, x > 0 PX > t + x X > t = e x. La ite 3 est donc une égalité stricte pour tout t. C est la propriété caractéristique de la loi exponentielle. la fonction auxiliaire est donc ψ. La loi normale centrée réduite est dans le domaine d attraction de la loi de Gumbel. On peut choisir pour fonction auxiliaire ψx = /x. 3

Loi de Pareto. Une variable aléatoire positive X est dite de type Pareto si sa fonction de survie F x = PX > x est de la forme t F tx F t = x α pour un α > 0 et pour tout x > 0. On dit que F est à variation régulière à l infini d indice α. Le réel α est appelé l indice de Pareto ou de queue de la loi de X, et X est dans le domaine d attraction de la loi G γ avec γ = /α > 0. Il suffit de vérifier 3 en choisissant pou fonction auxiliaire ψx = γx : t F t + tx F t = + γx /γ. Loi uniforme. La loi uniforme sur [0, ] est dans le domaine d attraction de la loi G. On peut calculer directement P n{ max U i } x = e x i n pour tout x < 0. Soit P max U i /n + x/n i n = G x. On a donc la ite avec a n = /n et b n = /n. On peut aussi voir que 5 U est une loi de type Pareto d indice. 3 Estimation 3. Estimation de l indice des valeurs extrêmes Méthode du maximum de vraisemblance Soit X,..., X n sont des observations i.i.d. de la loi G γ,µ,σ. Si γ 0, la log-vraisemblance est n l n γ, µ, σ = n log σ γ + log + γ X i µ n + γ X i µ /γ. σ σ Pour γ = 0, la log-vraisemblance est l n 0, µ, σ = n log σ i= n exp X i µ/σ i= i= n X i µ/σ. L estimateur du maximum de vraisemblance maximise l. Il est toujours bien défini si γ > et asymptotitiquement normal si γ > /2. Si les observations Y,..., Y n sont issues d une loi F MDAG γ, on les regroupe par blocs de taille k et on définit m = [n/k] et des pseudo-observations X,, X m par X i = max j k Y i k+j, i m. On peut alors appliquer la procédure du maximum de vraisemblance aux pseudo-observations Y i. 4 i=

Méthode des excès Etant données n observations i.i.d. de la loi F MDAG γ, cette méthode dite méthode POT peaks over threshold consiste à ne conserver que les observations dépassant un certain seuil threshold, soit déterministe et le nombre d observation conservées est aléatoire, soit une statistique d ordre X n:n k et le nombre d observations conservées est k. Pour ces observations, on utilise la ite 3 qui justifie l approximation pour x grand et y > x, PX > y PX > x + γy x/σ /γ 6 avec σ = ψx. La loi des observations plus grande que x étant précisément la loi conditionnelle sachant X > x, on applique la méthode du maximum de vraisemblance à ces observations considérées comme suivant la loi de Pareto généralisée P γ,x,σ. Si l on a choisit le seuil X n:n k les observations sont donc Y j = X n:n j+ X n:n k, j k. La log-vraisemblance est donc k lγ, σ = k log σ γ + log + γy j σ j= l0, σ = k log σ k Y j. σ On obtient un estimateur de γ en maximisant la log-vraisemblance. j=, γ 0, Estimateur de Hill Si γ > 0, on définit un estimateur de γ par ˆγ Hill = k k log X n:n j+ log X n:n k. j= Cet estimateur est consistant pour toute suite intermediaire k, et asymptotiquement normal si l on peut convenablement choisir la suite k, en fonction de conditions dites du second ordre. 3.2 Estimation de quantiles extrêmes Soit p ]0, [. Le quantile xp d ordre p est défini par F xp = p. Si p est très petit par rapport au nombre d observations, i.e. p /n, une estimation empirique est impossible. Un modèle semi-paramétrique est nécessaire. Ceci signifie que l on va modéliser la queue de distribution par une loi de valeurs extrêmes, tandis que des probabilités non extrêmes seront estimées empiriquement, soit avec la fonction de répartition empirique F n définie par F n x = n n {Xi x}. 7 i= 5

Si la loi des observations est dans le domaine d attraction d une loi de valeurs extrêmes, on peut utiliser la méthode des excès. On utilise l approximation 6 p = PX > xp + γy x/σ /γ PX > x. 8 On estime les paramètres γ et σ de la loi de Pareto généralisée avec les plus grandes observations, et pour un seuil x choisi en fonction des observations et donc aléatoire x = X n:n k, on estime la probabilité de dépassement du seuil par PX > x = F n X n:n k = k n. Pour des estimateurs ˆγ et ˆσ de γ et σ, l estimateur du quantil extrême ˆxp est caractérisé par p = k n + ˆγˆxp X n:n k/ˆσ /ˆγ, soit ˆxp = X n:n k + ˆσˆγ { } k/npˆγ. Dans le cas γ > 0, on peut choisir ψx = γx. On prend donc ˆσ = ˆγX n:n k et ˆxp = X k/npˆγ n:n k. Si l on a accepté l hypothèse γ = 0, on a l estimateur du quantile ˆxp = X n:n k + ˆσ logk/np. 3.3 Estimation de la prime nette En réassurance une quantité d intérêt est la prime nette, c est-à-dire la fonction ΠR = exp[x R + ] = E[X R X > R]PX > R, où x + = maxx, 0. Si la loi F des sinistres appartient au domaine d attraction d une loi de valeurs extrêmes, Pour R grand et 0 γ <, la relation 5 suggère l approximation ΠR ψr PX > R. 9 γ Si F MDAG γ avec γ > 0, on a ψr = γr. On choisit pour seuil R = X n:n k, on estime la probabilité PX > R empiriquement comme en 8 et on remplace γ par un estimateur ˆγ dans 9. On obtient alors un estimateur de la prime nette pour R = X n:n k défini par ΠX n:n k = ˆγ ˆγ k n X n:n k. 6

3.4 Lois de type Weibull Le domaine d attraction de la loi de Gumbel est très vaste et l approximation peut-être très mauvaise. Pour obtenir de meilleures approximations, on peut se restreindre aux lois de type Weibull. Une fonction de répartition F est dite de type Weibull si F x = e cxβ +ox β, c, β > 0. Le paramètre β est appelé paramètre de forme. Une loi de type Weibull est dans le domaine d attraction de la loi de Gumbel avec pour fonction auxiliaire Un estimateur de β est donné par ψx = cβ x β. ˆβ = k i= {log X n:n i+ log X n:n k } k i= {log logn/i log logn/k + } L estimateur ˆβ est consistant pour toute suite intermédiaire, et asymptotiquement normal si l on peut convenablement choisir la suite k, en fonction de conditions dites du second ordre. Les quantiles extrêmes d ordre /n sont estimés par log/p / ˆβ ˆxp = X n:n k logn/k. 4 Cas de dépendance temporelle Soit X,..., X n,... une suite de variables de même loi F MDAG γ. Si les variables sont de plus indépendantes, il existe des suites a n et b n telles que max i n X i b n /a n converge vers la loi G γ. Que peut-on dire si les observations ne sont pas indépendantes? Dans certains cas, il existe un réel θ ]0, ] appelé indice extrémal de la suite {X i } tel que max i n X i b n /a n converge vers la loi G θ γ, i.e. P max X i b n + a n x = G θ γx. i n Si θ =, la dépendance temporelle ne modifie pas le comportement asymptotique du maximum. Si θ <, la dépendance implique des différences par rapport au cas i.i.d. Par exemple, pour obtenir une approximation des quantiles extrêmes, on doit tenir alors compte de la dépendance. Soit xp le quantile d ordre p de G γ, i.e. G γ xp = p. On a alors l approximation P max X i b n + a n xp G θ γxp = p θ > p. i n Le quantile approché x θ p de max i n X i est donc inférieur à xp. 7

Exemple Soit Y i une suite i.i.d. de loi F MDAG γ et soit X i = maxy i, Y i+. Alors l indice extrémal de la suite {X i } est /2. 5 Lois de valeurs extrêmes multivariées Soit X,..., X d un vecteur aléatoire de loi F. On dit que F est dans le domaine d attraction du maximum d une loi de valeurs extrêmes multivariée G si il existe des suites a i b i n, i d telles que P max i n X i b n a n x,..., max i n X d i a i n b i n pour une suite i.i.d. X i,..., X d i de vecteurs aléatoires de loi F. x d = Gx,..., x d, Par transformation marginale, on peut en théorie toujours se ramener au cas où les lois marginales de F sont identiques et dans le domaine d attraction d une loi G γ avec γ > 0. On peut alors caractériser les lois ites multivariées G possibles. Pour simplifier les notations, on se restreint au cas d = 2. n, Théorème Soit F la fonction de répartition bivariée d un couple X, Y de lois marginales égales H MDAG γ avec γ > 0. Soit a n une suite vérifiant npx > a n =. La loi F est dans un domaine d attraction du maximum si et seulement si il existe une mesure ν sur R d + telle que P max i n X i x, max i n Y i y = exp{ ν[[0, x] [0, y] c ]}, a n a n ou de façon équivalente X np > x ou Y > y a n a n et la mesure ν a les propriétés suivantes : P X > tx ou Y > ty = = ν[[0, x] [0, y] c ], t PX > t νa < si A est séparé de 0, 0 t > 0, νta = t /γ νa. Plus généralement, on a, pour tout ensemble A séparé de 0, X, Y np P X, Y ta A = = νa, 2 t PX > t a n Exemples Si X et Y sont indépendantes, alors X np > x ou Y X > y = np > x a n a n a n x /γ + y /γ. Y X + np > y np > x et Y > y a n a n a n 8

La mesure ν ind est donc portée par les axes [0, ] {0} et {0} [0, ], c est-à-dire que pour tout A R 2 +, séparé de 0, si l on pose A = A [0, [ {0} et A 2 = A {0} [0, [, ν ind A = x /γ dx + y /γ dy. γ A γ A 2 En particulier, si A ne touche pas les axes, i.e. A = A 2 =, alors ν ind A = 0. Si X = Y comonotonie, alors la mesure ite ν c est portée par la diagonale = {x, y R 2 + x = y} et pour tout A, on a ν c A = y /γ dy. γ A Soit U, V, W trois variables i.i.d. dans le domaine d attraction de la loi G γ et soit Y = U +V et Y = V + W. Alors X, Y est dans le domaine d attraction d une loi bivariée et la mesure ν est caractérisée par ν[0, x] [0, c] c = 2 {x /γ + x y /γ + y /γ }. On en déduit la relation ν = 2 {ν ind + ν c }. Applications Probabilité de défaut simultané. Soit X et Y deux variables aléatoires représentés des risques actifs financiers, coûts de sinistres, etc. On s intérésse à la probabilité de défaut simultané : PX > D et Y > D 2 lorsque les seuils D et D 2 sont grands, ce que l on formalise en considérant des seuils dilatés a n D et a n D 2, avec npx > a n. On a alors npx > a nd et a n Y > D 2 = ν]d, [ ]D 2, [. Il reste donc à calculer ν]d, [ ]D 2, [ dans chacun des trois exemples précédents. Indépendance. On a vu que ν]d, [ ]D 2, [ = 0 et donc npx > a nd et a n Y > D 2 = 0. En première approximation, la probabilité de défault simultané est négligeable devant la probabilité d un seul défaut. Comonotonie. npx > a nd et Y > a n D 2 = ν]d, [ ]D 2, [ = D D 2 α. Cas X = U + V, Y = V + W, U, V, W i.i.d. npx > a nd et Y > a n D 2 = ν]d, [ ]D 2, [ = 2 D D 2 α. Portefeuille. Soit X et Y les coûts unitaires de deux contrats détenus en quantité a et b dans un portefeuille. Le coût total du portefeuille est ax + by. On s intéresse à la probabilité 9

que le coût total dépasse un seuil D : PaX + by > D. Soit A = {x, y R 2 + ax + by > }. On a alors npax + by > a nd = D /γ νa. On va déterminer dans les trois exemples précédents la valeur de νa pour quantifier l influence de la dépendance. Indépendance. Comonotonie. Cas X = U + V, Y = V + W, U, V, W i.i.d. ν ind A = a /γ + b /γ. ν c A = a + b /γ. νa = 2 {a/γ + b /γ + a + b /γ }. Prime nette. Si γ <, on peut calculer la prime nette pour un contrat où le réassureur intervient si X + Y dépasse la rétention R, soit ΠR = E[X + Y R + ] = R PX + Y > x dx = R PX + Y > Rt dt En posant A t = {x, y R 2 + x + y > t}, la ite 2 et la propriété d homogénéité permettent l approximation PX + Y > Rt ΠR = RPX > R dt PX > R RPX > R νa t dt = RPX > RνA t /γ RPX > R dt = νa. γ Il reste à calculer νa dans les trois exemples précédents. Indépendance. Comonotonicité. Cas X = U + V, Y = V + W, U, V, W i.i.d. ν ind A = 2. ν c A = 2 /γ. νa = + 2 /γ. La prime est minimale dans le cas de l indépendance et maximale pour la comonotonicité. 0