Modélisation des distributions de sinistres. Exercices et solutions



Documents pareils
Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Loi binomiale Lois normales

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Annexe commune aux séries ES, L et S : boîtes et quantiles

3. Caractéristiques et fonctions d une v.a.

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Méthodes de Simulation

Simulation de variables aléatoires

Modélisation aléatoire en fiabilité des logiciels

Modélisation des risques

TSTI 2D CH X : Exemples de lois à densité 1

TABLE DES MATIERES. C Exercices complémentaires 42

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Programmes des classes préparatoires aux Grandes Ecoles

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

Correction de l examen de la première session

PROBABILITES ET STATISTIQUE I&II

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Moments des variables aléatoires réelles

MODELES DE DUREE DE VIE

Table des matières. I Mise à niveau 11. Préface

3 Approximation de solutions d équations

Probabilités III Introduction à l évaluation d options

Projet Etienne Marceau Méthodes statistiques en assurance non vie

Variables Aléatoires. Chapitre 2

Théorème du point fixe - Théorème de l inversion locale

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Commun à tous les candidats

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Modèles et Méthodes de Réservation

EXERCICES - ANALYSE GÉNÉRALE

La fonction exponentielle

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Statistique : Résumé de cours et méthodes

Probabilités conditionnelles Exercices corrigés

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

MÉTHODE DE MONTE CARLO.

CNAM léments de cours Bonus-malus et Crédibilité

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

I. Polynômes de Tchebychev

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Résumé des communications des Intervenants

EPREUVES AU CHOIX DU CANDIDAT. Durée : De 09 h 00 à 12 h 00 (Heure de Yaoundé, TU + 1)

Modélisation et simulation

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Estimation et tests statistiques, TD 5. Solutions

Soutenance de stage Laboratoire des Signaux et Systèmes

Introduction à l approche bootstrap

Statistiques Descriptives à une dimension

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

Précision d un résultat et calculs d incertitudes

FINANCEMENT OPTIMAL DE LA SOLVABILITE D UN ASSUREUR

Chapitre 2 Le problème de l unicité des solutions

4 Distributions particulières de probabilités

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Chapitre 3 : INFERENCE

EXERCICE 4 (7 points ) (Commun à tous les candidats)

FIMA, 7 juillet 2005

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

Processus aléatoires avec application en finance

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

3. Conditionnement P (B)

Pierre Thérond Année universitaire

M2 IAD UE MODE Notes de cours (3)

Économetrie non paramétrique I. Estimation d une densité

Cours d Analyse. Fonctions de plusieurs variables

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

Séries Statistiques Simples

Chapitre 3. Les distributions à deux variables

Correction du baccalauréat ES/L Métropole 20 juin 2014

Correction du Baccalauréat S Amérique du Nord mai 2007

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Travaux dirigés d introduction aux Probabilités

PLAN STATISTIQUE AUTOMOBILE DU QUÉBEC Définitions

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Mesure et gestion des risques d assurance

Complément d information concernant la fiche de concordance

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Modélisation de la dépendance entre les garanties applicables en assurance automobile

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Fonctions de plusieurs variables

Correction du baccalauréat STMG Polynésie 17 juin 2014

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Correction du baccalauréat S Liban juin 2007

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: F:

Continuité en un point

Rappels sur les suites - Algorithme

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Transcription:

Modélisation des distributions de sinistres Exercices et solutions

Modélisation des distributions de sinistres Exercices et solutions Hélène Cossette Vincent Goulet Michel Jacques Mathieu Pigeon École d actuariat, Université Laval

2009 Hélène Cossette, Vincent Goulet, Michel Jacques, Mathieu Pigeon Cette création est mise à disposition selon le contrat Paternité-Partage à l identique 2.5 Canada disponible en ligne http://creativecommons.org/licenses/by-sa/ 2.5/ca/ ou par courrier postal à Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA. Historique de publication Septembre 2009 : Première édition Septembre 2008 : Première version préliminaire Code source Le code source LATEX de ce document est disponible à l adresse http://vgoulet.act.ulaval.ca/distributions_sinistres/ ou en communiquant directement avec les auteurs. ISBN 978-2-9811416-1-3 Dépôt légal Bibliothèque et Archives nationales du Québec, 2009 Dépôt légal Bibliothèque et Archives Canada, 2009

Introduction Ce document est le fruit de la mise en commun d exercices colligés au fil du temps pour nos cours de modélisation des distributions de sinistres à l Université Laval et à l Université Concordia. Nous ne sommes toutefois pas les uniques auteurs des exercices ; certains ont, en effet, été rédigés par les Docteurs José Garrido et Jacques Rioux, entre autres. Quelques exercices proviennent également d anciens examens de la Society of Actuaries et de la Casualty Actuarial Society. C est d ailleurs afin de ne pas usurper de droits d auteur que ce document est publié selon les termes du contrat Paternité-Partage des conditions initiales à l identique 2.5 Canada de Creative Commons. Il s agit donc d un document «libre» que quiconque peut réutiliser et modifier à sa guise, à condition que le nouveau document soit publié avec le même contrat. Les exercices sont divisés en six chapitres qui correspondent aux chapitres de notre cours. Le chapitre 1 porte sur des rappels de notions de base en analyse, probabilité et statistique. Le chapitre 2 traite des fondements de la modélisation en assurance de dommages, en particulier le traitement mathématique des franchises, limite supérieure et coassurance ainsi que de l effet de l inflation sur la fréquence et la sévérité des sinistres. Les aspects plus statistiques apparaissent au chapitre 3 avec la modélisation non paramétrique. Le chapitre 4 étudie les principales distributions utilisées en assurance de dommages et la création de nouvelles distributions à partir des lois usuelles. Les chapitres 5 et 6 portent quant à eux sur l estimation paramétrique et les tests d adéquation des modèles. Enfin, le chapitre 7 propose une brève incursion dans la modélisation des distributions de fréquence des sinistres. Les termes anglais ordinary deductible et franchise deductible nous ont posé quelques soucis de traduction. Pour le premier, nous utilisons l expression «franchise forfaitaire» recommandée par Béguin (1990). Pour le second terme, beaucoup moins répandu, nous avons opté pour l expression «franchise atteinte» suggérée, entre autres, dans Charbonnier (2004). Les réponses des exercices se trouvent à la fin de chacun des chapitres, alors que les solutions complètes sont regroupées à l annexe E. De plus, on trouvera à la fin de chaque chapitre (sauf le premier) une liste non exhaustive d exercices proposés dans Klugman et collab. (2008a). Des solutions de ces exercices sont offertes dans Klugman et collab. (2008b). L annexe A présente la paramétrisation des lois de probabilité continues v

vi Introduction et discrètes utilisée dans les exercices. L information qui s y trouve est en plusieurs points similaire à celle des annexes A et B de Klugman et collab. (1998, 2004, 2008a), mais la paramétrisation des lois est dans certains cas différente. Le lecteur est donc fortement invité à la consulter. Plusieurs exercices de ce recueil requièrent l utilisation de R (R Development Core Team, 2009) et du package actuar (Dutang et collab., 2008). L annexe B explique comment configurer R pour faciliter l installation et l administration de packages externes. Enfin, les annexes C et D contiennent des tableaux de quantiles des lois normale et khi carré. Nous remercions d avance les lecteurs qui voudront bien nous faire part de toute erreur ou omission dans les exercices ou leurs solutions. Hélène Cossette <helene.cossette@act.ulaval.ca> Vincent Goulet <vincent.goulet@act.ulaval.ca> Michel Jacques <michel.jacques@act.ulaval.ca> Mathieu Pigeon <mathieu.pigeon@uclouvain.be> Québec, septembre 2009

Table des matières Introduction v 1 Rappels d analyse, de probabilité et de statistique 1 2 Modélisation en assurance de dommages 7 3 Modélisation non paramétrique 13 4 Modèles paramétriques potentiels 21 5 Modélisation paramétrique 27 6 Tests d adéquation 35 7 Modèles de fréquence 39 A Paramétrisation des lois de probabilité 43 A.1 Famille bêta transformée....................... 44 A.2 Famille gamma transformée..................... 47 A.3 Autres distributions continues................... 49 A.4 Distributions discrètes de la famille (a, b,0)............ 52 B Installation de packages dans R 55 C Table de quantiles de la loi normale 57 D Table de quantiles de la loi khi carré 59 E Solutions 61 Chapitre 1.................................. 61 Chapitre 2.................................. 73 Chapitre 3.................................. 85 Chapitre 4.................................. 103 Chapitre 5.................................. 114 Chapitre 6.................................. 131 Chapitre 7.................................. 137 Bibliographie 145 vii

1 Rappels d analyse, de probabilité et de statistique 1.1 On a l inégalité 1 2 x2 24 < 1 cos(x) x 2 < 1 2 vraie pour toutes valeurs de x près de 0. Calculer 1 cos(x) lim x 0 x 2 et faire le graphique de la fonction et des deux bornes pour 2 x 2. 1.2 Calculer x lim x 0 ln(x + 1). 1.3 Calculer lim x 0 (1 + x) 1/x. 1.4 a) Déterminer laquelle des expressions, x ou ln(x), tend la plus rapidement vers l infini lorsque x tend vers l infini. b) Répéter la partie a) avec x et e x. 1.5 Il faut parfois élargir l ensemble des nombres réels à celui des nombres complexes. Un nombre complexe z se présente souvent sous la forme d une somme z = a + bi où a et b sont des nombres réels et i est un nombre imaginaire particulier tel que i 2 = 1. 1

2 Rappels d analyse, de probabilité et de statistique De là, il découle que i 3 = (i 2 )(i) = ( 1)(i) = i i 4 = (i 2 )(i 2 ) = ( 1)( 1) = 1 i 5 = i i 6 = 1 et ainsi de suite. À partir du développement connu de e x, e x = 1 + x + x2 2! + x3 3! + x4 4! +..., démontrer l identité d Euler e iπ = 1 en suivant les étapes suivantes. a) Développer autour de c = 0 la fonction f (x) = cos(x). b) Développer autour de c = 0 la fonction f (x) = sin(x). c) Développer, en remplaçant x par ix la fonction f (x) = e ix. d) Démontrer l identité e ix = cos(x) + i sin(x). e) Démontrer l identité e iπ = 1. 1.6 Soit la fonction F(x) = 1 1 + e x < x <. Démontrer qu il s agit d une fonction de répartition. 1.7 Soit X, une variable aléatoire continue avec fonction de densité f (x) et fonction de répartition F(x). On choisit une valeur quelconque x 0 et on définit la fonction { f (x) g(x) = 1 F(x 0 ), x x 0 0, x < x 0. On suppose que F(x 0 ) < 1. Démontrer que g(x) est une densité de probabilité. 1.8 Soit X, une variable aléatoire avec une distribution de Pareto(α, λ) : f (x) = αλ α, x > 0, α > 0, λ > 0. (x + λ) α+1 Calculer la fonction de survie S(x) = 1 F(x) et en faire le graphique pour α = 2 et λ = 3 000.

Rappels d analyse, de probabilité et de statistique 3 1.9 Soit X, une variable aléatoire avec une distribution Binomiale(n, p), c està-dire que ( ) n Pr(X = x) = p x (1 p) n x, x = 0,1,.... x Déterminer la distribution de la variable aléatoire Y = n X. 1.10 Soit X N(µ, σ 2 ). La variable aléatoire Y = e X est distribuée selon la loi log-normale. a) Exprimer la fonction de densité de probabilité et la fonction de répartition de Y en fonction de celles de X. b) Calculer Var[Y]. 1.11 La distribution de Cauchy a comme fonction de densité de probabilité f (x) = 1 π 1, < x <. 1 + x2 Démontrer que l espérance de cette distribution n existe pas, c est-à-dire que E[ X ] =. 1.12 Soit X, une variable aléatoire avec densité Poisson(λ) et soit g(x), une fonction telle que < E[g(X)] < et < g( 1) <. Démontrer que E[λg(X)] = E[Xg(X 1)]. 1.13 Soient X et Y, deux variables aléatoires continues. On définit M = max(x,y) m = min(x,y). Démontrer que E[M] = E[X] + E[Y] E[m]. 1.14 Soit X, une variable aléatoire avec densité f X (x) = 7e 7x, 0 < x <, et soit Y = 4X + 3. Calculer la densité de Y en utilisant la technique de la fonction de répartition. 1.15 Soit X, une variable aléatoire avec densité f X (x) = x 2 /9, 0 < x < 3. Trouver la fonction de densité de probabilité de Y = X 3. 1.16 Soit X, une variable aléatoire avec distribution N(0, σ 2 ). Trouver la distribution de Y = X 2. 1.17 Pour une densité quelconque, démontrer que si la densité est symétrique par rapport à un point a, alors le coefficient d asymétrie est 0.

4 Rappels d analyse, de probabilité et de statistique 1.18 Soit X, une variable aléatoire avec densité f (x) = e x, x > 0. Calculer son coefficient d asymétrie. 1.19 Soit X, une variable aléatoire avec densité f (x) = 1, 1 < x < 1. 2 Calculer son coefficient d aplatissement et commenter. 1.20 Déterminer la fonction génératrice des moments de la densité f (x) = 2x c 2, 0 < x < c. 1.21 Soit X 1 et X 2 les moyennes de deux échantillons aléatoires indépendants de taille n d une population avec variance σ 2, trouver une valeur de n telle que ( Pr X 1 X 2 < σ ) 0,99. 5 1.22 Soit X la moyenne d un échantillon de taille 100 issu d une loi χ 2 (50). a) Trouver la distribution exacte de X. b) Calculer à l aide d un logiciel statistique la valeur exacte de Pr[49 < X < 51]. c) Calculer une valeur approximative de la probabilité en b). 1.23 Soit ˆΘ, un estimateur de la variance d une loi de Pareto(3, 1 000). Sachant que E[ ˆΘ] = 749 500 et que Var[ ˆΘ] = 750, trouver le biais et l erreur quadratique moyenne de ˆΘ. 1.24 Soit X 1,..., X n, un échantillon aléatoire d une population avec moyenne µ et variance σ 2. a) Démontrer que l estimateur T(X) = n i=1 a ix i est un estimateur sans biais de µ si n i=1 a i = 1. b) On nomme les estimateurs de la forme en a) des estimateurs sans biais linéaires. Parmi ceux-ci, trouver celui avec la plus petite variance. 1.25 Soit X 1,..., X n un échantillon aléatoire d une distribution avec moyenne µ et variance σ 2. Démontrer que n 1 n i=1 (X i µ) 2 est un estimateur sans biais de σ 2. 1.26 Soit X, une observation d une population dont la densité est f (x;θ) = ( ) θ x (1 θ) 1 x, x = 1,0,1; 0 θ 1. 2

Rappels d analyse, de probabilité et de statistique 5 Soit l estimateur T(X) = { 2, x = 1 0, ailleurs. Démontrer que T(X) est un estimateur sans biais pour θ. 1.27 Soit X Binomiale(n, p). Démontrer que n X ( 1 X ) n n est un estimateur biaisé de la variance de X. Calculer le biais de l estimateur ci-dessus. 1.28 Calculer l efficacité de X comme estimateur du paramètre λ d une distribution de Poisson. 1.29 Deux experts tentent d évaluer le montant des dommages causés par un ouragan. La variable aléatoire X représente l évaluation du premier expert et la variable aléatoire Y représente l évaluation faite par le second expert. On suppose que les deux experts travaillent de façon indépendante. Les données suivantes sont connues : E[X] = 0,8z, E[Y] = z, Var[X] = z 2, et Var[Y] = 1,5z 2, où z représente le vrai montant des dommages. On considère une classe d estimateurs pour z de la forme 1.30 Soit Ẑ = αx + βy. Déterminer les valeurs de α et β qui feront de ˆX l estimateur sans biais à variance uniformément minimale de z. a) Identifier cette distribution. f (x;θ) = 1 θ x(1 θ)/θ, 0 < x < 1, θ > 0. b) Démontrer que l estimateur du maximum de vraisemblance de θ est ˆθ = 1 n n i=1 ln X i. c) Démontrer que ˆθ est un estimateur sans biais de θ. Réponses 1.1 1 2 1.2 1

6 Rappels d analyse, de probabilité et de statistique 1.3 e 1.4 a) x plus rapide que ln(x) b) e x plus rapide que x 1.8 S(x) = ( x x+λ ) α 1.9 Binomiale(n, 1 p) 1.10 a) F Y (x) = F X (ln x), f Y (x) = x 1 f X (ln x) b) e 2µ+σ2 (e σ2 1) 1.14 f Y (y) = 7 4 e 7 4 (y 3), y > 3 1.15 f Y (y) = 1 27, 0 < y < 27 1.16 Gamma( 1 2, 1 2 σ 2 ) 1.18 2 1.19 9/5 1.20 2(ct) 2 (ct2 tc e tc + 1) 1.21 332 1.22 a) Gamma(2 500, 50) b) 0,682722 c) 0,6826 1.23 Biais : 500 ; MSE : 250 750 1.24 b) X 1.28 1 1.29 α = 0,6122, β = 0,5102. 1.30 a) Bêta(1/θ, 1)

2 Modélisation en assurance de dommages Rappelons que l expression «franchise forfaitaire» correspond au terme anglais ordinary deductible, alors que l expression «franchise atteinte» correspond au terme franchise deductible. 2.1 Les montants suivants représentent les coûts associés aux réparations automobiles de 12 contrats : {579,110,842,213,98,445,1 332,162,131,276,312,482}. Les contrats présentent une franchise forfaitaire de 250 $. Calculer le rapport d élimination de perte (LER) de l assureur. 2.2 Les montants suivants représentent les coûts associés à des accidents automobiles pour huit contrats : {86 000,123 000,423 000,43 000,213 000,28 000,52 000,178 000}. Les contrats présentent une limite supérieure de 100 000 $. Calculer le rapport d élimination de perte de l assureur. 2.3 Pour un portefeuille dont le montant d un sinistre obéit à une loi exponentielle de paramètre 0,02, trouver le rapport d élimination de perte découlant de l introduction des limites de couvertures suivantes. a) Une franchise atteinte de 10. b) Une franchise forfaitaire de 10. 2.4 On suppose que le montant d un sinistre obéit à une distribution gamma de paramètres α = 4 et λ = 0,1. Un assureur a signé un traité avec un réassureur où ce dernier s engage à payer l excédent de 100 sur chacun des sinistres. Trouver le rapport d élimination de perte de l assureur. 2.5 Dans un groupe d assurés, les sinistres suivants sont survenus : {20,50,80,80,80,85,90,110,150,240,360,400}. Trouver le rapport d élimination de perte de l assureur si celui-ci a instauré une franchise forfaitaire de 70 et s il limite ses paiements à 200. 7

8 Modélisation en assurance de dommages 2.6 Soit X, la variable aléatoire représentant le montant d un sinistre. On sait que E[X] = 2 000, que E[X; 30 000] = 1 640,79 et que le rapport d élimination de perte de l assureur pour un contrat avec une franchise forfaitaire de 100 est de 0,0465. Trouver le rapport d élimination de perte de l assureur pour un contrat avec une franchise forfaitaire de 100 et une limite supérieure de 30 000. 2.7 Soit X, une variable aléatoire représentant le montant d un sinistre tel que a) Trouver E[X; d]. f X (x) = e 2x + e x 2, x > 0. b) Soit N, une variable aléatoire représentant la fréquence des sinistres. Calculer la prime pure (fréquence moyenne multipliée par la sévérité moyenne) pour une franchise de d = 0,25 et une fréquence moyenne de un sinistre tous les 10 ans. c) Si on observe un taux d inflation de 5 %, que devient la prime pure? 2.8 On suppose que le montant d un sinistre obéit à une loi Pareto de paramètres α = 1,5 et λ = 2 500. a) Calculer le montant moyen des sinistres payé par un assureur pour un contrat de réassurance avec une rétention de 50 000. b) Trouver le rapport d élimination de perte pour le réassureur si la rétention est de 100 000. 2.9 Soit Y P la variable aléatoire du montant payé par paiement pour un contrat d assurance avec une franchise forfaitaire de d et X est la variable aléatoire du montant d un sinistre. Démontrer que E[Y P ] = E[X] E[X;d], 1 F X (d) où E[X;d] = E[min(X, d)] est l espérance limitée de X à d. Interpréter le résultat. 2.10 Un assureur décide de modéliser X, la variable aléatoire du montant d un sinistre, par une distribution Weibull de paramètres τ = 3 et λ = 1/15. Tracer (idéalement de manière informatique, à l aide du package actuar) les graphiques des variables aléatoires suivantes. a) La variable aléatoire du montant payé par sinistre pour un contrat avec une franchise forfaitaire de 10. b) La variable aléatoire du montant payé par paiement pour une franchise atteinte de 10 et une limite supérieure de 40. c) La variable aléatoire du montant du sinistre avec une coassurance de 80 %.

Modélisation en assurance de dommages 9 2.11 Un assureur dispose des informations suivantes : le montant d un sinistre pour l année 1990 obéit à une loi Pareto de paramètres α = 1,5 et λ = 1 500 ; un taux d inflation de 5 % par année a été observé entre 1990 et 1992 et de 6 % par année entre 1992 et 1995 ; et une franchise de 500 est introduite en 1995. a) Calculer le rapport d élimination de perte pour l assureur en 1995. b) L assureur paie un sinistre en 1995. Déterminer la probabilité qu il paie plus de 2 000 $ c) Déterminer la charge espérée par sinistre de l assureur s il avait décidé en 1995 de ne pas payer plus de 3 500 $ par sinistre (en plus de la franchise de 500 $). 2.12 Le tableau ci-dessous présente, sous forme groupée, les montants payés par sinistre pour des sinistres en assurance habitation couverts par des contrats ayant une limite supérieure de 300 000 $. Montant payé Nombre Montant moyen 0 2 500 41 1 389 2 500 7 500 48 4 661 7 500 12 500 24 9 991 12 500 17 500 18 15 482 17 500 22 500 15 20 232 22 500 32 500 14 26 616 32 500 47 500 16 40 278 47 500 67 500 12 56 414 67 500 87 500 6 74 985 87 500 125 000 11 106 851 125 000 225 000 5 184 735 225 000 300 000 4 264 025 300 000 3 300 000 Pour modéliser les données, on utilise une distribution log-normale de paramètres µ et σ 2. À l aide d une technique d estimation quelconque, on trouve que ˆµ = 9,356 et ˆσ = 1,596. a) Estimer le montant payé espéré. b) Estimer le pourcentage de changement dans le montant payé par paiement espéré si l on observe une inflation de 10 % des sinistres. c) Estimer le pourcentage de réduction dans le montant payé espéré si l on décide d ajouter une franchise de 1 000 $ au contrat de base (on ne tient plus compte de l inflation). 2.13 Soit X, la variable aléatoire représentant le montant d un sinistre en responsabilité professionnelle pour un médecin. On suppose que la compagnie d assurance achète un traité de réassurance de rétention δ par

10 Modélisation en assurance de dommages réclamation, c est-à-dire que le réassureur paie l excédent des pertes audessus de δ pour chaque réclamation. Si l on suppose que X a une distribution de Pareto(α, λ), démontrer que la distribution du montant payé par paiement du réassureur a une distribution de Pareto de paramètres α et λ + δ. 2.14 On suppose que le montant d un sinistre obéit à une loi exponentielle de paramètre 3, c est-à-dire que f (x) = 3 3x, x > 0. On introduit une franchise forfaitaire de 0,2. Lorsque l assureur effectue un paiement, quelle est la probabilité qu il soit de plus de 0,50? 2.15 Une compagnie décide d acheter deux contrats d assurance pour l année à venir. Le montant moyen des sinistres pour une année est de 11 100 $. La police A a une franchise forfaitaire de 5 000 $ et ne présente pas de limite, alors que la police B a une limite de 5 000 $ et ne présente pas de franchise. Pour la police A, l espérance de la variable aléatoire du montant payé par sinistre, Y S, est de 6 500 $ et l espérance de la variable aléatoire du montant payé par paiement, Y P, est de 10 000 $. Sachant qu un sinistre d un montant plus petit ou égal à 5 000 $ s est produit, calculer l espérance de la variable aléatoire du montant payé par paiement pour le contrat B. 2.16 Un assureur utilise une distribution binomiale négative de paramètres r = 3 et θ = 1/6 pour modéliser la fréquence des sinistres par année et une distribution de Weibull de paramètres τ = 0,3 et λ = 1/1 000 pour modéliser la sévérité des sinistres. Il décide également d appliquer une franchise forfaitaire de 200. Déterminer le nombre espéré de paiements que fera l assureur par année. 2.17 Pour un contrat comportant une franchise forfaitaire de d, une limite supérieure de u et une coassurance de α, la variable aléatoire du montant payé par sinistre, Y S, est donnée à partir de la variable aléatoire du montant d un sinistre, X, par 0, X < d Y S = α(x d), d X < u α(u d), X u. a) Démontrer que E[Y S ] = α(e[x;u] E[X;d]). b) Trouver Var[Y S ]. c) Trouver l expression générale de l espérance du montant payé par sinistre à la suite d une inflation de 100r %. 2.18 Soient Y S, la variable aléatoire du montant payé par sinistre, X, la variable aléatoire du montant d un sinistre, d une franchise forfaitaire et

Modélisation en assurance de dommages 11 u, une limite supérieure. Démontrer la relation E[Y S ] = E[X;u] E[X;d] à l aide d intégrales, et non par une définition astucieuse de la variable aléatoire Y S. 2.19 Le ratio de perte (loss ratio) R est défini comme étant le montant total des sinistres payés pendant l année, S, divisé par le montant total des primes reçues pendant l année, π. Une compagnie d assurance souhaite bien entendu conserver ce ratio sous un certain niveau pour ne pas être en difficulté financière. Pour ce faire, elle offre un bonus B à ses agents à la fin de l année si le ratio de perte pour l année est inférieur à 75 %. Le montant du bonus est calculé comme suit : B = max ( 0, π ( 0,75 R 3 )). Calculer le montant espéré du bonus si π = 600 000 et que la distribution de la variable aléatoire S est une Pareto avec paramètres α = 3 et λ = 700 000. 2.20 Soit X, une variable aléatoire représentant le montant d un sinistre. Un assureur souhaite connaître les paiements à sa charge pour un contrat d assurance incluant une franchise décroissante (disappearing deductible). Dans ce type de contrat, l assuré assume en entier tout sinistre inférieur à d et l assureur assume en entier tout sinistre supérieur à d. Entre d et d, le paiement effectué par l assureur est une fonction linéaire du montant d un sinistre. a) Définir la variable aléatoire Y P représentant le montant payé par paiement pour un contrat avec une franchise décroissante. b) Trouver l expression générale en termes de E[X], E[X; x] et F X (x) du montant payé par paiement espéré. Exercices proposés dans Loss Models 3.5, 3.7, 3.8, 3.9, 3.11, 3.15, 8.1 8.2, 8.3, 8.5 8.7 8.8 8.11, 8.12, 8.14, 8.16, 8.17, 8.18, 8.19, 8.23, 8.24, 8.25, 8.26, 8.27. 8.28 Réponses 2.1 0,4946 2.2 0,4686 2.3 a) 0,0175 b) 0,1813 2.4 0,0034 2.5 0,567

12 Modélisation en assurance de dommages 2.6 0,226 2.7 a) (3 e 2d 2e d )/4 b) 0,0541 c) 0,0576 2.8 a) 1 091,09 b) 0,8438 2.11 a) 0,1069 b) 0,4107 c) 1 255,23 2.12 a) 33 962 b) +8,04 % c) 2,87 % 2.14 0,22 2.15 3 857 2.16 8,0925 2.17 b) α 2 (E[X 2 ;u 2 ] E[X 2 ;d 2 ] 2dE[X;u] + 2dE[X;d]) α 2 (E[X;u] E[X;d]) 2 c) α(1 + r)(e[x;u/(1 + r)] E[X;d/(1 + r)]) 2.19 76 559,55 2.20 b) (E[X] + d/(d d)e[x;d ] d /(d d)e[x;d])/(1 F X (d))

3 Modélisation non paramétrique 3.1 Un assureur présente les coûts (en millions de $) créés par les écrasements de météorites : {3,5,5,6,8,8,8,8,9,10,10,11,11,11,16,21,23,26,29,36}. a) Faire des graphiques de la fonction de répartition empirique et de la fonction de masse de probabilité empirique du coût des écrasements. b) À partir des bornes c 0 = 2, c 1 = 7, c 2 = 12, c 3 = 22 et c 4 = 38, écrire l équation de l ogive. c) En utilisant les mêmes bornes qu en b), écrire l équation de l histogramme. 3.2 Le tableau ci-dessous présente les sinistres enregistrés par un assureur. Classe Nombre de sinistres (0, 50] 36 (50, 150] x (150, 250] y (250, 500] 84 (500, 1 000] 80 (1 000, ) 0 Total Soit F n ( ) l ogive correspondant à ces données. Sachant que F n (90) = 0,21 et F n (210) = 0,51, déterminer la valeur de x. 3.3 Pour 500 sinistres, un assureur a enregistré la distribution présentée au tableau ci-dessous. Classe n Nombre de sinistres (0, 500] 200 (500, 1 000] 110 (1 000,2 000] x (2 000,5 000] y (5 000,10 000] (10 000,25 000] (25 000, ) 13

14 Modélisation non paramétrique Soit F n ( ) l ogive correspondant à ces données. Sachant que F 500 (1 500) = 0,689 et F 500 (3 500) = 0,839, calculer la valeur de y. 3.4 Au cours de la dernière année, la compagnie d assurance Big Company a remboursé les sinistres présentés dans le tableau ci-dessous. Classe Nombre de sinistres 0 1 000 16 1 000 3 000 22 3 000 5 000 25 5 000 10 000 18 10 000 25 000 10 25 000 50 000 5 50 000 100 000 3 100 000 et plus 1 Tracer l ogive de ces données et calculer, à la main et avec R, la probabilité que le montant d une réclamation soit compris entre 2 000 $ et 6 000 $. Expliquer le traitement réservé à la dernière classe. 3.5 Un assureur a enregistré les montants de sinistres suivants au cours de la dernière année : {80, 153, 162, 267, 410}. Soit F(x) l estimateur avec noyaux uniformes de bande 50 de la fonction de répartition et soit F 5 (x) la fonction de répartition empirique. Calculer F 5 (150) F(150). 3.6 Un assureur estime la densité des données {150, 210, 240, 300} à l aide d un estimateur avec noyaux triangulaires de largeur de bande 50. a) Calculer la moyenne de f (x). b) Tracer le graphique de f (x). 3.7 Un échantillon est composé des valeurs {5,7,4,5,9,8,3,5,4,10}. Évaluer au point 6,2 un estimateur de la densité avec a) noyaux uniformes et largeur de bande 0,5. b) noyaux uniformes et largeur de bande 1. c) noyaux uniformes et largeur de bande 2. d) noyaux uniformes et largeur de bande 3. e) noyaux triangulaires et largeur de bande 0,5. f) noyaux triangulaires et largeur de bande 1. g) noyaux triangulaires et largeur de bande 2. 3.8 Pour l échantillon {2,4,6,8,10}, on construit un estimateur lissé de la densité de probabilité avec noyaux triangulaires. Quelle est la plus petite largeur de bande qui assure que f (5) = 0,01?

Modélisation non paramétrique 15 3.9 Un assureur a enregistré les montants suivants (en 1 000 000 $) liés à des catastrophes naturelles : {2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,4,4,4,5,5,5,5, 6,6,6,6,8,8,9,15,17,22,23,24,24,25,27,32,43}. a) Tracer le graphique de la fonction de répartition empirique F 40. b) En utilisant les bornes c 0 = 1,5, c 1 = 2,5, c 2 = 6,5, c 3 = 29,5, et c 4 = 49,5, tracer l ogive des données sur le même graphique que pour la sousquestion précédente. L ajustement semble-t-il bon? Détailler. Le choix des bornes semble-il correct? c) Tracer l histogramme des données en utilisant les mêmes classes qu en b). d) Calculer la moyenne et l écart type empiriques. 3.10 Un assureur a enregistré les montants de sinistres suivants (en millions) : {1,2,2,4,6,6,6,8,8,10}. Construire un intervalle de confiance de niveau 0,95 pour F(4). 3.11 Le tableau ci-dessous présente les sinistres censurés à droite enregistrés par un assureur pendant l année 2002. Montant Nombre de sinistres Groupe-risque 500 3 52 800 10 40 1 200 11 19 1 700 2 6 Calculer l estimateur de F(1 200) basé sur l estimateur de Nelson-Aalen H n (1 200). 3.12 Le tableau ci-dessous présente les sinistres enregistrés par un assureur pendant l année 2006. Montant Nombre de sinistres Groupe-risque 1 000 1 20 3 400 1 19 4 500 1 18 7 500 1 17 15 000 1 16 17 500 1 15 a) Déterminer l estimateur de Nelson-Aalen, H n (x), pour les six valeurs du tableau.

16 Modélisation non paramétrique b) On va maintenant tenter d appliquer la méthode d estimation par noyaux au taux d incidence. Pour une fonction de densité, l estimateur par noyaux est f (x) = s f n (y j )k j (x), j=1 que l on peut aussi écrire sous la forme f (x) = 1 b s ( ) x yj f n (y j )k j b j=1 en définissant k j sur l intervalle [ 1,1]. Par analogie, pour le taux d incidence, on va utiliser h(x) = 1 b s j=1 ( ) x yj h n (y j )k j, b en estimant h n (y j ) par H n (y j ). En utilisant un noyau uniforme, c est-à-dire { 1/2, 1 x 1 k(x) = 0, ailleurs et une largeur de bande de 6 000, calculer h(10 000). 3.13 Un assureur a enregistré les 30 réclamations suivantes : deux réclamations de 2 000 $, six réclamations de 4 000 $, 12 réclamations de 6 000 $ et 10 réclamations de 8 000 $. Donner la valeur de l estimateur empirique du coefficient d asymétrie et son interprétation. 3.14 Le tableau ci-dessous présente les réclamations enregistrées par un petit assureur automobile pendant une année. Montant enregistré Fréquence 100 1 200 4 300 10 400 4 500 1 Calculer les estimateurs empiriques du coefficient d asymétrie et du coefficient d aplatissement. 3.15 Soit l échantillon suivant {12,16,20,23,26,28,30,32,33,35,36,38,39,40,41,43,45,47,50,57}.

Modélisation non paramétrique 17 a) Calculer l estimateur lissé du soixantième centile. b) Calculer l estimateur lissé du troisième quartile. 3.16 On a les données groupées présentées dans le tableau ci-dessous. En supposant que les données sont distribuées uniformément sur chacun des intervalles, calculer une estimation empirique de E[min(X, 320)]. Classe Nombre de données (0, 50] 20 (50, 100] 34 (100, 200] 22 (200, 500] 24 3.17 On dispose d un échantillon de cinq données d une distribution continue. À partir de cet échantillon, un intervalle de confiance non paramétrique pour la médiane est construit, dont les bornes sont les 2 e et 4 e statistiques d ordre de l échantillon. Quel est le niveau de confiance de cet intervalle? 3.18 On dispose d un échantillon de taille 500 d une distribution continue. À partir de cet échantillon, un intervalle de confiance non paramétrique pour la médiane est construit, dont les bornes sont les statistiques d ordre X (240) et X (260) de l échantillon. Quel est le niveau de confiance de cet intervalle? 3.19 Un assureur a enregistré les montants de sinistres suivants (en milliers) : {1,1,1,2,2,3,5,6,9,10,12,15,15,20,30,32,33,33,35,40}. Déterminer le niveau de confiance de l intervalle [10,20) pour π 0,55. 3.20 Soit Y Gamma(α, λ) et X = e Y. On a f Y (y) = a) Déterminer la distribution de X. b) Soit α = 1 et l estimateur λα Γ(α) yα 1 e λy, y > 0. ˆλ = X X 1. Évaluer empiriquement le biais de cet estimateur de la façon suivante : 1. Choisir une valeur de λ plus grande que 1 (la solution est construite avec λ = 5). 2. Simuler des observations x (j) 1,..., x(j) n de la variable X dont la distribution a été déterminée en a).

18 Modélisation non paramétrique 3. Répéter les étapes 2 et 3 pour j = 1,2,..., r. 4. Calculer le biais moyen 5. Estimer le biais comme suit : Faire cette estimation pour i) n = 10 et r = 1 000 ; ii) n = 1 000 et r = 100 ; et iii) n = 1 000 et r = 1 000. ˆbˆλ (λ) = 1 r r ˆλ (j) λ. j=1 Discuter de l impact du nombre d observations dans l échantillon et du nombre de répétitions dans la simulation. c) En utilisant les estimateurs de la partie b) ii), tracer la fonction de répartition empirique de ˆλ. d) En utilisant les estimateurs de la partie c) et les classes calculées automatiquement par la fonction hist, tracer l histogramme et l ogive de la distribution de ˆλ. e) Calculer les 45 e et 70 e quantiles lissés des données de la partie c). Exercices proposés dans Loss Models 13.2, 13.3, 13.4, 13.6, 13.7, 13.8, 13.9, 14.2, 14.3, 14.6, 14.7, 14.8, 14.11, 14.12, 14.14, 14.18, 14.19, 14.22, 14.25, 14.28, 14.29, 14.31, 14.34, 14.35, 3.1, 3.2, 3.4, 3.13, 3.14, 3.16, 15.9, 15.10 Réponses 3.1 b) 0, x 2 (x 2)/25, 2 < x 7 (x 5)/10, 7 < x 12 F 20 (x) = (x + 58)/100, 12 < x 22 (x + 42)/80, 22 < x 38 1, x > 38

Modélisation non paramétrique 19 c) 0, x 2 1/25, 2 < x 7 1/10, 7 < x 12 f 20 (x) = 1/100, 12 < x 22 1/80, 22 < x 38 0, x > 38. 3.2 120 3.3 81 3.4 0,396 3.5 0,17 3.6 a) 225 3.7 a) 0 b) 0,05 c) 0,125 d) 0,1333 e) 0 f) 0,02 g) 0,095 3.8 1,0264 3.9 d) 9,225 et 10,2369 3.10 (0,0964, 0,7036) 3.11 0,5880 3.12 a) 0,05, 0,1026, 0,1582, 0,2170, 0,2795, 0,3462 b) 0,00001449 3.13 0,559 3.14 γ 1 = 0, γ 2 = 3,125 3.15 a) 38,6 b) 42,5 3.16 134,54 3.17 0,625 3.18 0,6287 3.19 0,6208 3.20 a) Log-gamma(α, λ)

4 Modèles paramétriques potentiels 4.1 Soit X, une variable aléatoire avec densité Pareto(α, λ) représentant le montant d un sinistre et c > 0, une constante. Démontrer que la distribution de Y = cx est une distribution Pareto(α, cλ). 4.2 Soit X, une variable aléatoire avec fonction de densité f (x) = 1 2θ e x/θ, < x <. Trouver la fonction de répartition de Y = e X. 4.3 Il existe une relation intéressante entre les fonctions de répartition des lois gamma et Poisson. Soit X, une variable aléatoire avec densité Gamma(α, β) et α un entier. Démontrer que Pr(X x) = Pr(Y α), où Y Poisson(x/β). Utiliser la paramétrisation de la loi gamma où le second paramètre est un paramètre d échelle. 4.4 Soit X, une variable aléatoire avec densité de Pareto généralisée(α, τ, λ). Démontrer que la distribution de Y = X X + λ est une distribution bêta et identifier les paramètres de cette loi. 4.5 Soit X, une variable aléatoire telle que X Pareto(α,1). Trouver la fonction de répartition de la variable aléatoire Y = 5X 1/4 et identifier cette distribution ainsi que ses paramètres. 4.6 Soit X, une variable aléatoire avec densité Gamma(α, λ). a) Trouver la fonction de densité de Y = e X. b) Trouver E[Y] et Var[Y]. c) Est-ce que tous les moments existent? 21

22 Modèles paramétriques potentiels 4.7 Soit X, une variable aléatoire et i (0 i 1), le taux d inflation pour l année 2006. Pour chacune des lois ci-dessous, trouver la distribution de Y = (1 + i)x : a) X Pareto(α, λ). b) X Burr(α, γ, θ). c) X Log-gamma(α, λ). 4.8 Soit X, une variable aléatoire avec densité Pareto(α, λ). Trouver la fonction de densité de Y = X 1/τ, τ > 0. 4.9 Un assureur modélise des données à l aide de la variable aléatoire X qui a une distribution de Pareto de paramètres α et θ. On pose Déterminer la distribution de Y. Y = ln(1 + X/θ). 4.10 Un assureur automobile a dans sa base de données les montants des sinistres de 2004. Il estime que les sinistres obéissaient alors à une loi Burr(α = 0,5, γ = 2, θ = 3). Pour s en servir le premier janvier 2007, il se doit de les mettre à jour selon les considérations suivantes : 2005 : inflation de 4 % ; 2006 : inflation de 4,5 % ; et nouvelles taxes de 16 %. Quelle est la probabilité d avoir un sinistre supérieur à 4 en 2007? 4.11 Soit X, la variable aléatoire représentant le montant d un sinistre (en millions) pour l année 2006. Sa fonction de densité de probabilité est f (x) = 3x 4, x 1. On observe qu une inflation de 10 % affecte uniformément tous les sinistres de 2006 à 2007. a) Trouver la fonction de répartition du montant des sinistres en 2007. b) Trouver la probabilité que le montant d un sinistre en 2007 soit supérieur à 2 200 000 $. 4.12 Pour un assuré d un certain groupe, le nombre de sinistres suit une loi Binomiale(10, θ). Sachant que, dans ce groupe, le paramètre θ est tiré d une distribution uniforme sur l intervalle (0, 1), trouver la probabilité qu un assuré pris au hasard ait plus de six sinistres au cours d une période. 4.13 Soit X, une variable aléatoire telle que la distribution conditionnelle de X étant donné le paramètre Θ = θ est une distribution Gamma(τ, θ), où Θ obéit à une loi gamma de paramètres α et λ. Trouver la distribution de X.

Modèles paramétriques potentiels 23 4.14 On suppose que X a une distribution conditionnelle géométrique telle que Pr(X = x Θ = θ) = θ(1 θ) x 1, x = 1,2,... et θ est une réalisation de la variable aléatoire Θ de loi Bêta(α, β). Démontrer que la fonction de masse de probabilité de X est Pr(X = x) = Γ(α + β)γ(α + 1)Γ(β + x 1). Γ(α)Γ(β)Γ(α + β + x) 4.15 On suppose que X a une distribution conditionnelle de Weibull(τ, θ 1/τ ) telle que f (x Θ = θ) = τθx τ 1 e θxτ, x > 0. Aussi, on suppose que Θ Gamma(α, λ). Démontrer que la distribution marginale de X est une Burr(α, τ, λ 1/τ ). 4.16 On suppose que le montant d un sinistre pour un groupe d assurés a une distribution Burr(5,1, λ). Si λ est une réalisation de la variable aléatoire Λ pour ce groupe d assurés et que l on suppose que Λ Gamma(10, 2), trouver l espérance et la variance du montant d un sinistre pour un assuré pris au hasard. 4.17 Soit le taux d échec suivant pour le montant d un sinistre pour une valeur donnée de θ, λ(x θ) = 3 x + θ, où x est la réalisation de la variable aléatoire X représentant le montant d un sinistre et θ est la réalisation de la variable aléatoire Θ où Θ Gamma(10, 0,01). Trouver l espérance et la variance du montant d un sinistre pris au hasard. 4.18 Comparer les queues des lois Gamma(α, λ) et Log-normale(µ, σ 2 ). 4.19 Soit X, une variable aléatoire représentant le montant d un sinistre et l espérance de vie résiduelle suivante e(x) = 2 000 + 2x. Pour un contrat d assurance comportant une limite supérieure de 10 000, trouver le ratio d élimination de perte (LER) de l assureur. 4.20 Le tableau ci-dessous présente l espérance de vie résiduelle pour certaines valeurs de x. x e(x) 0 4 4 7 9 10,75 14 14,5

24 Modèles paramétriques potentiels a) À quelle distribution peut-on associer ces données et quelles sont les valeurs de ses paramètres? b) Trouver E[X; 10]. 4.21 On construit une distribution raccordée sur les sous-intervalles (0, 2), (2,8) et (8,16) avec les poids respectifs 0,5, 0,20 et 0,30. Dans chacun des sous-intervalles, on utilise une distribution gamma, de moyenne égale au point milieu du sous-intervalle et de variance égale à 1. Écrire la densité de probabilité obtenue sur (0,16). La réponse sera en fonction de la gamma incomplète. 4.22 On construit un modèle raccordé avec une distribution uniforme sur l intervalle (0,10) et une loi de Pareto de paramètres α = 3 et λ = 100 sur le reste des valeurs positives. Quels poids doivent être accordés aux distributions pour que la densité obtenue soit continue? 4.23 a) Comparer les queues d une distribution Weibull(λ, τ) et d une distribution Weibull inverse(θ, α) en utilisant les critères suivants : i) l existence des moments ; et ii) la comparaison des fonctions de survie. b) En utilisant une distribution Weibull et une distribution Weibull inverse dont les moyennes et variances sont égales, comparer graphiquement les queues des distributions. 4.24 Soit Y, une variable aléatoire telle que f Y (y) = S X(y) E[X] pour une variable aléatoire X quelconque. On dit qu une telle distribution est équilibrée. Démontrer que M Y (t) = M X(t) 1 te[x] lorsque M X (t) existe. Astuce 1 : intégrer par parties. Astuce 2 : l existence de M X (t) signifie que l intégrale converge. M X (t) = e tx f X (x) dx 0 4.25 Un assureur modélise ses sinistres par une variable aléatoire X avec densité f (x) = (1 + 2x 2 )e 2x, x 0. a) Calculer la fonction de survie S X (x). b) Calculer le taux d incidence h(x).

Modèles paramétriques potentiels 25 c) Calculer la fonction d espérance résiduelle e(x). d) Calculer lim x h(x). e) Calculer lim x e(x). f) Démontrer que e(x) est une fonction strictement décroissante, mais que h(x) n est pas une fonction strictement croissante. Exercices proposés dans Loss Models 5.1, 5.3, 5.4, 5.5, 5.7, 5.9, 5.13, 5.17, 5.18, 5.19, 5.20, 5.21, 5.22, 5.23, 3.25, 3.26, 3.27 Réponses 4.2 F Y (y) = 1 2 eln(y)/θ I {0<y<1} + (1 1 2 eln(y)/θ )I {y 1} 4.4 Bêta(τ, α) 4.5 Burr inverse(α, 4, 5) 4.6 a) Log-gamma(α, λ) b) E[Y] = (λ/(λ 1)) α, Var[Y] = (λ/(λ 2)) α (λ(λ 1)) 2α c) Non 4.7 a) Pareto(α, (1 + i)λ) b) Burr(α, γ, (1 + i)θ) c) f Y (y) = λ α (1 + i) λ (ln(y) ln(1 + i)) α 1 y λ 1 /Γ(α) 4.8 Burr(α, τ, λ 1/τ ) 4.9 Exponentielle(α) 4.10 0,6870 4.11 a) F(x) = 1 1,331x 3, x 1,1 b) 0,125 4.12 4/11 4.13 X Pareto généralisée(α, τ, λ) 4.16 5/4 et 145/48 4.17 500, 850 000 4.18 La distribution log-normale a une queue plus lourde que la distribution gamma. 4.19 0,30 4.20 a) Pareto(7/3, 16/3) b) 3,0215

26 Modèles paramétriques potentiels 4.21 0,5e x Γ(1;2), 0 < x 2 0,2 5 f X (x) = 25 x 25 1 e 5x, 2 < x 8 Γ(25;40) Γ(25;10) Γ(25) 0,3 12 144 x 144 1 e 12x, 8 < x 16 Γ(144;192) Γ(144;96) Γ(144) 4.22 3/14 4.25 a) (1 + x + x 2 )e 2x b) 2 (1 + 2x)/(1 + x + x 2 ) c) (1 + x + 0,5x 2 )/(1 + x + x 2 )

5 Modélisation paramétrique 5.1 Soit X, une variable aléatoire représentant le montant d un sinistre. On suppose X Λ = λ Exponentielle(λ) Λ Gamma(α, β). Les sinistres suivants ont été observés : {1,10,200,1 000,5 000}. Estimer α et β par la méthode des moments. 5.2 On dispose d un échantillon aléatoire avec deux données inférieures à 2 000 et quatre données entre 2 000 et 5 000. Les données supérieures à 5 000 n ont pas été enregistrées. Écrire la fonction de vraisemblance pour un modèle de loi exponentielle. 5.3 Un assureur automobile a enregistré les montants de sinistres suivants : {1 000,850,750,1 100,1 250,900}. Il souhaite utiliser une distribution Gamma(α, 1/θ) pour les représenter. Estimer les paramètres de cette distribution à l aide de la méthode des moments. 5.4 Un actuaire dispose d un échantillon aléatoire tiré d une distribution loglogistique. Dans cet échantillon, 80 % des données sont supérieures à 100 et 20 % des données sont supérieures à 400. Calculer les estimateurs des paramètres de la distribution à l aide de la méthode des quantiles. 5.5 Soit x 1,..., x n un échantillon aléatoire d une population dont la fonction de répartition est F X (x) = x p, 0 < x < 1. Déterminer l estimateur de p par la méthode des moments. 5.6 Pendant une année, un assureur a enregistré les montants de sinistres suivants : {500,1 000,1 500,2 500,4 500}. Il décide de modéliser ces données par une loi Log-normale(µ, σ). En utilisant la méthode des moments, estimer les paramètres µ et σ. Calculer ensuite la probabilité d avoir un sinistre supérieur à 4 500. 27

28 Modélisation paramétrique 5.7 Soit X, une variable aléatoire avec densité f (x) = β 2 xe 1 2 ( x β )2, x > 0, β > 0. L espérance de cette variable aléatoire est donnée par β 2π/2. On a observé les cinq valeurs suivantes : {4,9, 1,8, 3,4, 6,9, 4,0}. Déterminer l estimateur de β à l aide de la méthode des moments. 5.8 On suppose que la distribution du montant des sinistres obéit à une loi Weibull(τ, λ) de paramètres inconnus. a) Sachant que 50 % des sinistres sont supérieurs à 1 000 $ et que 75 % des sinistres sont supérieurs à 500 $, estimer τ et λ par la méthode des quantiles. b) À partir des estimations obtenues en a), estimer le 80 e centile. 5.9 Soit X, la variable aléatoire représentant le montant d un sinistre. On suppose que le montant d un sinistre pour un λ fixé obéit à une distribution Exponentielle(λ) et que λ est une réalisation de la variable aléatoire Λ, où Λ Gamma(α, β). À la suite d une expérience, on observe que 0,1 % des sinistres sont supérieurs à 450 et que 87,5 % des sinistres sont inférieurs à 50. Trouver l équation, uniquement fonction de β, que l on doit résoudre pour estimer β et qui, après avoir été résolue, permet d estimer le paramètre α. 5.10 Pour des contrats en assurance automobile avec les modalités suivantes, on a observé pour l année 1999 : un rapport d élimination de perte de 0,56 avec une franchise forfaitaire de d = 200 ; un rapport d élimination de perte de 0,32 avec une franchise atteinte de d = 200 ; un rapport d élimination de perte de 0,79 avec une franchise forfaitaire de d = 500 ; un rapport d élimination de perte de 0,52 avec une franchise atteinte de d = 500. On a aussi observé que le montant moyen d un sinistre est de 200 $. Si on suppose une loi de Weibull(τ, λ) pour modéliser le montant d un sinistre, estimer les paramètres τ et λ par la méthode des quantiles. 5.11 Un assureur a déterminé que 20 % des sinistres de son portefeuille sont supérieurs à 50 $ et que 10 % des sinistres sont supérieurs à 55 $. D après ces données, estimer A et B (à l aide de la méthode des quantiles) pour 1 f X (x) = b a, a < x < b 0, ailleurs.

Modélisation paramétrique 29 5.12 On a enregistré n essais indépendants X 1,..., X n de la variable aléatoire X Bernoulli(p). Trouver l estimateur du maximum de vraisemblance pour p. 5.13 Soit X 1,..., X n, un échantillon aléatoire provenant d une loi normale de paramètres µ et σ 2 inconnus. a) Trouver les estimateurs du maximum de vraisemblance de µ et σ 2. b) Démontrer que ˆµ et ˆσ 2 ont approximativement une distribution normale conjointe avec moyennes µ et σ 2 et variances σ 2 /n et 2σ 4 /n. c) Trouver l approximation de la distribution de l estimateur h( ˆµ, ˆσ 2 ) de ( ) c µ h(µ, σ 2 ) = Pr(X c) = Φ. σ 5.14 Soit X, une variable aléatoire représentant les montants de sinistres dont on possède un échantillon de taille n. La fonction de densité de probabilité de X est f (x) = 2θxe θx2, x > 0. Déterminer l estimateur du maximum de vraisemblance de θ. 5.15 Un assureur possède un échantillon aléatoire x 1,..., x n et il souhaite modéliser la variable aléatoire sous-jacente à l aide de la fonction F(x) = x p, 0 < x < 1. a) Déterminer l estimateur du maximum de vraisemblance de p. b) Quelle est la variance asymptotique de l estimateur du maximum de vraisemblance de p? c) À partir de la réponse obtenue en b), déterminer un intervalle de confiance de niveau 95 % pour p. d) Déterminer l estimateur du maximum de vraisemblance de E[X]. e) À partir de la réponse obtenue en d), déterminer un intervalle de confiance de niveau 95 % pour E[X]. 5.16 La variable aléatoire X a la densité suivante : f (x) = αλ α (λ + x) α 1, x > 0. On sait que λ = 1 000. À partir de l échantillon {43, 145, 233, 396, 777}, déterminer l estimation du maximum de vraisemblance de α. 5.17 Quatre observations sont faites d une variable aléatoire dont la densité est f (x) = 2λxe λx2, x > 0. La seule information dont on dispose est qu une des quatre observations est inférieure à 2. Calculer une estimation du maximum de vraisemblance de λ.

30 Modélisation paramétrique 5.18 Un échantillon de taille 40 a été tiré d une population dont la densité est f (x) = (2πθ) 1/2 e x2 /(2θ), < x <. À partir de cet échantillon, on détermine une estimation du maximum de vraisemblance de θ : ˆθ = 2. Déterminer une approximation de l erreur quadratique de ˆθ. 5.19 On suppose que X obéit à une distribution log-gamma : f (x) = λ2 ln(x) x λ+1, x > 1. a) Trouver l estimateur des moments de λ. b) Trouver l estimateur du maximum de vraisemblance de λ. 5.20 Soit l échantillon suivant provenant d une distribution Gamma(5, λ) : {2,20,5,4,19}. a) Trouver l estimateur du maximum de vraisemblance de λ et en calculer la valeur. b) Trouver la variance de ˆλ si λ = 5 8. 5.21 Le tableau ci-dessous présente les sinistres payés en 1999. On pose l hypothèse que la sévérité d un sinistre est distribuée selon une loi de Pareto de paramètres α et 1. Déterminer l équation finale permettant de trouver l estimateur du maximum de vraisemblance de α. Montant Nombre de sinistres (0, 2] 2 (2, 5] 0 (5, 11] 1 (11, ) 1 5.22 Le tableau ci-dessous présente les sinistres payés par un assureur. On pose que la distribution de X est une exponentielle de paramètre β inconnu. Quel est l estimateur du maximum de vraisemblance de β? Montant Nombre de sinistres (0, 1] 1 (1, 2] 0 (2, ) 1 5.23 Soit X 1,..., X n un échantillon aléatoire provenant d une loi Weibull de densité f (x) = 2λxe λx2, x > 0. On estime P k = Pr(X k) par la méthode du maximum de vraisemblance.

Modélisation paramétrique 31 a) Déterminer ˆP k. b) Déterminer la variance de l estimateur trouvé en a). c) Si X 1 = X 2 = 10 et X 3 = 15, calculer Pr( ˆP 10 1 2 ). 5.24 Sachant qu un échantillon aléatoire X 1,..., X 50 provenant d une distribution de Pareto(α, λ) a conduit aux estimations ˆα = 1,5 et ˆλ = 1 500 par la méthode du maximum de vraisemblance, estimer les variances des estimateurs ˆα et ˆλ ainsi que leur covariance. 5.25 On suppose que le montant d un sinistre obéit à une loi de Pareto(α, λ). Pendant une année, on observe 50 sinistres. À l aide des montants des 50 sinistres, on obtient ˆα = 2, ˆλ = 4, Var[ˆα] = 24 et Var[ ˆλ] = 40. Si la covariance entre les estimateurs ˆα et ˆλ est 10, trouver un intervalle de confiance de niveau α = 0,15 pour Pr(X > 10). 5.26 Soit X la variable aléatoire représentant le montant d un sinistre. On observe les sinistres suivants en assurance automobile : {25,88,33,62,44,75,47,53}. On suppose que X Exponentielle(λ). a) Estimer la variance de la distribution de l estimateur du maximum de vraisemblance de E[X; 50]. b) Estimer la variance de la distribution de l estimateur du maximum de vraisemblance de π 0,95. 5.27 Soit X, une variable aléatoire indiquant si une expérience est un succès (1) ou un échec (0) et dont la distribution est une loi de Bernoulli de paramètre α. On sait que la distribution a priori du paramètre α est une loi U(0,1). On a observé un succès en trois essais. a) Calculer l estimateur bayesien ˆα si la fonction de perte choisie est l erreur quadratique. b) Trouver l estimation bayesienne de la probabilité que α se retrouve entre 0,2 et 0,4. 5.28 On suppose que X Θ = θ obéit à une loi de Poisson(θ) et que la distribution a priori de Θ est une loi Gamma(α, λ). Pour un échantillon de taille n, trouver l estimateur bayesien ˆθ si la fonction de perte choisie est l erreur quadratique. 5.29 On suppose que X A = α Pareto(α,1) et que la distribution a priori de A est une Exponentielle(3). a) Trouver la distribution a posteriori de A. b) Calculer ˆα à partir de l échantillon {2,1,2,3,3,4} si la fonction de perte choisie est l erreur quadratique.

32 Modélisation paramétrique 5.30 On suppose que X B = β Exponentielle(β) et que la distribution a priori de B est une Gamma(2,3). On a l échantillon aléatoire suivant : {6,11,8,13,9} a) Calculer l estimateur bayesien du paramètre β si la fonction de perte est l erreur quadratique. b) Répéter la partie a) avec la fonction de perte valeur absolue de l erreur. On fournit les valeurs Γ(7;4,734) = 0,2 Γ(7;5,411) = 0,3 Γ(7;6,039) = 0,4 Γ(7;6,670) = 0,5 Γ(7;7,343) = 0,6. 5.31 Au cours d une session, les étudiants en actuariat font des devoirs informatiques. En faisant ces devoirs, il leur arrive de rester bloqués. Le nombre de fois où un étudiant reste bloqué dans un devoir suit une distribution Binomiale(3, θ), où l on suppose que θ est uniformément distribué sur l intervalle (0,25, 0,75). Deux étudiants sont restés bloqués chacun deux fois pendant un certain devoir. a) Trouver l estimateur bayesien de θ avec une fonction de perte quadratique. b) Déterminer la probabilité a posteriori que θ se retrouve dans l intervalle (0,6, 0,7). 5.32 Pour des contrats d assurance comportant une rétention de 1,5 millions, 40 catastrophes ont été déclarées au réassureur. Le réassureur suppose que les montants de sinistres obéissent à une loi de Pareto(α, λ). Soit W la variable aléatoire représentant un montant de sinistre déclaré au réassureur (en millions). À l aide des montants qui lui ont été déclarés, le réassureur a estimé les paramètres α et λ par la méthode du maximum de vraisemblance. Il a obtenu ˆα = 5,084 et ˆλ = 28,998. a) Trouver, par la méthode du maximum de vraisemblance, l estimation de Pr(W > 29,5). b) Si la matrice variance-covariance de (ˆα, ˆλ) est [ ] 23,92 167,07, 167,07 1 199,32 estimer la variance de l estimateur de Pr(W > 29,5) utilisé en a). 5.33 Soit X la variable aléatoire représentant le montant d un sinistre. On suppose X Exponentielle(λ). Pour des contrats d assurance comportant une franchise forfaitaire de 100 $ et une limite supérieure de 3 000 $, les montants de sinistres suivants ont été payés par l assureur : {100,200,250,425,515,630,1 000,1 500,2 900,2 900}. Estimer le montant espéré d un sinistre par la méthode du maximum de vraisemblance.