Modélisation des distributions de sinistres. Exercices et solutions

Dimension: px
Commencer à balayer dès la page:

Download "Modélisation des distributions de sinistres. Exercices et solutions"

Transcription

1 Modélisation des distributions de sinistres Exercices et solutions

2

3 Modélisation des distributions de sinistres Exercices et solutions Hélène Cossette Vincent Goulet Michel Jacques Mathieu Pigeon École d actuariat, Université Laval

4 2009 Hélène Cossette, Vincent Goulet, Michel Jacques, Mathieu Pigeon Cette création est mise à disposition selon le contrat Paternité-Partage à l identique 2.5 Canada disponible en ligne 2.5/ca/ ou par courrier postal à Creative Commons, 171 Second Street, Suite 300, San Francisco, California 94105, USA. Historique de publication Septembre 2009 : Première édition Septembre 2008 : Première version préliminaire Code source Le code source LATEX de ce document est disponible à l adresse ou en communiquant directement avec les auteurs. ISBN Dépôt légal Bibliothèque et Archives nationales du Québec, 2009 Dépôt légal Bibliothèque et Archives Canada, 2009

5 Introduction Ce document est le fruit de la mise en commun d exercices colligés au fil du temps pour nos cours de modélisation des distributions de sinistres à l Université Laval et à l Université Concordia. Nous ne sommes toutefois pas les uniques auteurs des exercices ; certains ont, en effet, été rédigés par les Docteurs José Garrido et Jacques Rioux, entre autres. Quelques exercices proviennent également d anciens examens de la Society of Actuaries et de la Casualty Actuarial Society. C est d ailleurs afin de ne pas usurper de droits d auteur que ce document est publié selon les termes du contrat Paternité-Partage des conditions initiales à l identique 2.5 Canada de Creative Commons. Il s agit donc d un document «libre» que quiconque peut réutiliser et modifier à sa guise, à condition que le nouveau document soit publié avec le même contrat. Les exercices sont divisés en six chapitres qui correspondent aux chapitres de notre cours. Le chapitre 1 porte sur des rappels de notions de base en analyse, probabilité et statistique. Le chapitre 2 traite des fondements de la modélisation en assurance de dommages, en particulier le traitement mathématique des franchises, limite supérieure et coassurance ainsi que de l effet de l inflation sur la fréquence et la sévérité des sinistres. Les aspects plus statistiques apparaissent au chapitre 3 avec la modélisation non paramétrique. Le chapitre 4 étudie les principales distributions utilisées en assurance de dommages et la création de nouvelles distributions à partir des lois usuelles. Les chapitres 5 et 6 portent quant à eux sur l estimation paramétrique et les tests d adéquation des modèles. Enfin, le chapitre 7 propose une brève incursion dans la modélisation des distributions de fréquence des sinistres. Les termes anglais ordinary deductible et franchise deductible nous ont posé quelques soucis de traduction. Pour le premier, nous utilisons l expression «franchise forfaitaire» recommandée par Béguin (1990). Pour le second terme, beaucoup moins répandu, nous avons opté pour l expression «franchise atteinte» suggérée, entre autres, dans Charbonnier (2004). Les réponses des exercices se trouvent à la fin de chacun des chapitres, alors que les solutions complètes sont regroupées à l annexe E. De plus, on trouvera à la fin de chaque chapitre (sauf le premier) une liste non exhaustive d exercices proposés dans Klugman et collab. (2008a). Des solutions de ces exercices sont offertes dans Klugman et collab. (2008b). L annexe A présente la paramétrisation des lois de probabilité continues v

6 vi Introduction et discrètes utilisée dans les exercices. L information qui s y trouve est en plusieurs points similaire à celle des annexes A et B de Klugman et collab. (1998, 2004, 2008a), mais la paramétrisation des lois est dans certains cas différente. Le lecteur est donc fortement invité à la consulter. Plusieurs exercices de ce recueil requièrent l utilisation de R (R Development Core Team, 2009) et du package actuar (Dutang et collab., 2008). L annexe B explique comment configurer R pour faciliter l installation et l administration de packages externes. Enfin, les annexes C et D contiennent des tableaux de quantiles des lois normale et khi carré. Nous remercions d avance les lecteurs qui voudront bien nous faire part de toute erreur ou omission dans les exercices ou leurs solutions. Hélène Cossette <[email protected]> Vincent Goulet <[email protected]> Michel Jacques <[email protected]> Mathieu Pigeon <[email protected]> Québec, septembre 2009

7 Table des matières Introduction v 1 Rappels d analyse, de probabilité et de statistique 1 2 Modélisation en assurance de dommages 7 3 Modélisation non paramétrique 13 4 Modèles paramétriques potentiels 21 5 Modélisation paramétrique 27 6 Tests d adéquation 35 7 Modèles de fréquence 39 A Paramétrisation des lois de probabilité 43 A.1 Famille bêta transformée A.2 Famille gamma transformée A.3 Autres distributions continues A.4 Distributions discrètes de la famille (a, b,0) B Installation de packages dans R 55 C Table de quantiles de la loi normale 57 D Table de quantiles de la loi khi carré 59 E Solutions 61 Chapitre Chapitre Chapitre Chapitre Chapitre Chapitre Chapitre Bibliographie 145 vii

8

9 1 Rappels d analyse, de probabilité et de statistique 1.1 On a l inégalité 1 2 x2 24 < 1 cos(x) x 2 < 1 2 vraie pour toutes valeurs de x près de 0. Calculer 1 cos(x) lim x 0 x 2 et faire le graphique de la fonction et des deux bornes pour 2 x Calculer x lim x 0 ln(x + 1). 1.3 Calculer lim x 0 (1 + x) 1/x. 1.4 a) Déterminer laquelle des expressions, x ou ln(x), tend la plus rapidement vers l infini lorsque x tend vers l infini. b) Répéter la partie a) avec x et e x. 1.5 Il faut parfois élargir l ensemble des nombres réels à celui des nombres complexes. Un nombre complexe z se présente souvent sous la forme d une somme z = a + bi où a et b sont des nombres réels et i est un nombre imaginaire particulier tel que i 2 = 1. 1

10 2 Rappels d analyse, de probabilité et de statistique De là, il découle que i 3 = (i 2 )(i) = ( 1)(i) = i i 4 = (i 2 )(i 2 ) = ( 1)( 1) = 1 i 5 = i i 6 = 1 et ainsi de suite. À partir du développement connu de e x, e x = 1 + x + x2 2! + x3 3! + x4 4! +..., démontrer l identité d Euler e iπ = 1 en suivant les étapes suivantes. a) Développer autour de c = 0 la fonction f (x) = cos(x). b) Développer autour de c = 0 la fonction f (x) = sin(x). c) Développer, en remplaçant x par ix la fonction f (x) = e ix. d) Démontrer l identité e ix = cos(x) + i sin(x). e) Démontrer l identité e iπ = Soit la fonction F(x) = e x < x <. Démontrer qu il s agit d une fonction de répartition. 1.7 Soit X, une variable aléatoire continue avec fonction de densité f (x) et fonction de répartition F(x). On choisit une valeur quelconque x 0 et on définit la fonction { f (x) g(x) = 1 F(x 0 ), x x 0 0, x < x 0. On suppose que F(x 0 ) < 1. Démontrer que g(x) est une densité de probabilité. 1.8 Soit X, une variable aléatoire avec une distribution de Pareto(α, λ) : f (x) = αλ α, x > 0, α > 0, λ > 0. (x + λ) α+1 Calculer la fonction de survie S(x) = 1 F(x) et en faire le graphique pour α = 2 et λ =

11 Rappels d analyse, de probabilité et de statistique Soit X, une variable aléatoire avec une distribution Binomiale(n, p), c està-dire que ( ) n Pr(X = x) = p x (1 p) n x, x = 0,1,.... x Déterminer la distribution de la variable aléatoire Y = n X Soit X N(µ, σ 2 ). La variable aléatoire Y = e X est distribuée selon la loi log-normale. a) Exprimer la fonction de densité de probabilité et la fonction de répartition de Y en fonction de celles de X. b) Calculer Var[Y] La distribution de Cauchy a comme fonction de densité de probabilité f (x) = 1 π 1, < x <. 1 + x2 Démontrer que l espérance de cette distribution n existe pas, c est-à-dire que E[ X ] = Soit X, une variable aléatoire avec densité Poisson(λ) et soit g(x), une fonction telle que < E[g(X)] < et < g( 1) <. Démontrer que E[λg(X)] = E[Xg(X 1)] Soient X et Y, deux variables aléatoires continues. On définit M = max(x,y) m = min(x,y). Démontrer que E[M] = E[X] + E[Y] E[m] Soit X, une variable aléatoire avec densité f X (x) = 7e 7x, 0 < x <, et soit Y = 4X + 3. Calculer la densité de Y en utilisant la technique de la fonction de répartition Soit X, une variable aléatoire avec densité f X (x) = x 2 /9, 0 < x < 3. Trouver la fonction de densité de probabilité de Y = X Soit X, une variable aléatoire avec distribution N(0, σ 2 ). Trouver la distribution de Y = X Pour une densité quelconque, démontrer que si la densité est symétrique par rapport à un point a, alors le coefficient d asymétrie est 0.

12 4 Rappels d analyse, de probabilité et de statistique 1.18 Soit X, une variable aléatoire avec densité f (x) = e x, x > 0. Calculer son coefficient d asymétrie Soit X, une variable aléatoire avec densité f (x) = 1, 1 < x < 1. 2 Calculer son coefficient d aplatissement et commenter Déterminer la fonction génératrice des moments de la densité f (x) = 2x c 2, 0 < x < c Soit X 1 et X 2 les moyennes de deux échantillons aléatoires indépendants de taille n d une population avec variance σ 2, trouver une valeur de n telle que ( Pr X 1 X 2 < σ ) 0, Soit X la moyenne d un échantillon de taille 100 issu d une loi χ 2 (50). a) Trouver la distribution exacte de X. b) Calculer à l aide d un logiciel statistique la valeur exacte de Pr[49 < X < 51]. c) Calculer une valeur approximative de la probabilité en b) Soit ˆΘ, un estimateur de la variance d une loi de Pareto(3, 1 000). Sachant que E[ ˆΘ] = et que Var[ ˆΘ] = 750, trouver le biais et l erreur quadratique moyenne de ˆΘ Soit X 1,..., X n, un échantillon aléatoire d une population avec moyenne µ et variance σ 2. a) Démontrer que l estimateur T(X) = n i=1 a ix i est un estimateur sans biais de µ si n i=1 a i = 1. b) On nomme les estimateurs de la forme en a) des estimateurs sans biais linéaires. Parmi ceux-ci, trouver celui avec la plus petite variance Soit X 1,..., X n un échantillon aléatoire d une distribution avec moyenne µ et variance σ 2. Démontrer que n 1 n i=1 (X i µ) 2 est un estimateur sans biais de σ Soit X, une observation d une population dont la densité est f (x;θ) = ( ) θ x (1 θ) 1 x, x = 1,0,1; 0 θ 1. 2

13 Rappels d analyse, de probabilité et de statistique 5 Soit l estimateur T(X) = { 2, x = 1 0, ailleurs. Démontrer que T(X) est un estimateur sans biais pour θ Soit X Binomiale(n, p). Démontrer que n X ( 1 X ) n n est un estimateur biaisé de la variance de X. Calculer le biais de l estimateur ci-dessus Calculer l efficacité de X comme estimateur du paramètre λ d une distribution de Poisson Deux experts tentent d évaluer le montant des dommages causés par un ouragan. La variable aléatoire X représente l évaluation du premier expert et la variable aléatoire Y représente l évaluation faite par le second expert. On suppose que les deux experts travaillent de façon indépendante. Les données suivantes sont connues : E[X] = 0,8z, E[Y] = z, Var[X] = z 2, et Var[Y] = 1,5z 2, où z représente le vrai montant des dommages. On considère une classe d estimateurs pour z de la forme 1.30 Soit Ẑ = αx + βy. Déterminer les valeurs de α et β qui feront de ˆX l estimateur sans biais à variance uniformément minimale de z. a) Identifier cette distribution. f (x;θ) = 1 θ x(1 θ)/θ, 0 < x < 1, θ > 0. b) Démontrer que l estimateur du maximum de vraisemblance de θ est ˆθ = 1 n n i=1 ln X i. c) Démontrer que ˆθ est un estimateur sans biais de θ. Réponses

14 6 Rappels d analyse, de probabilité et de statistique 1.3 e 1.4 a) x plus rapide que ln(x) b) e x plus rapide que x 1.8 S(x) = ( x x+λ ) α 1.9 Binomiale(n, 1 p) 1.10 a) F Y (x) = F X (ln x), f Y (x) = x 1 f X (ln x) b) e 2µ+σ2 (e σ2 1) 1.14 f Y (y) = 7 4 e 7 4 (y 3), y > f Y (y) = 1 27, 0 < y < Gamma( 1 2, 1 2 σ 2 ) / (ct) 2 (ct2 tc e tc + 1) a) Gamma(2 500, 50) b) 0, c) 0, Biais : 500 ; MSE : b) X α = 0,6122, β = 0, a) Bêta(1/θ, 1)

15 2 Modélisation en assurance de dommages Rappelons que l expression «franchise forfaitaire» correspond au terme anglais ordinary deductible, alors que l expression «franchise atteinte» correspond au terme franchise deductible. 2.1 Les montants suivants représentent les coûts associés aux réparations automobiles de 12 contrats : {579,110,842,213,98,445,1 332,162,131,276,312,482}. Les contrats présentent une franchise forfaitaire de 250 $. Calculer le rapport d élimination de perte (LER) de l assureur. 2.2 Les montants suivants représentent les coûts associés à des accidents automobiles pour huit contrats : {86 000, , ,43 000, ,28 000,52 000, }. Les contrats présentent une limite supérieure de $. Calculer le rapport d élimination de perte de l assureur. 2.3 Pour un portefeuille dont le montant d un sinistre obéit à une loi exponentielle de paramètre 0,02, trouver le rapport d élimination de perte découlant de l introduction des limites de couvertures suivantes. a) Une franchise atteinte de 10. b) Une franchise forfaitaire de On suppose que le montant d un sinistre obéit à une distribution gamma de paramètres α = 4 et λ = 0,1. Un assureur a signé un traité avec un réassureur où ce dernier s engage à payer l excédent de 100 sur chacun des sinistres. Trouver le rapport d élimination de perte de l assureur. 2.5 Dans un groupe d assurés, les sinistres suivants sont survenus : {20,50,80,80,80,85,90,110,150,240,360,400}. Trouver le rapport d élimination de perte de l assureur si celui-ci a instauré une franchise forfaitaire de 70 et s il limite ses paiements à

16 8 Modélisation en assurance de dommages 2.6 Soit X, la variable aléatoire représentant le montant d un sinistre. On sait que E[X] = 2 000, que E[X; ] = 1 640,79 et que le rapport d élimination de perte de l assureur pour un contrat avec une franchise forfaitaire de 100 est de 0,0465. Trouver le rapport d élimination de perte de l assureur pour un contrat avec une franchise forfaitaire de 100 et une limite supérieure de Soit X, une variable aléatoire représentant le montant d un sinistre tel que a) Trouver E[X; d]. f X (x) = e 2x + e x 2, x > 0. b) Soit N, une variable aléatoire représentant la fréquence des sinistres. Calculer la prime pure (fréquence moyenne multipliée par la sévérité moyenne) pour une franchise de d = 0,25 et une fréquence moyenne de un sinistre tous les 10 ans. c) Si on observe un taux d inflation de 5 %, que devient la prime pure? 2.8 On suppose que le montant d un sinistre obéit à une loi Pareto de paramètres α = 1,5 et λ = a) Calculer le montant moyen des sinistres payé par un assureur pour un contrat de réassurance avec une rétention de b) Trouver le rapport d élimination de perte pour le réassureur si la rétention est de Soit Y P la variable aléatoire du montant payé par paiement pour un contrat d assurance avec une franchise forfaitaire de d et X est la variable aléatoire du montant d un sinistre. Démontrer que E[Y P ] = E[X] E[X;d], 1 F X (d) où E[X;d] = E[min(X, d)] est l espérance limitée de X à d. Interpréter le résultat Un assureur décide de modéliser X, la variable aléatoire du montant d un sinistre, par une distribution Weibull de paramètres τ = 3 et λ = 1/15. Tracer (idéalement de manière informatique, à l aide du package actuar) les graphiques des variables aléatoires suivantes. a) La variable aléatoire du montant payé par sinistre pour un contrat avec une franchise forfaitaire de 10. b) La variable aléatoire du montant payé par paiement pour une franchise atteinte de 10 et une limite supérieure de 40. c) La variable aléatoire du montant du sinistre avec une coassurance de 80 %.

17 Modélisation en assurance de dommages Un assureur dispose des informations suivantes : le montant d un sinistre pour l année 1990 obéit à une loi Pareto de paramètres α = 1,5 et λ = ; un taux d inflation de 5 % par année a été observé entre 1990 et 1992 et de 6 % par année entre 1992 et 1995 ; et une franchise de 500 est introduite en a) Calculer le rapport d élimination de perte pour l assureur en b) L assureur paie un sinistre en Déterminer la probabilité qu il paie plus de $ c) Déterminer la charge espérée par sinistre de l assureur s il avait décidé en 1995 de ne pas payer plus de $ par sinistre (en plus de la franchise de 500 $) Le tableau ci-dessous présente, sous forme groupée, les montants payés par sinistre pour des sinistres en assurance habitation couverts par des contrats ayant une limite supérieure de $. Montant payé Nombre Montant moyen Pour modéliser les données, on utilise une distribution log-normale de paramètres µ et σ 2. À l aide d une technique d estimation quelconque, on trouve que ˆµ = 9,356 et ˆσ = 1,596. a) Estimer le montant payé espéré. b) Estimer le pourcentage de changement dans le montant payé par paiement espéré si l on observe une inflation de 10 % des sinistres. c) Estimer le pourcentage de réduction dans le montant payé espéré si l on décide d ajouter une franchise de $ au contrat de base (on ne tient plus compte de l inflation) Soit X, la variable aléatoire représentant le montant d un sinistre en responsabilité professionnelle pour un médecin. On suppose que la compagnie d assurance achète un traité de réassurance de rétention δ par

18 10 Modélisation en assurance de dommages réclamation, c est-à-dire que le réassureur paie l excédent des pertes audessus de δ pour chaque réclamation. Si l on suppose que X a une distribution de Pareto(α, λ), démontrer que la distribution du montant payé par paiement du réassureur a une distribution de Pareto de paramètres α et λ + δ On suppose que le montant d un sinistre obéit à une loi exponentielle de paramètre 3, c est-à-dire que f (x) = 3 3x, x > 0. On introduit une franchise forfaitaire de 0,2. Lorsque l assureur effectue un paiement, quelle est la probabilité qu il soit de plus de 0,50? 2.15 Une compagnie décide d acheter deux contrats d assurance pour l année à venir. Le montant moyen des sinistres pour une année est de $. La police A a une franchise forfaitaire de $ et ne présente pas de limite, alors que la police B a une limite de $ et ne présente pas de franchise. Pour la police A, l espérance de la variable aléatoire du montant payé par sinistre, Y S, est de $ et l espérance de la variable aléatoire du montant payé par paiement, Y P, est de $. Sachant qu un sinistre d un montant plus petit ou égal à $ s est produit, calculer l espérance de la variable aléatoire du montant payé par paiement pour le contrat B Un assureur utilise une distribution binomiale négative de paramètres r = 3 et θ = 1/6 pour modéliser la fréquence des sinistres par année et une distribution de Weibull de paramètres τ = 0,3 et λ = 1/1 000 pour modéliser la sévérité des sinistres. Il décide également d appliquer une franchise forfaitaire de 200. Déterminer le nombre espéré de paiements que fera l assureur par année Pour un contrat comportant une franchise forfaitaire de d, une limite supérieure de u et une coassurance de α, la variable aléatoire du montant payé par sinistre, Y S, est donnée à partir de la variable aléatoire du montant d un sinistre, X, par 0, X < d Y S = α(x d), d X < u α(u d), X u. a) Démontrer que E[Y S ] = α(e[x;u] E[X;d]). b) Trouver Var[Y S ]. c) Trouver l expression générale de l espérance du montant payé par sinistre à la suite d une inflation de 100r % Soient Y S, la variable aléatoire du montant payé par sinistre, X, la variable aléatoire du montant d un sinistre, d une franchise forfaitaire et

19 Modélisation en assurance de dommages 11 u, une limite supérieure. Démontrer la relation E[Y S ] = E[X;u] E[X;d] à l aide d intégrales, et non par une définition astucieuse de la variable aléatoire Y S Le ratio de perte (loss ratio) R est défini comme étant le montant total des sinistres payés pendant l année, S, divisé par le montant total des primes reçues pendant l année, π. Une compagnie d assurance souhaite bien entendu conserver ce ratio sous un certain niveau pour ne pas être en difficulté financière. Pour ce faire, elle offre un bonus B à ses agents à la fin de l année si le ratio de perte pour l année est inférieur à 75 %. Le montant du bonus est calculé comme suit : B = max ( 0, π ( 0,75 R 3 )). Calculer le montant espéré du bonus si π = et que la distribution de la variable aléatoire S est une Pareto avec paramètres α = 3 et λ = Soit X, une variable aléatoire représentant le montant d un sinistre. Un assureur souhaite connaître les paiements à sa charge pour un contrat d assurance incluant une franchise décroissante (disappearing deductible). Dans ce type de contrat, l assuré assume en entier tout sinistre inférieur à d et l assureur assume en entier tout sinistre supérieur à d. Entre d et d, le paiement effectué par l assureur est une fonction linéaire du montant d un sinistre. a) Définir la variable aléatoire Y P représentant le montant payé par paiement pour un contrat avec une franchise décroissante. b) Trouver l expression générale en termes de E[X], E[X; x] et F X (x) du montant payé par paiement espéré. Exercices proposés dans Loss Models 3.5, 3.7, 3.8, 3.9, 3.11, 3.15, , 8.3, , 8.12, 8.14, 8.16, 8.17, 8.18, 8.19, 8.23, 8.24, 8.25, 8.26, Réponses 2.1 0, , a) 0,0175 b) 0, , ,567

20 12 Modélisation en assurance de dommages 2.6 0, a) (3 e 2d 2e d )/4 b) 0,0541 c) 0, a) 1 091,09 b) 0, a) 0,1069 b) 0,4107 c) 1 255, a) b) +8,04 % c) 2,87 % , , b) α 2 (E[X 2 ;u 2 ] E[X 2 ;d 2 ] 2dE[X;u] + 2dE[X;d]) α 2 (E[X;u] E[X;d]) 2 c) α(1 + r)(e[x;u/(1 + r)] E[X;d/(1 + r)]) , b) (E[X] + d/(d d)e[x;d ] d /(d d)e[x;d])/(1 F X (d))

21 3 Modélisation non paramétrique 3.1 Un assureur présente les coûts (en millions de $) créés par les écrasements de météorites : {3,5,5,6,8,8,8,8,9,10,10,11,11,11,16,21,23,26,29,36}. a) Faire des graphiques de la fonction de répartition empirique et de la fonction de masse de probabilité empirique du coût des écrasements. b) À partir des bornes c 0 = 2, c 1 = 7, c 2 = 12, c 3 = 22 et c 4 = 38, écrire l équation de l ogive. c) En utilisant les mêmes bornes qu en b), écrire l équation de l histogramme. 3.2 Le tableau ci-dessous présente les sinistres enregistrés par un assureur. Classe Nombre de sinistres (0, 50] 36 (50, 150] x (150, 250] y (250, 500] 84 (500, 1 000] 80 (1 000, ) 0 Total Soit F n ( ) l ogive correspondant à ces données. Sachant que F n (90) = 0,21 et F n (210) = 0,51, déterminer la valeur de x. 3.3 Pour 500 sinistres, un assureur a enregistré la distribution présentée au tableau ci-dessous. Classe n Nombre de sinistres (0, 500] 200 (500, 1 000] 110 (1 000,2 000] x (2 000,5 000] y (5 000,10 000] (10 000,25 000] (25 000, ) 13

22 14 Modélisation non paramétrique Soit F n ( ) l ogive correspondant à ces données. Sachant que F 500 (1 500) = 0,689 et F 500 (3 500) = 0,839, calculer la valeur de y. 3.4 Au cours de la dernière année, la compagnie d assurance Big Company a remboursé les sinistres présentés dans le tableau ci-dessous. Classe Nombre de sinistres et plus 1 Tracer l ogive de ces données et calculer, à la main et avec R, la probabilité que le montant d une réclamation soit compris entre $ et $. Expliquer le traitement réservé à la dernière classe. 3.5 Un assureur a enregistré les montants de sinistres suivants au cours de la dernière année : {80, 153, 162, 267, 410}. Soit F(x) l estimateur avec noyaux uniformes de bande 50 de la fonction de répartition et soit F 5 (x) la fonction de répartition empirique. Calculer F 5 (150) F(150). 3.6 Un assureur estime la densité des données {150, 210, 240, 300} à l aide d un estimateur avec noyaux triangulaires de largeur de bande 50. a) Calculer la moyenne de f (x). b) Tracer le graphique de f (x). 3.7 Un échantillon est composé des valeurs {5,7,4,5,9,8,3,5,4,10}. Évaluer au point 6,2 un estimateur de la densité avec a) noyaux uniformes et largeur de bande 0,5. b) noyaux uniformes et largeur de bande 1. c) noyaux uniformes et largeur de bande 2. d) noyaux uniformes et largeur de bande 3. e) noyaux triangulaires et largeur de bande 0,5. f) noyaux triangulaires et largeur de bande 1. g) noyaux triangulaires et largeur de bande Pour l échantillon {2,4,6,8,10}, on construit un estimateur lissé de la densité de probabilité avec noyaux triangulaires. Quelle est la plus petite largeur de bande qui assure que f (5) = 0,01?

23 Modélisation non paramétrique Un assureur a enregistré les montants suivants (en $) liés à des catastrophes naturelles : {2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,4,4,4,5,5,5,5, 6,6,6,6,8,8,9,15,17,22,23,24,24,25,27,32,43}. a) Tracer le graphique de la fonction de répartition empirique F 40. b) En utilisant les bornes c 0 = 1,5, c 1 = 2,5, c 2 = 6,5, c 3 = 29,5, et c 4 = 49,5, tracer l ogive des données sur le même graphique que pour la sousquestion précédente. L ajustement semble-t-il bon? Détailler. Le choix des bornes semble-il correct? c) Tracer l histogramme des données en utilisant les mêmes classes qu en b). d) Calculer la moyenne et l écart type empiriques Un assureur a enregistré les montants de sinistres suivants (en millions) : {1,2,2,4,6,6,6,8,8,10}. Construire un intervalle de confiance de niveau 0,95 pour F(4) Le tableau ci-dessous présente les sinistres censurés à droite enregistrés par un assureur pendant l année Montant Nombre de sinistres Groupe-risque Calculer l estimateur de F(1 200) basé sur l estimateur de Nelson-Aalen H n (1 200) Le tableau ci-dessous présente les sinistres enregistrés par un assureur pendant l année Montant Nombre de sinistres Groupe-risque a) Déterminer l estimateur de Nelson-Aalen, H n (x), pour les six valeurs du tableau.

24 16 Modélisation non paramétrique b) On va maintenant tenter d appliquer la méthode d estimation par noyaux au taux d incidence. Pour une fonction de densité, l estimateur par noyaux est f (x) = s f n (y j )k j (x), j=1 que l on peut aussi écrire sous la forme f (x) = 1 b s ( ) x yj f n (y j )k j b j=1 en définissant k j sur l intervalle [ 1,1]. Par analogie, pour le taux d incidence, on va utiliser h(x) = 1 b s j=1 ( ) x yj h n (y j )k j, b en estimant h n (y j ) par H n (y j ). En utilisant un noyau uniforme, c est-à-dire { 1/2, 1 x 1 k(x) = 0, ailleurs et une largeur de bande de 6 000, calculer h(10 000) Un assureur a enregistré les 30 réclamations suivantes : deux réclamations de $, six réclamations de $, 12 réclamations de $ et 10 réclamations de $. Donner la valeur de l estimateur empirique du coefficient d asymétrie et son interprétation Le tableau ci-dessous présente les réclamations enregistrées par un petit assureur automobile pendant une année. Montant enregistré Fréquence Calculer les estimateurs empiriques du coefficient d asymétrie et du coefficient d aplatissement Soit l échantillon suivant {12,16,20,23,26,28,30,32,33,35,36,38,39,40,41,43,45,47,50,57}.

25 Modélisation non paramétrique 17 a) Calculer l estimateur lissé du soixantième centile. b) Calculer l estimateur lissé du troisième quartile On a les données groupées présentées dans le tableau ci-dessous. En supposant que les données sont distribuées uniformément sur chacun des intervalles, calculer une estimation empirique de E[min(X, 320)]. Classe Nombre de données (0, 50] 20 (50, 100] 34 (100, 200] 22 (200, 500] On dispose d un échantillon de cinq données d une distribution continue. À partir de cet échantillon, un intervalle de confiance non paramétrique pour la médiane est construit, dont les bornes sont les 2 e et 4 e statistiques d ordre de l échantillon. Quel est le niveau de confiance de cet intervalle? 3.18 On dispose d un échantillon de taille 500 d une distribution continue. À partir de cet échantillon, un intervalle de confiance non paramétrique pour la médiane est construit, dont les bornes sont les statistiques d ordre X (240) et X (260) de l échantillon. Quel est le niveau de confiance de cet intervalle? 3.19 Un assureur a enregistré les montants de sinistres suivants (en milliers) : {1,1,1,2,2,3,5,6,9,10,12,15,15,20,30,32,33,33,35,40}. Déterminer le niveau de confiance de l intervalle [10,20) pour π 0, Soit Y Gamma(α, λ) et X = e Y. On a f Y (y) = a) Déterminer la distribution de X. b) Soit α = 1 et l estimateur λα Γ(α) yα 1 e λy, y > 0. ˆλ = X X 1. Évaluer empiriquement le biais de cet estimateur de la façon suivante : 1. Choisir une valeur de λ plus grande que 1 (la solution est construite avec λ = 5). 2. Simuler des observations x (j) 1,..., x(j) n de la variable X dont la distribution a été déterminée en a).

26 18 Modélisation non paramétrique 3. Répéter les étapes 2 et 3 pour j = 1,2,..., r. 4. Calculer le biais moyen 5. Estimer le biais comme suit : Faire cette estimation pour i) n = 10 et r = ; ii) n = et r = 100 ; et iii) n = et r = ˆbˆλ (λ) = 1 r r ˆλ (j) λ. j=1 Discuter de l impact du nombre d observations dans l échantillon et du nombre de répétitions dans la simulation. c) En utilisant les estimateurs de la partie b) ii), tracer la fonction de répartition empirique de ˆλ. d) En utilisant les estimateurs de la partie c) et les classes calculées automatiquement par la fonction hist, tracer l histogramme et l ogive de la distribution de ˆλ. e) Calculer les 45 e et 70 e quantiles lissés des données de la partie c). Exercices proposés dans Loss Models 13.2, 13.3, 13.4, 13.6, 13.7, 13.8, 13.9, 14.2, 14.3, 14.6, 14.7, 14.8, 14.11, 14.12, 14.14, 14.18, 14.19, 14.22, 14.25, 14.28, 14.29, 14.31, 14.34, 14.35, 3.1, 3.2, 3.4, 3.13, 3.14, 3.16, 15.9, Réponses 3.1 b) 0, x 2 (x 2)/25, 2 < x 7 (x 5)/10, 7 < x 12 F 20 (x) = (x + 58)/100, 12 < x 22 (x + 42)/80, 22 < x 38 1, x > 38

27 Modélisation non paramétrique 19 c) 0, x 2 1/25, 2 < x 7 1/10, 7 < x 12 f 20 (x) = 1/100, 12 < x 22 1/80, 22 < x 38 0, x > , , a) a) 0 b) 0,05 c) 0,125 d) 0,1333 e) 0 f) 0,02 g) 0, , d) 9,225 et 10, (0,0964, 0,7036) , a) 0,05, 0,1026, 0,1582, 0,2170, 0,2795, 0,3462 b) 0, , γ 1 = 0, γ 2 = 3, a) 38,6 b) 42, , , , , a) Log-gamma(α, λ)

28

29 4 Modèles paramétriques potentiels 4.1 Soit X, une variable aléatoire avec densité Pareto(α, λ) représentant le montant d un sinistre et c > 0, une constante. Démontrer que la distribution de Y = cx est une distribution Pareto(α, cλ). 4.2 Soit X, une variable aléatoire avec fonction de densité f (x) = 1 2θ e x/θ, < x <. Trouver la fonction de répartition de Y = e X. 4.3 Il existe une relation intéressante entre les fonctions de répartition des lois gamma et Poisson. Soit X, une variable aléatoire avec densité Gamma(α, β) et α un entier. Démontrer que Pr(X x) = Pr(Y α), où Y Poisson(x/β). Utiliser la paramétrisation de la loi gamma où le second paramètre est un paramètre d échelle. 4.4 Soit X, une variable aléatoire avec densité de Pareto généralisée(α, τ, λ). Démontrer que la distribution de Y = X X + λ est une distribution bêta et identifier les paramètres de cette loi. 4.5 Soit X, une variable aléatoire telle que X Pareto(α,1). Trouver la fonction de répartition de la variable aléatoire Y = 5X 1/4 et identifier cette distribution ainsi que ses paramètres. 4.6 Soit X, une variable aléatoire avec densité Gamma(α, λ). a) Trouver la fonction de densité de Y = e X. b) Trouver E[Y] et Var[Y]. c) Est-ce que tous les moments existent? 21

30 22 Modèles paramétriques potentiels 4.7 Soit X, une variable aléatoire et i (0 i 1), le taux d inflation pour l année Pour chacune des lois ci-dessous, trouver la distribution de Y = (1 + i)x : a) X Pareto(α, λ). b) X Burr(α, γ, θ). c) X Log-gamma(α, λ). 4.8 Soit X, une variable aléatoire avec densité Pareto(α, λ). Trouver la fonction de densité de Y = X 1/τ, τ > Un assureur modélise des données à l aide de la variable aléatoire X qui a une distribution de Pareto de paramètres α et θ. On pose Déterminer la distribution de Y. Y = ln(1 + X/θ) Un assureur automobile a dans sa base de données les montants des sinistres de Il estime que les sinistres obéissaient alors à une loi Burr(α = 0,5, γ = 2, θ = 3). Pour s en servir le premier janvier 2007, il se doit de les mettre à jour selon les considérations suivantes : 2005 : inflation de 4 % ; 2006 : inflation de 4,5 % ; et nouvelles taxes de 16 %. Quelle est la probabilité d avoir un sinistre supérieur à 4 en 2007? 4.11 Soit X, la variable aléatoire représentant le montant d un sinistre (en millions) pour l année Sa fonction de densité de probabilité est f (x) = 3x 4, x 1. On observe qu une inflation de 10 % affecte uniformément tous les sinistres de 2006 à a) Trouver la fonction de répartition du montant des sinistres en b) Trouver la probabilité que le montant d un sinistre en 2007 soit supérieur à $ Pour un assuré d un certain groupe, le nombre de sinistres suit une loi Binomiale(10, θ). Sachant que, dans ce groupe, le paramètre θ est tiré d une distribution uniforme sur l intervalle (0, 1), trouver la probabilité qu un assuré pris au hasard ait plus de six sinistres au cours d une période Soit X, une variable aléatoire telle que la distribution conditionnelle de X étant donné le paramètre Θ = θ est une distribution Gamma(τ, θ), où Θ obéit à une loi gamma de paramètres α et λ. Trouver la distribution de X.

31 Modèles paramétriques potentiels On suppose que X a une distribution conditionnelle géométrique telle que Pr(X = x Θ = θ) = θ(1 θ) x 1, x = 1,2,... et θ est une réalisation de la variable aléatoire Θ de loi Bêta(α, β). Démontrer que la fonction de masse de probabilité de X est Pr(X = x) = Γ(α + β)γ(α + 1)Γ(β + x 1). Γ(α)Γ(β)Γ(α + β + x) 4.15 On suppose que X a une distribution conditionnelle de Weibull(τ, θ 1/τ ) telle que f (x Θ = θ) = τθx τ 1 e θxτ, x > 0. Aussi, on suppose que Θ Gamma(α, λ). Démontrer que la distribution marginale de X est une Burr(α, τ, λ 1/τ ) On suppose que le montant d un sinistre pour un groupe d assurés a une distribution Burr(5,1, λ). Si λ est une réalisation de la variable aléatoire Λ pour ce groupe d assurés et que l on suppose que Λ Gamma(10, 2), trouver l espérance et la variance du montant d un sinistre pour un assuré pris au hasard Soit le taux d échec suivant pour le montant d un sinistre pour une valeur donnée de θ, λ(x θ) = 3 x + θ, où x est la réalisation de la variable aléatoire X représentant le montant d un sinistre et θ est la réalisation de la variable aléatoire Θ où Θ Gamma(10, 0,01). Trouver l espérance et la variance du montant d un sinistre pris au hasard Comparer les queues des lois Gamma(α, λ) et Log-normale(µ, σ 2 ) Soit X, une variable aléatoire représentant le montant d un sinistre et l espérance de vie résiduelle suivante e(x) = x. Pour un contrat d assurance comportant une limite supérieure de , trouver le ratio d élimination de perte (LER) de l assureur Le tableau ci-dessous présente l espérance de vie résiduelle pour certaines valeurs de x. x e(x) , ,5

32 24 Modèles paramétriques potentiels a) À quelle distribution peut-on associer ces données et quelles sont les valeurs de ses paramètres? b) Trouver E[X; 10] On construit une distribution raccordée sur les sous-intervalles (0, 2), (2,8) et (8,16) avec les poids respectifs 0,5, 0,20 et 0,30. Dans chacun des sous-intervalles, on utilise une distribution gamma, de moyenne égale au point milieu du sous-intervalle et de variance égale à 1. Écrire la densité de probabilité obtenue sur (0,16). La réponse sera en fonction de la gamma incomplète On construit un modèle raccordé avec une distribution uniforme sur l intervalle (0,10) et une loi de Pareto de paramètres α = 3 et λ = 100 sur le reste des valeurs positives. Quels poids doivent être accordés aux distributions pour que la densité obtenue soit continue? 4.23 a) Comparer les queues d une distribution Weibull(λ, τ) et d une distribution Weibull inverse(θ, α) en utilisant les critères suivants : i) l existence des moments ; et ii) la comparaison des fonctions de survie. b) En utilisant une distribution Weibull et une distribution Weibull inverse dont les moyennes et variances sont égales, comparer graphiquement les queues des distributions Soit Y, une variable aléatoire telle que f Y (y) = S X(y) E[X] pour une variable aléatoire X quelconque. On dit qu une telle distribution est équilibrée. Démontrer que M Y (t) = M X(t) 1 te[x] lorsque M X (t) existe. Astuce 1 : intégrer par parties. Astuce 2 : l existence de M X (t) signifie que l intégrale converge. M X (t) = e tx f X (x) dx Un assureur modélise ses sinistres par une variable aléatoire X avec densité f (x) = (1 + 2x 2 )e 2x, x 0. a) Calculer la fonction de survie S X (x). b) Calculer le taux d incidence h(x).

33 Modèles paramétriques potentiels 25 c) Calculer la fonction d espérance résiduelle e(x). d) Calculer lim x h(x). e) Calculer lim x e(x). f) Démontrer que e(x) est une fonction strictement décroissante, mais que h(x) n est pas une fonction strictement croissante. Exercices proposés dans Loss Models 5.1, 5.3, 5.4, 5.5, 5.7, 5.9, 5.13, 5.17, 5.18, 5.19, 5.20, 5.21, 5.22, 5.23, 3.25, 3.26, 3.27 Réponses 4.2 F Y (y) = 1 2 eln(y)/θ I {0<y<1} + (1 1 2 eln(y)/θ )I {y 1} 4.4 Bêta(τ, α) 4.5 Burr inverse(α, 4, 5) 4.6 a) Log-gamma(α, λ) b) E[Y] = (λ/(λ 1)) α, Var[Y] = (λ/(λ 2)) α (λ(λ 1)) 2α c) Non 4.7 a) Pareto(α, (1 + i)λ) b) Burr(α, γ, (1 + i)θ) c) f Y (y) = λ α (1 + i) λ (ln(y) ln(1 + i)) α 1 y λ 1 /Γ(α) 4.8 Burr(α, τ, λ 1/τ ) 4.9 Exponentielle(α) , a) F(x) = 1 1,331x 3, x 1,1 b) 0, / X Pareto généralisée(α, τ, λ) /4 et 145/ , La distribution log-normale a une queue plus lourde que la distribution gamma , a) Pareto(7/3, 16/3) b) 3,0215

34 26 Modèles paramétriques potentiels ,5e x Γ(1;2), 0 < x 2 0,2 5 f X (x) = 25 x 25 1 e 5x, 2 < x 8 Γ(25;40) Γ(25;10) Γ(25) 0, x e 12x, 8 < x 16 Γ(144;192) Γ(144;96) Γ(144) / a) (1 + x + x 2 )e 2x b) 2 (1 + 2x)/(1 + x + x 2 ) c) (1 + x + 0,5x 2 )/(1 + x + x 2 )

35 5 Modélisation paramétrique 5.1 Soit X, une variable aléatoire représentant le montant d un sinistre. On suppose X Λ = λ Exponentielle(λ) Λ Gamma(α, β). Les sinistres suivants ont été observés : {1,10,200,1 000,5 000}. Estimer α et β par la méthode des moments. 5.2 On dispose d un échantillon aléatoire avec deux données inférieures à et quatre données entre et Les données supérieures à n ont pas été enregistrées. Écrire la fonction de vraisemblance pour un modèle de loi exponentielle. 5.3 Un assureur automobile a enregistré les montants de sinistres suivants : {1 000,850,750,1 100,1 250,900}. Il souhaite utiliser une distribution Gamma(α, 1/θ) pour les représenter. Estimer les paramètres de cette distribution à l aide de la méthode des moments. 5.4 Un actuaire dispose d un échantillon aléatoire tiré d une distribution loglogistique. Dans cet échantillon, 80 % des données sont supérieures à 100 et 20 % des données sont supérieures à 400. Calculer les estimateurs des paramètres de la distribution à l aide de la méthode des quantiles. 5.5 Soit x 1,..., x n un échantillon aléatoire d une population dont la fonction de répartition est F X (x) = x p, 0 < x < 1. Déterminer l estimateur de p par la méthode des moments. 5.6 Pendant une année, un assureur a enregistré les montants de sinistres suivants : {500,1 000,1 500,2 500,4 500}. Il décide de modéliser ces données par une loi Log-normale(µ, σ). En utilisant la méthode des moments, estimer les paramètres µ et σ. Calculer ensuite la probabilité d avoir un sinistre supérieur à

36 28 Modélisation paramétrique 5.7 Soit X, une variable aléatoire avec densité f (x) = β 2 xe 1 2 ( x β )2, x > 0, β > 0. L espérance de cette variable aléatoire est donnée par β 2π/2. On a observé les cinq valeurs suivantes : {4,9, 1,8, 3,4, 6,9, 4,0}. Déterminer l estimateur de β à l aide de la méthode des moments. 5.8 On suppose que la distribution du montant des sinistres obéit à une loi Weibull(τ, λ) de paramètres inconnus. a) Sachant que 50 % des sinistres sont supérieurs à $ et que 75 % des sinistres sont supérieurs à 500 $, estimer τ et λ par la méthode des quantiles. b) À partir des estimations obtenues en a), estimer le 80 e centile. 5.9 Soit X, la variable aléatoire représentant le montant d un sinistre. On suppose que le montant d un sinistre pour un λ fixé obéit à une distribution Exponentielle(λ) et que λ est une réalisation de la variable aléatoire Λ, où Λ Gamma(α, β). À la suite d une expérience, on observe que 0,1 % des sinistres sont supérieurs à 450 et que 87,5 % des sinistres sont inférieurs à 50. Trouver l équation, uniquement fonction de β, que l on doit résoudre pour estimer β et qui, après avoir été résolue, permet d estimer le paramètre α Pour des contrats en assurance automobile avec les modalités suivantes, on a observé pour l année 1999 : un rapport d élimination de perte de 0,56 avec une franchise forfaitaire de d = 200 ; un rapport d élimination de perte de 0,32 avec une franchise atteinte de d = 200 ; un rapport d élimination de perte de 0,79 avec une franchise forfaitaire de d = 500 ; un rapport d élimination de perte de 0,52 avec une franchise atteinte de d = 500. On a aussi observé que le montant moyen d un sinistre est de 200 $. Si on suppose une loi de Weibull(τ, λ) pour modéliser le montant d un sinistre, estimer les paramètres τ et λ par la méthode des quantiles Un assureur a déterminé que 20 % des sinistres de son portefeuille sont supérieurs à 50 $ et que 10 % des sinistres sont supérieurs à 55 $. D après ces données, estimer A et B (à l aide de la méthode des quantiles) pour 1 f X (x) = b a, a < x < b 0, ailleurs.

37 Modélisation paramétrique On a enregistré n essais indépendants X 1,..., X n de la variable aléatoire X Bernoulli(p). Trouver l estimateur du maximum de vraisemblance pour p Soit X 1,..., X n, un échantillon aléatoire provenant d une loi normale de paramètres µ et σ 2 inconnus. a) Trouver les estimateurs du maximum de vraisemblance de µ et σ 2. b) Démontrer que ˆµ et ˆσ 2 ont approximativement une distribution normale conjointe avec moyennes µ et σ 2 et variances σ 2 /n et 2σ 4 /n. c) Trouver l approximation de la distribution de l estimateur h( ˆµ, ˆσ 2 ) de ( ) c µ h(µ, σ 2 ) = Pr(X c) = Φ. σ 5.14 Soit X, une variable aléatoire représentant les montants de sinistres dont on possède un échantillon de taille n. La fonction de densité de probabilité de X est f (x) = 2θxe θx2, x > 0. Déterminer l estimateur du maximum de vraisemblance de θ Un assureur possède un échantillon aléatoire x 1,..., x n et il souhaite modéliser la variable aléatoire sous-jacente à l aide de la fonction F(x) = x p, 0 < x < 1. a) Déterminer l estimateur du maximum de vraisemblance de p. b) Quelle est la variance asymptotique de l estimateur du maximum de vraisemblance de p? c) À partir de la réponse obtenue en b), déterminer un intervalle de confiance de niveau 95 % pour p. d) Déterminer l estimateur du maximum de vraisemblance de E[X]. e) À partir de la réponse obtenue en d), déterminer un intervalle de confiance de niveau 95 % pour E[X] La variable aléatoire X a la densité suivante : f (x) = αλ α (λ + x) α 1, x > 0. On sait que λ = À partir de l échantillon {43, 145, 233, 396, 777}, déterminer l estimation du maximum de vraisemblance de α Quatre observations sont faites d une variable aléatoire dont la densité est f (x) = 2λxe λx2, x > 0. La seule information dont on dispose est qu une des quatre observations est inférieure à 2. Calculer une estimation du maximum de vraisemblance de λ.

38 30 Modélisation paramétrique 5.18 Un échantillon de taille 40 a été tiré d une population dont la densité est f (x) = (2πθ) 1/2 e x2 /(2θ), < x <. À partir de cet échantillon, on détermine une estimation du maximum de vraisemblance de θ : ˆθ = 2. Déterminer une approximation de l erreur quadratique de ˆθ On suppose que X obéit à une distribution log-gamma : f (x) = λ2 ln(x) x λ+1, x > 1. a) Trouver l estimateur des moments de λ. b) Trouver l estimateur du maximum de vraisemblance de λ Soit l échantillon suivant provenant d une distribution Gamma(5, λ) : {2,20,5,4,19}. a) Trouver l estimateur du maximum de vraisemblance de λ et en calculer la valeur. b) Trouver la variance de ˆλ si λ = Le tableau ci-dessous présente les sinistres payés en On pose l hypothèse que la sévérité d un sinistre est distribuée selon une loi de Pareto de paramètres α et 1. Déterminer l équation finale permettant de trouver l estimateur du maximum de vraisemblance de α. Montant Nombre de sinistres (0, 2] 2 (2, 5] 0 (5, 11] 1 (11, ) Le tableau ci-dessous présente les sinistres payés par un assureur. On pose que la distribution de X est une exponentielle de paramètre β inconnu. Quel est l estimateur du maximum de vraisemblance de β? Montant Nombre de sinistres (0, 1] 1 (1, 2] 0 (2, ) Soit X 1,..., X n un échantillon aléatoire provenant d une loi Weibull de densité f (x) = 2λxe λx2, x > 0. On estime P k = Pr(X k) par la méthode du maximum de vraisemblance.

39 Modélisation paramétrique 31 a) Déterminer ˆP k. b) Déterminer la variance de l estimateur trouvé en a). c) Si X 1 = X 2 = 10 et X 3 = 15, calculer Pr( ˆP ) Sachant qu un échantillon aléatoire X 1,..., X 50 provenant d une distribution de Pareto(α, λ) a conduit aux estimations ˆα = 1,5 et ˆλ = par la méthode du maximum de vraisemblance, estimer les variances des estimateurs ˆα et ˆλ ainsi que leur covariance On suppose que le montant d un sinistre obéit à une loi de Pareto(α, λ). Pendant une année, on observe 50 sinistres. À l aide des montants des 50 sinistres, on obtient ˆα = 2, ˆλ = 4, Var[ˆα] = 24 et Var[ ˆλ] = 40. Si la covariance entre les estimateurs ˆα et ˆλ est 10, trouver un intervalle de confiance de niveau α = 0,15 pour Pr(X > 10) Soit X la variable aléatoire représentant le montant d un sinistre. On observe les sinistres suivants en assurance automobile : {25,88,33,62,44,75,47,53}. On suppose que X Exponentielle(λ). a) Estimer la variance de la distribution de l estimateur du maximum de vraisemblance de E[X; 50]. b) Estimer la variance de la distribution de l estimateur du maximum de vraisemblance de π 0, Soit X, une variable aléatoire indiquant si une expérience est un succès (1) ou un échec (0) et dont la distribution est une loi de Bernoulli de paramètre α. On sait que la distribution a priori du paramètre α est une loi U(0,1). On a observé un succès en trois essais. a) Calculer l estimateur bayesien ˆα si la fonction de perte choisie est l erreur quadratique. b) Trouver l estimation bayesienne de la probabilité que α se retrouve entre 0,2 et 0, On suppose que X Θ = θ obéit à une loi de Poisson(θ) et que la distribution a priori de Θ est une loi Gamma(α, λ). Pour un échantillon de taille n, trouver l estimateur bayesien ˆθ si la fonction de perte choisie est l erreur quadratique On suppose que X A = α Pareto(α,1) et que la distribution a priori de A est une Exponentielle(3). a) Trouver la distribution a posteriori de A. b) Calculer ˆα à partir de l échantillon {2,1,2,3,3,4} si la fonction de perte choisie est l erreur quadratique.

40 32 Modélisation paramétrique 5.30 On suppose que X B = β Exponentielle(β) et que la distribution a priori de B est une Gamma(2,3). On a l échantillon aléatoire suivant : {6,11,8,13,9} a) Calculer l estimateur bayesien du paramètre β si la fonction de perte est l erreur quadratique. b) Répéter la partie a) avec la fonction de perte valeur absolue de l erreur. On fournit les valeurs Γ(7;4,734) = 0,2 Γ(7;5,411) = 0,3 Γ(7;6,039) = 0,4 Γ(7;6,670) = 0,5 Γ(7;7,343) = 0, Au cours d une session, les étudiants en actuariat font des devoirs informatiques. En faisant ces devoirs, il leur arrive de rester bloqués. Le nombre de fois où un étudiant reste bloqué dans un devoir suit une distribution Binomiale(3, θ), où l on suppose que θ est uniformément distribué sur l intervalle (0,25, 0,75). Deux étudiants sont restés bloqués chacun deux fois pendant un certain devoir. a) Trouver l estimateur bayesien de θ avec une fonction de perte quadratique. b) Déterminer la probabilité a posteriori que θ se retrouve dans l intervalle (0,6, 0,7) Pour des contrats d assurance comportant une rétention de 1,5 millions, 40 catastrophes ont été déclarées au réassureur. Le réassureur suppose que les montants de sinistres obéissent à une loi de Pareto(α, λ). Soit W la variable aléatoire représentant un montant de sinistre déclaré au réassureur (en millions). À l aide des montants qui lui ont été déclarés, le réassureur a estimé les paramètres α et λ par la méthode du maximum de vraisemblance. Il a obtenu ˆα = 5,084 et ˆλ = 28,998. a) Trouver, par la méthode du maximum de vraisemblance, l estimation de Pr(W > 29,5). b) Si la matrice variance-covariance de (ˆα, ˆλ) est [ ] 23,92 167,07, 167, ,32 estimer la variance de l estimateur de Pr(W > 29,5) utilisé en a) Soit X la variable aléatoire représentant le montant d un sinistre. On suppose X Exponentielle(λ). Pour des contrats d assurance comportant une franchise forfaitaire de 100 $ et une limite supérieure de $, les montants de sinistres suivants ont été payés par l assureur : {100,200,250,425,515,630,1 000,1 500,2 900,2 900}. Estimer le montant espéré d un sinistre par la méthode du maximum de vraisemblance.

41 Modélisation paramétrique Un assureur signe un traité de réassurance excess-of-loss de plein 150, c est-à-dire que l assureur ne paie que les 150 premiers dollars de chaque sinistre et le réassureur se charge de l excédent. Cet assureur veut calculer combien lui coûterait la hausse du plein à 200, mais il ignore la distribution du coût des sinistres. L assureur a payé les montants suivants : {10,70,100,105,110,150,150,150} et il suppose que le coût des sinistres est distribué comme suit : { λe λx, x > 0 f (x) = 0, ailleurs. Quel est l estimateur du maximum de vraisemblance de λ en supposant que les trois montants de 150 de l échantillon proviennent d un montant payé supérieur à 150 $? 5.35 On dispose d un échantillon tiré d une loi exponentielle présentant deux observations entre 0 et 2, quatre observations entre 2 et 5 et trois observations entre 5 et 8. Estimer le paramètre de la loi par la méthode de Cramér von Mises avec poids unitaires. Exercices proposés dans Loss Models 15.1, 15.2, 15.3, 15.4, 15.6, 15.8, 15.11, 15.12, 15.15, 15.20, 15.22, 15.23, 15.24, 15.25, 15.26, 15.29, 15.33, 15.37, 15.38, 15.39, 15.40, 15.46, 15.47, 15.48, 15.51, 15.52, 15.53, 15.57, 15.58, 15.59, 15.60, 15.62, 15.64, 15.65, 15.66, 15.68, 15.70, 15.71, 15.72, 15.73, Réponses 5.1 ˆα = 3,45, ˆβ = 3 048, L(λ) = [(1 e 2 000λ ) 2 (e 2 000λ e 5 000λ ) 4 ]/(1 e 5 000λ ) ˆα = 34,83, ˆθ = 27, ˆγ = 2, ˆθ = x/(1 x) 5.6 ˆµ = 7,40, ˆσ = 0,6368 et 0, , a) ˆτ = 1,2687, ˆλ = 0, b) β(β + 450) 0,3010 = β 0,3010 (β + 50)

42 34 Modélisation paramétrique 5.10 ˆτ = 0,48, ˆλ = 0,01, 5.11 a = 10, b = ˆp = X 5.13 a) ˆµ = X, ˆσ 2 = S 2 c) h( ˆµ, ˆσ 2 ) N(h(µ, σ 2 ), V), V = φ 2 ((c ˆµ)/ˆσ)(1/n + (c ˆµ) 2 /(2nˆσ 2 )) 5.14 n/ n i=1 x2 i 5.15 a) n/ n i=1 ln x i b) p 2 /n c) ˆp ± 1,96p/ n d) ˆp/(1 + ˆp) e) ˆp/(1 + ˆp) ± 1,96 ˆp(1 + ˆp) 2 / n , ln , a) X/( X 1) b) 2n/ n i=1 ln(x i) 5.20 a) 1/2 b) 1/ L(α) = (1 (1/3) α ) 2 ((1/6) α (1/12) α )(1/12) α 5.22 ln(1,5) 5.23 a) 1 e ˆλk 2, ˆλ = n/ n i=1 X2 i b) k 4 λ 2 e 2λk2 /n c) 0, Var[ˆα] = 0,28133, Var[ ˆλ] = , Ĉov(ˆα, ˆλ) = 393, (0, 0,7653) 5.26 a) 20,68 b) a) 0,4 b) 0, (α + n i=1 X i)/(λ + n) 5.29 a) Gamma(n + 1,3 + n i=1 ln(1 + x i)) b) 0, a) 0,14 b) 0, a) 0,5668 b) 0, a) 0,0365 b) 0, , , ,2286

43 6 Tests d adéquation 6.1 On suppose que la variable aléatoire représentant le montant d un sinistre a une distribution de Pareto avec paramètres α = 2 et λ = Un échantillon de taille 10 présente trois données entre 0 et 250, deux données entre 250 et 500, trois données entre 500 et et deux données supérieures à Appliquer le test du khi carré à un seuil de signification de 10 % même si les nombres de sinistres attendus dans chaque classe ne sont pas supérieurs à cinq. 6.2 Le tableau ci-dessous présente un échantillon de données groupées. Intervalle Nombre de données (0, 3] 180 (3, 7,5] 180 (7,5, 15] 235 (15, 40] 255 (40, ) 150 Une loi de Pareto a été ajustée à ces données et les estimateurs obtenus sont ˆα = 3,5 et ˆλ = 50. Quel est le seuil de signification le plus élevé (parmi 5 %, 2,5 %, 1 % et 0,5 %) auquel on ne rejette pas ce modèle avec le test du khi carré? 6.3 On dispose de l échantillon aléatoire {0,1, 0,4, 0,8, 0,8, 0,9} et on veut y ajuster la distribution avec fonction de densité de probabilité f (x) = 1 + 2x, 0 x 1. 2 Calculer la statistique de Kolmogorov Smirnov et réaliser un test avec un seuil de signification de 5 %. 6.4 La compagnie d assurance Great Company a obtenu les montants de sinistres suivants : {1,1,2,2,2,2,3,3,4,8}. a) Trouver la distribution empirique. b) Si le montant d un sinistre obéit à une loi de Pareto(2,2), calculer la distance de Cramér von Mises avec poids unitaires. 35

44 36 Tests d adéquation c) Un compétiteur sujet aux mêmes sinistres, Greater Company, a perdu toutes les données sur ses sinistres. Dans un élan de sollicitude, Great Company lui fournit ses données, mais sous la forme restreinte cidessous. Montants des sinistres Nombre de sinistres (0, 2] 6 (0, 4] 9 (0, 8] 10 Calculer la distance de Cramér von Mises avec poids unitaires. 6.5 Soit la distribution avec fonction de densité de probabilité f (x) = x 2, 0 x 2, et soit l échantillon tiré de cette densité {0,5, 1, 1,25, 1,5}. Calculer la statistique de Kolmogorov Smirnov. 6.6 On veut tester si f X (x) = { x 50, 0 < x < 10 0, ailleurs est un bon modèle pour les données suivantes : {1, 4, 6, 9, 8, 7, 9,5}. Utiliser la statistique de Kolmogorov Smirnov avec un seuil de signification de 5 %. (Utiliser la valeur critique c = 1,36/ n même si n < 15.) 6.7 En supposant que les données du tableau ci-dessous sont associées à une loi de Pareto(1, 8), calculer la statistique de Pearson. Intervalle Fréquence (0, 5] 10 (5, 20] 5 (20, ) On a observé les sinistres suivants en assurance habitation : {125, 550, 550, 700}. On hésite entre les distributions Gamma(3, 0,01) et Gamma(3,5, 0,01) pour modéliser le montant d un sinistre. Utiliser la statistique de Kolmogorov Smirnov pour guider le choix de la distribution. Voici quelques valeurs de la Gamma incomplète : Γ(3,5; 1,25) = 0,0729, Γ(3,5; 5,51) = 0,8614, Γ(3,5;7) = 0,9488. De plus, pour α entier, on a α 1 Γ(α; x) = 1 j=0 x j e x. j!

45 Tests d adéquation On a observé les sinistres du tableau ci-dessous en assurance médicaments. Déterminer, à l aide de la statistique de Pearson, si l hypothèse d une distribution avec taux d échec constant λ(x) = 0,01, x > 0 est appropriée à un niveau de confiance de 95 %. Montants des sinistres Nombre de sinistres [0, 25) 10 [25, 40) 5 [40, 60) 10 [60, 80) 5 [80, ) On détient les informations du tableau ci-dessous sur l expérience de sinistres d un portefeuille d assurance. Montants de sinistres Fréquence [0, 25) 10 [25, 50) 12 [50, 100) 12 [100, 200) 11 [200, ) 5 On hésite entre une loi de Pareto(1,5, 50) et une loi de Weibull(0,01, 1) pour la distribution du montant d un sinistre. a) Quel modèle privilégier si on utilise la distance de Cramér von Mises avec poids unitaires pour guider le choix? b) Si la statistique de Pearson avait été utilisée au lieu de la distance de Cramér von Mises, l hypothèse de la loi Pareto(1,5,50) aurait-elle été rejetée à un niveau de confiance α = 0,05? c) Si l on obtient une distance de Cramér von Mises de 0,01 lorsque l on suppose X Log-normale(µ = 65, σ 2 = 5 500), est-ce que, selon cette statistique, le choix de cette distribution est meilleur que le choix de la distribution de Pareto(1,5, 50)? 6.11 Au départ d une course de chevaux, il y a habituellement huit positions de départ et la position numéro 1 est la plus proche de la palissade. On soupçonne qu un cheval a plus de chances de gagner quand il porte un numéro faible, c est-à-dire lorsqu il est plus proche de la palissade intérieure. Le tableau ci-dessous présente les résultats pour 144 courses. Numéro Gains

46 38 Tests d adéquation a) Poser les hypothèses à tester (hypothèse nulle et hypothèse alternative). b) La comparaison de la distribution observée à la distribution théorique s effectue par un test de Kolmogorov Smirnov. Que peut-on en conclure? 6.12 À partir d un échantillon contenant 100 données, un assureur obtient les résultats présentés dans le tableau ci-dessous pour cinq modèles postulés. Déterminer le meilleur modèle selon le critère bayesien de Schwarz. Modèle Nombre de paramètres Log-vraisemblance Pareto généralisée 3 219,1 Burr 3 219,2 Pareto 2 221,2 Log-normale 2 221,4 Exponentielle inverse 1 224,4 Exercices proposés dans Loss Models 16.1, 16.2, 16.3, 16.4, 16.5, 16.8, 16.9, 16.11, 16.12, 16.15, Réponses 6.1 Q = 0, ,5 % 6.3 D = 0, b) 0,3478 c) 0, , D = 0, , Gamma(3,5, 0,01) 6.9 Q = 1, a) Weibull b) oui c) oui 6.11 b) D = 0, Pareto

47 7 Modèles de fréquence 7.1 Un assureur décide de modéliser la fréquence des sinistres par une distribution N Binomiale(m, θ) dont le paramètre m est connu. a) Démontrer que l estimateur du maximum de vraisemblance de θ est sans biais. b) Déterminer directement la variance de cet estimateur. c) Déterminer la variance de cet estimateur en calculant l information de Fisher. d) Déterminer un intervalle de confiance approximatif de niveau 1 α pour la paramètre θ. 7.2 Un portefeuille de la compagnie Even Greater Company comptant risques a produit les fréquences de sinistres présentées dans le tableau cidessous. Fréquence Nombre de risques a) Déterminer l estimateur du maximum de vraisemblance du paramètre λ d une loi de Poisson ainsi qu un intervalle de confiance de niveau 95 % pour ce paramètre. b) Soit une distribution géométrique de paramètre β = (1 θ)/θ, c està-dire que β Pr(N = k) = k, k = 0,1,... (β + 1) k+1 Déterminer l estimateur du maximum de vraisemblance du paramètre β ainsi qu un intervalle de confiance de niveau 95 % pour ce paramètre. c) Déterminer les estimateurs de la méthode des moments des paramètres d une distribution binomiale négative avec fonction de masse 39

48 40 Modèles de fréquence de probabilité ( ) k + r 1 β Pr(N = k) = k, k = 0,1,... r 1 (β + 1) k+r d) Répéter la partie c) pour les estimateurs du maximum de vraisemblance en utilisant une procédure numérique. 7.3 Un assureur offre un contrat couvrant les accidents automobiles causés par des hommes et par des femmes. L information pour polices est présentée dans le tableau ci-dessous. Fréquence Hommes Femmes a) Déterminer l estimateur du maximum de vraisemblance du paramètre λ d une loi de Poisson pour la variable N 1, le nombre de sinistres causés par des hommes, et la variable N 2, le nombre de sinistres causés par des femmes. b) En supposant que N 1 et N 2 sont des variables indépendantes, déterminer un modèle pour N = N 1 + N Le tableau ci-dessous présente des données de fréquence annuelle d accidents pour un portefeuille d assurance automobile. Fréquence Nombre de risques a) Ajuster une distribution Binomiale(7, θ) à ces données en estimant le paramètre θ par la méthode du maximum de vraisemblance. b) Ajuster plutôt une distribution binomiale négative aux données par la méthode des moments. Utiliser la paramétrisation de l exercice 7.2 c). c) Répéter la partie b) en estimant plutôt par la méthode du maximum de vraisemblance.

49 Modèles de fréquence Démontrer que la distribution Binomiale négative(r, β(β + 1) 1 ) est le résultat du mélange continu de distributions de Poisson suivant N Λ = λ Poisson(λ) Λ Gamma(r, β). 7.6 Un assureur modélise la fréquence des sinistres par une distribution Binomiale négative(3, 1/6). La sévérité des sinistres est modélisée par une distribution Exponentielle(0,01). Si une franchise de 20 $ est ajoutée au contrat, calculer E[N ], l espérance de la fréquence modifiée. 7.7 Un portefeuille d assurance compte contrats. Le tableau ci-dessous résume l information connue à propos de la fréquence des sinistres. Nombre de sinistres Nombre de contrats Parmi les distributions binomiale, Poisson, binomiale négative, normale et gamma, laquelle semble la plus appropriée pour modéliser ces données? 7.8 Un assureur enregistre tous les jours d une année (365 jours) le nombre de réclamations qu il reçoit. Les données recueillies sont présentées dans le tableau ci-dessous. L assureur utilise une distribution de Poisson de moyenne 0,6 pour modéliser la variable aléatoire du nombre quotidien de sinistres. Déterminer la statistique de Pearson. Nombre de sinistres Nombre de jours Exercices proposés dans Loss Models 6.1, 6.2, 6.3, 15.18, 15.19, 15.4, , , , , , 8.29, 8.32, 8.33, 8.34

50 42 Modèles de fréquence Réponses 7.1 b) θ(1 θ)/(nm) c) θ(1 θ)/(nm) d) ˆθ ± z α/2 ˆθ(1 ˆθ)/(mn) 7.2 a) 0,1001 ± 1,96 0,1001/ b) 0,1001 ± 1,96 0,1001(1,1001)/ c) ˆr = 55,67, ˆβ = 0,0018 d) ˆr = 52,73, ˆµ = 0, a) ˆλ 1 = 0,109 et ˆλ 2 = 0,057 b) N Poisson(0,166) 7.4 a) 0,0237 b) ˆr = 0,4715, ˆβ = 0,3521 c) ˆr = 0,656, ˆµ = 0, , Binomiale 7.8 2,85

51 A Paramétrisation des lois de probabilité Cette annexe précise la paramétrisation des lois de probabilité continues et discrètes utilisée dans les énoncés des exercices. Dans certains cas, elle est différente de celle présentée dans les annexes A et B de Klugman et collab. (2008a). En particulier, nous utilisons toutes les distributions de la famille gamma transformée avec un paramètre de taux (λ) plutôt qu un paramètre d échelle (θ). De plus, l ordre des paramètres est différent. En plus de la fonction de densité de probabilité et de la fonction de répartition, l annexe fournit les éléments suivants pour chaque loi : la racine foo des fonctions dfoo, pfoo, qfoo, rfoo, mfoo et levfoo telles que définies dans R et actuar ; les noms des arguments de ces fonctions correspondant à chacun des paramètres de la loi ; le k e moment (ainsi que l espérance et la variance pour les cas les plus usuels) ; l espérance limitée (lois continues seulement) ; la fonction génératrice des moments M(t), lorsqu elle existe ; la fonction génératrice des probabilités P(z) (lois discrètes seulement). Dans les formules ci-dessous, avec Γ(α; x) = 1 x t α 1 e t dt, α > 0, x > 0 Γ(α) 0 Γ(α) = t α 1 e t dt 0 est la fonction gamma incomplète, alors que avec β(a, b; x) = 1 x t a 1 (1 t) b 1 dt, a > 0, b > 0, 0 < x < 1 β(a, b) 0 1 β(a, b) = t a 1 (1 t) b 1 dt = Γ(a)Γ(b) 0 Γ(a + b) est la fonction bêta incomplète régularisée. Sauf avis contraire, les paramètres sont strictement positifs et les fonctions sont définies pour x > 0. 43

52 44 Paramétrisation des lois de probabilité A.1 Famille bêta transformée A.1.1 Bêta transformée (α, γ, τ, θ) Racine : trbeta, pearson6 Paramètres : shape1 (α), shape2 (γ), shape3 (τ), rate (λ = 1/θ), scale (θ) f (x) = γuτ (1 u) α, u = v ( x ) γ xβ(α, τ) 1 + v, v = θ F(x) = β(τ, α;u) E[X k ] = θk Γ(τ + k/γ)γ(α k/γ), τγ < k < αγ Γ(α)Γ(τ) θγ(τ + 1/γ)Γ(α 1/γ) E[X; x] = β(τ + 1/γ, α 1/γ;u) + x(1 F(x)) Γ(α)Γ(τ) A.1.2 Burr (α, γ, θ) Racine : burr Paramètres : shape1 (α), shape2 (γ), rate (λ = 1/θ), scale (θ) f (x) = αγuα (1 u), u = 1 ( x ) γ x 1 + v, v = θ F(x) = 1 u α E[X k ] = θk Γ(1 + k/γ)γ(α k/γ), γ < k < αγ Γ(α) θγ(1 + 1/γ)Γ(α 1/γ) E[X; x] = β(1 + 1/γ, α 1/γ;u) + xu α Γ(α) A.1.3 Burr inverse (τ, γ, θ) Racine : invburr Paramètres : shape1 (τ), shape2 (γ), rate (λ = 1/θ), scale (θ) f (x) = τγuτ (1 u), u = v ( x ) γ x 1 + v, v = θ F(x) = u τ E[X k ] = θk Γ(τ + k/γ)γ(1 k/γ), τγ < k < γ Γ(τ) θγ(τ + 1/γ)Γ(1 1/γ) E[X; x] = β(τ + 1/γ,1 1/γ;u) + x(1 u τ ) Γ(α)

53 A.1. Famille bêta transformée 45 A.1.4 Pareto généralisée (α, τ, θ) Racine : genpareto Paramètres : shape1 (α), shape2 (τ), rate (λ = 1/θ), scale (θ) f (x) = uτ (1 u) α xβ(α, τ), u = v 1 + v, v = x θ F(x) = β(τ, α;u) E[X k ] = θk Γ(τ + k)γ(α k), τ < k < α Γ(α)Γ(τ) E[X] = θτ α 1, α > 1 Var[X] = θ2 τ(τ + α 1) (α 1) 2 (α 2), α > 2 E[X; x] = A.1.5 Pareto (α, θ) Racine : pareto, pareto2 Paramètres : shape (α), scale (θ) θτ β(τ + 1, α 1;u) + x(1 F(x)) α 1 f (x) = αuα (1 u), u = 1 x 1 + v, v = x θ F(x) = 1 u α E[X k ] = θk Γ(k + 1)Γ(α k), 1 < k < α Γ(α) E[X] = θ α 1, α > 1 θ Var[X] = 2 α (α 1) 2 (α 2), α > 2 [ ( ) ] θ θ α 1 1, α 1 α 1 x + θ E[X; x] = ( ) θ θ ln, α = 1 x + θ A.1.6 Pareto inverse (τ, θ) Racine : invpareto Paramètres : shape (τ), scale (θ) f (x) = τuτ (1 u), u = v x 1 + v, v = x θ F(x) = u τ

54 46 Paramétrisation des lois de probabilité E[X k ] = θk Γ(τ + k)γ(1 k), τ < k < 1 Γ(τ) u E[X; x] = θ k y τ τ 0 1 y dy + x(1 uτ ) A.1.7 Log-logistique (γ, θ) Racine : llogis Paramètres : shape (γ), rate (λ = 1/θ), scale (θ) γu(1 u) f (x) =, u = v ( x ) γ x 1 + v, v = θ F(x) = u E[X k ] = θ k Γ(1 + k/γ)γ(1 k/γ), γ < k < γ E[X; x] = θγ(1 + 1/γ)Γ(1 1/γ)β(1 + 1/γ,1 1/γ;u) + x(1 u) A.1.8 Paralogistique (α, θ) Racine : paralogis Paramètres : shape (α), rate (λ = 1/θ), scale (θ) f (x) = α2 u α (1 u), u = 1 ( x ) α x 1 + v, v = θ F(x) = 1 u α E[X k ] = θk Γ(1 + k/α)γ(α k/α), γ 2 < k < α 2 Γ(α) θγ(1 + 1/α)Γ(α 1/α) E[X; x] = β(1 + 1/α, α 1/α;u) + xu α Γ(α) A.1.9 Paralogistique inverse (τ, θ) Racine : invparalogis Paramètres : shape (τ), rate (λ = 1/θ), scale (θ) f (x) = τ2 u τ (1 u), u = v ( x ) τ x 1 + v, v = θ F(x) = u τ E[X k ] = θk Γ(τ + k/τ)γ(1 k/τ), τ 2 < k < τ Γ(τ) θγ(τ + 1/τ)Γ(1 1/τ) E[X; x] = β(τ + 1/τ,1 1/τ;u) + x(1 u τ ) Γ(τ)

55 A.2. Famille gamma transformée 47 A.2 Famille gamma transformée A.2.1 Gamma transformée (α, τ, λ) Racine : trgamma Paramètres : shape1 (α), shape2 (τ), rate (λ), scale (θ = 1/λ) f (x) = τuα e u xγ(α), F(x) = Γ(α;u) u = (λx)τ E[X k Γ(α + k/τ) ] = λ k, k > ατ Γ(α) Γ(α + 1/τ) E[X; x] = Γ(α + 1/τ;u) + x(1 Γ(α;u)) λγ(α) A.2.2 Gamma transformée inverse (α, τ, λ) Racine : invtrgamma Paramètres : shape1 (α), shape2 (τ), rate (λ), scale (θ = 1/λ) f (x) = τuα e u xγ(α), F(x) = 1 Γ(α;u) u = (λx) τ E[X k Γ(α k/τ) ] = λ k, k < ατ Γ(α) Γ(α 1/τ) E[X; x] = (1 Γ(α 1/τ;u)) + xγ(α;u) λγ(α) A.2.3 Gamma (α, λ) Racine : gamma Paramètres : shape (α), rate (λ), scale (θ = 1/λ) f (x) = uα e u xγ(α), F(x) = Γ(α;u) E[X k ] = Γ(α + k) λ k Γ(α), u = λx k > α E[X] = α λ Var[X] = α λ 2

56 48 Paramétrisation des lois de probabilité Γ(α + 1) E[X; x] = Γ(α + 1;u) + x(1 Γ(α;u)) λγ(α) ( ) λ α M(t) = λ t A.2.4 Gamma inverse (α, λ) Racine : invgamma Paramètres : shape (α), rate (λ), scale (θ = 1/λ) f (x) = uα e u xγ(α), F(x) = 1 Γ(α;u) E[X k ] = E[X; x] = A.2.5 Weibull (τ, λ) Γ(α k) λ k Γ(α), Γ(α 1) λγ(α) u = (λx) 1 k < α Racine : weibull Paramètres : shape (τ), scale (θ = 1/λ) A.2.6 Weibull inverse (τ, λ) (1 Γ(α + 1;u)) + xγ(α;u) f (x) = τue u, u = (λx) τ x F(x) = 1 e u E[X k Γ(1 + k/τ) ] = λ k, k > τ Γ(1 + 1/τ) E[X; x] = Γ(1 + 1/τ;u) + xe u λ Racine : invweibull, lgompertz Paramètres : shape (τ), rate (λ), scale (θ = 1/λ) f (x) = τue u, u = (λx) τ x F(x) = e u E[X k Γ(1 k/τ) ] = λ k, k < τ Γ(1 1/τ) E[X; x] = (1 Γ(1 1/τ;u)) + x(1 e u ) λ

57 A.3. Autres distributions continues 49 A.2.7 Exponentielle (λ) Racine : exp Paramètre : rate (λ) f (x) = ue u x, u = λx F(x) = 1 e u E[X k ] = E[X] = 1 λ Γ(k + 1) λ k, k > 1 A.2.8 Var[X] = 1 λ 2 E[X; x] = 1 e u λ M(t) = λ λ t Exponentielle inverse (λ) Racine : invexp Paramètres : rate (λ), scale (θ = 1/λ) f (x) = ue u x, u = (λx) 1 F(x) = e u E[X k ] = Γ(1 k) λ k, k < 1 A.3 Autres distributions continues A.3.1 Normale (µ, σ 2 ) Racine : norm Paramètres : mean ( < µ < ), sd (σ) f (x) = 1 { exp 2πσ ( x µ F(x) = Φ σ E[X] = µ Var[X] = σ 2 M(t) = e µt+σ2 t 2 /2 ( x µ 1 2 σ ), Φ(x) = 1 x 2π ) 2 }, < x < e y2 dy

58 50 Paramétrisation des lois de probabilité A.3.2 Log-normale (µ, σ 2 ) Racine : lnorm Paramètres : meanlog (α), sdlog (σ) f (x) = 1 1 2πσ x exp ( ) ln x µ F(x) = Φ σ E[X k ] = e kµ+k2 σ 2 /2 E[X] = e µ+σ2 /2 A.3.3 Log-gamma (α, λ) Var[X] = e 2µ+σ2 (e σ2 1) Racine : lgamma Paramètres : shapelog (α), ratelog (λ) f (x) = λα (ln x) α 1 x λ+1 Γ(α), x > 1 { 1 ( ) ln x µ 2 } 2 σ F(x) = Γ(α;λln x), x > 1 ( ) λ α E[X k ] = λ k ( ) λ α E[X] = λ 1 ( ) λ α ( ) λ 2α Var[X] = λ 2 λ 1 ( ) λ α E[X; x] = Γ(α;(λ 1)ln x) + x(1 Γ(α;λln x)) λ 1 A.3.4 Pareto translatée (α, θ) Racine : pareto1 Paramètres : shape (α), min (θ) f (x) = αθα x α+1, x > θ ( ) θ α F(x) = 1, x > θ x E[X k ] = αθk α k, E[X; x] = k < α αθ α 1 θ (α 1)x α 1

59 A.3. Autres distributions continues 51 Cette loi est également appelée Pareto à un paramètre. Seul α est considéré comme un véritable paramètre de la distribution. Le paramètre θ est la borne inférieure du support de la distribution et est en général considéré connu. A.3.5 Bêta généralisée (α, β, τ, θ) Racine : genbeta Paramètres : shape1 (α), shape2 (β), shape3 (τ), rate (λ = 1/θ), scale (θ) f (x) = τuα (1 u) β 1 ( x ) τ, u =, 0 < x < θ xβ(α, β) θ F(x) = β(α, β;u) E[X k ] = θk Γ(α + β)γ(α + k/τ) Γ(α)Γ(α + β + k/τ), E[X; x] = A.3.6 Bêta (α, β) θγ(α + β)γ(α + 1/τ) Γ(α)Γ(α + β + 1/τ) Racine : beta Paramètres : shape1 (α), shape2 (β) f (x) = k > ατ β(α + 1/τ, β;u) + x(1 β(α, β;u)) Γ(α + β) Γ(α)Γ(β) xα 1 (1 x) β 1, 0 < x < 1 F(x) = β(α, β; x) E[X k Γ(α + β)γ(α + k) ] = Γ(α)Γ(α + β + k), k > α E[X] = α α + β αβ Var[X] = (α + β) 2 (α + β + 1) Γ(α + β)γ(α + 1) E[X; x] = β(α + 1, β;u) + x(1 β(α, β; x)) Γ(α)Γ(α + β + 1)

60 52 Paramétrisation des lois de probabilité A.4 Distributions discrètes de la famille (a, b, 0) A.4.1 Binomiale (n, θ) Racine : binom Paramètres : size (n), prob (θ) Pr(X = x) = E[X] = nθ Var[X] = nθ(1 θ) ( ) n θ x (1 θ) n x, n entier, 0 < θ < 1, x = 0,1,... x M(t) = (1 θ + θe t ) n P(z) = (1 θ(z 1)) n A.4.2 Binomiale négative (r, θ) Racine : nbinom Paramètres : size (r), prob (θ), mu (µ = r(1 θ)/θ) ( x + r 1 Pr(X = x) = r 1 r(1 θ) E[X] = θ r(1 θ) Var[X] = θ ( 2 M(t) = θ 1 (1 θ)e t P(z) = (1 (1 θ)z) r ) θ r (1 θ) x, 0 < θ < 1, x = 0,1,... ) r A.4.3 Géométrique (θ) Racine : nbinom Paramètre : prob (θ) Pr(X = x) = θ(1 θ) x, 0 < θ < 1, x = 0,1,... E[X] = 1 θ θ Var[X] = 1 θ θ 2 θ M(t) = 1 (1 θ)e t P(z) = (1 (1 θ)z) 1

61 A.4. Distributions discrètes de la famille (a, b, 0) 53 A.4.4 Poisson (λ) Racine : pois Paramètre : lambda (λ) Pr(X = x) = λx e λ, x = 0,1,... x! E[X] = λ Var[X] = λ M(t) = e λ(et 1) P(z) = e λ(z 1)

62

63 B Installation de packages dans R Plusieurs exercices de ce recueil requièrent l utilisation du package actuar (Dutang et collab., 2008). Le package doit être installé depuis le site Comprehensive R Archive Network (CRAN ; Cette annexe explique comment configurer R pour faciliter l installation et l administration de packages externes. Les instructions ci-dessous sont centrées autour de la création d une bibliothèque personnelle où seront installés les packages R téléchargés de CRAN. Il est fortement recommandé de créer une telle bibliothèque. Cela permet d éviter d éventuels problèmes d accès en écriture dans la bibliothèque principale et de conserver les packages intacts lors des mises à jour de R. Nous montrons également comment spécifier le site miroir de CRAN pour éviter d avoir à le répéter à chaque installation de package. 1. Identifier le dossier de départ de l utilisateur. En cas d incertitude, examiner la valeur de la variable d environnement HOME 1, soit depuis R avec la commande > Sys.getenv("HOME") ou encore directement depuis Emacs avec M-x getenv RET HOME RET Tout comme R et Emacs, nous référerons à ce dossier par le symbole ~. 2. Créer un dossier qui servira de bibliothèque de packages personnelle. Dans la suite, nous utiliserons ~/R/library. 3. Dans un fichier nommé ~/.Renviron (donc situé dans le dossier de départ), enregistrer la ligne appropriée ci-dessous selon votre système d exploitation : R_LIBS="~/R/library;${R_LIBS}" R_LIBS="~/R/library:${R_LIBS}" (Windows) (OS X, Linux, Unix) Au besoin, remplacer le chemin ~/R/library par celui du dossier créé à l étape précédente. Utiliser la barre oblique avant (/) dans le chemin pour séparer les dossiers. 1. Dans Windows, la variable est créée par l assistant d installation de GNU Emacs lorsqu elle n existe pas déjà. 55

64 56 Installation de packages dans R 4. Dans un fichier nommé ~/.Rprofile, enregistrer les options suivantes : options(repos = " menu.graphics = FALSE) Si désiré, remplacer la valeur de l option repos par l URL d un autre site miroir de CRAN. Consulter la rubriques d aide de Startup pour les détails sur la syntaxe et l emplacement des fichiers de configuration, celles de library et.libpaths pour la gestion des bibliothèques et celle de options pour les différentes options reconnues par R. Après un redémarrage de R, la bibliothèque personnelle aura préséance sur la bibliothèque principale et il ne sera plus nécessaire de préciser le site miroir de CRAN lors de l installation de packages. Ainsi, la simple commande > install.packages("actuar") téléchargera le package actuar depuis de le miroir canadien de CRAN et l installera dans le dossier ~/R/library. Pour charger le package en mémoire, on fera > library("actuar") On peut arriver au même résultat sans utiliser les fichiers de configuration.renviron et.rprofile. Il faut cependant recourir aux arguments lib et repos de la fonction install.packages et à l argument lib.loc de la fonction library. Consulter les rubriques d aide de ces deux fonctions pour de plus amples informations.

65 C Table de quantiles de la loi normale x 1 Pr[X x] = Φ(x) = e y2 /2 dy 2π Φ( x) = 1 Φ(x) x Φ(x) x Φ(x) x Φ(x) 0,00 0,500 1,10 0,864 2,05 0,980 0,05 0,520 1,15 0,875 2,10 0,982 0,10 0,540 1,20 0,885 2,15 0,984 0,15 0,560 1,25 0,894 2,20 0,986 0,20 0,579 1,282 0,900 2,25 0,988 0,25 0,599 1,30 0,903 2,30 0,989 0,30 0,618 1,35 0,911 2,326 0,990 0,35 0,637 1,40 0,919 2,35 0,991 0,40 0,655 1,45 0,926 2,40 0,992 0,45 0,674 1,50 0,933 2,45 0,993 0,50 0,691 1,55 0,939 2,50 0,994 0,55 0,709 1,60 0,945 2,55 0,995 0,60 0,726 1,645 0,950 2,576 0,995 0,65 0,742 1,65 0,951 2,60 0,995 0,70 0,758 1,70 0,955 2,65 0,996 0,75 0,773 1,75 0,960 2,70 0,997 0,80 0,788 1,80 0,964 2,75 0,997 0,85 0,802 1,85 0,968 2,80 0,997 0,90 0,816 1,90 0,971 2,85 0,998 0,95 0,829 1,95 0,974 2,90 0,998 1,00 0,841 1,96 0,975 2,95 0,998 1,05 0,853 2,00 0,977 3,00 0,999 57

66

67 D Table de quantiles de la loi khi carré x 1 Pr[X x] = 0 Γ(r/2)2 r/2 yr/2 1 e r/2 dx 59

68 60 Table de quantiles de la loi khi carré Pr[X x] r 0,01 0,025 0,05 0,95 0,975 0,99 1 0,000 0,001 0,004 3,841 5,024 6, ,020 0,051 0,103 5,991 7,378 9, ,115 0,216 0,352 7,815 9,348 11, ,297 0,484 0,711 9,488 11,143 13, ,554 0,831 1,145 11,070 12,833 15, ,872 1,237 1,635 12,592 14,449 16, ,239 1,690 2,167 14,067 16,013 18, ,646 2,180 2,733 15,507 17,535 20, ,088 2,700 3,325 16,919 19,023 21, ,558 3,247 3,940 18,307 20,483 23, ,053 3,816 4,575 19,675 21,920 24, ,571 4,404 5,226 21,026 23,337 26, ,107 5,009 5,892 22,362 24,736 27, ,660 5,629 6,571 23,685 26,119 29, ,229 6,262 7,261 24,996 27,488 30, ,812 6,908 7,962 26,296 28,845 32, ,408 7,564 8,672 27,587 30,191 33, ,015 8,231 9,390 28,869 31,526 34, ,633 8,907 10,117 30,144 32,852 36, ,260 9,591 10,851 31,410 34,170 37, ,897 10,283 11,591 32,671 35,479 38, ,542 10,982 12,338 33,924 36,781 40, ,196 11,689 13,091 35,172 38,076 41, ,856 12,401 13,848 36,415 39,364 42, ,524 13,120 14,611 37,652 40,646 44, ,198 13,844 15,379 38,885 41,923 45, ,879 14,573 16,151 40,113 43,195 46, ,565 15,308 16,928 41,337 44,461 48, ,256 16,047 17,708 42,557 45,722 49, ,953 16,791 18,493 43,773 46,979 50,892

69 E Solutions Plusieurs solutions faisant appel à R utilisent des fonctions des packages actuar (Dutang et collab., 2008) et MASS (Venables et Ripley, 2002). On suppose donc que les packages ont été chargés en mémoire avec > library("actuar") > library("mass") Chapitre On a et 1 lim x 0 2 = lim x 0 2 x2 24 = 1 2. En utilisant le théorème «sandwich», on obtient donc directement 1 cos(x) lim x 0 x 2 = 1 2. La figure E.1 présente le graphique de la fonction et des deux bornes, ainsi que le code R pour créer ce graphique. 1.2 Il suffit d appliquer la règle de l Hôpital : x lim x 0 ln(x + 1) = lim dx/dx x 0 dln(x + 1)/dx 1 = lim x 0 1/(x + 1) = 1. 61

70 62 Solutions > f <- function(x) (1 - cos(x))/(x^2) > g <- function(x) x^2/24 > curve(f, from = -2, to = 2, lwd = 2) > curve(g, add = TRUE, lty = 2) > abline(h = 0.5, lty = 2) f (x) x Figure E.1: Fonction f (x) = (1 cos(x))/x 2 (trait plein) et les bornes y = 1 2 x 2 /24 et y = 2 1 (traits brisés) 1.3 Il faut faire quelques modifications avant de pouvoir utiliser la règle de l Hôpital. On passe d abord à la forme logarithmique y = (1 + x) 1/x ln(y) = ln(1 + x) 1/x = ln(1 + x), x

71 Solutions 63 pour ensuite calculer la limite à l aide de la règle de l Hôpital dln(1 + x)/dx lim ln(y) = lim x 0 x 0 dx/dx ln(1 + x) = lim x 0 x 1/(1 + x) = lim x 0 1 = 1 et enfin revenir à la forme exponentielle lim y = lim (1 + x)1/x x 0 x 0 = e 1 = e. 1.4 a) On utilise la règle de l Hôpital pour évaluer lim x x ln(x) = lim dx/dx x dln(x)/dx 1 = lim x 1/x = lim x x =. Il est donc possible de conclure que le numérateur tend plus rapidement vers l infini que le dénominateur, c est-à-dire que x tend plus rapidement vers l infini que ln(x). b) De manière similaire, x lim x e x = lim dx/dx x de x /dx 1 = lim x e x = 0, d où e x tend plus rapidement vers l infini que x. 1.5 a) On a f (x) = cos(x), f (0) = 1, f (x) = sin(x), f (0) = 0, f (x) = cos(x), f (0) = 1, f (x) = sin(x), f (0) = 0, et ainsi de suite. On obtient donc cos(x) = 1 x2 2! + x4 4!...

72 64 Solutions b) On a f (x) = sin(x), f (0) = 0, f (x) = cos(x), f (0) = 1, f (x) = sin(x), f (0) = 0, f (x) = cos(x), f (0) = 1, et ainsi de suite. On obtient donc sin(x) = x x3 3! + x5 5!... c) On obtient e ix = 1 + ix + i2 x 2 2! + i3 x 3 3! + i4 x 4 4! + i5 x 5 5! = 1 + ix x2 2! i x3 3! + x4 4! + i x5 5!.... En regroupant les termes, on obtient +... ) ) e ix = (1 x2 2! + x4 4!... + i (x x3 3! + x5 5!... d) Des résultats obtenus en a), b) et c), on a directement e ix = cos(x) + i sin(x). e) En posant x = π dans le résultat en d), on obtient e iπ = cos(π) + i sin(π) = 1 + i(0) = Il faut démontrer que la fonction F(x) est non décroissante, que sa limite à droite est 1, que sa limite à gauche est 0 et qu elle est continue (à droite). Clairement, on a lim x F(x) = 0, et lim x F(x) = 1. De plus, F (x) = e x (1 + e x ) 2 > 0, qui implique que la fonction est non décroissante. 1.7 La fonction g(x) est clairement positive. Il faut démontrer que l intégrale sur la totalité du domaine de cette fonction est 1 : x 0 g(x) dx = x 0 x 0 f (x) 1 F(x 0 ) dx f (x) dx = 1 F(x 0 ) = 1 F(x 0) 1 F(x 0 ) = 1.

73 Solutions 65 > library(actuar) > curve(ppareto(x, shape = 2, scale = 3000, + lower.tail = FALSE), from = 0, to = 5000, + ylab = "S(x)", lwd = 2) S(x) x Figure E.2: Fonction de survie d une distribution Pareto(2, 3 000) 1.8 On a S(x) = Pr(X > x) αλ = α x (t + λ) ( ) λ α =. x + λ α+1 dt La figure E.2 présente le graphique de cette fonction.

74 66 Solutions 1.9 On a que Y = n X si, et seulement si, X = n Y. Ainsi, Pr(Y = y) = Pr(X = n y) ( ) n = p n y (1 p) n (n y) n y ( ) n = (1 p) y p n y, y = 0,1,..., y d où Y Binomiale(n,1 p) a) On a Y = e X où X N(µ, σ 2 ). Par conséquent, et F Y (x) = Pr[Y x] = Pr[e X x] = Pr[X ln x] = F X (ln x) f Y (x) = F Y (x) = 1 x f X(ln x). b) La fonction génératrice des moments de X est M X (t) = e µt+σ2 t 2 /2. On a Var[Y] = E[Y 2 ] E[Y] 2 = E[e 2X ] E[e X ] 2 = M X (2) M 2 X (1) = e 2µ+2σ2 e 2µ+σ2 = e 2µ+σ2 (e σ2 1) On a E[ X ] = = 0 = 2 π 0 2 = lim a π x 1 π 1 + x 2 dx x 1 π 1 + x 2 dx + 0 x 1 + x 2 dx a x 1 + x 2 dx = lim a ln(1 + a 2 ) =. 0 x π x 2 dx

75 Solutions On utilise la définition de l espérance : E[λg(X)] = = = x=0 x=0 x=0 λg(x) e λ λ x x! ( e g(x) λ λ x+1 x! ) ( ) x + 1 x + 1 (x + 1)g(x) e λ λ x+1 (x + 1)!. Il faut maintenant faire un glissement d indice et ajouter un terme pour obtenir E[λg(X)] = x=1 xg(x 1) e λ λ x x! = xg(x 1) e λ λ x x! x=0 = E[Xg(X 1)] Il suffit de remarquer que M + m = X + Y. Le résultat découle ensuite directement par linéarité de l espérance : E[M] + E[m] = E[X] + E[Y] On utilise la technique de la fonction de répartition : La densité est alors F Y (y) = Pr(Y y) = Pr(4X + 3 y) ( = Pr X y 3 ) 4 ( ) y 3 = F X 4 ( = 1 e 7 y 3 4 f Y (y) = F Y (y) = 7 4 e 7 4 (y 3), y > On utilise la technique de la fonction de répartition : F Y (y) = Pr(Y y) ( ) = Pr X 3 y ( ) = Pr X y 1 3 = 1 9 y = y 27. ). x 2 dx

76 68 Solutions On trouve donc que f Y (y) = F Y (y) = 1 27, 0 y Selon l énoncé, X N(0,σ 2 ) et Y = X 2. Il faut voir que Y = X 2 n est pas une transformation bijective (à une valeur de Y correspond plus d une valeur de X). On pose W = X et on trouve la densité de W à l aide de la technique de la fonction de répartition : et donc F W (w) = Pr( X w) = Pr( w X w) = F X (w) F X ( w) f W (w) = f X (w) + f X ( w) = 2 σ 2π e x2 /(2σ2). On pose maintenant Y = W 2 = X 2 = X 2 et on trouve la densité de Y par la technique du changement de variable : f Y (y) = f W (y 1/2 ) d dy y1/2 = f W (y 1/2 ) 1 2 y = 2 σ 2π e y/(2σ2 ) ( 1 ) 2 y = (2σ2 ) 1/2 Γ( 1 2 ) y 1/2 e y/(2σ2 ) puisque π Γ( 1 2 ). On a donc que Y Gamma( 1 2, 1 2 σ 2 ). De manière équivalente, on peut aussi poser X = σz, où Z N(0,1), et utiliser le résultat connu que Z 2 χ 2 (1) Gamma( 1 2, 1 2 ) Si X est une variable aléatoire dont la distribution est symétrique autour du point a, alors E[X] = a. On a donc µ 3 = E[(X a) 3 ] = = a (x a) 3 f (x) dx (x a) 3 f (x) dx + (x a) 3 f (x) dx. a

77 Solutions 69 En faisant le changement de variable y = x a, on obtient µ 3 = = 0 0 = 0, y 3 f (y + a) dy + y 3 f ( y + a) dy + 0 y 3 f (y + a) dy 0 y 3 f (y + a) dy puisque f ( y + a) = f (y + a) par symétrie autour du point a. Par conséquent, γ 1 = µ 3 /µ 3/2 2 = La distribution de la variable aléatoire X est en fait une Exponentielle(1). Par conséquent, E[X] = Var[X] = 1 et µ 3 = E[(X 1) 3 ] = = 0 0 (x 1) 3 e x dx (x 3 3x 2 + 3x 1)e x dx = Γ(4) 3Γ(3) + 3Γ(2) Γ(1) = 3! 3! = 2 en reconnaissant des lois gamma. Ainsi, on obtient γ 1 = µ 3 /µ 3/2 2 = On trouve que µ 2 = 1/3, µ 4 = 1/5 et donc γ 2 = µ 4 /µ 2 2 = 9/5. Comme γ 2 < 3, la distribution a des queues moins lourdes que la distribution normale Par définition, M X (t) = E[e tx ] c 2x = c 2 etx dx 0 = 2 c 2 t 2 (ctect e ct + 1) Par le théorème central limite, on sait que X 1 N(µ, σ 2 /n) et X 2 N(µ, σ 2 /n). Comme les deux variables aléatoires sont indépendantes, X 1 X 2 N(0,2σ 2 /n). Ainsi, ( Pr X 1 X 2 < σ ) = Pr 5 ( σ/5 σ/ n/2 < X 1 X 2 σ/ n/2 < σ/5 ) σ/ n/2 ( 1 n = Pr 5 2 < Z < 1 ) n, 5 2 où Z N(0,1). On doit donc trouver une valeur de n tel que Pr(Z n/(5 2)) 0,005. On trouve dans une table de quantiles de la loi normale que n/(5 2) = 2,576, et donc que n 332.

78 70 Solutions 1.22 a) On a X i Gamma(25, 1 2 ). Or, une somme de n lois gamma indépendantes de paramètres α i et λ est une loi gamma de paramètres i=1 n α i et λ. Par conséquent, i=1 n X i Gamma(2 500, 1 2 ) et X Gamma(2 500,50). b) On obtient avec R > diff(pgamma(c(49, 51), 2500, 50)) [1] c) Pour obtenir une approximation de la probabilité en b), on peut utiliser le Théorème central limite. On a que E[ X] = 2 500/50 = 50 et Var[ X] = = 1. Par conséquent, où Z N(0,1) Par définition, le biais est [ Pr[49 < X < 51] = Pr < X 50 < 1 1 b ˆΘ (θ) = E[ ˆΘ] θ = = 500. L erreur quadratique moyenne est 1.24 a) Par linéarité de l espérance, Pr[ 1 < Z < 1] = Φ(1) Φ( 1) = 2Φ(1) 1 = 0,6826, ( 2(1 000) 2 (2)(1) MSE( ˆΘ) = Var[ ˆΘ] + b ˆΘ (θ)2 E = ( 500) 2 = [ n i=1 a i X i ] = = = µ n i=1 n ( ) ) a i E[X i ] a i µ i=1 n a i i=1 = µ. 2 ]

79 Solutions 71 b) Étant donné que les variables sont indépendantes, on a Var [ n i=1 a i X i ] = n i=1 a 2 i Var[X i] = σ 2 n a 2 i. i=1 Il faut donc minimiser n i=1 a2 i sous la contrainte n i=1 a i = 1. Or, n i=1 a 2 i = = n i=1 n i=1 (( a i 1 ) + 1 ) 2 n n ( a i 1 ) n n, étant donné que le produit croisé vaut 0. Ainsi, l expression n i=1 a2 i est minimisée en choisissant a i = 1/n pour tout i. Par conséquent, X = n i=1 1 n X i possède la plus petite variance parmi tous les estimateurs sans biais linéaires On a [ 1 E n n i=1 (X i µ) 2 ] = 1 n = 1 n = σ 2. n i=1 n σ 2 i=1 E[(X i µ) 2 ] 1.26 En utilisant la définition de l espérance, on obtient E[T(X)] = (2) ( ) θ 1 = θ Soit Var[X] = θ et ˆθ = n X n ( 1 X ). n

80 72 Solutions On a E[ ˆθ] = E[X] E[X2 ] n np(1 p) + (np)2 = np n = np p(1 p) np 2 = np(1 p) p(1 p) = θ p(1 p). Par conséquent, ˆθ est un estimateur de θ avec un biais de p(1 p) On sait que De plus, Var[ X] = Var[X] n = λ n. [ ( ) ] [ 2 ( ) ] X λ 2 E ln f (X;λ) = E λ λ La borne de Rao Cramér est donc = 1 λ 2 Var[X] = 1 λ. λ n = Var[ X]. Comme la variance de l estimateur est égale à la borne de Rao Cramér, son efficacité vaut 1 et de X est un estimateur sans biais à variance minimale du paramètre λ d une loi de Poisson D abord, on cherche un estimateur sans biais : E[Ẑ] = αe[x] + βe[y] = α0,8z + βz = z, d où β = 1 0,8α. Ensuite, on cherche un estimateur avec une variance minimale : Var[Ẑ] = α 2 Var[X] + β 2 Var[Y] = α 2 z 2 + β 2 (1,5)z 2 = (α 2 + 1,5(1 0,8α) 2 )z 2. Cette dernière expression est minimisée lorsque α 2 + 1,5(1 0,8α) 2 est minimisé, c est-à-dire, lorsque α = 0,6122. On trouve ensuite que β = 0,5102.

81 Solutions a) On a f (x;θ) = 1 θ x1/θ 1 (1 x) 1 1, 0 < x < 1, θ > 0, soit une distribution bêta de paramètres α = 1/θ et β = 1. b) On a ln f (x i ;θ) = (θ 1 1)ln x i lnθ et, donc, ( 1 l(θ) = θ 1 ln x i nlnθ. Par conséquent, et ˆθ = n 1 n i=1 ln x i. c) On a Chapitre 2 E[ ˆθ] = 1 n = 1 n = 1 n = θ. ) n i=1 d dθ l(θ) = n i=1 ln x i θ 2 n θ n 1 i=1 0 n [ i=1 n i=1 1 θ (ln x i)x 1/θ 1 i dx i x 1/θ ln x ( θ) 0 ] x 1/θ 1 i dx i 2.1 La franchise permet à l assureur d économiser au plus 250 $ par contrat. L assureur économise donc, pour les 12 contrats de son portefeuille, 250,110,250,213,98,250,250,162,131,250,250,250, pour un total de $. Le montant total des sinistres sans la franchise est de $. Le rapport d élimination de perte est donc LER = = 0, La limite permet à l assureur d économiser l excédent de $ par contrat. L assureur économise donc, pour les huit contrats de son portefeuille, 0,23 000, ,0, ,0,0,78 000, pour un total de $. Le montant total des sinistres sans la limite est de $. Le rapport d élimination de perte est donc LER = = 0,4686.

82 74 Solutions 2.3 a) Soit X Exponentielle(0,02) la variable aléatoire du montant d un sinistre et soit Y, la variable aléatoire du montant économisé par l assureur. On définit { X, X 10 Y = 0, X > 10. Le rapport d élimination de perte est LER = E[Y] E[X] = 10 0 x f X (x) dx 50 = 0, = 0,0175. b) Avec une franchise forfaitaire, on a plutôt { X, X 10 Y = 10, X > 10. Le rapport d élimination de perte est LER = E[Y] E[X] 10 0 x f X (x) dx + 10 = 10 f X(x) dx E[X] = E[X;10] E[X] = 9, = 0,1813. Il est normal que ce ratio soit supérieur à celui en a) puisque l assureur ne rembourse que la partie du montant du sinistre excédent la franchise forfaitaire, et non le montant au complet. 2.4 Soit X Gamma(4, 0,1), la variable aléatoire du montant d un sinistre et soit Y, la variable aléatoire du montant économisé par l assureur. On définit { 0, X 100 Y = X 100, X > 100.

83 Solutions 75 Le rapport d élimination de perte est LER = E[Y] E[X] 100 = (x 100) f X(x) dx E[X] = 0, = 0,0034. Il est également possible de réécrire la variable aléatoire comme étant { X X, X 100 Y = X 100, X > 100. Il est alors aisé de calculer le rapport d élimination de perte comme suit : LER = E[Y] E[X] E[X] E[X;100] = E[X] (40)Γ(5;10) + (100)(1 Γ(4;10)) =. 40 Comme la valeur de α est entière, on peut utiliser Γ(α;y) = 1 α 1 y j e y j! j=0 pour obtenir 40 39,862 LER = = 0, Il est dit dans la question que l assureur «limite ses paiements à 200», la limite est donc de 270. En introduisant d abord la limite, l assureur économise, respectivement, 0,0,0,0,0,0,0,0,0,0,90,130, pour un total de 220. En introduisant ensuite la franchise, l assureur économise en plus, respectivement, 20,50,70,70,70,70,70,70,70,70,70,70, pour un total de 770. Le montant total des sinistres sans la limite et la franchise est de Le rapport d élimination de perte est donc LER = = 0,567.

84 76 Solutions 2.6 On trouve d abord x f X (x) dx LER d=100 = 100 f X(x) dx E[X] = E[X;100] E[X] = E[X;100] = 0,0465 d où l on trouve que E[X;100] = 93. Soit Y, la variable aléatoire du montant épargné par l assureur. On définit ou, de manière équivalente, X, X 100 Y = 100, 100 < X X , X > , Y = X min(x,30 000) + min(x,100) X X + X, X 100 = X X + 100, 100 < X X , X > Ainsi, LER = E[X] E[X;30 000] + E[X;100] E[X] = 0, a) Il faut voir que la densité donnée peut s écrire comme une combinaison linéaire de deux distributions exponentielles : f X (x) = e 2x + e x 2 = 1 2 (2e 2x ) e x. L espérance limitée est donc, en utilisant les formules pour l espérance limitée d une exponentielle, E[X;d] = ( 1 2 = 1 e 2d 4 ) ( ) 1 (1 e 2d ) e d. 2 ( ) 1 (1)(1 e d ) 2

85 Solutions 77 b) Il faut d abord évaluer la sévérité moyenne. Soit Y, la variable aléatoire du montant payé par l assureur, on a { 0, X 0,25 Y = X 0,25, X > 0,25, ou encore Y = max(x 0,25,0) = X min(x,0,25) { X X, X 0,25 = X 0,25, X > 0,25. À partir de cette représentation, il est facile de voir que E[Y] = E[X] E[X;0,25] ( 1 = ) 3 e 0,5 2e 0, = 0,541. L espérance de la sévérité est de un sinistre tous les dix ans, donc de 0,1. Ainsi, la prime pure est π = (0,541)(0,1) = 0,0541. c) Soit Z = 1,05X, la variable aléatoire du montant de sinistre après inflation. On a F Z (x) = F X (x/1,05) = 1 2 (1 e (2/1,05)x ) (1 e 1/1,05x ). Le calcul de l espérance de la sévérité est donc La prime pure est alors E[Y] = E[Z] E[Z;0,25] = 0,7875 0,2107 = 0,576. π = (0,576)(0,1) = 0, a) Pour le réassureur, il s agit d une franchise de Soit Y, la variable aléatoire du montant payé par le réassureur. On a { 0, X Y = X , X > ,

86 78 Solutions ou encore Y = max(x ,0) = X min(x,50 000) { X X, X = X , X > À partir de cette représentation, il est facile de voir que E[Y] = E[X] E[X;50 000] = 1 091,09. b) Soit Y la variable aléatoire du montant économisé par le réassureur. On définit On trouve alors que Y = { X, X , X > E[Y ] = E[X; ] = 4 219,13. De plus, on a E[X] = λ α 1 = ,5 1 = Le rapport d élimination de perte est donc LER = 4 219, = 0, On sait que Y P = X d X > d et que f Y P(x) = f X(x + d) 1 F X (d), x > 0.

87 Solutions 79 On a donc E[Y P 1 ] = x f 1 F X (d) X (x + d) dx 0 1 = (y d) f 1 F X (d) X (y) dy d ( 1 ) = y f 1 F X (d) X (y) dy d(1 F(d)) d ( 1 d ) = y f 1 F X (d) X (y) dy y f X (y) dy d(1 F(d)) 0 0 E[X] E[X;d] = 1 F X (d) par définition de l espérance limitée. Le numérateur représente le montant moyen des sinistres au-dessus de la franchise d, alors que la présence du dénominateur s interprète comme la sélection des seuls sinistres dépassant la franchise Pour chaque cas, la fonction coverage du package actuar retourne une fonction pour calculer ou tracer la densité modifiée. Voir la figure E.3 pour les graphique demandés. On a superposé, sur chaque graphique, la densité de la distribution sans la modification à la densité modifiée. Le code R pour créer ces graphiques est le suivant : a) > f <- coverage(dweibull, pweibull, deductible = 10, + per.loss = TRUE) > curve(dweibull(x, 3, 15), from = 0, to = 50, + ylim = c(0, f(0, 3, 15))) > curve(f(x, 3, 15), from = 0.01, add = TRUE, + lwd = 3) > points(0, f(0, 3, 15), pch = 16, lwd = 3) b) > f <- coverage(dweibull, pweibull, deductible = 10, + limit = 40, franchise = TRUE) > curve(f(x, 3, 15), from = 10.01, to = 39.99, + xlim = c(0, 50), lwd = 3) > points(40, f(40, 3, 15), pch = 16, lwd = 3) > curve(dweibull(x, 3, 15), add = TRUE, lty = 2) c) > f <- coverage(dweibull, pweibull, coins = 0.8) > curve(f(x, 3, 15), from = 0, to = 50) > curve(dweibull(x, 3, 15), add = TRUE, lty = 2) 2.11 a) On a X Pareto(1,5, 1 500). En 1995, la variable aléatoire est, après inflation, X 1995 = (1,05) 2 (1,06) 3 X 1990 = (1,3131)X 1990,

88 80 Solutions (a) Franchise forfaitaire de 10 (b) Franchise atteinte de 10 et limite de 40 (c) Coassurance de 80 % Figure E.3: Graphiques de l exercice Le trait épais représente la variable aléatoire modifiée et le trait mince la variable aléatoire de base. et donc X 1995 Pareto(1,5, ,3131). L espérance limitée est E[X 1995 ;500] = 421,3. L espérance du montant d un sinistre en 1995 est donc, avant la franchise, et après la franchise E[X 1995 ] = 1 969,65 1,5 1 = 3 939,3 E[X 1995 ] = E[X 1995] E[X 1995 ;500] = 3 939,3 421,3 = Enfin, le rapport d élimination de perte est LER = 3 939, ,3 = 0,1069. b) Soit N, la variable aléatoire représentant le nombre de paiements. On cherche, Pr(X >2 000 N = 1) = Pr(X > X 1995 > 500) = Pr(X > 2 000, X 1995 > 500) Pr(X 1995 > 500) = Pr(X > 2 000) Pr(X 1995 > 500) = 0,4107.

89 Solutions 81 c) La nouvelle variable aléatoire est 0, X Y = X , 500 < X , X 1995 > 4 000, ou encore, d où Y = max(min(x 1995,4 000) 500,0) = min(x 1995,4 000) min(x 1995,500) X 1995 X 1995, X = X , 500 < X , X 1995 > 4 000, E[Y ] = E[X 1995 ;4 000] E[X 1995 ;500] = 1 154, a) On veut calculer ( ln(u) µ σ E[X;u] = e µ+σ2 /2 2 ) ( ( )) ln(u) µ Φ + u 1 Φ σ σ avec u = , µ = 9,356 et σ = 1,596. On obtient E[X; ] = (41 340,92)(0,671413) + ( )(1 0,9793) = b) Soit Y, le montant payé par sinistre après inflation. On a [ ] d E[Y] = (1 + r)e X; 1 + r = (1,1)E[X; ,272] = (1,1)(33 356) = Puisque / = 1,0804, cela représente une augmentation des coûts de 8,04 %. c) Soit Y la variable aléatoire du montant payé par sinistre suite à l introduction d une franchise de $. On a E[Y ] = E[X; ] E[X;1 000] = ,92 = ,38. Puisque ,38/ = 0,9713, l introduction de la franchise entraîne une baisse des coûts de 2,87 % par rapport à la situation en a).

90 82 Solutions 2.13 Soit Y P la variable aléatoire du montant payé par paiement par le réassureur. On a Y P = X δ X > δ, donc f Y P(x) = f X(x + δ) 1 F X (δ) = αλα /(x + δ + λ) α+1 λ α /(δ + λ) α = d où Y P Pareto(α, λ + δ). α(λ + δ) α, x > 0, (x + (λ + δ)) α Soit X la variable aléatoire du montant d un sinistre et Y P = X d X > d, la variable aléatoire du montant payé par paiement avec une franchise forfaitaire d. Or, la distribution exponentielle étant sans mémoire, on a, de manière générale, 2.15 On a Pr(Y P > x) = Pr(X > x + d) Pr(X > d) = e λ(x+d) e λd = e λx, d où Y P Exponentielle(λ). Ici, on a donc Pr(Y P > 0,5) = e 3(0,5) = 0,22. d où E[X;5 000] = De même, E A [Y S ] = E[X] E[X;5 000] = E[X;5 000] = 6 500, E A [Y P E[X] E[X;5 000] ] = 1 F(5 000) = 1 F(5 000) = , d où F(5 000) = 0,35. Enfin, on cherche E B [Y P X 5 000] = E[X X 5 000] x f (x) dx = F(5 000) E[X;5 000] (5 000)(1 F(5 000)) = F(5 000) =

91 Solutions L espérance de la fréquence annuelle des sinistres est r(1 θ)/θ = 15. Pour qu il y ait un paiement, le montant du sinistre doit être supérieur à la franchise. Or Pr(X > 200) = e (200/1 000)0,3 = 0,5395. Ainsi, 53,95 % des sinistres occasionneront un paiement, d où le nombre espéré de paiements par années est (15)(0,5395) = 8, a) Le résultat découle directement de la redéfinition de la variable aléatoire Y S comme suit : Y S = αmax(min(x, u) d,0) = α(min(x, u) min(x, d)) X X, X < d = α X d, d X < u u d, X u. b) Pour calculer le second moment de la variable aléatoire Y S, on écrit d abord 0, X d (Y S ) 2 = α 2 (X 2 2dX + d 2 ), d < X < u α 2 (u 2 2ud + d 2 ), X u α 2 (X 2 X 2 2dX + 2dX), X d = α 2 (X 2 d 2 2dX + 2dd), d < X < u α 2 (u 2 d 2 2du + 2dd), X u. On a alors E[(Y S ) 2 ] = α 2 (E[X 2 ;u 2 ] E[X 2 ;d 2 ] 2dE[X;u] + 2dE[X;d]). La variance est donc Var[Y S ] = E[(Y S ) 2 ] E[Y S ] 2 = α 2 (E[X 2 ;u 2 ] E[X 2 ;d 2 ] 2dE[X;u] + 2dE[X;d]) α 2 (E[X;u] E[X;d]) 2. c) Suite à une inflation de 100r %, la définition de la variable aléatoire Y S équivalente à celle utilisée en a) est [ ( ) ( )] Y S u d = α(1 + r) min X, min X, 1 + r 1 + r X X, X < d/(1 + r) = α(1 + r) X d/(1 + r), d/(1 + r) X < u/(1 + r) u/(1 + r) d/(1 + r), X u/(1 + r).

92 84 Solutions On obtient donc directement ( [ ] [ E[Y S u ] = α(1 + r) E X; E X; 1 + r d 1 + r ]) On remarquera que la relation est un cas spécial du résultat de l exercice 2.17 avec α = 1 et r = 0. On a 0, X < d Y S = X d, d X < u u d, X u. Par conséquent, E[Y S ] = (0)Pr(X < d) + u d 0 y f Y S(y) dy + (u d)(1 F X (u)) u d = y f Y S(y) dy + (u d)(1 F X (u)). 0 En faisant le changement de variable x = y + d dans l intégrale, on obtient E[Y S ] = = = = u d u (x d) f X (x) dx + (u d)(1 F X (u)) d (x d) f X (x) dx (x d) f X (x) dx (u d)(1 F X (u)) u 0 x f X (x) dx d F X (u) + (u d)(1 F X (u)) u 0 d x f X (x) dx + u(1 F X (u)) = E[X;u] E[X;d]. 0 x f X (x) dx + d F X (d) d 2.19 Lorsqu il y a bonus, son montant est ( ) 0,75 S/ = 3 Il y aura donc un bonus si L < On a donc ( B = max 0, d où S 3 0 x f X (x) dx d(1 F X (d)) S. 3 ) = min(s, ), 3 E[B] = E[S; ] 3 = ( ,36) 3 = ,55.

93 Solutions a) Lorsqu un sinistre de montant d < x d survient, l assureur rembourse un montant d (x d)/(d d). On a donc d Y P = d (X d), d d < X d X, X > d. b) Pour pouvoir évaluer l espérance, il est plus facile de réécrire la variable sous la forme ( ) ( d Y P = X + d min(x, d d ) ) d d min(x, d) d X > d ( ) ( d d ) X + d = X d d d, d < X d d ( ) ( d X + d d d ) d d d, X > d. d Par la définition de l espérance limitée ou en utilisant le résultat de l exercice 2.9, on obtient directement E[Y P ] = E[X] + de[x;d ]/(d d) d E[X;d]/(d d). 1 F X (d) Chapitre a) On peut calculer puis tracer la fonction de répartition empirique aisément avec la fonction ecdf de R ; voir la figure E.4. Quant à la fonction de masse de probabilité empirique, la façon la plus simple de la calculer est à partir de la fonction table ; voir la figure E.5. b) Il faut d abord déterminer le nombre de données dans chacune des classes. On a n 1 = 4, n 2 = 10, n 3 = 2 et n 4 = 4. L équation de l ogive est alors 0, x 2 (x 2)/25, 2 < x 7 (x 5)/10, 7 < x 12 F 20 (x) = (x + 58)/100, 12 < x 22 (x + 42)/80, 22 < x 38 1, x > 38 Les fonctions grouped.data et ogive de actuar permettent, dans l ordre, de définir un objet de données groupées et de calculer son ogive ; voir la figure E.6.

94 86 Solutions > x <- c(3, 5, 5, 6, 8, 8, 8, 8, 9, 10, 10, 11, + 11, 11, 16, 21, 23, 26, 29, 36) > Fn <- ecdf(x) > plot(fn) ecdf(x) Fn(x) x Figure E.4: Fonction de répartition empirique des données de l exercice 3.1 c) L équation de l histogramme est, en dérivant l ogive obtenue en b), 0, x 2 1/25, 2 < x 7 1/10, 7 < x 12 f 20 (x) = 1/100, 12 < x 22 1/80, 22 < x 38 0, x > 38. Le package actuar définit une méthode de la fonction hist pour les données groupées ; voir la figure E.7.

95 Solutions 87 > table(x) x > fn <- table(x)/length(x) > plot(unique(x), fn, type = "h", lwd = 4) fn unique(x) Figure E.5: Fonction de masse de probabilité empirique des données de l exercice À partir de l information du tableau et de la définition de l ogive, on a En résolvant, on obtient x = ,21 = 36 n + 0,40x n 0,51 = 36 n + x n + 0,60y n n = x + y. 3.3 En utilisant les informations du tableau et la définition de l ogive, on

96 88 Solutions > xg <- grouped.data(group = c(2, 7, 12, 22, 38), + Frequency = c(4, 10, 2, 4)) > Gn <- ogive(xg) > plot(gn) ogive(xg) F(x) x Figure E.6: Ogive des données groupées de l exercice 3.1 obtient 0,689 = (0,5) F 500 (1 000) + (0,5) F 500 (2 000) ( = (0,5) x ), d où l on trouve que x = 69 et d où l on trouve que y = 81. 0,839 = (0,5) F 500 (2 000) + (0,5) F 500 (5 000) ( = (0,5) y ), Les données sont entrées dans R avec > (x <- grouped.data(group = 1000 * c(0, 1, 3, 5, + 10, 25, 50, 100, Inf), Frequency = c(16, 22, + 25, 18, 10, 5, 3, 1)))

97 Solutions 89 > hist(x) Histogram of x Frequency x Figure E.7: Histogramme des données groupées de l exercice 3.1 Group Frequency 1 (0, 1000] 16 2 (1000, 3000] 22 3 (3000, 5000] 25 4 (5000, 10000] 18 5 (10000, 25000] 10 6 (25000, 50000] 5 7 (50000, ] 3 8 (100000, Inf] 1 Pour calculer l ogive de ces données, la borne infinie de la dernière classe doit être remplacée par une valeur très grande par rapport aux autres bornes. Il ne faut pas que cette valeur soit trop grande si on veut avoir un graphique intéressant. Il ne faut pas supprimer la dernière classe. La figure E.8 présente les ogives avec et comme dernière borne. On cherche Or, Pr(2 000 X 6 000) = F 100 (6 000) F 100 (2 000).

98 90 Solutions > x[8, 1] <- c(1e+05, 2e+05) > Gn <- ogive(x) > plot(gn) > x[8, 1] <- c(1e+05, 2e+06) > Gn <- ogive(x) > plot(gn) ogive(x) ogive(x) F(x) F(x) x x (a) c r = (b) c r = Figure E.8: Ogive des données de l exercice 3.4 avec différentes dernières bornes > Gn <- ogive(x) > Gn(c(2000, 6000)) [1] d où Pr(2 000 X 6 000) = 0, Comme seulement une donnée est plus petite ou égale à 150, la fonction de répartition empirique est F 5 (150) = 1/5 = 0,20. Pour l estimateur lissé, on regarde la contribution de chacune des données au point 150, t j (150) : le noyau autour de 80 va de 30 à 130, la donnée 80 contribue donc à 100 % ; le noyau autour de 153 va de 103 à 203, la donnée 153 contribue donc à ( ) % = 47 % ; le noyau autour de 162 va de 112 à 212, la donnée 162 contribue donc à ( ) % = 38 % ; les deux autres données ne contribuent pas. L estimateur lissé est donc F(150) = 5 f 5 (y j )t j (150) j=1 = (0,20)(1) + (0,20)(0,47) + (0,20)(0,38) = 0,37. Ainsi, F 5 (150) F(150) = 0,20 0,37 = 0,17.

99 Solutions 91 Density Density N = 1 Bandwidth = 20 N = 4 Bandwidth = 20 (a) Noyaux individuels (b) Somme pondérée Figure E.9: Estimation par noyaux triangulaires et largeur de bande de 50 des données de l exercice a) Étant donné que la distribution est symétrique, la moyenne sera le point central, c est-à-dire = 225. b) La figure E.9(a) présente les quatre noyaux (quatre densités) sur le même graphique et la figure E.9(b) présente leur somme pondérée, c est-à-dire f (x). 3.7 La figure E.10 présente la distribution empirique des données. a) On voit que pour une largeur de bande de 0,5, aucune donnée ne va contribuer à la densité au point 6,2. b) Pour une largeur de bande de 1, il y a une valeur, 7, qui va contribuer à la densité au point 6,2 : f (6,2) = 0,1 (2)(1) = 0,05. c) Pour une largeur de bande de 2, il y a trois valeurs, 5, 7 et 8 qui vont contribuer à la densité au point 6,2 : f (6,2) = 0,3 (2)(2) + 0,1 (2)(2) + 0,1 (2)(2) = 0,125. d) Pour une largeur de bande de 3, il y a cinq valeurs, 4, 5, 7, 8 et 9 qui vont contribuer à la densité au point 6,2 : f (6,2) = 0,2 (2)(3) + 0,3 (2)(3) + 0,1 (2)(3) + 0,1 (2)(3) + 0,1 (2)(3) = 0,13333.

100 92 Solutions fn unique(x) Figure E.10: Distribution empirique des données de l exercice 3.7 e) On voit que pour une largeur de bande de 0,5, aucune donnée ne va contribuer à la densité au point 6,2. f) Pour une largeur de bande de 1, il y a une valeur, 7, qui va contribuer à la densité au point 6,2 : ( 1 f (6,2) = 10 ) ( 6, (1) 2 ) = 0,02. g) Pour une largeur de bande de 2, il y a trois valeurs, 5, 7 et 8 qui vont contribuer à la densité au point 6,2 : ( ) ( ) ( ) ( ) 1 6, , f (6,2) = 10 (2) (2) ( ) ( ) 2 3 6, (2) 2 = 0,095.

101 Solutions On utilise l équation d un estimateur avec noyaux triangulaires : f (5) = ( ) 1/5 a 2 (5 (6 a)) + = 0,01. ( 1/5 a 2 ) (5 (4 + a)) En simplifiant, on trouve 0,05a 2 2a + 2 = 0 et, en choisissant la bonne racine, a = 1, On entre les données individuelles de l exercice dans R avec > x <- c(2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, + 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, + 8, 8, 9, 15, 17, 22, 23, 24, 24, 25, 27, 32, + 43) et les données sous forme groupée avec > xg <- grouped.data(group = c(1.5, 2.5, 6.5, 29.5, ), Frequency = c(12, 15, 11, 2)) a) La figure E.11 présente la fonction de répartition empirique des données, obtenue à l aide de la fonction ecdf. b) La figure figure E.11 présente également l ogive des données, obtenue avec la fonction ogive du package actuar. On voit que l ogive et la fonction de répartition empirique correspondent généralement bien. Autour du point x = 22, l ajustement pourrait être un peu meilleur, par exemple en ajoutant une classe. Pour les deux bornes extrêmes, 0 aurait peut-être été un peu plus intuitif comme choix de borne inférieure que 1,5. La borne supérieure est logique, car supérieure à la valeur maximale de l échantillon, mais est totalement arbitraire sinon (on aurait pu choisir, par exemple, 50). c) La figure E.12 présente l histogramme des données créé à partir de l objet de données groupées. d) On a simplement > mean(x) [1] > sd(x) [1] Tout d abord, on a F 10 (4) = 0,40, E[F 10 (4)] = F(4), et Var[F 10 (4)] = F(4)(1 F(4))/10. En utilisant le Théorème central limite, on peut poser que Pr ( 1,96 F 10(4) E[F 10 (4)] Var[F10 (4)] 1,96 ) 0,95,

102 94 Solutions > Fn <- ecdf(x) > Gn <- ogive(xg) > plot(fn, pch = 16) > lines(knots(gn), Gn(knots(Gn)), type = "o", pch = 21, + bg = "white", lty = 2) ecdf(x) Fn(x) x Figure E.11: Fonction de répartition empirique (lignes et points pleins) et ogive (lignes brisées et points vides) des données de l exercice 3.9 soit Pr ( 1,96 ) 10(F10 (4) F(4)) 1,96 0,95. F(4)(1 F(4)) En estimant le dénominateur par F 10 (4)(1 F 10 (4)) = 0,24 puis en

103 Solutions 95 > hist(xg) Histogram of xg Density xg Figure E.12: Histogramme des données de l exercice 3.9 isolant F(4), on trouve ( F(4) F 10 (4) ± 1,96 ( ) 0,24 0,4 ± (1,96) 10 (0,0964, 0,7036). ) F10 (4)(1 F 10 (4)) 3.11 En utilisant l équation de l estimateur de Nelson-Aalen, on obtient 10 H n (1 200) = = 0,8866. On trouve maintenant la valeur de la fonction de survie évaluée au point 1 200, Ŝ(1 200) = e 0,8866 = 0,4120,

104 96 Solutions y i ( y i )/(6 000) k H n ,5000 0,0 0, ,1000 0,0 0, ,9167 0,5 0, ,4167 0,5 0, ,8333 0,5 0, ,2500 0,0 0,0667 Table E.1: Résultats intermédiaires du calcul de l estimation par noyaux pour les données de l exercice 3.12 et finalement la valeur de la fonction de répartition évaluée à ce même point : ˆF(1 200) = 1 0,4120 = 0, a) En utilisant l équation de l estimateur de Nelson-Aalen, on trouve H n (1 000) = 1 20 = 0,0500 H n (3 400) = = 0,1026 H n (4 500) = = 0,1582 H n (7 500) = = 0,2170 H n (15 000) = = 0,2795 H n (17 500) = = 0,3462. b) Le tableau E.1 présente les résultats intermédiaires. L estimation est donc ( ) 1 h(10 000) = (0,5)(0, , ,0625) = 0,

105 Solutions On a ˆγ 1 = ˆµ 3 ˆσ 3. En entrant les données dans R, on peut calculer les troisième et deuxième moment centraux facilement : > x < * c(rep(2, 2), rep(4, 6), rep(6, 12), + rep(8, 10)) > (m <- mean(x)) [1] 6000 > mean((x - m)^3) [1] -3.2e+09 > mean((x - m)^2) [1] On a donc ˆγ 1 = /2 = 0,559. La distribution des données est donc asymétrique vers la gauche ou, de manière équivalente, la bosse se trouve à droite Étant donné que la distribution empirique est symétrique, l estimateur du coefficient d asymétrie est 0. En entrant les données dans R, on peut calculer les quatrième et deuxième moment centraux facilement : > x <- c(100, rep(200, 4), rep(300, 10), rep(400, + 4), 500) > (m <- mean(x)) [1] 300 > mean((x - m)^4) [1] 2e+08 > mean((x - m)^2) [1] 8000 On a donc ˆγ 2 = ˆµ 4 ˆσ = = 3,125. La distribution empirique des données s approche donc de celle d une loi normale.

106 98 Solutions 3.15 a) On a (n + 1)p = (20 + 1)(0,60) = 12,6, d où π 0,60 = 0,4x (12) + 0,6x (13) = (0,4)(38) + (0,6)(39) = 38,6. b) On a (n + 1)p = (20 + 1)(0,75) = 15,75, d où 3.16 Par définition, E[min(X, 320)] = π 0,75 = 0,25x (15) + 0,75x (16) = (0,25)(41) + (0,75)(43) = 42, x f X (x) dx + 320(1 F X (320)). En supposant que les données sont uniformément distribuées à l intérieur des classes, la moyenne de celles-ci est affectée au point milieu. À la classe (200, 320], on attribue un nombre de données proportionnel à la longueur de leur classe par rapport à la classe (200,500], soit (120/300)(24) = (0,4)(24) = 9,6 données. On a au total n = 100 données. On a donc ( ) ( ) ( ) ( ) E 100 [min(x,320)] = ( ) ( ( ) 24 9, ) + = , , ,08 = 134, ( ) ( 9,6 100 On peut vérifier ce résultat à l aide de la fonction elev de actuar : > x <- grouped.data(classe = c(0, 50, 100, 200, + 500), Frequence = c(20, 34, 22, 24)) > elev(x)(320) [1] Étant donné que l intervalle est petit, on peut en calculer le niveau de confiance exactement. En utilisant la loi binomiale avec paramètres n = 5 et p = 0,5, on obtient Pr(X (2) π 0,5 < X (4) ) = 3 k=2 = 0,625. ( ) 5 (0,5) k (0,5) 5 k k )

107 Solutions Étant donné que l intervalle est grand, on va utiliser l approximation normale avec correction pour la continuité pour déterminer le niveau de confiance. On a, avec Y N(250,125), Pr(240 π 0,50 < 260) Pr(239,5 K < 259,5) = Φ(0,85) Φ( 0,94) = 0, La valeur 10 est la 10 e statistique d ordre et la valeur 20 est la 14 e statistique d ordre. Comme l intervalle est petit, on peut en calculer le degré de confiance exactement. Soit N Binomiale(20, 0,55), Pr(X (10) π 0,55 < X (14) ) = Pr(N = 10,11,12,13) ( ) 20 = (0,55) k (0,45) 20 k k 3.20 a) On obtient aisément 13 k=10 f X (x) = 1 x f Y(ln(x)) = 0, , , ,1221 = 0,6208. = λα Γ(α)x (ln(x))α 1 e λln(x), x > 1. On remarque que comme Y est définie sur [0, ), X = e Y est définie sur [1, ). Cette distribution est la log-gamma de paramètres α et λ. b) La fonction R de la figure E.13 calcule le biais empirique pour des valeurs de λ, n et r données. On remarquera que cette fonction définit une fonction interne qui se charge des étapes 2 et 3 de l algorithme présenté dans l exposé de l exercice. Cette fonction est ensuite passée à replicate pour réaliser efficacement l étape 4 de l algorithme. i) Pour n = 10 et r = on a > simul.1 <- sim(5, 10, 1000) > simul.1$bias [1] ii) Pour n = et r = 100 on a > simul.2 <- sim(5, 1000, 100) > simul.2$bias [1] iii) Pour n = et r = on a

108 100 Solutions sim <- function(lambda, n, r) { ## Fonction interne pour simuler un échantillon ## et calculer l estimateur. f <- function(lambda, n) { ## Simulation des données. On pourrait aussi ## utiliser la fonction rlgamma() du package ## actuar. x <- exp(rgamma(n, shape = 1, rate = lambda)) } ## Estimateur de lambda 1 / (1-1/mean(x)) ## Simulation de r échantillons lc <- replicate(r, f(lambda, n)) } ## La fonction retourne une liste contenant le ## vecteur d estimateurs et le biais empirique. list(estimates = lc, bias = mean(lc) - lambda) Figure E.13: Fonction R permettant la création des échantillons et le calcul du biais empirique > simul.3 <- sim(5, 1000, 1000) > simul.3$bias [1] La taille de l échantillon a un impact sur le biais de l estimateur. On voit qu au passage d un petit échantillon (partie i)) à un plus grand (partie ii)) le biais devient moins important et l estimateur est donc plus proche de sa vraie valeur. En revanche, le nombre de simulation n a un impact que sur la force de la conclusion. De la partie ii) à la partie iii), seul le nombre de simulations change. Or, le biais change assez peu. Nous ne sommes que confortés dans notre conclusion que l estimateur ˆλ est probablement sans biais pour λ. c) On a un échantillon de 100 estimations. La figure E.14 présente le graphique de la fonction de répartition empirique de l estimateur ˆλ. d) La figure E.15 présente l histogramme et l ogive de l estimateur ˆλ. Tel que suggéré dans l énoncé de l exercice, on a utilisé les classes

109 Solutions 101 > x <- simul.2$estimates > Fn <- ecdf(x) > plot(fn, do.points = FALSE) ecdf(x) Fn(x) x Figure E.14: Fonction de répartition empirique de l estimateur ˆλ de l exercice 3.20 calculées par la fonction hist pour construire l ogive. On a procédé ainsi : > gn <- hist(x, plot = FALSE) > xg <- grouped.data(cj = gn$breaks, nj = gn$counts) > Gn <- ogive(xg) e) Comme il y a 100 données dans l échantillon, on a (101)(0,45) = 45,45 et donc ˆπ 0,45 = (0,55)x (45) + (0,45)x (46). Pour le 70 e centile, la procédure est la même. On a (101)(0,70) = 70,7 et donc ˆπ 0,70 = (0,30)x (70) + (0,70)x (71). Pour notre échantillon, on obtient > xs <- sort(x) > 0.55 * xs[44] * xs[45]

110 102 Solutions > hist(x, prob = TRUE) > plot(gn) Histogram of x ogive(xg) Density F(x) x x (a) Histogramme (b) Ogive Figure E.15: Histogramme et ogive de l estimateur ˆλ de l exercice 3.20 [1] et > 0.3 * xs[70] * xs[71] [1] Plus simplement, on peut utiliser la méthode pour données groupées de la fonction quantile définie dans actuar pour calculer les quantiles lissés (soit l inverse de l ogive) : > quantile(xg, c(0.45, 0.7)) 45% 70% Les résultats diffèrent légèrement parce que la technique de lissage utilisé par quantile n est pas tout à fait la même que celle utilisée ci-dessus.

111 Solutions 103 Chapitre En utilisant la technique de la fonction de répartition, on a et donc, Y Pareto(α, cλ). F Y (y) = Pr(Y y) = Pr(cX y) = Pr(X y/c) = F X (y/c) ( λ = 1 λ + y/c ( cλ = 1 cλ + y 4.2 En utilisant la technique de la fonction de répartition, on a ) α ) α F Y (y) = Pr(Y y) = Pr(X ln(y)) = F X (ln(y)). Étant donné la présence de la valeur absolue dans la densité de X, il faut séparer le domaine. Pour < x 0, on a 0 < y < 1, et donc ln(y) 1 F X (ln(y)) = 2θ e x θ dx = 1 2 eln(y)/θ. Pour 0 < x <, on a 1 < y <, et donc 0 F X (ln(y)) = 1 ln(y) 2θ ex/θ dx + 0 = e ln(y) θ. 1 2θ e x/θ dx Par conséquent, F(y) = { 12 e ln(y)/θ, 0 < y < eln(y)/θ, y 1.

112 104 Solutions 4.3 En utilisant le fait que, pour α entier, Γ(α) = (α 1)!, on trouve Pr(X x) = = 1 x (α 1)!β α 1 (α 1)!β α 0 t α 1 e t/β dt ( t α 1 βe t/β x x x = xα 1 e x/β (α 1)!β α (α 2)!β α 1 = Pr(Y = α 1) + 1 (α 2)!β α 1 0 x 0 ) (α 1)t α 2 βe t/β dt t α 2 e t/β dt t α 2 e t/β dt avec Y Poisson(x/β). La relation s obtient en continuant à intégrer comme ci-dessus jusqu à obtenir Pr(X x) = 1 Pr(Y = α 1) Pr(Y = 0) = Pr(Y α). 4.4 En utilisant la technique de la fonction de répartition, on a ( ) λy F Y (y) = F X 1 y ( ) λy/(1 y) = β τ, α; λy/(1 y) + λ = β(τ, α;y), où β(a, b; x) est la fonction de répartition d une distribution Bêta(a, b) évaluée au point x. On a donc que Y Bêta(τ, α). 4.5 En utilisant la technique de la fonction de répartition, on obtient F Y (y) = Pr(Y y) = Pr(5X 1/4 y) ( ( y ) ) 4 = Pr X > 5 ( ( y = 1 F X 5 ( 1 = 1 + (5/y) 4 ) 4 ) qui est la fonction de répartition d une variable aléatoire avec distribution Burr inverse de paramètres τ = α, γ = 4 et θ = a) Par définition, la distribution de Y est nommée log-gamma. On remarque que comme X est définie sur [0, ), Y = e X est définie sur ) α

113 Solutions 105 [1, ). On a donc f Y (y) = 1 y f X(ln(y)) = λα Γ(α)y (ln(y))α 1 e λln(y), y 1. b) En utilisant la fonction génératrice des moments de X, on trouve d où c) De la partie b), on voit que E[Y] = E[e X ] = M X (1) ( ) λ α =, λ > 1 λ 1 E[Y 2 ] = E[e 2X ] = M X (2) ( ) λ α =, λ > 2, λ 2 Var[Y] = E[Y 2 ] E[Y] 2 ( ) λ α ( ) λ 2α =, λ > 2. λ 2 λ 1 E[Y k ] = M X (k) ( ) λ α =, λ > k. λ k Les moments de Y existent donc seulement pour k < λ. 4.7 a) Il suffit de poser c = 1 + i dans le résultat de l exercice 4.1. b) En utilisant la technique de la fonction de répartition, on trouve et donc, Y Burr(α, γ, (1 + i)θ). ( ) y F Y (y) = F X 1 + i ( θ = 1 γ (1 + i) γ θ γ (1 + i) γ + y γ ) α

114 106 Solutions c) On a f Y (y) = 1 ( ) x 1 + i f X 1 + i = 1 λ α (ln(y/(1 + i))) α i Γ(α) (y/(1 + i)) λ+1 = λα (1 + i)) λ (ln(y) ln(1 + i)) α 1 Γ(α)y λ En utilisant la technique de la fonction de répartition, on a et donc, Y Burr(α, τ, λ 1/τ ). F Y (y) = F X (y τ ) ( λ = 1 λ + y τ 4.9 En utilisant la technique de la fonction de répartition, on a Ainsi, Y Exponentielle(α). ) α F Y (y) = Pr(Y y) = Pr(ln(1 + X/θ) y) = Pr(X θ(e y 1)) = F X (θ(e y 1)) ( = 1 θ θ + θ(e y 1) = 1 e αy, y Soit Y, la variable aléatoire du montant des sinistres en On définit Y = (1,04)(1,045)(1,16)X = 1,260688X. En se reportant à l exercice 4.7 b), on a que Y Burr(α = 0,5, γ = 2, θ = 3,7821) et donc que ) α Pr(Y > 4) = 1 F Y (4) = 0, a) On observe que la variable aléatoire X obéit à une distribution Pareto translatée(3, 1). En utilisant la technique de la fonction de répartition, on trouve ( ) y F Y (y) = F X 1,10 ( ) 1,10 3 = 1. y b) On a Pr(Y > 2,2) = 1 F Y (2,2) = 0,125.

115 Solutions On a X Θ Binomiale(10, Θ) et Θ Uniforme(0,1). Par la loi des probabilités totales, 1 ( ) 10 Pr(X = x) = θ x (1 θ) 10 x dθ 0 x ( ) 10 1 = θ x (1 θ) 10 x dθ x qui devient, en reconnaissant sous l intégrale la forme fonctionnelle d une distribution Bêta(x + 1,11 x), 0 Par conséquent, ( ) 10 Γ(x + 1)Γ(11 x) Pr(X = x) = x Γ(12) 10! x!(10 x)! = (10 x)!x! 11! = Pr(X > 6) = 10 i=7 = Par la loi des probabilités totales, on trouve f X (x) = 0 Pr(X = i) ( θ τ e θx x τ 1 ) ( λ α e λθ θ α 1 ) dθ Γ(τ) Γ(α) = xτ 1 λ α Γ(τ)Γ(α) 0 θ τ+α 1 e (x+λ)θ dθ qui devient, en reconnaissant sous l intégrale la forme fonctionnelle d une distribution Gamma(τ + α, x + λ) 4.14 On a f X (x) = xτ 1 λ α Γ(τ + α) Γ(α)Γ(τ)(x + λ) τ+α et donc, X Pareto Généralisée(α, τ, λ). 1 x 1 Γ(α + β) Pr(X = x) = θ(1 θ) 0 Γ(α)Γ(β) θα 1 (1 θ) β 1 dθ Γ(α + β) 1 = θ α (1 θ) x+β 2 dθ Γ(α)Γ(β) 0

116 108 Solutions qui devient, en reconnaissant sous l intégrale une distribution Bêta(α + 1, β + x 1), Pr(X = x) = Γ(α + β)γ(α + 1)Γ(x + β 1). Γ(α)Γ(β)Γ(α + β + x) 4.15 Par la loi des probabilités totales, on obtient f X (x) = τθx τ 1 e θxτ λα x α 1 e λx dθ 0 Γ(α) = τxτ 1 λ α θ α e (xτ +λ)θ dθ Γ(α) 0 = ατxτ 1 λ α (λ + x τ ) α+1, en reconnaissant une distribution Gamma(α + 1, x τ + λ) sous l intégrale. La densité obtenue est celle d une loi Burr(α, τ, λ 1/τ ) On a X Λ Burr(5,1, Λ) et Λ Gamma(10,2). On cherche E[X] et Var[X]. Il ne faut pas tenter de trouver la distribution marginale de X, mais plutôt conditionner : E[X] = E[E[X Λ]] [ ] ΛΓ(4)Γ(2) = E Γ(5) = 1 4 E[Λ] = 5 4 et Var[X] = E[Var[X Λ]] + Var[E[X Λ]] [ Λ = 2 ( ) ] Γ(3)Γ(3) ΛΓ(4)Γ(2) 2 [ ] ΛΓ(4)Γ(2) E + Var Γ(5) Γ(5) Γ(5) = 5 48 E[Λ2 ] Var[Λ] = Pour commencer, on utilise le lien entre le taux d échec et la fonction de

117 Solutions 109 survie pour trouver S(x θ) = e x 0 λ(x θ) dt { x } 3 = exp 0 θ + t dt { ( )} θ = exp 3ln = exp { ln ( ) θ 3 =. θ + x ( θ θ + x θ + x ) } 3 La fonction de répartition est donc ( ) θ 3 F(x θ) = 1, θ + x d où X Θ Pareto(3, Θ). Par conséquent, et E[X] = E[E[X Θ]] [ ] Θ = E 2 = 500 Var[X] = E[Var[X Θ]] + Var[E[X Θ]] [ ] [ ] 3Θ Θ = E + Var 4 2 = Soit f ( ) la fonction de densité de probabilité d une Log-normale(µ, σ 2 ) et g( ) celle d une Gamma(α, λ). Pour comparer les queues de ces deux distributions, il faut évaluer f (x) lim x g(x). En éliminant les termes qui ne dépendent pas de x, on obtient x 1 e (ln(x) µ)2 /2σ 2 lim x x α 1 e x/θ = lim x e (ln(x) µ)2 /2σ 2 αln(x)+x/θ. Or, de l exercice 1.4 on sait que x tend plus rapidement vers l infini que ln(x). L exposant tend donc vers, d où la distribution log-normale a une queue plus épaisse que la distribution gamma.

118 110 Solutions 4.19 Une fonction d espérance de vie résiduelle linéaire en x indique une distribution de Pareto telle que ( ) 1 e(x) = x + λ α 1 α 1. À partir de e(x) = x, on trouve que α = 1,5 et λ = En utilisant les formules de l annexe A pour l espérance limitée d une loi de Pareto, on a que le LER est LER = E[X] E[X; x] 1 F X (x) = 0, a) Il s agit d une fonction linéaire en x, on a donc que X Pareto. En utilisant la relation de l exercice 4.19, on trouve que α = 7/3 et λ = 16/3. b) En utilisant la formule de l annexe A, on trouve que E[X;10] = 3, Pour X Gamma(α, λ), on a E[X] = α/λ et Var[X] = α/λ 2. On trouve les paramètres suivants pour les trois sous-intervalles : α 1 = 1, λ 1 = 1, α 2 = 25, λ 2 = 5, α 3 = 144 et λ 3 = 12. Pour le premier sous-intervalle, on a A Gamma(1,1) et Pr(A 2) = Γ(1;2). Pour le second sous-intervalle, on a B Gamma(25, 5) et Pr(2 < B 8) = Γ(25;40) Γ(25;10). Pour le troisième sous-intervalle, on a C Gamma(144, 12) et Pr(8 < C 16) = Γ(144,192) Γ(144;96). La densité raccordée est donc 0,5e x Γ(1;2), 0 < x 2 0,2 5 f X (x) = 25 x 25 1 e 5x, 2 < x 8 Γ(25;40) Γ(25;10) Γ(25) 0, x e 12x, 8 < x 16. Γ(144;192) Γ(144;96) Γ(144) 4.22 On a p/10, 0 < x < 10 f X (x) = (1 p) (3)(1003 ) 1 (100 + x) 4 (100/110) 3, x 10 p/10, 0 < x < 10 = (3)(110 3 ) (1 p), x 10. (100 + x) 4

119 Solutions 111 Pour que la distribution soit continue au point x = 10, on doit avoir soit f X (10) = p 10, 3 p (1 p) = En résolvant pour p, on trouve p = 3/ a) On pose X Weibull(λ 1, τ 1 ) et Y = X 1 Weibull inverse(λ 2, τ 2 ). On sait de l annexe A que tous les moments positifs de la distribution Weibull existent, alors que ceux de la distribution Weibull inverse n existent que pour k < τ 2. Par ce critère, on voit que la distribution Weibull Inverse possède une queue plus lourde. D autre part, on a f Y (x) f X (x) = τ 2λ τ2 2 x τ2 1 e (λ 2x) τ 2 τ 1 λ τ 1 1 xτ1 1 e (λ 1x) τ 1 x τ 1 τ 2 e (λ 2x) τ 2 +(λ 1 x) τ1, d où ln ( ) fy (x) (λ f X (x) 1 x) τ 1 (λ 2 x) τ 2 (τ 1 + τ 2 )ln(x). Lorsque x, le terme central tend vers 0. Comme x tend plus rapidement vers que ln(x), on a que d où ( ) lim ln fy (x) = lim (λ x f X (x) 1 x) τ 1 (λ 2 x) τ 2 (τ 1 + τ 2 )ln(x) x =, S lim Y (x) x S X (x) = lim f Y (x) x f X (x) =. Ainsi, en comparant les fonctions de survie on arrive aussi à la conclusion que la queue de la loi Weibull inverse est plus lourde que celle de la Weibull. b) On fixe τ 1 et λ 1 de manière arbitraire et on résoud numériquement pour τ 2 et θ 2. La figure E.16 présente le graphique des deux distributions pour τ 1 = 3, λ 1 = 0,1, τ 2 = 4,4744 et θ 2 = 0,1335.

120 112 Solutions x Figure E.16: Comparaison des queues des distributions Weibull (trait mince) et Weibull inverse (trait épais) 4.24 On a M Y (t) = e ty S X(y) 0 ( e ty = t E[X] dy ) ( ) SX (y) + E[X] = 1 te[x] + M X(t) te[x] = M X(t) 1. te[x] 0 0 ( e ty t ) ( ) fx (y) dy E[X] Ce résultat suppose que lim y e ty S X (y) = 0. En appliquant la règle de l Hôpital, on voit qu il s agit de la même limite que t 1 lim y e ty f X (y) qui doit être 0 sinon l intégrale définissant M X (t) ne convergerait pas.

121 Solutions a) Par définition de la fonction de survie : S(x) = (1 + 2t 2 )e 2t dt x = (1 + x + x 2 )e 2x, x 0. b) Par définition du taux d incidence : c) On a d abord h(x) = d dx lns(x) x = d dx (2x) d dx ln(1 + x + x2 ) = x 1 + x + x 2. S(t) dt = (1 + t + t 2 )e 2t dt x = (1 + x + 0,5x 2 )e 2x et donc d) On a e(x) = x S(x) dx = 1 + x + 0,5x2 S(x) 1 + x + x 2. ( lim h(x) = lim x ) x x 1 + x + x 2 = 2. e) On a lim e(x) = 1 x lim x h(x) = 1 2. f) À partir de c), on trouve d x + 0,5x2 e(x) = dx (1 + x + x 2 ) 2 < 0, pour x > 0, d où e(x) est une fonction strictement décroissante. Cependant, pour h(x), on a h(0) = 1, h(0,5) = 6/7 et h( ) = 2. On voit donc que le taux d incidence n est pas une fonction strictement croissante.

122 114 Solutions Chapitre On a 5 i=1 x i = et 5 i=1 x2 i = Pour trouver les estimateurs des moments de α et β, on pose et E[X] = E[E[X Λ]] = E[Λ 1 ] = β α 1 = E[X 2 ] = E[E[X Λ]] = E[Λ 2 ] = 2β 2 (α 1)(α 2) En résolvant, on trouve ˆα = 3,45 et ˆβ = 3 048, = Par définition, la fonction de vraisemblance donne la probabilité d obtenir un échantillon tel que celui obtenu. On doit donc avoir deux données entre 0 et et quatre données entre et 5 000, le tout sachant que les six données sont plus petites que On a alors L(λ) = (1 e 2 000λ ) 2 (e 2 000λ e 5 000λ ) 4 (1 e 5 000λ ) On a 5 i=1 x i = et 5 i=1 x2 i = Pour trouver les estimateurs des moments de α et θ il suffit de poser égaux les deux premiers moments empiriques et théoriques : αθ = et αθ 2 + α 2 θ =. 6 On trouve alors ˆα = 34,83 et ˆθ = 27, La fonction de répartition de la log-logistique étant F(x) = (x/θ)γ 1 + (x/θ) γ, on trouve, après avoir égalisé les quantiles théoriques et empiriques, que ˆγ = 2 et ˆθ = La densité de la variable aléatoire sous-jacente est L espérance est donc f X (x) = F X (x) = pxp 1. E[X] = 1 0 xpx p 1 dx = p p + 1.

123 Solutions 115 En posant E[X] = x pour trouver un estimateur des moments de p, on obtient ˆp = x 1 x. 5.6 On a 5 i=1 x i = et 5 i=1 x2 i = On égalise les deux premiers moments théoriques et empiriques : µ+ σ e 2 = 5 et e 2µ+2σ2 =. 5 On trouve alors ˆµ = 7,40 et ˆσ = 0,6368. Par conséquent, ( ) ln(4 500) 7,40 Pr(X > 4 500) = 1 Φ 0,6368 = 1 Φ(1,5919) = 0, On pose simplement d où ˆβ = 3, a) Posons λ = λ τ. On a β 2π 2 = x = 4,2, Pr(X 500) = 1 e λ500 τ = 0,25 et Pr(X 1 000) = 1 e λ1 000 τ = 0,50 d où on trouve que ˆ λ = 0, et ˆτ = 1,2687. Ainsi, on a ˆλ = 0, b) On cherche ˆπ 0,80 tel que 1 e ( ˆλ ˆπ 0,80 ) ˆτ = 0,80. On trouve ˆπ 0,80 = ( ln0,20) 1/ ˆτ / ˆλ = La distribution marginale de la variable X est une loi de Pareto(α, β). Ainsi, pour estimer les paramètres α et β par la méthode des quantiles, on pose ( ) β α S X (450) = = 0,001 β + 450

124 116 Solutions et ( ) β α S X (50) = = 0,125. β + 50 Il suffit maintenant de manipuler les termes pour obtenir ( ln β β ( β β+50 ( β β+450 ) ln(0,125) ln(0,001) = ln ) ln ) 0,3010 ( β = ln β + 50 β 0,3010 (β + 50) = β(β + 450) 0, D abord, le rapport d élimination de perte avec une franchise forfaitaire est LER = E[X;d] E[X] alors qu avec une franchise atteinte il est LER = ) E[X;d] d(1 F(d)). E[X] Par conséquent, on a les équations suivantes : 0,56 = E[X;200] E[X] 0,79 = E[X;500] E[X] E[X;200] 200(1 F(200)) 0,32 = E[X] E[X;500] 500(1 F(500)) 0,52 = E[X] Puisque E[X] = 200, on trouve F(200) = 0,76 et F(500) = 0,892, d où ˆλ 0,01 et ˆτ 0, La fonction de répartition d une loi U(a, b) étant F(x) = x a b a,

125 Solutions 117 on a d où on obtient â = 10 et ˆb = a b a = 0,80 55 a b a = 0,90, 5.12 Pour X Bernoulli(p), on a la fonction de vraisemblance L(p; x 1,..., x n ) = n i=1 et la fonction de log-vraisemblance d où l(p; x 1,..., x n ) = p x i(1 p) 1 x i = p n i=1 x i(1 p) n n i=1 x i n i=1 l (p; x 1,..., x n ) = n i=1 x i p On trouve donc ˆp = X. x i ln(p) + = n x p n n x 1 p. ( n n i=1 n n i=1 x i 1 p 5.13 a) On a la fonction de log-vraisemblance ( ) 1 l(µ, σ 2 ) = nln 1 2πσ 2 et les dérivées partielles µ l(µ, σ2 ) = n i=1 (x i µ) σ 2 n i=1 x i )ln(1 p), (x i µ) 2 σ 2 σ 2 l(µ,σ2 ) = n 2σ 2 + n i=1 (x i µ) 2 2σ 4. En posant ces dérivées égales à 0 et en résolvant pour µ et σ 2, on obtient les estimateurs du maximum de vraisemblance ˆµ = 1 n ˆσ 2 = 1 n n i=1 n i=1 X i = X (X i X) 2 = S 2.

126 118 Solutions b) À partir des calculs précédents, on trouve Or, et 2 µ 2 l(µ, σ2 ) = n σ 2 2 σ 4 l(µ, σ2 ) = n 2σ 4 n i=1 (x i µ) 2 σ 6 2 µ σ 2 l(µ, σ2 ) = n i=1 x i µ σ 4. [ E E [ n ] σ 2 n i=1 (X i µ) σ 4 = n σ 2 ] = 0 [ n E 2σ 4 n i=1 (X i µ) 2 ] σ 6 = n 2σ 4 car E[X i µ] = 0 et E[(X i µ) 2 ] = σ 2. On obtient ainsi la matrice variance-covariance : [ σ Σ = 2 ] /n 0 0 2σ 4. /n Or, on sait que la distribution asymptotique conjointe des estimateurs du maximum de vraisemblance est une normale multivariée sans biais et de matrice variance-covariance Σ. c) On rappelle que Φ( ) et φ( ) sont, dans l ordre, les fonctions de répartition et de densité de probabilité d une loi N(0, 1). Par conséquent, et d où A = µ h(µ, σ2 ) = 1 σ φ B = σ 2 h(µ, σ2 ) = 1 2 ( ) c µ σ ( c µ σ 3 ) φ ( c µ Var[h( ˆµ, ˆσ 2 )] = [ A B ] [ σ 2 ] [ ] /n 0 A 0 2σ 4 /n B ( ( )) c µ 2 ( 1 = φ σ n Enfin, on sait que, asymptotiquement, σ ), + (c µ)2 2nσ 2 h( ˆµ, ˆσ 2 ) N(h(µ, σ 2 ),Var[h( ˆµ, ˆσ 2 )]). ).

127 Solutions En utilisant la technique habituelle : ( n ) L(θ) = 2 n θ n x i e θ n i=1 x2 i i=1 l(θ) = nln(2) + nln(θ) + l (θ) = n θ n i=1 x 2 i. n i=1 ln x i θ n xi 2 i=1 On trouve alors ˆθ = n/ i=1 n x2 i. En calculant la dérivée seconde de la fonction de log-vraisemblance, on voit qu il s agit bien d un maximum a) On a f (x) = px p 1, d où L(p) = p n n x p 1 i i=1 l(p) = nln(p) + (p 1) l (p) = n p + n i=1ln(x i ). n i=1 ln(x i ) On trouve alors ˆp = n/ n i=1 ln(x i). En calculant la dérivée seconde, on voit qu il s agit bien d un maximum. b) À partir de a), on calcule l (p; x 1,..., x n ) = n p 2 d où I(p) = ne[p 2 ] = n p 2 et Var[ ˆp] = 1 I(p) = p2 n. c) On sait que De a) et b), on a donc p ˆp ± 1,96 Var[ ˆp]. p ˆp ± 1,96 p n.

128 120 Solutions d) On a 1 E[X] = xpx p 1 dx 0 = p p + 1. Par la propriété d invariance, l estimateur du maximum de vraisemblance de E[X] est Ê[X] = ˆp 1 + ˆp, où ˆp est l estimateur du maximum de vraisemblance de p déterminé en a). e) On pose E[X] = h(p) avec d où Par la méthode delta, h(p) = h (p) = p 1 + p, 1 (1 + p) 2. Var [ Ê[X] ] = h (p) 2 Var[ ˆp] ( ) 1 4 ( p 2 ) = 1 + p n et 5.16 On a et donc Var [ Ê[X] ] ( ) 1 4 ( ˆp 2 ) = 1 + ˆp n E[X] ( ˆp 1 + ˆp ± 1,96 ˆp (1 + ˆp) 2 n ). L(α) = α 5 λ 5α 5 i=1 (λ + x i ) α 1 l(α) = 5ln(α) + 5αlnλ (α + 1) 5 i=1 l (α) = 5 α + 5ln(λ) 5 i=1ln(λ + x i ). ln(λ + x i )

129 Solutions 121 On obtient alors ˆα = 5/( 5 i=1 ln(λ + x i) 5lnλ) = 3,8629. En calculant la dérivée seconde de la fonction de log-vraisemblance, on vérifie qu il s agit bien d un maximum La probabilité d avoir une observation inférieure à 2 est 2 F(2) = 2λxe λx2 dx = 1 e 4λ. 0 On a ensuite, pour un échantillon aléatoire de taille 4, On trouve alors ˆλ = 1 4 ln 4 3. L(λ) = F(2)(1 F(2)) 3 = (1 e 4λ )e 12λ l(λ) = ln(1 e 4λ ) 12λ l (λ) = 4(1 e 4λ ) 1 e 4λ On aura reconnu la densité d une N(0, θ). On sait que l estimateur du maximum de vraisemblance de θ est sans biais. Ainsi, MSE( ˆθ) = Var[ ˆθ]. Or, on a ln f (x) = 1 x2 ln(2πθ) 2 2θ d 2 1 ln f (x) = dθ2 2θ 2 x2 θ 3 [ 1 I(θ) = ne = 2n θ 2 2θ 2 X2 θ 3 et Var[ ˆθ] = I 1 (θ). Une approximation de l erreur quadratique moyenne est donc MSE( ˆθ) = Var[ ˆθ] = 2 ˆθ 2 n = 0, a) On a une distribution log-gamma de paramètres α = 2 et λ. De l annexe A, on sait que ( ) λ 2 E[X] =. λ 1 En posant E[X] = X, on trouve que l estimateur des moments de λ est ˆλ = ± X ± X 1. ]

130 122 Solutions b) On a L(λ) = λ2n n i=1 ln(x i) n i=1 xλ+1 l(λ) = 2nln(λ) + i n i=1 l (λ) = 2n λ n i=1ln(x i ). ln(ln(x i )) (λ + 1) n i=1 ln(x i ) 5.20 a) On a On trouve alors que ˆλ = 2n/ n i=1 ln(x i). L(λ) = (λ5 ) 5 ( 5 i=1 x4 i )e λ 5 i=1 x i (Γ(5)) 5 l(λ) = 25ln(λ) + 4 l (λ) = 25 λ 5 i=1 x i, 5 i=1 ln x i λ 5 i=1 x i 5lnΓ(5) d où ˆλ = 25/ 5 i=1 x i = 1/2. b) On a l (λ) = 25 λ 2 et donc la matrice d information de Fisher est [ ] 25 I(λ) = E λ 2 = 25 (5/8) 2 = 64. Par conséquent, Var[ ˆλ] = Par définition de la fonction de vraisemblance : L(α) = (Pr(X 2)) 2 Pr(5 X 11)Pr(X 11) ( ( ) 1 α ) 2 (( ) 1 α ( ) 1 α ) ( ) 1 α = Étant donné qu il faudra faire appel à des méthodes numériques pour résoudre ce problème, on peut tout aussi bien minimiser la fonction de vraisemblance au lieu de la fonction de log-vraisemblance.

131 Solutions On a On obtient ˆβ = ln(1,5). L(β) = Pr(0 X 1)Pr(X 2) = (1 e β )e 2β l(β) = ln(1 e β ) 2β e β l (β) = 2. 1 e β 5.23 a) Par la méthode du maximum de vraisemblance habituelle, on trouve ˆλ = n n i=1 x2 i Or, P k = F X (k) = 1 e λk2. Par la propriété d invariance de l estimateur du maximum de vraisemblance, on a donc ˆP k = 1 e ˆλk 2. b) Par la méthode delta, on a que Var[ ˆP k ] = ( ) 2 Pk Var[ ˆλ] λ = (k 2 e λk2 ) 2 Var[ ˆλ]. Or, en laissant tomber les termes non fonction de λ, l(λ) = nln(λ) λ l (λ) = n λ n i=1 x 2 i. n i=1 x 2 i +... d où et Par conséquent, l (λ) = n λ 2 E [ n ] λ 2 = n λ 2 Var[ ˆλ] = λ2 n. Var[ ˆP k ] = k4 λ 2 e 2λk2. n c) On sait que ˆP k N(P k,var[ ˆP k ]). Or, si X 1 = X 2 = 10 et X 3 = 15, alors ˆλ = 3/425, ˆp 10 = 0,5063 et Var[ ˆP 10 ] = ˆλ 3 = 0,0405.

132 124 Solutions Ainsi, approximativement, ˆP 10 N(0,5063,0,0405), d où Pr( ˆP 10 0,5) Φ( 0,0313) = 0, En premier lieu, on a et l(α, λ; x) = nln(α) + αnln(λ) (α + 1) 2 α 2 l(α, λ; x) = n α 2 2 αn l(α, λ; x) = λ2 2 α λ l(α, λ; x) = n λ n i=1 n λ 2 + (α + 1) i=1 ( ) 1. λ + x i n i=1 ( 1 ln(λ + x i ) λ + x i Pour la suite, on aura besoin des résultats intermédiaires [ ( ) ] 1 2 E λ + X [ E 1 λ + X 1 αλ = α 0 (λ + x) 2 (λ + x) α = λ 2 (α + 2) 1 0 λ + x = α 1 α + 1 λ. ] = ) 2 α+1 dx αλ α dx (x + λ) α+1 Ainsi, [ 2 ] E l(α, λ; X) = E [ n ] α2 α 2 = n [ α 2 [ 2 ] E l(α, λ; X) = E λ2 [ 2 ] E l(α, λ; X) = E α λ αn n λ 2 + (α + 1) i=1 αn = λ 2 (α + 2) [ n ( ) ] n 1 λ λ + X i=1 i n = λ(α + 1) ( 1 λ + X i ) 2 ]

133 Solutions 125 et la matrice d information de Fisher est n n α I(α, λ) = 2 λ(α + 1) n αn. λ(α + 1) λ 2 (α + 2) 5.25 On a La matrice de variance-covariance est donc De là, on obtient Or, Σ = I 1 (α, λ) α 2 (α + 1) 2 = n α(α + 1)(α + 2)λ n α(α + 1)(α + 2)λ n λ 2 (α + 1) 2 (α + 2). nα Var[ˆα] = ˆα2 (ˆα + 1) 2 = 0, Var[ ˆλ] = ˆλ 2 (ˆα + 1) 2 (ˆα + 2) = ˆα Ĉov(ˆα, ˆλ) = ˆα(ˆα + 1)(ˆα + 2) ˆλ = 393, h(α, λ) = Pr(X > 10) ( ) λ α = λ + 10 ( ) h(α, λ) λ α ( ) λ = ln α λ + 10 λ + 10 ( ) h(α, λ) λ α 1 ( ) 10 = α λ λ + 10 (λ + 10) 2. h(ˆα, ˆλ) = 0,0816 h(α, λ) α = 0,1023 (ˆα, ˆλ) h(α, λ) λ = 0,0292 (ˆα, ˆλ) et donc Var[h(ˆα, ˆλ)] = [ 0,1023 0,0292 ] [ ] [ ] , ,0292 = 0,2254.

134 126 Solutions L intervalle de confiance est donc 0,0816 ± (1,44) 0,2254. Étant donné qu il s agit d un intervalle pour une probabilité, la borne inférieure ne peut être plus petite que 0 (et la borne supérieure ne peut être plus grande que 1). L intervalle de confiance est donc (0, 0,7653) On sait que l estimateur du maximum de vraisemblance de λ est ˆλ = X 1 et il est simple d établir que Var[ ˆλ] = λ 2 /n. Ici, on a ˆλ = 0,0187. a) On a d où et h(λ) = E[X; 50] = 1 e 50λ λ dh(λ) dλ = e 50λ (50λ + 1) 1 λ 2, ( e Var[h( ˆλ)] = 50λ ) 2 (50λ + 1) 1 λ 2 n λ 2 Var[h( ˆλ)] = ( 686,57) 2 (0, ) = 20,68. b) On procède comme en a) avec h(λ) = π 0,95 dh(λ) dλ On obtient Var[h( ˆλ)] = = ln(0,05) λ = ln(0,05) λ a) On a que X A = α obéit à une loi de Bernoulli(α) et que A obéit à une loi U(0,1). On cherche f (α x 1, x 2, x 3 ) α 3 i=1 x i(1 α) 3 3 i=1 x i(1) = α(1 α) 2. On reconnaît ici la forme fonctionnelle d une distribution Bêta(2, 3). On sait que, si la fonction de perte choisie est l erreur quadratique, l estimateur bayesien est l espérance de la distribution a posteriori. On a donc ˆα = = 2 5 = 0,4.

135 Solutions 127 b) On a 0,4 Γ(5) Pr(0,2 < A < 0,4 X = x) = 0,2 Γ(2)Γ(3) α(1 2α + α2 ) dα = 0, On a que X Θ = θ Poisson(θ) et que Θ Gamma(α, λ). On a donc ( ) ( e f (θ x 1,..., x n ) θn θ n i=1 x i λ α e λθ θ α 1 ) i=1 n x i! Γ(α) = e (λ+n)θ θ α+ n i=1 x i 1. On reconnaît ici la forme fonctionnelle d une distribution Gamma de paramètres α = α + n i=1 x i et λ = λ + n. On sait que, si la fonction de perte choisie est l erreur quadratique, l estimateur bayesien est l espérance de la distribution a posteriori. Par conséquent ˆθ = α + n i=1 x i. n + λ 5.29 a) On a que X A = α obéit à une loi de Pareto(α,1) et que A obéit à une distribution Exponentielle(3). On a ( f (α x 1,..., x n ) 3e 3α α n ) i=1 n (1 + x i) α+1 α = n e 3α i=1 n (1 + x i) α+1 ( = α n e 3 i=1 n (1 + x i) = α n e λ α avec λ = 3 + n i=1 ln(1 + x i). On reconnaît alors la forme fonctionnelle d une loi Gamma. On a donc, comme densité a posteriori, une loi Gamma de paramètres α = n + 1 et λ. b) On sait que, si la fonction de perte choisie est l erreur quadratique, l estimateur bayesien est l espérance de la distribution a posteriori. On a donc ˆα = ) α n n i=1 ln(1 + x i) = ,27 = 0, a) On a que X B = β obéit à une loi Exponentielle(β) et que B obéit à une loi Gamma(2,3). On a f (β x 1,..., x 5 ) β 6 e β(3+ 5 i=1 x i).

136 128 Solutions Puisque 5 i=1 x i = 47, on reconnaît ici la forme fonctionnelle d une loi Gamma(7, 50). Avec une fonction de perte quadratique, l estimateur bayesien est l espérance de la distribution a posteriori. On a donc ˆβ = 7 50 = 0,14. b) Avec une fonction de perte valeur absolue l estimateur bayesien est la médiane de la distribution a posteriori. Il faut donc choisir ˆβ tel que Pr(B ˆβ X = x) = Γ(7;50 ˆβ) = 1 2. Avec les informations données dans l énoncé, on trouve ˆβ = 6, = 0, a) Soit X la variable aléatoire du nombre de fois où un étudiant reste bloqué dans un devoir. On a X Θ = θ Binomiale(3, p) et Θ U(0,25,0,75). On a f (θ x 1 = 2, x 2 = 2) = = 2 ( ( 3 2 )θ2 (1 θ) 2) 2 0,75 0,25 2( ( 3 2 )θ2 (1 θ) 2) 2 dθ θ 4 (1 θ) 2 0,75 0,25 θ4 (1 θ) 2 dθ = 141,22θ 4 (1 θ) 2. Avec une fonction de perte quadratique, l estimateur bayesien est l espérance de la distribution a posteriori. Ainsi, b) On a 0,75 ˆθ = 141,22 θ 5 (1 θ) 2 dθ = 0, ,25 0,7 Pr(0,6 < Θ < 0,7 X 1 = 2, X 2 = 2) = 1441,22 θ 4 (1 θ) 2 dp 0,6 = 0, a) Soit X la variable aléatoire du montant d un sinistre en millions. On a W = X 1,5 X > 1,5. Par conséquent, Pr(W > 29,5) = F X(29,5) F X (1,5). 1 F X (1,5)

137 Solutions 129 Or, par la propriété d invariance de l estimateur du maximum de vraisemblance, on a )ˆα ( Pr(W > 29,5) = 1 = ( )ˆα ˆλ ˆλ ˆλ+1,5 ˆλ+29,5 ( )ˆα ˆλ ˆλ+1,5 )ˆα ( ˆλ + 1,5 ˆλ + 29,5 = 0,0365. b) On a et h(α, λ) α h(α, λ) λ ( λ + 1,5 h(α, λ) = λ + 29,5 h α = ( λ + 1,5 λ + 29,5 ) α h (λ + 1,5)α 1 = 28α λ (λ + 29,5) α+1 = 0,0238 (ˆα, ˆλ) = 0,0029, (ˆα, ˆλ) ) α ( ) λ + 1,5 ln λ + 29,5 d où Var[h(ˆα, ˆλ)] = [ 0,0238 0,0029 ] [ ] [ ] 23,92 167,07 0, , ,32 0,0029 = 0, Le montant payé par l assureur est Y = min(x,3 000) 100 X > 100, d où f X (y + 100) 1 F X (100), 0 y < f Y (y) = S X (3 000) 1 F X (100), y = , y > 2 900, λe λy, 0 y < = e 2 900λ, y = , y >

138 130 Solutions La fonction de vraisemblance est donc L(λ) = n i=1 f Y (y i ) = λ 8 e λ( ) (e 2 900λ ) 2 = λ 8 e λ. Par la méthode usuelle, on trouve ˆλ = 8/ On cherche une estimation de E[X] = λ 1. Par la propriété d invariance de l estimateur du maximum de vraisemblance, on a Ê[X] = 1ˆλ = = 1 302, Soit X la variable aléatoire du montant d un sinistre et Y la variable aléatoire du montant payé par l assureur. On a Y = min(x,150), d où f X (y), y < 150 f Y (y) = 1 F X (150), y = 150 0, y > 150, λe λy, y < 150 = e 150λ, y = 150 0, y > 150. On a donc la fonction de vraisemblance L(λ) = n i=1 f Y (y i ) = λ 5 e λ( ) (e 150λ ) 3 = λ 5 e 845λ. Par la technique usuelle, on trouve ˆλ = 0, On a la fonction de répartition empirique 0, x 0 2 F 9 (x) = 9, 0 < x 2 6 9, 2 < x 5 1, 5 < x 8. Il faut maintenant trouver la valeur de λ qui minimise Q(λ) = = x=2,5,8 (F(x) F 9 (x)) 2 ( 1 e λ2 2 9 ) 2 + ( 1 e λ5 6 ) 2 ( e λ8 1). 9 On trouve numériquement que le minimum est atteint en ˆλ = 0,2286.

139 Solutions 131 Chapitre La fonction de répartition théorique est ( ) λ α ( ) F X (x) = 1 = 1. λ + x x Ainsi, le nombre espéré de sinistres dans chaque classe est E 1 = 10(F(250) F(0)) = 3,6 E 2 = 10(F(500) F(250)) = 1,9556 E 3 = 10(F(1 000) F(500)) = 1,9444 E 4 = 10(F( ) F(1 000)) = 2,5. On a les nombres de sinistres observés n 1 = 3, n 2 = 2, n 3 = 3 et n 4 = 2. La valeur de la statistique du test du khi carré est donc Q = 4 (n j E j ) 2 E j=1 j (3 3,6)2 = 3,6 = 0, (2 1,9556)2 1, (3 1,9444)2 1, (2 2,5)2 2,5 Soit χ 2 3,0,10 = 6,2514 le 90e centile d une distribution khi carré avec trois degrés de liberté. Puisque 0,7740 < 6,2514, on ne rejette pas le modèle. 6.2 La fonction de répartition du modèle est ( ) λ α ( ) 50 3,5 F X (x) = 1 = 1. λ + x 50 + x On a les nombres espérés de sinistres par classe suivants : La valeur de la statistique est donc E 1 = 1 000(F(3) F(0)) = 184,49 E 2 = 1 000(F(7,5) F(3)) = 202,37 E 3 = 1 000(F(15) F(7,5)) = 213,93 E 4 = 1 000(F(40) F(15)) = 271,40 E 5 = 1 000(F( ) F(40)) = 127,80. ( ,49)2 Q = + 184,49 ( ,40) ,40 = 9,5046. ( ,37)2 202,37 + ( ,80)2 127,80 + ( ,93)2 213,93

140 132 Solutions Or, Pr(χ 2 2 > 9,5046) = 0,0086 (où χ2 2 est une variable aléatoire avec distribution khi carré avec deux degrés de liberté). Par conséquent, on ne rejette pas le modèle avec un seuil de signification de 0,86 %. Des seuils proposés, seul 0,5 % est donc valide. 6.3 La fonction de répartition empirique est 0, x < 0,1 0,2, 0,1 x < 0,4 F 5 (x) = 0,4, 0,4 x < 0,8 0,8, 0,8 x < 0,9 1, x 0,9. La fonction de répartition théorique est x 1 + 2y F(x) = dy = x (1 + x), 0 x La statistique de Kolmogorov Smirnov est donc D = max i=1,...,5 { F(x i) F 5 (x i ), F(x i ) F 5 (x i 1 ) } = max{ F(0,1) F 5 (0,1), F(0,1) F 5 (0), F(0,4) F 5 (0,4), F(0,4) F 5 (0,1), = 0,32. F(0,8) F 5 (0,8), F(0,8) F 5 (0,4), F(0,9) F 5 (0,9), F(0,9) F 5 (0,8) } La valeur critique du test de Kolmogorov Smirnov avec un seuil de signification de 5 % est c = 1,36/ 5 = 0,6082. Puisque D < c, on ne rejette pas le modèle. 6.4 a) La fonction de répartition empirique est F 10 (x) = 0, x < , 1 x < , 2 x < , 3 x < , 4 x < 8 1, x 8. b) La fonction de répartition théorique est ( ) 2 2 F X (x) = 1. = 2 + x

141 Solutions 133 i F n (x i ) F(x i ) F n (x i 1 ) F(x i ) 1 3/16 1/16 2 1/ , , /16 3/16 Table E.2: Différences entre les fonctions de répartition théorique et empirique pour les données de l exercice 6.5 On a donc F(1) = 5 9, F(2) = , F(3) = 25, F(4) = 8 9 distance de Cramér von Mises est Q CvM = 10 i=1 (F(x i ) F 10 (x i )) 2 ( 5 = ( ) = 0,3478. ) 2 ( ( ) 2 et F(8) = La ) 2 ( ) 2 10 c) On a cette fois une fonction de répartition empirique telle que F 10 (2) = 6 10, F 10(4) = 10 9 et F 10(8) = 1. La valeur de la distance est donc ( 3 Q CvM = 4 6 ) 2 ( ) 2 ( ) = 0, On trouve d abord la fonction de répartition théorique : x y x2 F(x) = dy = 0 2 4, 0 x 2. On a ensuite F 4 (0,5) = 1/4, F 4 (1) = 2/4, F 4 (1,25) = 3/4, et F 4 (1,5) = 1. Le tableau E.2 présente les différences entre les fonctions de répartition. La statistique D 4 est donc 7/16 = 0, On trouve d abord la fonction de répartition théorique : x y x2 F(x) = dy = , 0 x 10. On a ensuite F 7 (1) = 1/7, F 7 (4) = 2/7, F 7 (6) = 3/7, F 7 (7) = 4/7, F 7 (8) = 5/7, F 7 (9) = 6/7 et F 7 (9,5) = 1. Le tableau E.3 présente les différences entre les fonctions de répartition. La statistique de Kolmogorov Smirnov vaut donc D = 0,1329. Puisque la valeur critique du test est c = 1,36/ 7 = 0,5140 > D, on ne rejette pas le modèle.

142 134 Solutions x i F n (x i ) F(x i ) F n (x i 1 ) F(x i ) 1 0,1329 0, ,1257 0, ,0686 0, ,0814 0, ,0743 0, ,0471 0,0957 9,5 0,0975 0,0454 Table E.3: Différences entre les fonctions de répartition théorique et empirique pour les données de l exercice On a On trouve ensuite que Ainsi, la valeur de la statistique est ( ) λ α F X (x) = 1 = 1 8 λ + x 8 + x. (10 7,6923)2 Q = 7,6923 = 1,1667. E 1 = (20) (F(5) F(0)) = 7,6923 E 2 = (20) (F(20) F(5)) = 6,5934 E 3 = (20) (F( ) F(20)) = 5, (5 6,5934)2 6, (5 5,7143)2 5, On rappelle que F X (x;α, λ) = Γ(α;λx), où Γ(α; x) est la fonction de répartition de la distribution Gamma(α, 1). Le calcul de la statistique de Kolmogorov Smirnov requiert donc les valeurs de Γ(α; 1,25), Γ(α; 5,5) et Γ(α;7) pour α = 3 et α = 3,5. Or, avec la relation donnée dans l énoncé, on obtient ( Γ(3;1,25) = 1 e 1, ,25 + (1,25)2 2 ( Γ(3;5,5) = 1 e 5, ,5 + (5,5)2 2 Γ(3;7) = 1 e 7 ( (7)2 2 ) = 0,1315 ) = 0,9116 ) = 0,9704.

143 Solutions 135 F n (x i ) F(x i ) F n (x i 1 ) F(x i ) x i α = 3 α = 3,5 α = 3 α = 3, ,1185 0,1771 0,1315 0, ,1616 0,1114 0,6616 0, ,0296 0,0512 0,2204 0,1988 Table E.4: Différences entre les fonctions de répartition théorique et empirique pour les données de l exercice 6.8 Le tableau E.4 présente les calculs pour les deux distributions postulées. Pour la Gamma(3, 0,01), la statistique de Kolmogorov Smirnov est D = 0,6616 et pour la Gamma(3,5,0,01), la statistique est D = 0,6114. On choisit donc la deuxième distribution pour la modélisation les données. 6.9 L hypothèse de taux d échec constant correspond à une distribution exponentielle de paramètre λ = 0,01. On a donc F X (x) = 1 e x/100 et E 1 = 50(F(25) F(0)) = 11,0600 E 2 = 50(F(40) F(25)) = 5,4240 E 3 = 50(F(60) F(40)) = 6,0754 E 4 = 50(F(80) F(60)) = 4,9741 E 5 = 50(F( ) F(80)) = 22,4664. Étant donné que E 4 < 5, on regroupe (arbitrairement) E 3 et E 4 pour obtenir E 3,4 = 11,0495. On obtient ensuite Q = (10 11,06)2 11,06 + (15 11,0495)2 + 11,0495 = 1,8179. (5 5,4240)2 5, (20 22,4664)2 22,4664 Puisque Pr(χ 2 3 > 1,8179) = 0,61 > 0.05, on ne rejette pas l hypothèse a) On les valeurs suivantes de la fonction de répartition empirique : F 50 (25) = 0,20, F 50 (50) = 0,44, F 50 (100) = 0,68 et F 50 (200) = 0,90. Pour la distribution de Pareto, on a F(25) = 0,4557, F(50) = 0,6464, F(100) = 0,8075 et F(200) = 0,9106. La distance de Cramér von Mises est alors Q CvM = (0,4557 0,2) 2 + (0,6464 0,44) 2 + (0,8075 0,68) 2 + (0,9106 0,9) 2 = 0,1244.

144 136 Solutions Pour la distribution de Weibull, on a F(25) = 0,2212, F(50) = 0,3935, F(100) = 0,6321 et F(200) = 0,8647. La distance est alors Q CvM = (0,2212 0,2) 2 + (0,3935 0,44) 2 + (0,6321 0,68) 2 + (0,8647 0,9) 2 = 0,0062. Comme 0,0062 < 0,1244, la distribution de Weibull est un meilleur modèle. b) Pour la distribution de Pareto, on a E 1 = 50(F(25) F(0)) = 22,7834 E 2 = 50(F(50) F(25)) = 9,5389 E 3 = 50(F(100) F(50)) = 8,0552 E 4 = 50(F(200) F(100)) = 5,1504 E 5 = 50(F( ) F(200)) = 4,4721. Étant donné que E 5 < 5, on regroupe E 4 et E 5 pour obtenir E 4,5 = 9,6225. On obtient alors (10 22,7834)2 Q = + 22,7834 (12 8,0552) ,0552 = 13,9662. (12 9,5389)2 9,5389 (16 9,6225)2 9,6225 Or, χ 2 3,0,05 = 7,815 < Q. On rejette donc le modèle avec distribution de Pareto. c) Comme 0,10 < 0,1244, le choix de la distribution log-normale serait meilleur a) On a H 0 : numéros de départ équiprobables H 1 : numéros de départ non équiprobables. b) Pour un total de 144 courses et une probabilité uniforme de victoire de 1 8, le nombre de victoires espéré pour chaque numéro est 144/8 = 18. Les résultats cumulés observés et espérés sont présentés dans le tableau suivant : Numéro Gains observés Gains théoriques Écart absolu

145 Solutions 137 La plus grande différence est observée pour le numéro 4. On a donc D = 19/144 = 0,132. La valeur critique du test de Kolmogorov Smirnov pour une taille d échantillon n = 144 est 1,36/12 = 0,1133 pour un seuil α = 0,05 et 1,63/12 = 0,1358 pour un seuil α = 0,01. On rejette donc l hypothèse H 0 à un niveau de confiance de 95 %, mais pas à un niveau de confiance de 99 % On a, dans l ordre, ( ) 3 219,1 ln(100) = 226,01 2 ( ) 3 219,2 ln(100) = 226,11 2 ( ) 2 221,2 ln(100) = 225,81 2 ( ) 2 221,4 ln(100) = 226,01 2 ( ) 1 224,4 ln(100) = 226,70. 2 Le meilleur modèle est donc la distribution de Pareto. Chapitre a) On trouve d abord l estimateur du maximum de vraisemblance du paramètre θ. On a p k = Pr(N = k) = ( m k )θk (1 θ) n k, k = 0,..., m et donc L(θ) = l(θ) = = l (θ) = m k=0 m k=0 m k=0 m k=0 (p k ) n k n k ln p k n k (ln ( ) ) m + k ln(θ) + (m k)ln(1 θ) k n k ( k θ m k 1 θ ). En résolvant l équation l (θ) = 0, on trouve ˆθ = 1 m m k=0 kn k m k=0 N k = N m.

146 138 Solutions Par conséquent, b) On a c) De la partie a), on a [ ] N E[ ˆθ] = E m = E[N] m = mθ m = θ. [ ] N Var[ ˆθ] = Var m = Var[N] nm 2 mθ(1 θ) = nm 2 θ(1 θ) = nm. d 2 dθ 2 ln p k = k θ 2 m k (1 θ) 2 d où I( ˆθ) = E[ n d2 dθ 2 ln p N] = n n(m k) E[N] + E[m N] θ2 (1 θ) 2 = nm mn(1 θ) + θ (1 θ) 2 = nm θ(1 θ) et donc Var[ ˆθ] = I 1 (θ) = θ(1 θ) nm. d) Un intervalle de confiance de niveau 1 α pour θ est ˆθ ± z α/2 Var[ ˆθ]

147 Solutions 139 soit θ(1 θ) ˆθ ± z α/2. mn Or, comme le paramètre θ est inconnu, on utilise en pratique l intervalle approximatif ˆθ(1 ˆθ) ˆθ ± z α/2. mn 7.2 a) On a Pr(N = k) = λ k e λ /k!, k = 0,1,..., et donc les fonctions de vraisemblance ( ) λ L(λ) = k e λ nk k! et de log-vraisemblance l(λ) = k=0 k=0 n k (k lnλ λ lnk!). Par les techniques habituelles, on trouve ˆλ = N = k=0 kn k k=0 n k = 0,1001 puis E[ ˆλ] = λ et Var[ ˆλ] = Var[ N] = λ/n. On a donc ˆλ N(λ, λ/n). Par conséquent, un intervalle de confiance approximatif à 95 % pour le paramètre λ est ˆλ ± 1,96 Var[ ˆλ], avec Var[ ˆλ] = ˆλ/n. L intervalle de confiance est donc 0,1001 0,1001 ± 1, b) Avec la paramétrisation donnée dans l énoncé, E[N] = β et Var[N] = β(β + 1). De plus, L(β) = l(β) = k=0 k=0 ( β k (β + 1) k+1 ) nk n k (k ln β (k + 1)ln(β + 1))

148 140 Solutions et donc ˆβ = N = k=0 kn k k=0 n k = 0,1001. On trouve ensuite que E[ ˆβ] = 0,1001 et que Var[ ˆβ] = ˆβ( ˆβ + 1)/n, d où Var[ ˆβ] = 0,1001(1,1001)/ L intervalle de confiance est donc 0,1001(1,1001) 0,1001 ± 1, c) En posant θ = (β + 1) 1 dans les formules de l annexe A, on trouve E[N] = rβ et Var[N] = rβ(β + 1). Les estimateurs des moments de r et β sont donc les solutions des équations rβ = k=0 kn k k=0 n k = 0,1001 et rβ(1 + β) = k=0 k2 n k k=0 n k d où on trouve ˆr = 55,67 et ˆβ = 0,0018. ( ) k=0 kn 2 k k=0 n = 0,10028 k d) On peut utiliser la fonction fitdistr du package MASS dans sa forme la plus simple pour trouver les estimateurs du maximum de vraisemblance de r et µ = rβ : > x <- c(rep(0, 9048), rep(1, 905), rep(2, 45), + rep(3, 2)) > fitdistr(x, "negative binomial") size mu e e-01 ( e+02) ( e-03) 7.3 a) De l exercice 7.2, on sait que l estimateur du maximum de vraisemblance du paramètre d une distribution de Poisson est la moyenne échantillonale. Pour la variable aléatoire N 1, on a ˆλ 1 = x = 0,109. Pour la variable aléatoire N 2, on a ˆλ 2 = x = 0,057. b) On sait que la distribution de la somme de n variables aléatoires indépendantes distribuées selon des lois de Poisson de paramètre λ i, i = 1,..., n est une Poisson de paramètre λ = n i=1 λ i. On obtient donc N Poisson(λ 1 + λ 2 = 0,166). 7.4 a) De l exercice 7.1, on a ˆθ = n 7 = 7 k=0 kn k 7n = 0,0237.

149 Solutions 141 b) Comme à l exercice 7.2 c), on a rβ = k=0 kn k k=0 n k = 0,166 et rβ(1 + β) = k=0 k2 n k k=0 n k On trouve alors ˆr = 0,4715 et ˆβ = 0,3521. ( ) k=0 kn 2 k k=0 n = 0,2244 k c) On utilise la fonction fitdistr du package MASS pour trouver les estimateurs du maximum de vraisemblance de r et µ = rβ : 7.5 On a > x <- c(rep(0, 861), rep(1, 121), rep(2, 13), + rep(3, 3), 4, 6) > fitdistr(x, "negative binomial") size mu ( ) ( ) Pr(N = k) = Pr(N = k Λ = λ) f Λ (λ) dλ 0 = βr Γ(r)k! 0 λ r+k 1 e λ(β+1) dλ. Or, en reconnaissant sous l intégrale la forme fonctionnelle d une distribution Gamma(r + k, β + 1), on obtient Γ(r + k)β Pr(N = k) = r Γ(r)k!(β + 1) r+k ( Γ(r + k) β = Γ(r)Γ(k 1) β + 1 Γ(r + k) = Γ(r)Γ(k 1) θr (1 θ) k, ) r ( 1 ) k β + 1 avec θ = β(β + 1) 1, soit la fonction de masse de probabilité d une distribution binomiale négative de paramètres r et θ. 7.6 Sans la franchise, l espérance de la fréquence serait E[N] = r(1 θ)/θ = 15. De plus, on a S X (20) = e (0,01)(20) = 0,8187. Cela signifie qu environ 82 % des sinistres seront d un montant supérieur à la franchise, c est-à-dire qu environ 82 % des sinistres vont produire une réclamation. On a donc E[N ] = (0,8187)(15) = 12,28.

150 142 Solutions kn k /n k k Figure E.17: Graphique de kn k /n k 1 en fonction de k pour les données de l exercice Tout d abord, il est clair distributions continues normale et gamma ne sont pas appropriées pour modéliser la fréquence de sinistres. Pour choisir parmi les autres distributions possibles, on peut comparer la moyenne et la variance échantillonales. On a ˆµ = 2 et ˆσ 2 = 1,496. Comme ˆµ > ˆσ 2, la loi binomiale est le meilleur choix. La figure E.17 montre le graphique de k ˆp k / ˆp k 1 = kn k /n k 1 en fonction de k pour k = 1,..., 6. La pente est clairement négative. Ceci indique donc que le membre de la famille (a, b,0) avec a < 0, soit la binomiale, est le meilleur choix. 7.8 On regroupe les trois dernières classes pour obtenir une fréquence significative pour le calcul de la statistique. Si N Poisson(0,6), on a E 0 = 365Pr(N = 0) = 200,32 E 1 = 365Pr(N = 1) = 120,19 E 2 = 365Pr(N = 2) = 36,06 E 3+ = 365Pr(N 3) = 365 E 0 E 1 E 2 = 8,43.

151 Solutions 143 On a les nombres de sinistres observés n 0 = 209, n 1 = 111, n 2 = 33 et n 3+ = 12. La valeur de la statistique de Pearson est donc Q = 3 (n j E j ) 2 E j=0 j ( )2 = 209,32 (33 36,06)2 + 36,06 = 2, ( ,19)2 120,19 (12 8,43)2 8,43

152

153 Bibliographie Béguin, L.-P. 1990, Lexique général des assurances : lexique anglais-français et français-anglais, Cahiers de l Office de langue française, Publications du Québec, ISBN Charbonnier, J. 2004, Dictionnaire de la gestion des risques et des assurances, La Maison Du Dictionnaire, Paris, ISBN Dutang, C., V. Goulet et M. Pigeon. 2008, «actuar: An R package for actuarial science», Journal of Statistical Software, vol. 25, n o 7. URL http: // Klugman, S. A., H. H. Panjer et G. Willmot. 1998, Loss Models: From data to Decisions, Wiley, New York, ISBN Klugman, S. A., H. H. Panjer et G. Willmot. 2004, Loss Models: From Data to Decisions, 2 e éd., Wiley, New York, ISBN Klugman, S. A., H. H. Panjer et G. Willmot. 2008a, Loss Models: From Data to Decisions, 3 e éd., Wiley, New York, ISBN Klugman, S. A., H. H. Panjer et G. Willmot. 2008b, Solutions Manual to Accompany Loss Models: From Data to Decisions, 3 e éd., Wiley, New York, ISBN R Development Core Team. 2009, R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. URL Venables, W. N. et B. D. Ripley. 2002, Modern Applied Statistics with S, 4 e éd., Springer, New York, ISBN

154

155

156 ISBN

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. [email protected]. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier [email protected] http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ARTHUR CHARPENTIER 1 Une compagnie d assurance modélise le montant de la perte lors d un accident par la variable aléatoire continue X uniforme sur l intervalle

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Modélisation des risques

Modélisation des risques 2 Modélisation des risques 2. Introduction L objectif de ce chapitre est de présenter les modèles de base utilisés pour décrire le comportement aléatoire d un risque en actuariat pour une période xe. Les

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5 ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5 ARTHUR CHARPENTIER 1 Un certain test médical révèle correctement, avec probabilité 0.85, qu une personne a le sida lorsqu elle l a vraiment et révèle incorrectement,

Plus en détail

Correction de l examen de la première session

Correction de l examen de la première session de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

MODELES DE DUREE DE VIE

MODELES DE DUREE DE VIE MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Projet Etienne Marceau Méthodes statistiques en assurance non vie

Projet Etienne Marceau Méthodes statistiques en assurance non vie Trinôme : Carine Sauser, Mélanie Groisne, Xavier Milhaud Projet Etienne Marceau Méthodes statistiques en assurance non vie Méthodes statistiques pour la finance et l assurance ISFA - Décembre 2007 Table

Plus en détail

Variables Aléatoires. Chapitre 2

Variables Aléatoires. Chapitre 2 Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,

Plus en détail

Théorème du point fixe - Théorème de l inversion locale

Théorème du point fixe - Théorème de l inversion locale Chapitre 7 Théorème du point fixe - Théorème de l inversion locale Dans ce chapitre et le suivant, on montre deux applications importantes de la notion de différentiabilité : le théorème de l inversion

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Commun à tous les candidats

Commun à tous les candidats EXERCICE 3 (9 points ) Commun à tous les candidats On s intéresse à des courbes servant de modèle à la distribution de la masse salariale d une entreprise. Les fonctions f associées définies sur l intervalle

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16 ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois

Plus en détail

Modèles et Méthodes de Réservation

Modèles et Méthodes de Réservation Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E

Plus en détail

EXERCICES - ANALYSE GÉNÉRALE

EXERCICES - ANALYSE GÉNÉRALE EXERCICES - ANALYSE GÉNÉRALE OLIVIER COLLIER Exercice 1 (2012) Une entreprise veut faire un prêt de S euros auprès d une banque au taux annuel composé r. Le remboursement sera effectué en n années par

Plus en détail

La fonction exponentielle

La fonction exponentielle DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction

Plus en détail

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7 Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Probabilités conditionnelles Exercices corrigés

Probabilités conditionnelles Exercices corrigés Terminale S Probabilités conditionnelles Exercices corrigés Exercice : (solution Une compagnie d assurance automobile fait un bilan des frais d intervention, parmi ses dossiers d accidents de la circulation.

Plus en détail

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

MÉTHODE DE MONTE CARLO.

MÉTHODE DE MONTE CARLO. MÉTHODE DE MONTE CARLO. Alexandre Popier Université du Maine, Le Mans A. Popier (Le Mans) Méthode de Monte Carlo. 1 / 95 PLAN DU COURS 1 MÉTHODE DE MONTE CARLO 2 PROBLÈME DE SIMULATION Théorème fondamental

Plus en détail

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité 1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :

Plus en détail

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Résumé des communications des Intervenants

Résumé des communications des Intervenants Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit

Plus en détail

EPREUVES AU CHOIX DU CANDIDAT. Durée : De 09 h 00 à 12 h 00 (Heure de Yaoundé, TU + 1)

EPREUVES AU CHOIX DU CANDIDAT. Durée : De 09 h 00 à 12 h 00 (Heure de Yaoundé, TU + 1) 1 CYCLE MST-A 30 JUIN 2010 10 ème Promotion 2010 / 2012 CONCOURS D ENTREE A L IIA DROIT EPREUVES AU CHOIX DU CANDIDAT Durée : De 09 h 00 à 12 h 00 (Heure de Yaoundé, TU + 1) Le candidat traitera au choix

Plus en détail

Modélisation et simulation

Modélisation et simulation Modélisation et simulation p. 1/36 Modélisation et simulation INFO-F-305 Gianluca Bontempi Département d Informatique Boulevard de Triomphe - CP 212 http://www.ulb.ac.be/di Modélisation et simulation p.

Plus en détail

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Exercices - Polynômes : corrigé. Opérations sur les polynômes Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Soutenance de stage Laboratoire des Signaux et Systèmes

Soutenance de stage Laboratoire des Signaux et Systèmes Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300 I3, Probabilités 2014 Travaux Dirigés TD 1 : rappels. Exercice 1 Poker simplié On tire 3 cartes d'un jeu de 52 cartes. Quelles sont les probabilités d'obtenir un brelan, une couleur, une paire, une suite,

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

FINANCEMENT OPTIMAL DE LA SOLVABILITE D UN ASSUREUR

FINANCEMENT OPTIMAL DE LA SOLVABILITE D UN ASSUREUR FINANCEMENT OPTIMAL DE LA SOLVABILITE D UN ASSUREUR Guillaume PLANTIN GREMAQ Université Toulouse I 1 La détermination d un plan de réassurance optimal est une des applications les plus classiques de la

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

4 Distributions particulières de probabilités

4 Distributions particulières de probabilités 4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

EXERCICE 4 (7 points ) (Commun à tous les candidats)

EXERCICE 4 (7 points ) (Commun à tous les candidats) EXERCICE 4 (7 points ) (Commun à tous les candidats) On cherche à modéliser de deux façons différentes l évolution du nombre, exprimé en millions, de foyers français possédant un téléviseur à écran plat

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus. JF WALHIN* J PARIS* * Université Catholique de Louvain, Belgique Le Mans Assurances, Belgique RÉSUMÉ Nous proposons une méthodologie générale pour construire un système bonus-malus équilibré basé sur une

Plus en détail

Processus aléatoires avec application en finance

Processus aléatoires avec application en finance Genève, le 16 juin 2007. Processus aléatoires avec application en finance La durée de l examen est de deux heures. N oubliez pas d indiquer votre nom et prénom sur chaque feuille. Toute documentation et

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

3. Conditionnement P (B)

3. Conditionnement P (B) Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte

Plus en détail

Pierre Thérond [email protected]. Année universitaire 2013-2014

Pierre Thérond pierre@therond.fr. Année universitaire 2013-2014 http://www.therond.fr [email protected] Institut de Science Financière et d Assurances - Université Lyon 1 Année universitaire 2013-2014 Plan du cours 1 Chapitre 1 - Introduction 2 3 4 Bibliographie principale

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Économetrie non paramétrique I. Estimation d une densité

Économetrie non paramétrique I. Estimation d une densité Économetrie non paramétrique I. Estimation d une densité Stéphane Adjemian Université d Évry Janvier 2004 1 1 Introduction 1.1 Pourquoi estimer une densité? Étudier la distribution des richesses... Proposer

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance Auteur Laure de Montesquieu Responsable Centre

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Correction du baccalauréat ES/L Métropole 20 juin 2014

Correction du baccalauréat ES/L Métropole 20 juin 2014 Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)

Plus en détail

Correction du Baccalauréat S Amérique du Nord mai 2007

Correction du Baccalauréat S Amérique du Nord mai 2007 Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

Travaux dirigés d introduction aux Probabilités

Travaux dirigés d introduction aux Probabilités Travaux dirigés d introduction aux Probabilités - Dénombrement - - Probabilités Élémentaires - - Variables Aléatoires Discrètes - - Variables Aléatoires Continues - 1 - Dénombrement - Exercice 1 Combien

Plus en détail

PLAN STATISTIQUE AUTOMOBILE DU QUÉBEC Définitions

PLAN STATISTIQUE AUTOMOBILE DU QUÉBEC Définitions PLAN STATISTIQUE AUTOMOBILE DU QUÉBEC Définitions Juillet 2014 N/Réf. : 930.01 Le Groupement des assureurs automobiles agit à titre d agence autorisée par l Autorité des marchés financiers. Ce document

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

Mesure et gestion des risques d assurance

Mesure et gestion des risques d assurance Mesure et gestion des risques d assurance Analyse critique des futurs référentiels prudentiel et d information financière Congrès annuel de l Institut des Actuaires 26 juin 2008 Pierre THEROND [email protected]

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que Introduction. On suppose connus les ensembles N (des entiers naturels), Z des entiers relatifs et Q (des nombres rationnels). On s est rendu compte, depuis l antiquité, que l on ne peut pas tout mesurer

Plus en détail

Modélisation de la dépendance entre les garanties applicables en assurance automobile

Modélisation de la dépendance entre les garanties applicables en assurance automobile RICHARD VERMETTE Modélisation de la dépendance entre les garanties applicables en assurance automobile Mémoire présenté à la Faculté des études supérieures de l Université Laval dans le cadre du programme

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Correction du baccalauréat STMG Polynésie 17 juin 2014

Correction du baccalauréat STMG Polynésie 17 juin 2014 Correction du baccalauréat STMG Polynésie 17 juin 2014 EXERCICE 1 Cet exercice est un Q.C.M. 4 points 1. La valeur d une action cotée en Bourse a baissé de 37,5 %. Le coefficient multiplicateur associé

Plus en détail

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé Baccalauréat S/L Métropole La Réunion 13 septembre 2013 Corrigé A. P. M.. P. XRCIC 1 Commun à tous les candidats Partie A 1. L arbre de probabilité correspondant aux données du problème est : 0,3 0,6 H

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux [email protected] www.pressesagro.be

Plus en détail

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation

Plus en détail

Correction du baccalauréat S Liban juin 2007

Correction du baccalauréat S Liban juin 2007 Correction du baccalauréat S Liban juin 07 Exercice. a. Signe de lnx lnx) : on fait un tableau de signes : x 0 e + ln x 0 + + lnx + + 0 lnx lnx) 0 + 0 b. On afx) gx) lnx lnx) lnx lnx). On déduit du tableau

Plus en détail

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 [email protected] www.apstat.com

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Application des réseaux de neurones au plan de répartition des risques 5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 [email protected] www.apstat.com Copyright c

Plus en détail

Continuité en un point

Continuité en un point DOCUMENT 4 Continuité en un point En général, D f désigne l ensemble de définition de la fonction f et on supposera toujours que cet ensemble est inclus dans R. Toutes les fonctions considérées sont à

Plus en détail

Rappels sur les suites - Algorithme

Rappels sur les suites - Algorithme DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail