COPULES. Alexandre Popier Université du Maine, Le Mans Septembre 2010 A. Popier (Le Mans) Copules. Septembre 2010 1 / 72
PLAN DU COURS 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE MONTE CARLO Principe Simulation par inversion Vérifications 3 COPULES 2-DIMENSIONNELLES Fonctions de répartition bivariées Copules et théorème de Sklar Exemples 4 MESURER LA DÉPENDANCE 5 COPULES MULTI-DIMENSIONNELLES 6 GÉNÉRER DES VARIABLES CORRÉLÉES A. Popier (Le Mans) Copules. Septembre 2010 2 / 72
MODÉLISER DE LA DÉPENDANCE. SIMULATION MASTER 1 : v.a. indépendantes (ou supposées comme telles)! PROBLÈME : comment créer de la dépendance (non triviale)? EXEMPLES : en finance : instants de défaut (prêts, CDS, CDO, etc.) ; en assurance ou actuariat : dates de sinistre, de catastrophes ; en théorie des réseaux, de la fiabilité ; A. Popier (Le Mans) Copules. Septembre 2010 3 / 72
PLAN 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE MONTE CARLO Principe Simulation par inversion Vérifications 3 COPULES 2-DIMENSIONNELLES Fonctions de répartition bivariées Copules et théorème de Sklar Exemples 4 MESURER LA DÉPENDANCE 5 COPULES MULTI-DIMENSIONNELLES 6 GÉNÉRER DES VARIABLES CORRÉLÉES A. Popier (Le Mans) Copules. Septembre 2010 4 / 72
NOTATIONS ET DÉFINITIONS. NOTATIONS : Pour x = (x 1,..., x d ) R d, x = (x 2 1 +... + x 2 d )1/2. L p = L p d = {X = (X 1,..., X d ), X k v.a. réelle et E X p < }. Si X L 1, E(X) = (E(X 1 ),..., E(X d )). DÉFINITION On appelle vecteur aléatoire toute v.a. à valeurs dans R d. Les coordonnées de X = (X 1,..., X d ) sont alors des v.a.r., dont les lois µ X1,..., µ Xd sont les lois marginales de X. A. Popier (Le Mans) Copules. Septembre 2010 5 / 72
VECTEURS ALÉATOIRES ET DENSITÉS. Soit X un vecteur aléatoire de densité q. PROPOSITION Alors X k a pour densité q k (y) = q(x 1,..., x k 1, y, x k+1,..., x d )dx 1... dx k 1 dx k+1... dx d. A. Popier (Le Mans) Copules. Septembre 2010 6 / 72
VECTEURS ALÉATOIRES ET DENSITÉS. Soit X un vecteur aléatoire de densité q. PROPOSITION Les composantes X 1,..., X d sont indépendantes ssi q(x 1,..., x d ) = q 1 (x 1 )... q d (x d )p.p. avec q k densité de X k. COROLLAIRE Les composantes X 1,..., X d sont indépendantes ssi q(x 1,..., x d ) = g 1 (x 1 )... g d (x d )p.p. et alors X k a pour densité q k (y) = g k (y)/ g k. R A. Popier (Le Mans) Copules. Septembre 2010 6 / 72
MATRICE DE COVARIANCE. NOTATIONS : Si M est une matrice, M T est sa transposée. Un vecteur x R d est une matrice d 1. x, y = x T y. DÉFINITION Pour X L 2 d, la matrice de covariance de X est définie par [ ] K (X) = E (X E(X))(X E(X)) T = E(XX T ) E(X)E(X) T. A. Popier (Le Mans) Copules. Septembre 2010 7 / 72
MATRICE DE COVARIANCE. LEMME Soit X L 2. Alors K (αx) = α 2 K (X), α R ; K (X + a) = K (X), a R d ; K T (X) = K (X). Pour tout λ R d, λ T K (X)λ 0. Si M est une matrice déterministe r d, alors K (MX) = MK (X)M T. PROPOSITION Soient X et Y dans L 2 des vecteurs aléatoires indépendants. Alors K (X + Y ) = K (X) + K (Y ). PROPOSITION Soit X L 2. On a P(X E(X) Im (K (X))) = 1. A. Popier (Le Mans) Copules. Septembre 2010 7 / 72
CALCUL DE LOIS. PROPOSITION Soit X un vecteur aléatoire. Une probabilité µ sur R d est la loi de X ssi pour toute f : R d R mesurable et bornée, E(f (X)) = fdµ. CHANGEMENT DE VARIABLE DANS R d : LEMME Soit φ un difféomorphisne de l ouvert U sur l ouvert V. Pour toute fonction f bornée f (v)dv = f (φ(u)) J(φ)(u) du. V U J(φ) est le déterminant de la matrice des φ j / u k. Rappelons que J(φ)(u) = {J(φ 1 )(φ(u))} 1. A. Popier (Le Mans) Copules. Septembre 2010 8 / 72
PLAN 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE MONTE CARLO Principe Simulation par inversion Vérifications 3 COPULES 2-DIMENSIONNELLES Fonctions de répartition bivariées Copules et théorème de Sklar Exemples 4 MESURER LA DÉPENDANCE 5 COPULES MULTI-DIMENSIONNELLES 6 GÉNÉRER DES VARIABLES CORRÉLÉES A. Popier (Le Mans) Copules. Septembre 2010 9 / 72
LOI DES GRANDS NOMBRES. THÉORÈME Soit (Y i ) i N une suite de variables aléatoires. HYPOTHÈSES indépendance distribution identique (comme une v.a. Y ) E( Y ) < +. Alors presque sûrement : lim Y 1 n = lim n + n + n (Y 1 +... + Y n ) = E(Y ). Autrement dit, pour n assez grand 1 n Y i E(Y ). n i=1 A. Popier (Le Mans) Copules. Septembre 2010 10 / 72
MÉTHODE DE MONTE CARLO. MÉTHODE Pour calculer µ = E(f (X)), simuler N v.a. (X n ) 1 n N i.i.d. de même loi que X, poser : ˆµ N = 1 N N i=1 f (X i ) = f (X 1) +... + f (X N ). N Loi des grands nombres : ˆµ N µ pour N grand. PROBLÈME : quelle est l erreur commise? A. Popier (Le Mans) Copules. Septembre 2010 11 / 72
LOI EXPONENTIELLE (2) (ESPÉRANCE 1/2) A. Popier (Le Mans) Copules. Septembre 2010 12 / 72
LOI DE PARETO (0,5) PAS D ESPÉRANCE A. Popier (Le Mans) Copules. Septembre 2010 13 / 72
THÉORÈME CENTRAL LIMITE. THÉORÈME Soit (Y i ) i N une suite de v.a. HYPOTHÈSES indépendance distribution identique (comme une v.a. Y ) E( Y 2 ) < +. Alors Y n = N (0, 1) : pour tout a < b ( lim P a < ) n Y n µ < b = P(a < Z < b), Z N (0, 1). n + σ A. Popier (Le Mans) Copules. Septembre 2010 14 / 72
INTERVALLE DE CONFIANCE. TCL : µ = E(Y 1 ), Y n = 1 n (Y 1 +... + Y n ) P (Y n a n σ µ Y n + a n σ ) ( = P a ) n Y n µ a σ P( Z a), où σ 2 = Var (f (X)). Pour un niveau de confiance α [0, 1] fixé, il existe c α > 0 tel que Donc avec a = c α, pour n grand avec P( Z c α ) = α. P (µ I α,n ) P( Z c α ) = α ] σ σ I α,n = [Y n c α n, Y n + c α n : intervalle de confiance. A. Popier (Le Mans) Copules. Septembre 2010 15 / 72
MÉTHODE DE MONTE CARLO : ERREUR. MÉTHODE Simuler N v.a. (X n ) 1 n N i.i.d. de même loi que X. Poser : ˆµ N = 1 N N i=1 f (X i ) = f (X 1) +... + f (X N ). N Erreur donnée par un intervalle de confiance : P ( µ I α,n ) α avec [ ] σ σ I α,n = ˆµ N c α N, ˆµ N + c α N, σ 2 = Var (f (x)). Problème : on ne connaît pas en général la variance σ 2. A. Popier (Le Mans) Copules. Septembre 2010 16 / 72
ESTIMATION DE LA VARIANCE. On estime σ 2 grâce à l estimateur Sn 2 = 1 n 1 montrer que ES 2 n = σ 2 = Var (Y ) et n (Y i Y n ) 2. On peut i=1 lim n + S2 n = σ 2. MÉTHODE Simuler N v.a. (X n ) 1 n N i.i.d. de même loi que X. Poser : ˆσ N = 1 N (f (X i ) ˆµ N ) N 1 2. i=1 A. Popier (Le Mans) Copules. Septembre 2010 17 / 72
MÉTHODE DE MONTE CARLO COMPLÈTE. MÉTHODE 1 Simuler N v.a. (X n ) 1 n N i.i.d. de même loi que X. 2 Poser : ˆµ N = 1 N f (X i ) = f (X 1) +... + f (X N ), N N i=1 ˆσ N = 1 N (f (X i ) ˆµ N ) N 1 2. 3 Erreur donnée par intervalle de confiance avec niveau de confiance α [ ] ˆσ N ˆσ I α,n = ˆµ N c α N, ˆµ N + c α. N N i=1 A. Popier (Le Mans) Copules. Septembre 2010 18 / 72
LOI EXPONENTIELLE (2) (ESPÉRANCE 1/2) A. Popier (Le Mans) Copules. Septembre 2010 19 / 72
LOI EXPONENTIELLE (2) (DÉCROISSANCE EN 1/ N) A. Popier (Le Mans) Copules. Septembre 2010 20 / 72
PARETO (1,5) (ESPÉRANCE 3, PAS DE VARIANCE) A. Popier (Le Mans) Copules. Septembre 2010 21 / 72
PARETO (1,5) (TAILLE INTERVALLE CONFIANCE) A. Popier (Le Mans) Copules. Septembre 2010 22 / 72
MÉTHODE DE MONTE CARLO : REMARQUES. OBLIGATOIRE Donner ˆµ N sans intervalle de confiance n a aucune valeur! ERREUR Pour diminuer la taille de IC, diminuer le niveau de confiance α, augmenter N, diminuer σ ( réduction de variance). AVANT : SIMULATION Que signifie «Simuler N v.a. (X n ) 1 n N i.i.d. de même loi que X»? A. Popier (Le Mans) Copules. Septembre 2010 23 / 72
THÉORÈME FONDAMENTAL DE LA SIMULATION. THÉORÈME Toute variable aléatoire X à valeurs dans R d peut être simulée sous la forme X = en loi f (U 1, U 2,..., U n ) où (U 1, U 2,..., U n ) est uniformément répartie sur [0, 1] n, la fonction f : R n R d est borélienne et a ses points de discontinuité dans un ensemble Lebesgue-négligeable. Il est même possible de réaliser ceci en imposant n = 1 ou n = d ou encore n 1 donné. REMARQUE : f est «explicite». A. Popier (Le Mans) Copules. Septembre 2010 24 / 72
MÉTHODE D INVERSION. DÉFINITION Fonction de répartition de X v.a.r., notée F X, définie sur R par : x R, F X (x) = P(X x). PROPOSITION Soit F X la fonction de répartition d une v.a.r. X. Alors : 1 F X (x) [0, 1]. 2 F X est croissante. 3 lim F X (x) = 0 et lim F X (x) = 1. x x + 4 F X est continue à droite et a une limite à gauche en tout point. A. Popier (Le Mans) Copules. Septembre 2010 25 / 72
MÉTHODE D INVERSION. Fonction pseudo-inverse q X de F X : u (0, 1), q X (u) = inf{x R, F X (x) > u}. THÉORÈME Si U suit une loi uniforme sur [0, 1], q X (U) suit la même loi que X. LOI EXPONENTIELLE X = 1 ln(1 U) suit la loi exponentielle de paramètre λ. λ LOI DE BERNOULLI Si U < 1 p, X = 0, sinon X = 1 : suit la loi de Bernoulli de paramètre p [0, 1]. A. Popier (Le Mans) Copules. Septembre 2010 25 / 72
QUELLES VÉRIFICATIONS? DEUX TYPES de vérifications : histogramme normalisé contre densité, fonctions de répartition empirique contre théorique. Dans les deux cas, il faut d abord simuler un grand nombre de fois la loi en question. Pour n N, on obtient un vecteur (x 1,..., x n ) qui contient n réalisations de la loi de X. A. Popier (Le Mans) Copules. Septembre 2010 26 / 72
HISTOGRAMME VS. DENSITÉ. HISTOGRAMME NORMALISÉ 1 regrouper les n termes dans un certain nombre m de classes (avec m < n). Dans chaque classe r m réalisations de X avec r m = n. m 2 normalisation : la somme des aires des colonnes fait 1 r m /(n(c m+1 C m )). 3 tracé : sur l axe des abscisses, placer les m centres des m classes, et mettre une colonne de hauteur r m /(n(c m+1 C m )). CONVERGENCE VERS LA DENSITÉ r m n(c m+1 C m ) n + 1 C m+1 C m P(X [C m, C m+1 [). A. Popier (Le Mans) Copules. Septembre 2010 27 / 72
HISTOGRAMME VS. DENSITÉ. CONVERGENCE VERS LA DENSITÉ CONCLUSION r m n(c m+1 C m ) n + 1 C m+1 C m P(X [C m, C m+1 [). Si X discrète avec C k espacés de 1, approximativement p k. Si X à densité, alors P(X [C m, C m+1 [) C m+1 C m = 1 C m+1 C m Cm+1 C m f (t)dt C m+1 C m 0 f (C m). A. Popier (Le Mans) Copules. Septembre 2010 27 / 72
RÉPARTITION EMPIRIQUE VS. THÉORIQUE. FONCTION DE RÉPARTITION EMPIRIQUE t R, F n (t) = 1 n n 1 ],t] (x i ). i=1 THÉORÈME DE KOLMOGOROV-SMIRNOV t R, lim F n (t) = F X (t). n + A. Popier (Le Mans) Copules. Septembre 2010 28 / 72
EXEMPLE SUR LA LOI EXPONENTIELLE(2). n=100 Histogramme vs densite Fcts de repartition 2.0 1.8 1.6 1.0 empirique theorique 1.4 0.8 1.2 1.0 0.8 0.6 0.4 0.6 0.2 0.4 0.2 0.0 0.0 0 1 2 3 4 5 6!0.2!1 0 1 2 3 4 5 A. Popier (Le Mans) Copules. Septembre 2010 29 / 72
EXEMPLE SUR LA LOI EXPONENTIELLE(2). n=10000 Histogramme vs densite Fcts de repartition 2.0 1.8 1.6 1.0 empirique theorique 1.4 0.8 1.2 1.0 0.8 0.6 0.4 0.6 0.2 0.4 0.2 0.0 0.0 0 1 2 3 4 5 6 7 8!0.2!1 0 1 2 3 4 5 6 7 A. Popier (Le Mans) Copules. Septembre 2010 30 / 72
EXEMPLE SUR LA LOI DE BERNOULLI(0.3). n=100 Histogramme Fcts de repartition 0.8 0.7 1.0 empirique theorique 0.6 0.8 0.5 0.6 0.4 0.3 0.4 0.2 0.2 0.1 0.0 0.0!0.5 0.0 0.5 1.0 1.5 2.0!0.2!1.0!0.5 0.0 0.5 1.0 1.5 2.0 A. Popier (Le Mans) Copules. Septembre 2010 31 / 72
EXEMPLE SUR LA LOI DE BERNOULLI(0.3). n=10000 Histogramme Fcts de repartition 0.7 0.6 1.0 empirique theorique 0.5 0.8 0.4 0.6 0.3 0.4 0.2 0.2 0.1 0.0 0.0!0.5 0.0 0.5 1.0 1.5 2.0!0.2!1.0!0.5 0.0 0.5 1.0 1.5 2.0 A. Popier (Le Mans) Copules. Septembre 2010 32 / 72
PLAN 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE MONTE CARLO Principe Simulation par inversion Vérifications 3 COPULES 2-DIMENSIONNELLES Fonctions de répartition bivariées Copules et théorème de Sklar Exemples 4 MESURER LA DÉPENDANCE 5 COPULES MULTI-DIMENSIONNELLES 6 GÉNÉRER DES VARIABLES CORRÉLÉES A. Popier (Le Mans) Copules. Septembre 2010 33 / 72
DÉFINITIONS. DÉFINITION Soit (X, Y ) un vecteur aléatoire à valeurs dans R 2. La loi de (X, Y ) est caractérisée par F(x, y) = P(X x, Y y), (x, y) R 2. F est la fonction de répartition bivariée de (X, Y ). Lois marginales ou marginales de (X, Y ) : lois de X et de Y prises séparément. Décrites par : F 1 (x) = P(X x) = F 2 (y) = P(Y y) = lim F(x, y) = F(x, + ), y + lim F(x, y) = F(+, y). x + A. Popier (Le Mans) Copules. Septembre 2010 34 / 72
EXEMPLES. Indépendance : F(x, y) = F 1 (x)f 2 (y). F(x, y) = min(f 1 (x), F 2 (y)) : variables comonotones (ou parfaitement positivement corrélées) : X = F 1 1 (F 2(Y )). X est une fonction croissante de Y (et vice-versa). F(x, y) = max(f 1 (x) + F 2 (y) 1, 0) : variables contra-monotones (ou parfaitement négativement corrélées) : X = F 1 1 (1 F 2(Y )). X est une fonction décroissante de Y (et vice-versa). A. Popier (Le Mans) Copules. Septembre 2010 35 / 72
PROPRIÉTÉS. PROPOSITION Soit F fonction de répartition bivariée. 1 F est continue à droite : lim F(x, y) = F(x 0, y 0 ). x x 0,y y 0 2 lim F(x, y) = lim F(x, y) = 0. x y 3 lim F(x, y) = 1. x +,y + 4 F est 2-croissante : pour tout (a 1, a 2 ), (b 1, b 2 ) avec a 1 b 1 + et a 2 b 2 +, F(b 1, b 2 ) F(a 1, b 2 ) F(b 1, a 2 ) + F(a 1, a 2 ) 0. PROPOSITION Une fonction de deux variables vérifiant les quatre propriétés précédentes est une fonction de répartition bivariée. A. Popier (Le Mans) Copules. Septembre 2010 36 / 72
REMARQUES SUR LA CROISSANCE DE F. F croissante par rapport à x et par rapport à y n implique pas F 2-croissante. F 2-croissante n implique pas F croissante par rapport à x et par rapport à y. Mais F 2-croissante et lim F(x, y) = lim F(x, y) = 0 implique x y F croissante par rapport à x et par rapport à y. Si F est de classe C 2, être 2-croissante équivaut à 2 F x y 0. A. Popier (Le Mans) Copules. Septembre 2010 37 / 72
BORNES DE FRÉCHET-HOEFFDING. THÉORÈME Pour tout (x, y) R 2, max(f 1 (x) + F 2 (y) 1, 0) F(x, y) min(f 1 (x), F 2 (y)). A. Popier (Le Mans) Copules. Septembre 2010 38 / 72
COPULE : DÉFINITION. DÉFINITION On appelle copule (de dimension 2 ou 2-dimensionnelle) toute fonction de répartition bivariée C ayant pour marginales la loi uniforme sur [0, 1]. Autrement dit, C vérifie les quatre propriétés d une fonction de répartition bivariée avec en plus : C(x, y) = 0 si x 0 ou y 0, C(x, y) = 1 si x 1 et y 1, C(x, y) = x si y 1, C(x, y) = y si x 1. REMARQUE Il suffit de définir C sur [0, 1] 2! A. Popier (Le Mans) Copules. Septembre 2010 39 / 72
THÉORÈME DE SKLAR. THÉORÈME 1 Si C est une copule, si F 1 et F 2 sont deux fonctions de répartition, alors F(x, y) = C(F 1 (x), F 2 (y)) est une fonction de répartition bivariée, ayant F 1 et F 2 pour marginales. 2 Soit F une fonction de répartition bivariée de marginales F 1 et F 2. Il existe une copule C telle que pour tout (x, y) R 2 : F(x, y) = C(F 1 (x), F 2 (y)). Si de plus F 1 et F 2 sont continues, C est unique. A. Popier (Le Mans) Copules. Septembre 2010 40 / 72
COMMENTAIRES. La loi d un vecteur aléatoire (X, Y ), c est deux fonctions de répartition, qui capturent les marginales, et une copule qui mesure la dépendance. En pratique, on connaît «bien» les marginales et mal la dépendance. Difficulté : choisir la copule qui capture le mieux les structures de dépendance entre les données. A. Popier (Le Mans) Copules. Septembre 2010 41 / 72
PROPRIÉTÉS DES COPULES. 1 Toute copule C satisfait : (u, v) [0, 1] 2 W (u, v) = max(u + v 1, 0) C(u, v) min(u, v) = M(u, v). 2 M et W sont deux copules «extrêmes» : M : composantes fonctions croissantes l une de l autre, W : composantes fonctions décroissantes l une de l autre. 3 C (u, v) = uv : composantes indépendantes. 4 Si u 1, u 2, v 1, v 2 sont dans [0, 1], C(u 1, v 1 ) C(u 2, v 2 ) u 2 u 1 + v 2 v 1. A. Popier (Le Mans) Copules. Septembre 2010 42 / 72
INVARIANCE PAR TRANSFORMATIONS CROISSANTES. PROPOSITION Si C X,Y est la copule de (X, Y ), toute transformation croissante de (X, Y ) a la même copule. CONSÉQUENCES : Si f et g, C f (X),g(Y ) (u, v) = C X,Y (u, v) ; Si f et g, C f (X),g(Y ) (u, v) = u C X,Y (u, 1 v) ; Si f et g, C f (X),g(Y ) (u, v) = u + v 1 + C X,Y (1 u, 1 v). DÉFINITION Si (U 1, U 2 ) C, alors copules associées à (1 U 1, U 2 ), (U 1, 1 U 2 ) et (1 U 1, 1 U 2 ). Pour la dernière, on parle de copule de survie. A. Popier (Le Mans) Copules. Septembre 2010 43 / 72
PREMIERS EXEMPLES. C, M et W. FAMILLE DE FRÉCHET (1958) à deux paramètres (α, β) [0, 1] 2 avec α + β 1 : C α,β (u, v) = αm(u, v) + βw (u, v) + (1 α β)c (u, v). A une structure de dépendance peu riche... FAMILLE DE FARLIE-GUMBEL-MORGENSTERN (1960) à un paramètre θ [ 1, 1] : C θ (u, v) = uv(1 + θ(1 u)(1 v)). Prieger (2002) : sélection dans des plans d assurance-santé. Dépendance faible entre les composantes. A. Popier (Le Mans) Copules. Septembre 2010 44 / 72
COPULES ET DENSITÉS. INDÉPENDANCE : densité constante : 1 [0,1] 2. A. Popier (Le Mans) Copules. Septembre 2010 45 / 72
COPULES ET DENSITÉS. COPULE M : A. Popier (Le Mans) Copules. Septembre 2010 45 / 72
COPULES ET DENSITÉS. COPULE W : A. Popier (Le Mans) Copules. Septembre 2010 45 / 72
COPULES ARCHIMÉDIENNNES. DÉFINITION Soit φ strictement décroissante et convexe de [0, 1] dans [0, + ]. C(u, v) = φ 1 (φ(u) + φ(v)). COPULE DE CLAYTON pour θ [ 1, + [\{0} : φ(x) = u θ 1 ( 1/θ, C θ (u, v) = u θ + v θ 1). θ C θ M si θ + et C θ C si θ 0. Pas de dépendance négative : risques positivement corrélés. Utilisation : syndrôme du cœur brisé, risque de défaut et récession. A. Popier (Le Mans) Copules. Septembre 2010 46 / 72
COPULES ARCHIMÉDIENNNES. DÉFINITION Soit φ strictement décroissante et convexe de [0, 1] dans [0, + ]. C(u, v) = φ 1 (φ(u) + φ(v)). COPULE DE GUMBEL pour θ [1, + [ : [ ( φ(x) = ( ln u) θ, C θ (u, v) = exp ( ln u) θ + ( ln v) θ) ] 1/θ. C θ M si θ + et C θ C si θ 1. Pas de dépendance négative : risques positivement corrélés. A. Popier (Le Mans) Copules. Septembre 2010 46 / 72
COPULES ARCHIMÉDIENNNES. DÉFINITION Soit φ strictement décroissante et convexe de [0, 1] dans [0, + ]. C(u, v) = φ 1 (φ(u) + φ(v)). COPULE DE FRANK pour θ R \ {0} : φ(x) = ln ( e θu ) 1 e θ, C θ (u, v) = 1 [ 1 θ ln 1 + (e θu 1)(e θv ] 1) e θ. 1 C θ C si θ 0, C θ M si θ + et C θ W si θ. Très populaire : atteint toutes les extrêmes, dépendance faible par rapport aux gaussiennes. Invariance : (u, v) (1 u, 1 v) et (u, v, θ) (1 u, v, θ). A. Popier (Le Mans) Copules. Septembre 2010 46 / 72
COPULES ARCHIMÉDIENNNES. DÉFINITION Soit φ strictement décroissante et convexe de [0, 1] dans [0, + ]. AUTRES EXEMPLES. C(u, v) = φ 1 (φ(u) + φ(v)). Indépendance : φ(u) = ln(u). ( ) 1 θ(1 u) Ali-Mikhail-Haq : φ(u) = ln, θ [ 1, 1]. u ( ) Fang-Fang-Rosen : φ(u) = ln 1 θ(1 u 1/k ) u 1/k, θ [ 1, 1], k > 0. A. Popier (Le Mans) Copules. Septembre 2010 46 / 72
COPULE MINMAX. LEMME Soit X 1,..., X n i.i.d. de loi F, et X (1),..., X (n) les statistiques d ordre associées. Loi de X (r) : F r (x) = n CnF i i (x)(1 F(x)) n i. i=r Loi du Max et du min : Loi du couple (min,max) F M (x) = F n (x), F m (x) = 1 (1 F(x)) n. F (m,m) (x, y) = n CnF i i (x)(f (y) F (x)) n i 1 x<y + F n (y)1 x y. i=1 A. Popier (Le Mans) Copules. Septembre 2010 47 / 72
COPULE MINMAX. En résolvant : C (m,m) (F m (x), F M (y)) = F (m,m) (x, y), DÉFINITION COPULE MINMAX : [ ] v v 1 n + (1 u) 1 n 1 n 1, si 1 (1 u) n < v 1 n, C (m,m) (u, v) = v, si 1 (1 u) 1 n v 1 n. RELATION AVEC CLAYTON Pour α = 1/n : v C (m,m) (1 u, v) = Cα Clayton (u, v). A. Popier (Le Mans) Copules. Septembre 2010 47 / 72
COPULES GAUSSIENNES. NOTATIONS : φ : fonction de répartition de la loi normale N (0, 1) ; Φ ρ : distribution ( du vecteur ) gaussien (X, Y ) centré de matrice de 1 ρ covariance : ρ 1 x y [ 1 Φ ρ (x, y) = 2π (1 ρ 2 ) exp (s2 + t 2 ] 2ρst) 2(1 ρ 2 dsdt. ) DÉFINITION Copule gaussienne de paramètre ρ ] 1, 1[ : C ρ (u, v) = Φ ρ (φ 1 (u), φ 1 (v)). De loin la plus populaire (=Black-Scholes des copules!). C ρ W si ρ 1, C ρ C si ρ 0 et C ρ M si ρ 1. A. Popier (Le Mans) Copules. Septembre 2010 48 / 72
t-copules. DÉFINITION Loi t n de degré ν, de matrice de dispersion Σ, notée t n (ν, Σ), et définie par densité : t n (ν, Σ)(X) = Γ ( ) ν+n 2 Γ ( ν 2) (νπ) n det Σ ( 1 + X t Σ 1 ) ν+n 2 X. ν t ν : fonction de répartition de la loi t 1 de degré ν avec σ = 1 ; T n (ν, Σ) : fonction de répartition multivariée de t n (ν, Σ) ; X de loi t n (ν, Σ) si X = W Z avec Z N (0, Σ), ν/w χ 2 ν, W Z. W est une inverse gamma de paramètres (ν/2, ν/2) A. Popier (Le Mans) Copules. Septembre 2010 49 / 72
t-copules. DÉFINITION t-copule de corrélation ρ ] 1, 1[ et de degré de liberté ν : C ρ,ν (u, v) = Ici Σ = ( 1 ρ ρ 1 ). t 1 ν (u) t 1 ν (v) Très proches des gaussiennes, Γ ( ) ν+2 2 2πΓ ( ν 2) (1 ρ 2 ) [ 1 + (s2 + t 2 2ρst) ν(1 ρ 2 ) ] ν+2 2 dsdt. corrélations très fortes pour les mouvements de même signe. A. Popier (Le Mans) Copules. Septembre 2010 49 / 72
COPULES ET DENSITÉS. GAUSSIENNES : A. Popier (Le Mans) Copules. Septembre 2010 50 / 72
COPULES ET DENSITÉS. DE STUDENT : A. Popier (Le Mans) Copules. Septembre 2010 50 / 72
PLAN 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE MONTE CARLO Principe Simulation par inversion Vérifications 3 COPULES 2-DIMENSIONNELLES Fonctions de répartition bivariées Copules et théorème de Sklar Exemples 4 MESURER LA DÉPENDANCE 5 COPULES MULTI-DIMENSIONNELLES 6 GÉNÉRER DES VARIABLES CORRÉLÉES A. Popier (Le Mans) Copules. Septembre 2010 51 / 72
MESURE DE DÉPENDANCE. COEFFICIENTS DES COPULES : à quoi correspondent-ils? MESURE DE DÉPENDANCE : doit vérifier 1 Symétrie : δ(x, Y ) = δ(y, X). 2 Normalisation : 1 δ(x, Y ) 1. 3 Extrêmes : δ(x, Y ) = 1 (X, Y ) comonotone (copule M) ; δ(x, Y ) = 1 (X, Y ) contre-monotone (copule W ). 4 T : transformation monotone { δ(x, Y ) pour T croissante ; δ(t (X), Y ) = δ(x, Y ) pour T décroissante. A. Popier (Le Mans) Copules. Septembre 2010 52 / 72
COEFFICIENT DE CORRÉLATION. DÉFINITION Coefficient de corrélation appelé aussi Pearson s r : ρ(x, Y ) = Cov (X, Y ) σ X σ Y. n existe pas toujours. mesure de dépendance linéaire. Propriétés 1-2-3 : ok. Propriété 4 : invariance par transformations linéaires (pas pour des transformations monotones générales). PROPOSITION Si X Y, ρ(x, Y ) = 0. Réciproque fausse (sauf si (X, Y ) gaussien). A. Popier (Le Mans) Copules. Septembre 2010 53 / 72
V.A. CORRÉLÉES PAR COPULES GAUSSIENNES. EN FONCTION DE ρ : A. Popier (Le Mans) Copules. Septembre 2010 54 / 72
RANK CORRELATION ( CORRÉLATION DE RANG). DÉFINITION Spearman s ρ : ρ S (X, Y ) = ρ(f 1 (X), F 2 (Y )). Kendall s τ : τ K (X, Y ) = P((X 1 X 2 )(Y 1 Y 2 ) > 0) P((X 1 X 2 )(Y 1 Y 2 ) < 0) avec (X 1, Y 1 ), (X 2, Y 2 ) i.i.d. PROPOSITION ρ S (X, Y ) = 12 τ K (X, Y ) = 4 1 1 0 0 1 1 0 0 (C(u, v) uv)dudv, C(u, v)dc(u, v) 1. Et ρ S = τ K = 1 C = M, ρ S = τ K = 1 C = W. A. Popier (Le Mans) Copules. Septembre 2010 55 / 72
LIEN ENTRE CORRÉLATIONS ET PARAMÈTRES. REMARQUE GÉNÉRALE. Il n y a pas de lien simple entre les paramètres des copules et les mesures de corrélation! Farlie-Gumbel-Morgenstern (θ [ 1, 1]) : τ K = (2/9)θ, ρ S = θ/3. Gaussienne (ρ [ 1, 1]) : τ K = 2 π Arcsin (ρ) et ρ S = 6 Arcsin (ρ/2). π t-copule (ρ [ 1, 1], ν R +) : τ K = 2 π Arcsin (ρ). A. Popier (Le Mans) Copules. Septembre 2010 56 / 72
LIEN ENTRE CORRÉLATIONS ET PARAMÈTRES. REMARQUE GÉNÉRALE. Il n y a pas de lien simple entre les paramètres des copules et les mesures de corrélation! Archimédienne : τ K = 1 + 4 1 0 Clayton (θ R +) : τ K = θ θ+2 ; φ(t) φ (t) dt. Gumbel (θ [1, + [) : τ K = 1 1 θ ; Frank (θ R) : τ K = 1 4 1 D 1(θ) D k (x) = k x x 0 s k e s 1 θ ds (fonctions de Debye)., ρ S = 1 12 D 1(θ) D 2 (θ) θ, avec A. Popier (Le Mans) Copules. Septembre 2010 56 / 72
LIEN ENTRE CORRÉLATIONS ET PARAMÈTRES. REMARQUE GÉNÉRALE. Il n y a pas de lien simple entre les paramètres des copules et les mesures de corrélation! MinMax : τ = 1 2n 1, ρ = 3 12n C n 2n n i=0 ( 1) i 2n i Cn+k 2n + 12( 1) n (n!)3 (3n)!. A. Popier (Le Mans) Copules. Septembre 2010 56 / 72
DÉPENDANCE DES QUEUES DE DISTRIBUTION. DÉFINITION Soit X et Y v.a. avec fonction de répartition F X et F Y. Coefficients de dépendance à gauche et à droite (upper and lower dependency) : ( ) λ L = lim P Y F 1 1 u 0 Y (u) X FX (u), ( ) λ U = lim P Y > F 1 1 u 1 Y (u) X > FX (u). Si λ L 0 (resp. λ U 0), les queues de distribution de X et Y sont asymptotiquement dépendantes à gauche (resp. à droite). PROPOSITION C(u, u) 1 + C(u, u) 2u λ L = lim, λ U = lim. u 0 u u 1 1 u A. Popier (Le Mans) Copules. Septembre 2010 57 / 72
EXEMPLES. COPULES EXTRÊMES : pour M, λ L = λ U = 1, pour W, λ L = λ U = 0. FARLIE-GUMBEL-MORGENSTERN : λ L = λ U = 0. GAUSSIENNES : λ L = λ U = 0. t-copules : λ L = λ U = 2 2t ν+1 ( CLAYTON : λ U = 0, λ L = (1/2) 1/θ. GUMBEL : λ L = 0, λ U = 2 2 1/θ. MINMAX : en exercice. ) (ν + 1)(1 ρ). 1 + ρ A. Popier (Le Mans) Copules. Septembre 2010 58 / 72
PLAN 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE MONTE CARLO Principe Simulation par inversion Vérifications 3 COPULES 2-DIMENSIONNELLES Fonctions de répartition bivariées Copules et théorème de Sklar Exemples 4 MESURER LA DÉPENDANCE 5 COPULES MULTI-DIMENSIONNELLES 6 GÉNÉRER DES VARIABLES CORRÉLÉES A. Popier (Le Mans) Copules. Septembre 2010 59 / 72
DÉFINITIONS. DÉFINITION Soit X = (X 1,..., X n ) vecteur aléatoire à valeurs dans R n. La loi de X est caractérisée par F(x) = P(X i x i, i = 1,..., n), x = (x 1,..., x n ) R n. F est la fonction de répartition multivariée de X. Lois marginales ou marginales de X : lois des X i prises séparément. Décrites par : F i (x i ) = P(X i x i ) = lim x j +, j i F(x) = F(+,..., +, x i, +,..., + ). A. Popier (Le Mans) Copules. Septembre 2010 60 / 72
PROPRIÉTÉS. F est continue à droite. lim F(x 1, x 2,..., x n ) = 0 pour tout i = 1,..., n. x i + lim F(x 1,..., x n ) = 1. x i +, i F is n-croissante : si a k b k pour tout k, et si H = [a 1, b 1 ]... [a n, b n ], alors V F (H) = sgn (c)f(c) 0, la somme étant prise sur les sommets de H, avec { 1 si ck = a sgn (c) = k pour un nombre pair de sommets; 1 si c k = a k pour un nombre impair de sommets. A. Popier (Le Mans) Copules. Septembre 2010 61 / 72
BORNES DE FRÉCHET-HOEFFDING. THÉORÈME Si F est une fonction de répartition multivariée de marginales F i, alors pour tout x R n, ( n ) max F i (x i ) n + 1, 0 = W (x) F(x) ATTENTION! i=1 M(x) = min(f 1 (x 1 ),..., F n (x n )). M est toujours une fonction de répartition multivariée. W ne l est a priori que si n = 2. A. Popier (Le Mans) Copules. Septembre 2010 62 / 72
COPULE : DÉFINITION. DÉFINITION On appelle copule (de dimension n ou n-dimensionnelle) toute fonction de répartition multivariée C ayant pour marginales la loi uniforme sur [0, 1]. Autrement dit, C vérifie les quatre propriétés d une fonction de répartition multivariée avec en plus : C(x) = 0 si x i 0 pour au moins un i, C(x) = 1 si x i 1 pour tout i, C i (x i ) = x i pour tout i. REMARQUE Il suffit de définir C sur [0, 1] n! A. Popier (Le Mans) Copules. Septembre 2010 63 / 72
THÉORÈME DE SKLAR. THÉORÈME 1 Si C est une copule n-dimensionnelle, si F i sont n fonctions de répartition, alors F(x) = C(F 1 (x 1 ),..., F n (x n )) est une fonction de répartition multivariée, ayant F i pour marginales. 2 Soit F une fonction de répartition multivariée de marginales F i. Il existe une copule C telle que pour tout x R n : F(x) = C(F 1 (x 1 ),..., F n (x n )). Si de plus les F i sont continues, C est unique. REMARQUE En général C n est unique que sur le produit des images des F i. A. Popier (Le Mans) Copules. Septembre 2010 64 / 72
PROPRIÉTÉS DES COPULES. 1 Toute copule C satisfait : u = (u 1,..., u n ) [0, 1] n ( n ) W (u) = max u i + n 1, 0 i=1 C(u) min(u i ) = M(u). i 2 W n est pas une copule si n 3. M en est toujours une. 3 C (u) = i u i : composantes indépendantes. 4 Si X est distribuée suivant F et si C est de classe C n, alors la densité de X est : f (x 1,..., x n ) = n C u 1... u n (F 1 (x 1 ),..., F n (x n )) n f i (x i ). i=1 A. Popier (Le Mans) Copules. Septembre 2010 65 / 72
EXEMPLES. COPULES ARCHIMÉDIENNNES : soit φ strictement décroissante et convexe de [0, 1] dans [0, + ]. C(u) = φ 1 (φ(u 1 ) + φ(u 2 ) +... + φ(u n )). Exemples : Clayton, Frank, Gumbel, etc. COPULES GAUSSIENNES : φ : fonction de répartition de la loi normale N (0, 1) ; Φ Σ : distribution d un vecteur gaussien centré de matrice de covariance Σ. C Γ (u) = Φ Σ (φ 1 (u 1 ),..., φ 1 (u n )). t-copules : t ν : fonction de répartition de la loi t 1 (ν, 1) ; T n (ν, Σ) fonction de répartition de la loi t n (ν, Σ) Σ : matrice de covariance ; C ν,σ (u) = T n (ν, Σ)(tν 1 (u 1 ),..., tν 1 (u n )). A. Popier (Le Mans) Copules. Septembre 2010 66 / 72
PLAN 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE MONTE CARLO Principe Simulation par inversion Vérifications 3 COPULES 2-DIMENSIONNELLES Fonctions de répartition bivariées Copules et théorème de Sklar Exemples 4 MESURER LA DÉPENDANCE 5 COPULES MULTI-DIMENSIONNELLES 6 GÉNÉRER DES VARIABLES CORRÉLÉES A. Popier (Le Mans) Copules. Septembre 2010 67 / 72
PRINCIPE. 1 Choisir une copule C de dimension n et des marginales F 1,..., F n. 2 Générer U 1,..., U n, toutes uniformes sur [0, 1], via la copule C. Les v.a. U i sont donc corrélées. 3 Poser X i = F 1 i (U i ). Chaque X i a la loi marginale souhaitée, et les (X i ) 1 i n sont corrélés. REMARQUE. Les coefficients de corrélation linéaires des X i peuvent être très différents de ceux de la copule C. En revanche le ρ S et le τ K ne dépendent que de C. MATLAB La Statistics Toolbox connaît cinq types de copules : gaussienne, t, Clayton, Gumbel, Frank. A. Popier (Le Mans) Copules. Septembre 2010 68 / 72
GÉNÉRER DES COPULES. PAR MÉLANGE : une somme convexe de copules est une copule. Hu (2004) : sur indices (S&P 500, FTSE, Nikkei, Hang Seng). Combinaison convexe de gaussienne, de Gumbel, et de Gumbel Survival : C(u, v) = u + v 1 + C Gumbel (1 u, 1 v). Oakes (1982), Wang (2003) : occurence d un choc ou d un désastre. Très lié à l assurance-vie. Li (2000), etc. : risque de crédit. A. Popier (Le Mans) Copules. Septembre 2010 69 / 72
COPULES ARCHIMÉDIENNES. MÉTHODE 1 Générer R et S uniformes sur [0, 1] et indépendantes. 2 Résoudre S = T φ(t ) φ (T ), inconnue T. 3 Poser U = φ 1 (Rφ(T )), V = φ 1 ((1 R)φ(T )). PROPOSITION U et V sont uniformes sur [0, 1] et leur copule est archimédienne donnée par φ. EXEMPLE φ(u) = (u 1 1) θ, θ > 0. A. Popier (Le Mans) Copules. Septembre 2010 70 / 72
EXTENSION EN DIMENSION n. MÉTHODE 1 Simuler n v.a. i.i.d. V 1,..., V n uniformes sur [0, 1]. 2 Pour k = 1, 2,..., n 1, poser S k = V 1/k k. 3 Trouver la solution (d inconnue T ) de : V n = F(T ). 4 Poser U 1 = φ 1 (S 1... S n 1 φ(t )), U n = φ 1 ((1 S n 1 )φ(t )) et pour k = 2,..., n 1 : U k = φ 1 (1 S k 1 ) Avec φ 1(n) dérivée n-ième de φ 1 et F(t) = n 1 j=k S j φ(t ). 1 t φ 1(n) (x)[φ(x)] n 1 φ (x)dx. (n 1)! 0 A. Popier (Le Mans) Copules. Septembre 2010 71 / 72
COPULES GAUSSIENNES ET t-copules. V.A. GAUSSIENNES CORRÉLÉES : Γ R n n matrice de covariance. 1 Calculer A racine de Γ : Γ = AA T. 2 Générer n v.a. i.i.d. Z i, i = 1,..., n de loi N (0, 1). Z = (Z 1,..., Z n ). 3 Poser X = AZ T. LEMME X est un vecteur gaussien, de dimension n, centré et de matrice de covariance Γ. COPULES GAUSSIENNES : U i = N (X i ) avec N fonction de répartition de la loi N (0, 1) (normcdf en Matlab). A. Popier (Le Mans) Copules. Septembre 2010 72 / 72
COPULES GAUSSIENNES ET t-copules. V.A. GAUSSIENNES CORRÉLÉES : Γ R n n matrice de covariance. 1 Calculer A racine de Γ : Γ = AA T. 2 Générer n v.a. i.i.d. Z i, i = 1,..., n de loi N (0, 1). Z = (Z 1,..., Z n ). 3 Poser X = AZ T. LEMME X est un vecteur gaussien, de dimension n, centré et de matrice de covariance Γ. t-copules : 1 Générer une v.a.r. S de loi χ 2 ν. 2 Poser Y = ν S X. 3 Calculer U i = T (Y i ), avec T fonction de répartition de la loi t de Student (tcdf en Matlab). A. Popier (Le Mans) Copules. Septembre 2010 72 / 72