Détection de ruptures offline et online pour des processus causaux Travaux avec W. Kengne (Paris 1, Yaoundé) et O. Wintenberger (Paris IX) Jean-Marc Bardet bardet@univ-paris1.fr Trimestre du Laboratoire de Mathématique de Besançon 5 mai 2014 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 1 / 49
Un exemple Breaks detection analysis of the FTSE index Close -0.10-0.05 0.00 0.05 0.10 0 200 400 600 800 1000 1200 1400 Time Log-return de l indice FTSE à la cloture: du 27 juillet 2005 au 18 mars 2011 = n = 1428. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 2 / 49
But de l étude Deux cadres pour notre étude: Cadre offline (X 1,, X n ) trajectoire observée d une série chronologique (X t ) t Z. (X 1,, X n ) admet un nombre K 1, inconnu, de changements: pour k = 1,..., K, X t = g θk (ξ t, X t 1, X t 2, ) pour t {t k 1 + 1, t k 1 + 2,..., t k } avec (t k ) k et (θ k ) k inconnus Objectif: Estimer K, (t k ) 1 k K 1 et (θ k ) 1 k K. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 3 / 49
But de l étude (fin) Cadre online (X 1,, X n ) trajectoire observée d une série chronologique (X t ) t Z, X t = g θ0 (ξ t, X t 1, X t 2, ) On observe ensuite (X 1,, X n, X n+1,, X k ) et il peut exister k > n et θ 1 tels que: avec k et θ 1 inconnus X t = g θ1 (ξ t, X t 1, X t 2, ) pour t k Objectif: Tester s il y a changement (θ 1 θ 0 ) et estimer k, et θ 0 et θ 1. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 4 / 49
Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 5 / 49
Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 6 / 49
Modèles classiques Avec (ξ t ) t Z une suite de v.a.i.i.d. centrées, ARMA(1, 1) X t = a + bx t 1 + cξ t 1 + ξ t GARCH(1, 1), Engle (1982) { Xt = σ t ξ t, σ 2 t = b 0 + b 1 X 2 t 1 + c 1σ 2 t 1, b 0, b 1, c 1 > 0. 10 30 5 20 10 0 0 5 10 10 20 15 0 200 400 600 800 1000 30 0 200 400 600 800 1000 ARMA(1, 1) GARCH(1, 1) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 7 / 49
Processus ARMA et processus linéaires causaux Avec (ξ t ) t Z une suite de v.a.i.i.d. centrées, p q Processus ARMA(p, q) X t + a i X t i = ξ t + b i ξ t i Processus AR( ) X t = = X t = i=1 i=1 a i X t i + ξ t i=1 b i ξ t i sous certaines conditions. i=0 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 8 / 49
Processus GARCH(p, q) et ARCH( ) Processus GARCH(p, q), (Bollersev, { 1986) Xt = σ t ξ t, σt 2 = b 0 + p j=1 b jxt j 2 + q j=1 c jξt j 2 Processus ARCH( ), (Robinson, 1991) { Xt = σ t ξ t, σ 2 t = b 0 + j=1 b jx 2 t j. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 9 / 49
Extensions Processus TGARCH( ), (Zakoïan, 1994) X t = σ t ξ t, σ t = b 0 + [ ] b + j max(x t j, 0) b j min(x t j, 0) j=1 avec b 0, b + j, b j 0 pour tout j N. Processus GARCH(p, q) et ARCH( ) multidimensionels, (Jeantheau, 1998, Bardet et Wintenberger, 2009) X t = ( B 0 + ) 1/2ξt B j X t j X t jb j, j=1 où (ξ k ) k Z sont des vecteurs aléatoires, B j matrices positives. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 10 / 49
Deux exemples d estimation On suppose que (X 1, X 2,, X n ) est observée. Pour un processus GARCH(p, q), comment estimer θ = (b 0, b 1,, b p, c 1,, c q )? Pour un processus ARCH( ), comment estimer θ = (λ, µ) avec b j = λ µ j? Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 11 / 49
Principe de l estimation par maximum de la quasi-vraisemblance Soit (X t ) t un processus GARCH(1, 1): X t = ( b 0 1 c 1 + b 1 j=1 = c j 1 1 X 2 t j) 1/2ξt. { Xt = σ t ξ t, σ 2 t = b 0 + b 1 X 2 t 1 + c 1 σ2 t 1 Si (ξ t ) t v.a.i.i.d. N (0, 1) avec θ = (b 0, b 1, c 1 ), la log-vraisemblance conditionnelle est: L n (θ) = n q t (θ) avec t=1 q t(θ) = 1 [( b0 ) 1X ( + b 1 c j 1 1 X 2 2 b0 t j t +log +b 1 2 1 c 1 1 c 1 j=1 = L n (θ) dépend de (X t ) t 0 : inconnu!! j=1 )] c j 1 1 Xt j 2 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 12 / 49
Principe de l estimation par maximum de la quasi-vraisemblance (fin) Idée: remplacer q t (θ) par q t (θ) avec q t(θ) = 1 2 [( b0 t 1 + b 1 1 c 1 j=1 ) 1X ( c j 1 1 Xt j 2 2 b0 t 1 t + log + b 1 1 c 1 Définir le QMLE θ n = arg max Ln (θ) avec L n (θ) = θ Θ Calculer θ n même si (ξ t ) t n est pas gaussienne. Etendre ce principe à d autres modèles? j=1 n q t (θ). t=1 Consistence du QMLE θ n vers le vrai paramètre θ? Normalité asymptotique du QMLE? )] c j 1 1 Xt j 2 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 13 / 49
Une classe générale de processus causaux (X t ) t Z est un processus défini comme solution de: Classe M T (M θ, f θ ) X t = M θ (X t 1, X t 2,...) ξ t + f θ (X t 1, X t 2,...), t T, p.s.. M θ (X t 1, X t 2,...) et f θ (X t 1, X t 2,...) dépendent de θ; (ξ t ) t Z suite de v.a.i.i.d. i.i.d. telles que Eξ 0 = 0, E ( ξ 0 ) 2 = 1 et E ξ0 r < avec r 2; Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 14 / 49
Existence et stationnarité X t = M θ (X t 1, X t 2,...) ξ t + f θ (X t 1, X t 2,...), t Z, On suppose que f θ et M θ vérifient des conditions lipschitzienne: { f θ (x) f θ (y) j=1 α(0) j (f θ, θ) x j y j M θ (x) M θ (y) j=1 α(0) j (M θ, θ) x j y j. On définit l ensemble / Θ(r) = θ Rd j=1 α (0) j (f θ, θ) + ( E( ξ 0 r ) ) 1/r j=1 j (M θ, θ) < 1. α (0) Proposition Si θ Θ(r) avec r 1, il existe un unique processus solution (X t ) t T, causal qui est strictement stationnaire, ergodique et stationnaire d ordre r. ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 15 / 49
Estimateur QML fθ t = f θ(x t 1, X t 2,...), Mθ t = M θ(x t 1, X t 2,...), Hθ t = Mt θ Mt θ, q t (θ) = 1 2 [ (Xt f t θ ) ( ) H t 1 ( θ Xt fθ t ) ( ( )) ] + log det H t θ. Soit f t θ = f θ(x t 1,..., X 1, 0, ), M t θ = M θ(x t 1,..., X 1, 0, ) et Ĥ t θ = M t θ ( M t θ ), alors q t (θ) est telle que q t (θ) = 1 2[ (Xt f t θ ) (Ĥt ) 1 ( θ Xt f θ t ) ( (Ĥt )) ] + log det θ. On définit le QMLE θ n = arg min Ln (θ) avec L n (θ) = θ Θ n q t (θ). t=1 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 16 / 49
Comportement asymptotique du QMLE Dans Bardet et Wintenberger (2009), on montre que Si r 2 et certaines conditions, θ n a.s. n θ Si r 4 et certaines conditions, n ( θn θ ) D N ( 0, G(θ ) ) n (en particulier on suppose qu il existe l > 2 tel que pour i = 0, 1, 2 et j N, α (i) j (f θ, Θ) + α (i) j (M θ, Θ) = O(j l ) ) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 17 / 49
Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 18 / 49
Le problème de détection de ruptures Le problème de détection de ruptures multiples est le suivant: X t M Tk (f θ k, M θ k ) for t T k := {t k 1 + 1,..., t k } (1) (X 1,, X n ) est observée; tk = [n τ k ] pour k = 1,..., K avec τ0 = 0 < τ 1 < < τ K = 1 ; θk θ k+1 pour k = 1,..., K 1; f θ, M θ sont connues, K, (τk ) k, (θk ) k et la loi de ξ sont inconnus. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 19 / 49
Quelques références sur le sujet Davis et al. (1995): détection de ruptures pour les processus AR; Lavielle et Moulines (2000) : détection de ruptures dans la moyenne de processus par contraste des moindres carrés; Lavielle and Ludena (2000): détection de ruptures dans la densité spectrale de processus longue-mémoire par contraste de Whittle; Kokoszka and Leipus (2000): détection de ruptures dans des processus ARCH; Davis et al. (2008): Détection par MDE pour une classe de processus non-linéaires. Remarque: tous ses papiers supposent l indépendance et la stationnarité des processus de chaque côté d une rupture. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 20 / 49
Définition d un contraste pénalisé Pour K, t, θ fixé, on définit le contraste pénalisé Ĵn par: Ĵ n (K, t, θ) = K QLIK({t k 1 + 1,..., t k }, θ k ) + κ n K, k=1 avec κ n (n ) et QLIK({t k 1 + 1,..., t k }, θ k ) := t k t=t k 1 +1 QLIK est le contraste de quasi-vraisemblance ( Xt f θ t ) (Ĥt ) 1 ( k θk Xt f θ t ) ( (Ĥt )) k + log det θk. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 21 / 49
Définition des estimateurs On définit les estimateurs ( K, t n, θ n ) de (K, t, θ ) par: ( K, t n, θ n ) := Argmin (K,t,θ) {0,...,K max } F K Θ K Ĵ n (K, t, θ) et l estimateur des τ est: τ n = t n n. Remarque: si K et t sont connus alors θ n est le QMLE de θ. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 22 / 49
Convergence Théorème Si r 2, K max K et certaines conditions: ( K n, τ n, θ n ) P n (K, τ, θ ). ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 23 / 49
Vitesses de convergence Théorème Si r 4, K max K et certaines conditions: lim δ lim P( t n n t m > δ) = 0. Théorème Si r 4, K max K, d autres conditions et si κ n = n, alors pour tout j = 1,, K, nj ( θn ( T j ) θj ) D N ( d 0, G(θ n j ) ), ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 24 / 49
Simulations de processus AR(1) X t = θ k X t 1 + ξ t for t T k. Pour n = 500 et n = 1000, (X 1,, X n ) est simulé avec: scenario A 0 : θ (1) = 0.5 est constant (K = 1); scenario A 1 : θ (1) = 0.5 change de θ (2) = 0.2 à t = 0.5n (K = 2); scenario A 2 : θ (1) = 0.7 change de θ (2) = 0.9 à t = 0.5n (K = 2); scenario A 3 : θ (1) = 0.5 change de θ (2) = 0.3 à t1 = 0.3n qui change de θ (3) = 0.7 à t2 = 0.7n (K = 3); scenario A 4 : θ (1) = 0.7 change de θ (2) = 0.9 à t1 = 0.3n qui change de θ (3) = 0.6 à t2 = 0.7n (K = 3). Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 25 / 49
Résultats pour des simulations de processus AR(1) Modèle Kn = K K n < K K n > K scenario A 0 n = 500 κ n = ˆκ n 0.74 0.00 0.26 (K = 1) κ n = log n 0.50 0.00 0.50 κ n = n 0.94 0.00 0.06 MDL procedure 0.95 0.00 0.05 n = 1000 κ n = ˆκ n 0.81 0.00 0.20 κ n = log n 0.43 0.00 0.57 κ n = n 1.00 0.00 0.00 MDL procedure 0.97 0.00 0.03 scenario A 1 n = 500 κ n = ˆκ n 0.52 0.06 0.42 (K = 2) κ n = log n 0.40 0.04 0.56 κ n = n 0.23 0.77 0.00 MDL procedure 0.44 0.56 0.00 n = 1000 κ n = ˆκ n 0.78 0.00 0.22 κ n = log n 0.40 0.00 0.60 κ n = n 0.38 0.62 0.00 MDL procedure 0.87 0.13 0.00 scenario A 2 n = 500 κ n = ˆκ n 0.48 0.00 0.52 (K = 2) κ n = log n 0.17 0.00 0.83 κ n = n 0.29 0.71 0.00 MDL procedure 0.56 0.44 0.00 n = 1000 κ n = ˆκ n 0.76 0.00 0.24 κ n = log n 0.06 0.00 0.94 κ n = n 0.57 0.43 0.00 Jean-Marc Bardet, SAMM, Université Paris 1 MDL (Trimestre Ruptures procedure pour Laboratoire processusdecausaux 0.89 Mathématique de0.07 Besançon 5 mai 0.04 2014 ) 26 / 49
Résultats pour des simulations de processus AR(1) Modèle Kn = K K n < K K n > K scenario A 3 n = 500 κ n = ˆκ n 0.45 0.32 0.23 (K = 3) κ n = log n 0.37 0.26 0.37 κ n = n 0.00 1.00 0.00 MDL procedure 0.01 0.99 0.00 n = 1000 κ n = ˆκ n 0.61 0.13 0.26 κ n = log n 0.39 0.00 0.61 κ n = n 0.00 1.00 0.00 MDL procedure 0.20 0.80 0.00 scenario A 4 n = 500 κ n = ˆκ n 0.53 0.12 0.35 (K = 3) κ n = log n 0.28 0.06 0.66 κ n = n 0.04 0.96 0.00 MDL procedure 0.09 0.91 0.00 n = 1000 κ n = ˆκ n 0.75 0.00 0.25 κ n = log n 0.12 0.00 0.88 κ n = n 0.06 0.94 0.00 MDL procedure 0.54 0.46 0.00 Table : Fréquence du nombre estimé de ruptures pour 100 réplications de AR(1) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 27 / 49
Une procédure pour choisir une valeur adaptative de κ n Problème: si n n est pas très grand (typiquement n = 1000), K n n estime pas bien K avec un choix théorique a priori de κ n (typiquement κ n = n). = Choix adaptatif de κ n suivant une procédure de sélection de modèle (Lebarbier, 2005 Baudry et al., 2009, Arlot, 2009) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 28 / 49
Choix adaptatif de κ n a-) Slope estimation when n=500 b-) Slope estimation when n=1000 -QLIK criteria -1420-1400 -1380-1360 -QLIK criteria -2780-2760 -2740-2720 2 4 6 8 10 12 14 K 2 4 6 8 10 12 14 K L heuristique de la pente pour un processus AR(1): n = 500, κ n 2 4.3 8.6 et n = 1000, κ n 2 5 10 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 29 / 49
Simulations: estimation de K a-) Penalized QLIK criteria when n=500 b-) Penalized QLIK criteria when n=1000 Penalized QLIK criteria 1440 1450 1460 1470 1480 Penalized QLIK criteria 2810 2830 2850 2 4 6 8 10 12 14 K 2 4 6 8 10 12 14 K Le critère QLIK pénalisé pour un processus AR(1) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 30 / 49
Exemple d utilisation de κ n pour un processus AR(1) avec 2 ruptures a-) 500 observations of AR(1) with two breaks b-) 1000 observations of AR(1) with two breaks -4-2 0 2-3 -2-1 0 1 2 3 0 100 200 300 400 500 Time 0 200 400 600 800 1000 Time Processus AR(1) (n = 500 and n = 1000) avec: τ 1 = 0.3 et τ 2 = 0.7, θ 0 = 0.2, θ 1 = 0.4 et θ 2 = 0.25 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 31 / 49
Simulations for AR(2) process X t = φ 1(k) X t 1 + φ 2(k) X t 2 + ξ t pour t T k. Avec θ (k) = (φ 1 (k), φ 2 (k)), (X 1,, X n ) est simulé avec: scenario B 0 : θ (1) = (0.4, 0.3) est constant (K = 1); scenario B 1 : θ (1) = (0.4, 0.3) change en θ (2) = (0.1, 0.3) à t = 0.5n (K = 2); scenario B 1 : θ (1) = (0.4, 0.3) change en θ (2) = (0.2, 0.5) à t = 0.5n (K = 2); scenario B 2 : θ (1) = (0.4, 0.3) change en θ (2) = (0.6, 0.1) à t = 0.5n (K = 2). Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 32 / 49
Résultats de simulations pour des processus AR(2) Model Kn = K K n < K K n > K scenario B 0 n = 500 κ n = ˆκ n 0.61 0.00 0.39 (K = 1) κ n = log n 0.08 0.00 0.92 κ n = n 0.94 0.00 0.06 MDL procedure 0.92 0.00 0.08 n = 1000 κ n = ˆκ n 0.79 0.00 0.21 κ n = log n 0.06 0.00 0.94 κ n = n 0.98 0.00 0.02 MDL procedure 0.97 0.00 0.03 scenario B 1 n = 500 κ n = ˆκ n 0.57 0.15 0.28 (K = 2) κ n = log n 0.09 0.01 0.90 κ n = n 0.10 0.90 0.00 MDL procedure 0.11 0.89 0.00 n = 1000 κ n = ˆκ n 0.78 0.08 0.14 κ n = log n 0.05 0.00 0.95 κ n = n 0.17 0.83 0.00 MDL procedure 0.24 0.76 0.00 scenario B 2 n = 500 κ n = ˆκ n 0.41 0.25 0.34 (K = 3) κ n = log n 0.08 0.03 0.89 κ n = n 0.07 0.93 0.00 MDL procedure 0.08 0.92 0.00 n = 1000 κ n = ˆκ n 0.75 0.08 0.17 κ n = log n 0.03 0.00 0.97 κ n = n 0.19 0.81 0.00 Jean-Marc Bardet, SAMM, Université Paris 1 MDL (Trimestre Ruptures procedure pour Laboratoire processusdecausaux 0.22 Mathématique de0.78 Besançon 5 mai 0.00 2014 ) 33 / 49
Simulations pour des processus GARCH(1, 1) X t = σ t Z t, σ 2 t = a 0(k) + a 1(k)X 2 t + b 1(k)σ 2 t for t T k. Avec θ = (a 0, a 1, b 1 ), (X 1,, X n ) est simulé avec: scenario G 0 : θ (1) = (0.5, 0.2, 0.2) est constant (K = 1); scenario G 1 : θ (1) = (0.5, 0.2, 0.2) change en θ (2) = (0.5, 0.2, 0.6) à t = 0.5n (K = 2); scenario G 2 : θ (1) = (0.5, 0.6, 0.2) change en θ (2) = (1, 0.6, 0.2) à t = 0.5n (K = 2); scenario G 3 : θ (1) = (0.5, 0.2, 0.2) change en θ (2) = (0.5, 0.2, 0.0) à t 1 = 0.3n, puis change en θ (3) = (0.1, 0.2, 0.0) à t 2 = 0.7n (K = 3); scenario G 4 : θ (1) = (0.5, 0.6, 0.2) change en θ (2) = (1, 0.6, 0.2) à t 1 = 0.3n, puis change en θ (3) = (1, 0.2, 0.2) à t 2 = 0.7n (K = 3). Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 34 / 49
Resultats de simulations pour des processus GARCH(1, 1) Model Kn = K K n < K K n > K scenario G 0 n = 500 κ n = ˆκ n 0.44 0.00 0.56 (K = 1) κ n = log n 0.00 0.00 1.00 κ n = n 0.58 0.00 0.42 MDL procedure 0.51 0.00 0.49 n = 1000 κ n = ˆκ n 0.60 0.00 0.40 κ n = log n 0.00 0.00 1.00 κ n = n 0.75 0.00 0.25 MDL procedure 0.63 0.00 0.37 scenario G 1 n = 500 κ n = ˆκ n 0.42 0.12 0.46 (K = 2) κ n = log n 0.00 0.00 1.00 κ n = n 0.52 0.05 0.00 MDL procedure 0.55 0.35 0.10 n = 1000 κ n = ˆκ n 0.65 0.00 0.35 κ n = log n 0.00 0.00 1.00 κ n = n 0.74 0.10 0.00 MDL procedure 0.67 0.09 0.24 scenario G 2 n = 500 κ n = ˆκ n 0.52 0.20 0.28 (K = 2) κ n = log n 0.00 0.00 1.00 κ n = n 0.39 0.44 0.17 MDL procedure 0.44 0.40 0.16 n = 1000 κ n = ˆκ n 0.56 0.10 0.34 κ n = log n 0.00 0.00 1.00 κ n = n 0.42 0.48 0.10 Jean-Marc Bardet, SAMM, Université Paris 1 MDL (Trimestre Ruptures procedure pour Laboratoire processusdecausaux 0.57 Mathématique de0.31 Besançon 5 mai 0.12 2014 ) 35 / 49
Model Kn = K K n < K K n > K scenario G 3 n = 500 κ n = ˆκ n 0.41 0.28 0.31 (K = 3) κ n = log n 0.00 0.00 1.00 κ n = n 0.40 0.60 0.00 MDL procedure 0.53 0.39 0.08 n = 1000 κ n = ˆκ n 0.70 0.26 0.04 κ n = log n 0.00 0.00 1.00 κ n = n 0.43 0.57 0.00 MDL procedure 0.59 0.37 0.04 scenario G 4 n = 500 κ n = ˆκ n 0.30 0.55 0.15 (K = 3) κ n = log n 0.00 0.00 1.00 κ n = n 0.08 0.90 0.02 MDL procedure 0.16 0.77 0.07 n = 1000 κ n = ˆκ n 0.53 0.29 0.18 κ n = log n 0.00 0.00 1.00 κ n = n 0.10 0.90 0.00 MDL procedure 0.27 0.66 0.07 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 36 / 49
Exemple de données financières Breaks detection analysis of the FTSE index Close -0.10-0.05 0.00 0.05 0.10 0 200 400 600 800 1000 1200 1400 Time Log-return de l indice FTSE à la cloture: du 27 juillet 2005 au 18 mars 2011 = n = 1428. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 37 / 49
Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 38 / 49
Le problème de détection de rupture online Le problème de détection de rupture online est le suivant: H 0 : θ 0 tel que (X n ) n N provient du modèle M N (M θ0, f θ0 ); H 1 : k > n et θ 0 θ 1 tels que (X n ) n N provient du modèle M {1,,k }(M θ0, f θ0 ) M {k, }(M θ1, f θ1 ) Objectifs: Choisir entre H 0 et H 1 pour chaque k > n Estimer θ 0 et θ 1. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 39 / 49
Quelques références sur le sujet Chu et al. (1996): Monitoring pour un changement structurel. Berkes et al. (2004): Détection CUSUM séquentielle for GARCH processes. Aue et al. (2009): Détection séquentielle de rupture multivariée. Naet al. (2011): Monitoring pour un changement de paramètre pour des séries chronologiques. Remarque: tous ces papiers supposent l indépendance des processus des 2 cotés du changement de régime Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 40 / 49
Définition du détecteur On définit pour k > n et l {n,, k 1}, Ĉ k,l := n k l k Ĝ(T 1,n ) 1/2 ( θ(tl,k ) θ(t 1,n ) ). Le détecteur est: Ĉ k := max l Π n,k Ĉ k,l, avec Π n,k := {n v n, n v n + 1,, k v n } où v n et v n / n 0. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 41 / 49
Comportement asymptotique du détecteur Pour c α > 0, on définit pour k > n le temps d arrêt: } τ(n) := Inf {k > n / Ĉk > c α. { } = P{τ(n) < } = P sup Ĉ k > c α k>n On choisit c α > tel que: { limn P H0 {τ(n) < } = α lim n P H1 {τ(n) < } = 1 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 42 / 49
Comportement asymptotique du détecteur (suite) Théorème Sous H 0 et les conditions du théorème de normalité asymptotique du QMLE, { lim P{τ(n) < } = P sup n sup t>1 1<s<t W d (s) sw d (1)) t où W d est un mouvement Brownien standard de dimension d. > c α } ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 43 / 49
Comportement asymptotique du détecteur (fin) Théorème Sous H 1 et les conditions du théorème de normalité asymptotique du QMLE, pour lim sup n k (n)/n < et k n = k (n) + n δ avec 1/2 < δ < 1, Ĉ kn a.s. n. En conséquence Corollary Sous les hypothèses du Théorème, lim P{τ(n) < } = 1. n ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 44 / 49
Deux exemples simulés a ) C k for GARCH(1,1) without change b ) C k for GARCH(1,1) with one change at k*=750 0.5 1.0 1.5 2.0 2.5 3.0 3.5 0 2 4 6 8 10 12 500 600 700 800 900 1000 500 600 700 800 900 1000 k GARCH(1,1), n = 500, k = 501,, 1000 a-) θ 0 = (0.01, 0.3, 0.2) b-) θ 0 = (0.01, 0.3, 0.2), θ 1 = (0.05, 0.5, 0.2) à k = 750 k Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 45 / 49
Simulations dn Mean SD Min Q 1 Med Q 3 Max AR(1) n = 500 ; k = n + 50 Ĉ k 54.74 14.95 18 44 54 64 103 Q k 53.78 14.72 16 43 54 63 102 n = 500 ; k = n + 250 Ĉ k 63.14 23.18 12 45 61 77 135 Q k 72.70 21.47 7 56 71.5 90 139 n = 1000 ; k = n + 50 Ĉ k 75.84 14.19 37 66 75 83 114 Q k 72.60 13.23 41 63 73 82 111 n = 1000 ; k = n + 250 Ĉ k 76.24 19.15 23 60 76 89 140 Q k 86.82 22.57 27 70 85 100 151 GARCH(1,1) n = 500 ; k = n + 50 Ĉ k 20.21 6.15 1 16 20 24 35 Q k 27.06 4.52 16 24 27 30 44 n = 500 ; k = n + 250 Ĉ k 25.53 8.04 3 20 25 31 50 Q k 35.40 10.01 13 28 35 41 62 n = 1000 ; k = n + 50 Ĉ k 28.43 7.41 6 24 28 33 51 Q k 36.98 5.09 21 33 37 40 48 n = 1000 ; k = n + 250 Ĉ k 31.16 8.52 4 26 33 39 53 Q k 44.35 10.04 14 37 45 50 71 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 46 / 49
Retour sur l exemple financier Breaks detection in the FTSE 100 Returns FTSE 100 0.10 0.05 0.00 0.05 0.10 t F,1 t F,2 t F,3 t F,4 t F,5 t F,6 2004 2005 2006 2007 2008 2009 2010 2011 2012 Time Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 47 / 49
Breaks detection in the FTSE 100 Returns FTSE 100 0.10 0.05 0.00 0.05 0.10 t F,1 t F,2 t F,3 t F,4 t F,5 t F,6 2004 2005 2006 2007 2008 2009 2010 2011 2012 Time Breaks detection analysis of the FTSE index Close -0.10-0.05 0.00 0.05 0.10 0 200 400 600 800 1000 1200 1400 Time Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 48 / 49
Références Bardet, J.-M. et Kengne, W. (2014). Monitoring procedure for parameter change in causal time series. Journal of Multi. Analysis Bardet, J.-M., Kengne, W. et Wintenberger, O. (2012). Detecting multiple change-points in general causal time series using penalized quasi-likelihood. Elect. Journal Statis. Bardet, J.-M. et Wintenberger, O. (2009). Asymptotic normality of the Quasi-Maximum Likelihood Estimator for multidimensional causal processes. Ann. Statist. Kengne, W. (2012). Testing for parameter constancy in general causal time series models. Journal of Time Series Analysis Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 49 / 49