Détection de ruptures offline et online pour des processus causaux



Documents pareils
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Travail en collaboration avec F.Roueff M.S.Taqqu C.Tudor

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Méthodes de Simulation

3 Approximation de solutions d équations

Probabilités III Introduction à l évaluation d options

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Econométrie pour la Finance

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Modèles et Méthodes de Réservation

NON-LINEARITE ET RESEAUX NEURONAUX

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Modèle GARCH Application à la prévision de la volatilité

Principe de symétrisation pour la construction d un test adaptatif

Texte Agrégation limitée par diffusion interne

2 TABLE DES MATIÈRES. I.8.2 Exemple... 38

Le modèle de Black et Scholes

Soutenance de stage Laboratoire des Signaux et Systèmes

Température corporelle d un castor (une petite introduction aux séries temporelles)

Équation de Langevin avec petites perturbations browniennes ou

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Chapitre 2 Le problème de l unicité des solutions

Finance, Navier-Stokes, et la calibration

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

3. Conditionnement P (B)

MODELE A CORRECTION D ERREUR ET APPLICATIONS

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Modélisation de séries financières par un modèle multifractal. Céline Azizieh

Projet de Traitement du Signal Segmentation d images SAR

Limites finies en un point

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Chapitre 7 : Intégration sur un intervalle quelconque

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Cours d analyse numérique SMI-S4

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

de calibration Master 2: Calibration de modèles: présentation et simulation d

Communications numériques

1 Définition de la non stationnarité

aux différences est appelé équation aux différences d ordre n en forme normale.

TD1 Signaux, énergie et puissance, signaux aléatoires

Correction du Baccalauréat S Amérique du Nord mai 2007

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Introduction à la statistique non paramétrique

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

CCP PSI Mathématiques 1 : un corrigé

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Cours 02 : Problème général de la programmation linéaire

De la mesure à l analyse des risques

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

Chapitre 3. Les distributions à deux variables

FIMA, 7 juillet 2005

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Introduction à l approche bootstrap

Tests exacts d indépendance sérielle dans les cas de distributions continues et discrètes

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

PRIME D UNE OPTION D ACHAT OU DE VENTE

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

I. Polynômes de Tchebychev

Statistiques descriptives

F411 - Courbes Paramétrées, Polaires

Le Modèle Linéaire par l exemple :


TABLE DES MATIERES. C Exercices complémentaires 42


Cours de méthodes de scoring

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Calcul différentiel sur R n Première partie

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Débouchés professionnels

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

L E Ç O N. Marches aléatoires. Niveau : Terminale S Prérequis : aucun

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux

Leçon 01 Exercices d'entraînement

MCMC et approximations en champ moyen pour les modèles de Markov

Économetrie non paramétrique I. Estimation d une densité

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Pierre Thérond Année universitaire

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Programmes des classes préparatoires aux Grandes Ecoles

Quantification Scalaire et Prédictive

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Résolution d équations non linéaires

Interception des signaux issus de communications MIMO

La théorie des anticipations de la structure par terme permet-elle de rendre compte de l évolution des taux d intérêt sur euro-devise?

Intérêt du découpage en sous-bandes pour l analyse spectrale

De la mesure à l analyse des risques

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Cours d Analyse. Fonctions de plusieurs variables

Transcription:

Détection de ruptures offline et online pour des processus causaux Travaux avec W. Kengne (Paris 1, Yaoundé) et O. Wintenberger (Paris IX) Jean-Marc Bardet bardet@univ-paris1.fr Trimestre du Laboratoire de Mathématique de Besançon 5 mai 2014 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 1 / 49

Un exemple Breaks detection analysis of the FTSE index Close -0.10-0.05 0.00 0.05 0.10 0 200 400 600 800 1000 1200 1400 Time Log-return de l indice FTSE à la cloture: du 27 juillet 2005 au 18 mars 2011 = n = 1428. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 2 / 49

But de l étude Deux cadres pour notre étude: Cadre offline (X 1,, X n ) trajectoire observée d une série chronologique (X t ) t Z. (X 1,, X n ) admet un nombre K 1, inconnu, de changements: pour k = 1,..., K, X t = g θk (ξ t, X t 1, X t 2, ) pour t {t k 1 + 1, t k 1 + 2,..., t k } avec (t k ) k et (θ k ) k inconnus Objectif: Estimer K, (t k ) 1 k K 1 et (θ k ) 1 k K. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 3 / 49

But de l étude (fin) Cadre online (X 1,, X n ) trajectoire observée d une série chronologique (X t ) t Z, X t = g θ0 (ξ t, X t 1, X t 2, ) On observe ensuite (X 1,, X n, X n+1,, X k ) et il peut exister k > n et θ 1 tels que: avec k et θ 1 inconnus X t = g θ1 (ξ t, X t 1, X t 2, ) pour t k Objectif: Tester s il y a changement (θ 1 θ 0 ) et estimer k, et θ 0 et θ 1. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 4 / 49

Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 5 / 49

Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 6 / 49

Modèles classiques Avec (ξ t ) t Z une suite de v.a.i.i.d. centrées, ARMA(1, 1) X t = a + bx t 1 + cξ t 1 + ξ t GARCH(1, 1), Engle (1982) { Xt = σ t ξ t, σ 2 t = b 0 + b 1 X 2 t 1 + c 1σ 2 t 1, b 0, b 1, c 1 > 0. 10 30 5 20 10 0 0 5 10 10 20 15 0 200 400 600 800 1000 30 0 200 400 600 800 1000 ARMA(1, 1) GARCH(1, 1) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 7 / 49

Processus ARMA et processus linéaires causaux Avec (ξ t ) t Z une suite de v.a.i.i.d. centrées, p q Processus ARMA(p, q) X t + a i X t i = ξ t + b i ξ t i Processus AR( ) X t = = X t = i=1 i=1 a i X t i + ξ t i=1 b i ξ t i sous certaines conditions. i=0 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 8 / 49

Processus GARCH(p, q) et ARCH( ) Processus GARCH(p, q), (Bollersev, { 1986) Xt = σ t ξ t, σt 2 = b 0 + p j=1 b jxt j 2 + q j=1 c jξt j 2 Processus ARCH( ), (Robinson, 1991) { Xt = σ t ξ t, σ 2 t = b 0 + j=1 b jx 2 t j. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 9 / 49

Extensions Processus TGARCH( ), (Zakoïan, 1994) X t = σ t ξ t, σ t = b 0 + [ ] b + j max(x t j, 0) b j min(x t j, 0) j=1 avec b 0, b + j, b j 0 pour tout j N. Processus GARCH(p, q) et ARCH( ) multidimensionels, (Jeantheau, 1998, Bardet et Wintenberger, 2009) X t = ( B 0 + ) 1/2ξt B j X t j X t jb j, j=1 où (ξ k ) k Z sont des vecteurs aléatoires, B j matrices positives. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 10 / 49

Deux exemples d estimation On suppose que (X 1, X 2,, X n ) est observée. Pour un processus GARCH(p, q), comment estimer θ = (b 0, b 1,, b p, c 1,, c q )? Pour un processus ARCH( ), comment estimer θ = (λ, µ) avec b j = λ µ j? Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 11 / 49

Principe de l estimation par maximum de la quasi-vraisemblance Soit (X t ) t un processus GARCH(1, 1): X t = ( b 0 1 c 1 + b 1 j=1 = c j 1 1 X 2 t j) 1/2ξt. { Xt = σ t ξ t, σ 2 t = b 0 + b 1 X 2 t 1 + c 1 σ2 t 1 Si (ξ t ) t v.a.i.i.d. N (0, 1) avec θ = (b 0, b 1, c 1 ), la log-vraisemblance conditionnelle est: L n (θ) = n q t (θ) avec t=1 q t(θ) = 1 [( b0 ) 1X ( + b 1 c j 1 1 X 2 2 b0 t j t +log +b 1 2 1 c 1 1 c 1 j=1 = L n (θ) dépend de (X t ) t 0 : inconnu!! j=1 )] c j 1 1 Xt j 2 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 12 / 49

Principe de l estimation par maximum de la quasi-vraisemblance (fin) Idée: remplacer q t (θ) par q t (θ) avec q t(θ) = 1 2 [( b0 t 1 + b 1 1 c 1 j=1 ) 1X ( c j 1 1 Xt j 2 2 b0 t 1 t + log + b 1 1 c 1 Définir le QMLE θ n = arg max Ln (θ) avec L n (θ) = θ Θ Calculer θ n même si (ξ t ) t n est pas gaussienne. Etendre ce principe à d autres modèles? j=1 n q t (θ). t=1 Consistence du QMLE θ n vers le vrai paramètre θ? Normalité asymptotique du QMLE? )] c j 1 1 Xt j 2 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 13 / 49

Une classe générale de processus causaux (X t ) t Z est un processus défini comme solution de: Classe M T (M θ, f θ ) X t = M θ (X t 1, X t 2,...) ξ t + f θ (X t 1, X t 2,...), t T, p.s.. M θ (X t 1, X t 2,...) et f θ (X t 1, X t 2,...) dépendent de θ; (ξ t ) t Z suite de v.a.i.i.d. i.i.d. telles que Eξ 0 = 0, E ( ξ 0 ) 2 = 1 et E ξ0 r < avec r 2; Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 14 / 49

Existence et stationnarité X t = M θ (X t 1, X t 2,...) ξ t + f θ (X t 1, X t 2,...), t Z, On suppose que f θ et M θ vérifient des conditions lipschitzienne: { f θ (x) f θ (y) j=1 α(0) j (f θ, θ) x j y j M θ (x) M θ (y) j=1 α(0) j (M θ, θ) x j y j. On définit l ensemble / Θ(r) = θ Rd j=1 α (0) j (f θ, θ) + ( E( ξ 0 r ) ) 1/r j=1 j (M θ, θ) < 1. α (0) Proposition Si θ Θ(r) avec r 1, il existe un unique processus solution (X t ) t T, causal qui est strictement stationnaire, ergodique et stationnaire d ordre r. ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 15 / 49

Estimateur QML fθ t = f θ(x t 1, X t 2,...), Mθ t = M θ(x t 1, X t 2,...), Hθ t = Mt θ Mt θ, q t (θ) = 1 2 [ (Xt f t θ ) ( ) H t 1 ( θ Xt fθ t ) ( ( )) ] + log det H t θ. Soit f t θ = f θ(x t 1,..., X 1, 0, ), M t θ = M θ(x t 1,..., X 1, 0, ) et Ĥ t θ = M t θ ( M t θ ), alors q t (θ) est telle que q t (θ) = 1 2[ (Xt f t θ ) (Ĥt ) 1 ( θ Xt f θ t ) ( (Ĥt )) ] + log det θ. On définit le QMLE θ n = arg min Ln (θ) avec L n (θ) = θ Θ n q t (θ). t=1 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 16 / 49

Comportement asymptotique du QMLE Dans Bardet et Wintenberger (2009), on montre que Si r 2 et certaines conditions, θ n a.s. n θ Si r 4 et certaines conditions, n ( θn θ ) D N ( 0, G(θ ) ) n (en particulier on suppose qu il existe l > 2 tel que pour i = 0, 1, 2 et j N, α (i) j (f θ, Θ) + α (i) j (M θ, Θ) = O(j l ) ) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 17 / 49

Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 18 / 49

Le problème de détection de ruptures Le problème de détection de ruptures multiples est le suivant: X t M Tk (f θ k, M θ k ) for t T k := {t k 1 + 1,..., t k } (1) (X 1,, X n ) est observée; tk = [n τ k ] pour k = 1,..., K avec τ0 = 0 < τ 1 < < τ K = 1 ; θk θ k+1 pour k = 1,..., K 1; f θ, M θ sont connues, K, (τk ) k, (θk ) k et la loi de ξ sont inconnus. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 19 / 49

Quelques références sur le sujet Davis et al. (1995): détection de ruptures pour les processus AR; Lavielle et Moulines (2000) : détection de ruptures dans la moyenne de processus par contraste des moindres carrés; Lavielle and Ludena (2000): détection de ruptures dans la densité spectrale de processus longue-mémoire par contraste de Whittle; Kokoszka and Leipus (2000): détection de ruptures dans des processus ARCH; Davis et al. (2008): Détection par MDE pour une classe de processus non-linéaires. Remarque: tous ses papiers supposent l indépendance et la stationnarité des processus de chaque côté d une rupture. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 20 / 49

Définition d un contraste pénalisé Pour K, t, θ fixé, on définit le contraste pénalisé Ĵn par: Ĵ n (K, t, θ) = K QLIK({t k 1 + 1,..., t k }, θ k ) + κ n K, k=1 avec κ n (n ) et QLIK({t k 1 + 1,..., t k }, θ k ) := t k t=t k 1 +1 QLIK est le contraste de quasi-vraisemblance ( Xt f θ t ) (Ĥt ) 1 ( k θk Xt f θ t ) ( (Ĥt )) k + log det θk. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 21 / 49

Définition des estimateurs On définit les estimateurs ( K, t n, θ n ) de (K, t, θ ) par: ( K, t n, θ n ) := Argmin (K,t,θ) {0,...,K max } F K Θ K Ĵ n (K, t, θ) et l estimateur des τ est: τ n = t n n. Remarque: si K et t sont connus alors θ n est le QMLE de θ. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 22 / 49

Convergence Théorème Si r 2, K max K et certaines conditions: ( K n, τ n, θ n ) P n (K, τ, θ ). ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 23 / 49

Vitesses de convergence Théorème Si r 4, K max K et certaines conditions: lim δ lim P( t n n t m > δ) = 0. Théorème Si r 4, K max K, d autres conditions et si κ n = n, alors pour tout j = 1,, K, nj ( θn ( T j ) θj ) D N ( d 0, G(θ n j ) ), ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 24 / 49

Simulations de processus AR(1) X t = θ k X t 1 + ξ t for t T k. Pour n = 500 et n = 1000, (X 1,, X n ) est simulé avec: scenario A 0 : θ (1) = 0.5 est constant (K = 1); scenario A 1 : θ (1) = 0.5 change de θ (2) = 0.2 à t = 0.5n (K = 2); scenario A 2 : θ (1) = 0.7 change de θ (2) = 0.9 à t = 0.5n (K = 2); scenario A 3 : θ (1) = 0.5 change de θ (2) = 0.3 à t1 = 0.3n qui change de θ (3) = 0.7 à t2 = 0.7n (K = 3); scenario A 4 : θ (1) = 0.7 change de θ (2) = 0.9 à t1 = 0.3n qui change de θ (3) = 0.6 à t2 = 0.7n (K = 3). Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 25 / 49

Résultats pour des simulations de processus AR(1) Modèle Kn = K K n < K K n > K scenario A 0 n = 500 κ n = ˆκ n 0.74 0.00 0.26 (K = 1) κ n = log n 0.50 0.00 0.50 κ n = n 0.94 0.00 0.06 MDL procedure 0.95 0.00 0.05 n = 1000 κ n = ˆκ n 0.81 0.00 0.20 κ n = log n 0.43 0.00 0.57 κ n = n 1.00 0.00 0.00 MDL procedure 0.97 0.00 0.03 scenario A 1 n = 500 κ n = ˆκ n 0.52 0.06 0.42 (K = 2) κ n = log n 0.40 0.04 0.56 κ n = n 0.23 0.77 0.00 MDL procedure 0.44 0.56 0.00 n = 1000 κ n = ˆκ n 0.78 0.00 0.22 κ n = log n 0.40 0.00 0.60 κ n = n 0.38 0.62 0.00 MDL procedure 0.87 0.13 0.00 scenario A 2 n = 500 κ n = ˆκ n 0.48 0.00 0.52 (K = 2) κ n = log n 0.17 0.00 0.83 κ n = n 0.29 0.71 0.00 MDL procedure 0.56 0.44 0.00 n = 1000 κ n = ˆκ n 0.76 0.00 0.24 κ n = log n 0.06 0.00 0.94 κ n = n 0.57 0.43 0.00 Jean-Marc Bardet, SAMM, Université Paris 1 MDL (Trimestre Ruptures procedure pour Laboratoire processusdecausaux 0.89 Mathématique de0.07 Besançon 5 mai 0.04 2014 ) 26 / 49

Résultats pour des simulations de processus AR(1) Modèle Kn = K K n < K K n > K scenario A 3 n = 500 κ n = ˆκ n 0.45 0.32 0.23 (K = 3) κ n = log n 0.37 0.26 0.37 κ n = n 0.00 1.00 0.00 MDL procedure 0.01 0.99 0.00 n = 1000 κ n = ˆκ n 0.61 0.13 0.26 κ n = log n 0.39 0.00 0.61 κ n = n 0.00 1.00 0.00 MDL procedure 0.20 0.80 0.00 scenario A 4 n = 500 κ n = ˆκ n 0.53 0.12 0.35 (K = 3) κ n = log n 0.28 0.06 0.66 κ n = n 0.04 0.96 0.00 MDL procedure 0.09 0.91 0.00 n = 1000 κ n = ˆκ n 0.75 0.00 0.25 κ n = log n 0.12 0.00 0.88 κ n = n 0.06 0.94 0.00 MDL procedure 0.54 0.46 0.00 Table : Fréquence du nombre estimé de ruptures pour 100 réplications de AR(1) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 27 / 49

Une procédure pour choisir une valeur adaptative de κ n Problème: si n n est pas très grand (typiquement n = 1000), K n n estime pas bien K avec un choix théorique a priori de κ n (typiquement κ n = n). = Choix adaptatif de κ n suivant une procédure de sélection de modèle (Lebarbier, 2005 Baudry et al., 2009, Arlot, 2009) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 28 / 49

Choix adaptatif de κ n a-) Slope estimation when n=500 b-) Slope estimation when n=1000 -QLIK criteria -1420-1400 -1380-1360 -QLIK criteria -2780-2760 -2740-2720 2 4 6 8 10 12 14 K 2 4 6 8 10 12 14 K L heuristique de la pente pour un processus AR(1): n = 500, κ n 2 4.3 8.6 et n = 1000, κ n 2 5 10 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 29 / 49

Simulations: estimation de K a-) Penalized QLIK criteria when n=500 b-) Penalized QLIK criteria when n=1000 Penalized QLIK criteria 1440 1450 1460 1470 1480 Penalized QLIK criteria 2810 2830 2850 2 4 6 8 10 12 14 K 2 4 6 8 10 12 14 K Le critère QLIK pénalisé pour un processus AR(1) Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 30 / 49

Exemple d utilisation de κ n pour un processus AR(1) avec 2 ruptures a-) 500 observations of AR(1) with two breaks b-) 1000 observations of AR(1) with two breaks -4-2 0 2-3 -2-1 0 1 2 3 0 100 200 300 400 500 Time 0 200 400 600 800 1000 Time Processus AR(1) (n = 500 and n = 1000) avec: τ 1 = 0.3 et τ 2 = 0.7, θ 0 = 0.2, θ 1 = 0.4 et θ 2 = 0.25 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 31 / 49

Simulations for AR(2) process X t = φ 1(k) X t 1 + φ 2(k) X t 2 + ξ t pour t T k. Avec θ (k) = (φ 1 (k), φ 2 (k)), (X 1,, X n ) est simulé avec: scenario B 0 : θ (1) = (0.4, 0.3) est constant (K = 1); scenario B 1 : θ (1) = (0.4, 0.3) change en θ (2) = (0.1, 0.3) à t = 0.5n (K = 2); scenario B 1 : θ (1) = (0.4, 0.3) change en θ (2) = (0.2, 0.5) à t = 0.5n (K = 2); scenario B 2 : θ (1) = (0.4, 0.3) change en θ (2) = (0.6, 0.1) à t = 0.5n (K = 2). Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 32 / 49

Résultats de simulations pour des processus AR(2) Model Kn = K K n < K K n > K scenario B 0 n = 500 κ n = ˆκ n 0.61 0.00 0.39 (K = 1) κ n = log n 0.08 0.00 0.92 κ n = n 0.94 0.00 0.06 MDL procedure 0.92 0.00 0.08 n = 1000 κ n = ˆκ n 0.79 0.00 0.21 κ n = log n 0.06 0.00 0.94 κ n = n 0.98 0.00 0.02 MDL procedure 0.97 0.00 0.03 scenario B 1 n = 500 κ n = ˆκ n 0.57 0.15 0.28 (K = 2) κ n = log n 0.09 0.01 0.90 κ n = n 0.10 0.90 0.00 MDL procedure 0.11 0.89 0.00 n = 1000 κ n = ˆκ n 0.78 0.08 0.14 κ n = log n 0.05 0.00 0.95 κ n = n 0.17 0.83 0.00 MDL procedure 0.24 0.76 0.00 scenario B 2 n = 500 κ n = ˆκ n 0.41 0.25 0.34 (K = 3) κ n = log n 0.08 0.03 0.89 κ n = n 0.07 0.93 0.00 MDL procedure 0.08 0.92 0.00 n = 1000 κ n = ˆκ n 0.75 0.08 0.17 κ n = log n 0.03 0.00 0.97 κ n = n 0.19 0.81 0.00 Jean-Marc Bardet, SAMM, Université Paris 1 MDL (Trimestre Ruptures procedure pour Laboratoire processusdecausaux 0.22 Mathématique de0.78 Besançon 5 mai 0.00 2014 ) 33 / 49

Simulations pour des processus GARCH(1, 1) X t = σ t Z t, σ 2 t = a 0(k) + a 1(k)X 2 t + b 1(k)σ 2 t for t T k. Avec θ = (a 0, a 1, b 1 ), (X 1,, X n ) est simulé avec: scenario G 0 : θ (1) = (0.5, 0.2, 0.2) est constant (K = 1); scenario G 1 : θ (1) = (0.5, 0.2, 0.2) change en θ (2) = (0.5, 0.2, 0.6) à t = 0.5n (K = 2); scenario G 2 : θ (1) = (0.5, 0.6, 0.2) change en θ (2) = (1, 0.6, 0.2) à t = 0.5n (K = 2); scenario G 3 : θ (1) = (0.5, 0.2, 0.2) change en θ (2) = (0.5, 0.2, 0.0) à t 1 = 0.3n, puis change en θ (3) = (0.1, 0.2, 0.0) à t 2 = 0.7n (K = 3); scenario G 4 : θ (1) = (0.5, 0.6, 0.2) change en θ (2) = (1, 0.6, 0.2) à t 1 = 0.3n, puis change en θ (3) = (1, 0.2, 0.2) à t 2 = 0.7n (K = 3). Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 34 / 49

Resultats de simulations pour des processus GARCH(1, 1) Model Kn = K K n < K K n > K scenario G 0 n = 500 κ n = ˆκ n 0.44 0.00 0.56 (K = 1) κ n = log n 0.00 0.00 1.00 κ n = n 0.58 0.00 0.42 MDL procedure 0.51 0.00 0.49 n = 1000 κ n = ˆκ n 0.60 0.00 0.40 κ n = log n 0.00 0.00 1.00 κ n = n 0.75 0.00 0.25 MDL procedure 0.63 0.00 0.37 scenario G 1 n = 500 κ n = ˆκ n 0.42 0.12 0.46 (K = 2) κ n = log n 0.00 0.00 1.00 κ n = n 0.52 0.05 0.00 MDL procedure 0.55 0.35 0.10 n = 1000 κ n = ˆκ n 0.65 0.00 0.35 κ n = log n 0.00 0.00 1.00 κ n = n 0.74 0.10 0.00 MDL procedure 0.67 0.09 0.24 scenario G 2 n = 500 κ n = ˆκ n 0.52 0.20 0.28 (K = 2) κ n = log n 0.00 0.00 1.00 κ n = n 0.39 0.44 0.17 MDL procedure 0.44 0.40 0.16 n = 1000 κ n = ˆκ n 0.56 0.10 0.34 κ n = log n 0.00 0.00 1.00 κ n = n 0.42 0.48 0.10 Jean-Marc Bardet, SAMM, Université Paris 1 MDL (Trimestre Ruptures procedure pour Laboratoire processusdecausaux 0.57 Mathématique de0.31 Besançon 5 mai 0.12 2014 ) 35 / 49

Model Kn = K K n < K K n > K scenario G 3 n = 500 κ n = ˆκ n 0.41 0.28 0.31 (K = 3) κ n = log n 0.00 0.00 1.00 κ n = n 0.40 0.60 0.00 MDL procedure 0.53 0.39 0.08 n = 1000 κ n = ˆκ n 0.70 0.26 0.04 κ n = log n 0.00 0.00 1.00 κ n = n 0.43 0.57 0.00 MDL procedure 0.59 0.37 0.04 scenario G 4 n = 500 κ n = ˆκ n 0.30 0.55 0.15 (K = 3) κ n = log n 0.00 0.00 1.00 κ n = n 0.08 0.90 0.02 MDL procedure 0.16 0.77 0.07 n = 1000 κ n = ˆκ n 0.53 0.29 0.18 κ n = log n 0.00 0.00 1.00 κ n = n 0.10 0.90 0.00 MDL procedure 0.27 0.66 0.07 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 36 / 49

Exemple de données financières Breaks detection analysis of the FTSE index Close -0.10-0.05 0.00 0.05 0.10 0 200 400 600 800 1000 1200 1400 Time Log-return de l indice FTSE à la cloture: du 27 juillet 2005 au 18 mars 2011 = n = 1428. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 37 / 49

Plan 1 Introduction 2 Estimateur du quasi-maximum de vraisemblance Modèles classiques Estimation par maximum de quasi-vraisemblance 3 Détection de ruptures offline Définition des estimateurs Résultats asymptotiques Applications numériques 4 Détection de ruptures online Etude d un détecteur construit à partir de QMLEs Applications numériques ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 38 / 49

Le problème de détection de rupture online Le problème de détection de rupture online est le suivant: H 0 : θ 0 tel que (X n ) n N provient du modèle M N (M θ0, f θ0 ); H 1 : k > n et θ 0 θ 1 tels que (X n ) n N provient du modèle M {1,,k }(M θ0, f θ0 ) M {k, }(M θ1, f θ1 ) Objectifs: Choisir entre H 0 et H 1 pour chaque k > n Estimer θ 0 et θ 1. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 39 / 49

Quelques références sur le sujet Chu et al. (1996): Monitoring pour un changement structurel. Berkes et al. (2004): Détection CUSUM séquentielle for GARCH processes. Aue et al. (2009): Détection séquentielle de rupture multivariée. Naet al. (2011): Monitoring pour un changement de paramètre pour des séries chronologiques. Remarque: tous ces papiers supposent l indépendance des processus des 2 cotés du changement de régime Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 40 / 49

Définition du détecteur On définit pour k > n et l {n,, k 1}, Ĉ k,l := n k l k Ĝ(T 1,n ) 1/2 ( θ(tl,k ) θ(t 1,n ) ). Le détecteur est: Ĉ k := max l Π n,k Ĉ k,l, avec Π n,k := {n v n, n v n + 1,, k v n } où v n et v n / n 0. Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 41 / 49

Comportement asymptotique du détecteur Pour c α > 0, on définit pour k > n le temps d arrêt: } τ(n) := Inf {k > n / Ĉk > c α. { } = P{τ(n) < } = P sup Ĉ k > c α k>n On choisit c α > tel que: { limn P H0 {τ(n) < } = α lim n P H1 {τ(n) < } = 1 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 42 / 49

Comportement asymptotique du détecteur (suite) Théorème Sous H 0 et les conditions du théorème de normalité asymptotique du QMLE, { lim P{τ(n) < } = P sup n sup t>1 1<s<t W d (s) sw d (1)) t où W d est un mouvement Brownien standard de dimension d. > c α } ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 43 / 49

Comportement asymptotique du détecteur (fin) Théorème Sous H 1 et les conditions du théorème de normalité asymptotique du QMLE, pour lim sup n k (n)/n < et k n = k (n) + n δ avec 1/2 < δ < 1, Ĉ kn a.s. n. En conséquence Corollary Sous les hypothèses du Théorème, lim P{τ(n) < } = 1. n ean-marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 44 / 49

Deux exemples simulés a ) C k for GARCH(1,1) without change b ) C k for GARCH(1,1) with one change at k*=750 0.5 1.0 1.5 2.0 2.5 3.0 3.5 0 2 4 6 8 10 12 500 600 700 800 900 1000 500 600 700 800 900 1000 k GARCH(1,1), n = 500, k = 501,, 1000 a-) θ 0 = (0.01, 0.3, 0.2) b-) θ 0 = (0.01, 0.3, 0.2), θ 1 = (0.05, 0.5, 0.2) à k = 750 k Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 45 / 49

Simulations dn Mean SD Min Q 1 Med Q 3 Max AR(1) n = 500 ; k = n + 50 Ĉ k 54.74 14.95 18 44 54 64 103 Q k 53.78 14.72 16 43 54 63 102 n = 500 ; k = n + 250 Ĉ k 63.14 23.18 12 45 61 77 135 Q k 72.70 21.47 7 56 71.5 90 139 n = 1000 ; k = n + 50 Ĉ k 75.84 14.19 37 66 75 83 114 Q k 72.60 13.23 41 63 73 82 111 n = 1000 ; k = n + 250 Ĉ k 76.24 19.15 23 60 76 89 140 Q k 86.82 22.57 27 70 85 100 151 GARCH(1,1) n = 500 ; k = n + 50 Ĉ k 20.21 6.15 1 16 20 24 35 Q k 27.06 4.52 16 24 27 30 44 n = 500 ; k = n + 250 Ĉ k 25.53 8.04 3 20 25 31 50 Q k 35.40 10.01 13 28 35 41 62 n = 1000 ; k = n + 50 Ĉ k 28.43 7.41 6 24 28 33 51 Q k 36.98 5.09 21 33 37 40 48 n = 1000 ; k = n + 250 Ĉ k 31.16 8.52 4 26 33 39 53 Q k 44.35 10.04 14 37 45 50 71 Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 46 / 49

Retour sur l exemple financier Breaks detection in the FTSE 100 Returns FTSE 100 0.10 0.05 0.00 0.05 0.10 t F,1 t F,2 t F,3 t F,4 t F,5 t F,6 2004 2005 2006 2007 2008 2009 2010 2011 2012 Time Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 47 / 49

Breaks detection in the FTSE 100 Returns FTSE 100 0.10 0.05 0.00 0.05 0.10 t F,1 t F,2 t F,3 t F,4 t F,5 t F,6 2004 2005 2006 2007 2008 2009 2010 2011 2012 Time Breaks detection analysis of the FTSE index Close -0.10-0.05 0.00 0.05 0.10 0 200 400 600 800 1000 1200 1400 Time Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 48 / 49

Références Bardet, J.-M. et Kengne, W. (2014). Monitoring procedure for parameter change in causal time series. Journal of Multi. Analysis Bardet, J.-M., Kengne, W. et Wintenberger, O. (2012). Detecting multiple change-points in general causal time series using penalized quasi-likelihood. Elect. Journal Statis. Bardet, J.-M. et Wintenberger, O. (2009). Asymptotic normality of the Quasi-Maximum Likelihood Estimator for multidimensional causal processes. Ann. Statist. Kengne, W. (2012). Testing for parameter constancy in general causal time series models. Journal of Time Series Analysis Jean-Marc Bardet, SAMM, Université Paris 1 (Trimestre Rupturesdupour Laboratoire processusdecausaux Mathématique de Besançon 5 mai 2014 ) 49 / 49