Regime Switching Model : une approche «pseudo» multivarie e



Documents pareils
Modélisation du comportement habituel de la personne en smarthome

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Introduction à l approche bootstrap

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Exercice : la frontière des portefeuilles optimaux sans actif certain

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

MCMC et approximations en champ moyen pour les modèles de Markov

Texte Agrégation limitée par diffusion interne

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Simulation de variables aléatoires

NON-LINEARITE ET RESEAUX NEURONAUX

Programmes des classes préparatoires aux Grandes Ecoles

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

Probabilités III Introduction à l évaluation d options

Apprentissage Automatique

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

1 Définition de la non stationnarité

PROBABILITES ET STATISTIQUE I&II

TABLE DES MATIERES. C Exercices complémentaires 42

Mesure et gestion des risques d assurance

Modélisation aléatoire en fiabilité des logiciels

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Le risque Idiosyncrasique

NOTE SUR LA MODELISATION DU RISQUE D INFLATION


Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

Le modèle de régression linéaire

Moments des variables aléatoires réelles

CarrotAge, un logiciel pour la fouille de données agricoles

Chapitre 3. Les distributions à deux variables

Probabilités stationnaires d une chaîne de Markov sur TI-nspire Louis Parent, ing., MBA École de technologie supérieure, Montréal, Québec 1

3. Conditionnement P (B)

PROJET MODELE DE TAUX

Température corporelle d un castor (une petite introduction aux séries temporelles)

Soutenance de stage Laboratoire des Signaux et Systèmes

Résumé des communications des Intervenants

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

1 Complément sur la projection du nuage des individus

Modèle GARCH Application à la prévision de la volatilité

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

PRIME D UNE OPTION D ACHAT OU DE VENTE

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Méthodes de Simulation

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

Premier modèle - Version simple

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Le modèle de Black et Scholes

Tactical Currency Allocation Revisited: Four Simple Currency Trading Rules

Principe de symétrisation pour la construction d un test adaptatif

Précision d un résultat et calculs d incertitudes

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Le théorème des deux fonds et la gestion indicielle

!-.!#- $'( 1&) &) (,' &*- %,!

ESSEC Cours Wealth management

Solvabilité II Les impacts sur la tarification et l offre produit

Évaluation de la régression bornée

TSTI 2D CH X : Exemples de lois à densité 1

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Modélisation et simulation

Leçon N 4 : Statistiques à deux variables

Exemples de dynamique sur base modale

MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Econométrie pour la Finance

Note TDTE N 44. Philippe Foulquier, Directeur du pôle «Analyse Financière et Comptabilité» de l EDHEC.

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

Les variables financières sont-elles utiles pour anticiper la croissance économique?

4.2 Unités d enseignement du M1

Best Styles ou comment capturer au mieux les primes de risque sur les marchés d actions

TP N 57. Déploiement et renouvellement d une constellation de satellites

Titre 4 - Analyse de l impact de la résiliation annuelle sur les marges des contrats emprunteurs

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

Production des Services d Assurance non-vie selon le SCN 2008

Hedging delta et gamma neutre d un option digitale

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Lagrange, où λ 1 est pour la contrainte sur µ p ).

La valeur présente (ou actuelle) d une annuité, si elle est constante, est donc aussi calculable par cette fonction : VA = A [(1-1/(1+k) T )/k]

Gestion obligataire passive

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Le WACC est-il le coût du capital?

APPROCHE SEMI-MARKOVIENNE POUR LA MODÉLISATION DE STRATÉGIES DE MAINTENANCE : APPLICATION À LA PRÉVENTION DE RUPTURE DU RAIL

Programmation linéaire et Optimisation. Didier Smets

INF6304 Interfaces Intelligentes

Quantification Scalaire et Prédictive

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Économetrie non paramétrique I. Estimation d une densité

Transcription:

Regime Switching Model : une approche «pseudo» multivarie e A. Zerrad 1, R&D, Nexialog Consulting, Juin 2015 azerrad@nexialog.com Les crises financières survenues dans les trente dernières années et les tendances cycliques des marchés financiers remettent en question, au sens large, les outils classiques d aide à la décision. Les marchés financiers, peuvent se trouver dans des états très différents et peuvent être caractérisés par des changements de comportement très brutaux. Les modèles classiques, gaussiens notamment, sont très critiqués dans leurs capacités médiocres à capturer de tels phénomènes complexes. Les modèles, intégrant ce concept de changement de régimes, sont bien appropriés pour capter le comportement dépendant du temps des prix des instruments financiers : moyennes, volatilités, coefficients d asymétrie et d aplatissement, structure de dépendances, essentiels à prendre en compte dans les modèles d allocation d actifs. La dépendance entre les actifs financiers a tendance à s aggraver lors des périodes turbulentes, ce qui implique que supposer improprement une stabilité de dépendance peut conduire à une sous-estimation significative de la survenance des rendements conjointement négatifs 2. Ces modèles connus dans la littérature sous le nom de Hiddden Markov models (HMM 34 ), considèrent que le processus de prix d actifs est distribué selon un mélange de lois de probabilités, dont les transitions sont conditionnées par la réalisation d une variable aléatoire discrète latente ou inobservée vérifiant la propriété markovienne 5. Cependant, le calibrage de tels modèles reste une tâche complexe et pourrait vite engendrer de nombreux problèmes de robustesse et de perte de pragmatisme. Ceci se pose notamment lorsqu il s agit de calibrer de tels modèles sur des processus multivariés de dimension élevée; un modèle HMM gaussien multivarié à 6 composantes et à deux régimes latents, nécessite l estimation de 57 1 Ali Zerrad, Responsable du pôle R&D de Nexialog et Consultant en Risk Management et en Finance Quantitative. 2 Sheikh et Quiao (2010) 3 Pour plus de détails sur le sujet, le lecteur intéressé pourrait consulter : Zucchini M., MacDonald I. L., Hidden Markov Models for Time Series- An Introduction Using R, Chapman & Hall CRC Monographs on Statistics & Applied Probability, 2009. 4 J. Bulla &I. Bulla., Stylized facts of financial time series and hidden semi-markov models, Computational Statistics & Data Analysis, 51, 2192-2209, 2006 5 Un processus stochastique vérifie la propriété de Markov si et seulement si la distribution conditionnelle de probabilité des états futurs, étant donnés les états passés et l'état présent, ne dépend en fait que de l'état présent et non pas des états passés (absence de «mémoire»). 1

paramètres ; ce qui pourrait conduire à des estimations moins robustes et mène à des prédictions, de changement de régimes, de qualité médiocre, étant donné que l erreur d estimation augmente avec le nombre de paramètres. Nombreux investisseurs optent donc, pour des méthodes simples et utilisent plutôt des indicateurs simples, intégrant des prévisions économiques, afin de détecter tout changement futur de régime. L objectif de cette étude est de présenter un remède à telle problématique consistant à modifier légèrement la vraisemblance du modèle, HMM, dans sa version originale, en supposant l indépendance entre les actifs à modéliser. Ceci signifie, dans le cadre d un modèle à distributions conditionnelles gaussiennes, l utilisation des matrices de covariance diagonales (une autre alternative consisterait à utiliser des matrices de covariance «block diagonales» limitant l hypothèse d indépendance à seulement certains des actifs considérés). Cette hypothèse, quoi qu elle parait forte, n impacte en rien l objectif final de la modélisation consistant à prédire le changement des régimes et non pas les grandeurs des variations des prix des actifs. Nous allons montrer que cette approche pourrait bien fournir des résultats aussi satisfaisants que l approche originale. Nous rappelons que dans le cas des distributions multivariées 6, la vraisemblance du modèle se formule comme ceci : L T = πp(x 1 )ΓP(X 2 ) ΓP(X T ), avec (X t ) t 1 T un vecteur à valeur dans R J, T étant la taille de l échantillon: X t1 X t = {, X tj P(X t ) une matrice diagonale composée des densités conditionnelles relatives aux régimes (1, m). p(x t, θ 1 ) 0 P(X t ) = ( ) 0 p(x t, θ m ) Et Γ la matrice de transition du processus markovien latent. Dans le cadre de l approche considérée, que nous notons HMM d contre HMM f pour un modèle HMM multivarié à matrice de covariance complète, p(x t, θ j ) (= Pr(X t = x t /S t = j)), S t représente le processus markovien latent, se reformule par : p(x t, θ j ) = p 1 (X t1, θ j1 ) p J (X t1, θ jj ) Notons qu il n est pas nécessaire de considérer la même distribution conditionnelle p k (X tk, θ jk ) pour toutes les composantes X tk,kϵ(1:j). 6 Zucchini M., MacDonald I. L., Hidden Markov Models for Time Series- An Introduction Using R, Chapman & Hall CRC Monographs on Statistics & Applied Probability, 2009. 2

Afin d évaluer la pertinence d une telle approche, sans perte de généralité, nous considérons un vecteur composé de deux composantes aléatoires que nous modéliserons à l aide d un modèle HMM f bi varié à deux régimes. L objectif est de comparer, sur ce cas simple, les prédictions des changements de régimes, fournis par les deux modèles HMM f et HMM d. Nous considérons des distributions conditionnelles gaussiennes Ν (μ j, Σ j ) jϵ(1,2). Nous fixons arbitrairement μ j = (μ 1,j,, μ J,j ) et diag(σ j ) = (σ 2 1,j,, σ 2 1,J ) T (respectivement les moyennes et les variances conditionnelles des densités marginales) et nous faisons varier la corrélation ρ 2, relatif au deuxième régime, que nous considérons volatile, de 0.1 à 0.9, tout en fixant ρ 1 respectivement à 0, - 0.2 et 0.2. Pour chaque valeur de ρ 2 et pour i allant de 1 jusqu à B (B étant un nombre de simulations assez élevé pour assurer la convergence du paramètre d intérêt) : 1) Nous simulons, selon un modèle HMM f, un échantillon de taille T ( nous fixons T à 3900) ; 2) Pour chaque distribution simulée, nous estimons les paramètres du modèle HMM f, à l aide de l algorithme EM 7, et nous faisons appel à l algorithme de Viterbi 8 pour identifier le processus des régimes latents que nous notons S f i ; 3) Pour la même distribution simulée, nous y calibrons le modèle HMM d et nous faisons appel à l algorithme Viterbi, dans sa version modifiée tenant compte de la vraisemblance présentée ci-haut, pour identifier les régimes cachés que nous notons S i d. 4) Nous calculons ainsi le taux d erreur, que nous notons T d, relatif au modèle considéré en comparant les deux distributions des régimes identifiés. Formellement, il s agit d évaluer : T d = 1 B (S i,j i,j f Sd ) Les résultats obtenus, pour un nombre de simulation égale à 9999, sont représentés dans la figure 1. B i T j Figure 1 : taux d erreur d identification des régimes du modèle HMM d calculé par rapport aux régimes identifiés par HMM f ; application sur deux actifs. Nous remarquons que pour les différents cas de figures considérés, le taux d erreur commise par le modèle HMM d oscille autour de 0.4%. L approche ainsi considérée permet de réduire le nombre de 7 Esperance maximisation 8 L. R. Rabiner. A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE 77(2):257 286, février 1989. 3

paramètres à estimer tout en fournissant un résultat aussi satisfaisant que celui obtenu par un modèle HMM f. Afin de confirmer ces résultats, nous reprenons la même étude présentée ci-haut, mais en considérant maintenant une distribution multivariée à trois composantes. Les résultats obtenus sont représentés dans figure 2: Figure 2: taux d erreur d identification des régimes du modèle HMM d calculé par rapport aux régimes identifiés par HMM f ; application sur trois actifs. D après les résultats obtenus, les mêmes conclusions faites ci-haut restent valables. A ce stade, nous considérons des données réelles, nous limitons l analyse à trois actifs 9 : Equity 1, Bond 1 et Commodity 1. Nous considérons dans un premier temps un modèle HMM f à matrice de covariance complète. Les paramètres estimés, à l aide de l algorithme EM, figurent dans le tableau 1. Le nombre de régimes à considérer a été fixé à 2 régimes. Notons toutefois qu il est possible de considérer un nombre de régimes plus élevé, mais ceci n impactera pas l objectif de la présente étude. Le modèle résultant montre clairement la présence effective de deux régimes distincts, une faible volatilité associée à un rendement positif pour le premier régime, et une volatilité élevée associée à un rendement négatif pour le deuxième régime indiquant que les périodes de turbulence sont généralement caractérisées par des faibles rendements en moyenne. Les deux régimes sont quasiment identifiés par leurs variances comme la différence au niveau de leurs moyennes est plus ou moins similaire à celle de leurs variances. La différence des moyennes est une propriété indispensable pour que le modèle soit capable de reproduire l autocorrélation d ordre 1 ainsi que le skewness (le coefficient de dissymétrie). En analysant les probabilités de transition, il paraît que le premier régime est plus persistant que le deuxième avec une probabilité s élevant à 0.96 contre 0.87. Notons que la corrélation entre le premier actif et le troisième croît en régime volatile indiquant un phénomène de contagion, et celle entre le premier actif et le deuxième chute davantage indiquant la présence d un phénomène de découplage. Ceci confirme le fort lien entre les actifs et les changements de régime. 9 Les codes bloomberg sont respectivement : NDUEACWF, JHDCGBIG, SPGSCITR. 4

HMM f μ 10 4 σ 10 Corrélation Γ ii π 10 δ 11 1.. Régime 1 (6.09 1.89 5.79) (0.06 0.01 0.11) ( 0.25 1. ) 0.96 0.80 1 0.22 0.06 1 1.. Régime 2 ( 18.3 2.09 24.01) (0.18 0.02 0.23) ( 0.46 1. ) 0.87 0.19 0 0.43 0.26 1 Tableau 1 : paramètres estimés du modèle HMM f. Considérons maintenant le modèle HMM d en supposant l indépendance entre les trois actifs. Les paramètres estimés à l aide de l algorithme EM sont représentés dans le tableau 2. HMM d μ 10 4 σ 10 Γ ii π δ Régime 1 (6.72 1.76 6.39) (0.06 0.01 0.11) 0.95 0.80 1 Régime 2 ( 20.7 2.61 26.38) (0.19 0.02 0.23) 0.82 0.19 0 Tableau 2 : paramètres estimés du modèle HMM d Les estimations obtenues sont similaires, en termes de structure, à celles obtenues avec un modèle HMM d. Notons que le deuxième régime, du modèle HMM d, semble légèrement moins persistant que celui du modèle HMM f, toutefois, les régimes des deux modèles présentent des probabilités stationnaires similaires. Afin d évaluer à quel point la matrice de corrélation est conservée ou non par le modèle HMM d, nous estimons les matrices de corrélation empiriques moyennant les observations relatives à chaque régime. Les résultats obtenus sont représentés dans le tableau 3. HMM d Corrélation 1.. Régime 1 ( 0.22 1. ) 0.19 0.05 1 1.. Régime 2 ( 0.50 1. ) 0.46 0.28 1 Tableau 3 : corrélations empiriques du modèle HMM d. 10 π représente la probabilité stationnaire du modèle, s'interprète usuellement comme la fraction du temps passé en chaque régime. 11 δ représente la probabilité d émission des régimes. 5

La structure de corrélation est bien conservée. Il est également intéressant de noter que les corrélations empiriques obtenues sont du même ordre que celles modélisées explicitement par le modèle HMM f. A ce stade, nous comparons les distributions des régimes identifiées par les deux modèles. Nous évaluons dans un premier temps le T d relatif aux régimes cachés, conduisant les données réelles étudiées. Ensuite, à travers des simulations basées sur les paramètres estimés, nous construisons la distribution empirique du T d. Les résultats obtenus sont représentés dans le graphique ci-dessous. Figure 3 : distribution empirique du taux d erreur T d sur des échantillons simulés à travers les modèles, HMM d et HMM f, calibrés sur des données réelles. La droite rouge correspond au taux d erreur relatif aux données réelles. Le nombre de simulations effectué est de l ordre de 9999. Le taux d erreur T d oscille autour de 1.5% ; le modèle HMM d permet ainsi une réduction du nombre de paramètres à estimer tout en fournissant une identification des régimes aussi satisfaisante que celle du modèle HMM f. Il est intéressant de finir cette étude en abordant la question de la stabilité des estimations des paramètres relatifs au modèle étudié. Pour ce faire, nous effectuons des simulations multivariées basées sur les paramètres, du modèle HMM f, estimés ci-haut, et nous re-estimons ces derniers pour chaque distribution simulée et ceci pour les deux modèles considérés HMM f et HMM d. Les figures 4 et 5 représentent l estimation des paramètres μ et σ relatifs au deuxième régime pour les 99 premières simulations ; la figure 6 représente l estimation des probabilités de rester dans le même régime pour les mêmes simulations. Notons que nous avons effectué 9999 simulations au total. 6

Figure 4 : les 99 premières estimations du paramètre μ correspondant au deuxième régime. Sont représentées en rouge les estimations relatives au modèle HMM f, en gris, celles correspondant au modèle HMM d Figure 5 : les 99 premières estimations du paramètre σ correspondant au deuxième régime. Sont représentées en rouge les estimations relatives au modèle HMM f, en gris, celles correspondant au modèle HMM d Figure 6 : les 99 premières estimations des probabilités de rester au même régime. Sont représentées en rouge les estimations relatives au modèle HMM f, en gris, celles correspondant au modèle HMM d. 7

En vertu de ces résultats, nous pourrions conclure que le modèle HMM d fournit des estimations très légérement plus stables que celles obtenues par le modèle HMM f. En effet, les écarts types (que nous notons Sd) des estimations obtenues montrent une lègére préférance pour le modèle HMM d : Sd(μ). 10 4 Sd(σ). 10 4 Sd(Pr(S)). 10 2 μ 1 μ 2 μ 3 σ 1 σ 2 σ 3 Pr (S 1 ) 12 Pr (S 2 ) 13 HMM d 0.79 0.10 0.91 0.58 0.06 0.72 0.35 1.76 HMM f 0.86 0.10 0.96 0.74 0.06 0.78 1.18 0.60 Tableau 4 : écarts type des estimations des paramètres μ et σ relatifs au deuxième régime ainsi que ceux des probabilités de rester dans le même. A travers cette étude, il parait que supposer l indépendance des composantes de la distribution multivariée à calibrer par un modèle HMM d n introduit pas une perte significative en terme de qualité de prédiction des régimes cachés. Ceci s avère fortement utile lorsqu il s agit de modéliser une distribution multivariée de grande dimension, chose qui est fréquent dans le domaine de l allocation d actif. Il faut toutefois noter qu il serait intéressant de considérer d autres tests afin de confirmer ou infirmer les conclusions faites. 12 Nous notons par Pr (S 1 ) la probabilité de rester dans le régime 1. 13 La probabilité de rester dans le régime 2. 8