COMMUNAUTE ECONOMIQU E ET MONETAIRE DE L AFRIQUE CENTRALE (CEMAC) INSTITUT SOUS REGIONAL DE STATISTIQUES ET D ECONOMIE APPLIQUEE (ISSEA) Projetde SériesTemporelles MODELISATION DE LA RENTABILITE DE L INDICE CAC 40 Projet réalisé par : KEUNGNE KOUOTANG LEO-SPENCER Elève Ingénieur Statisticien Economiste SOUS LA SUPERVISION DE : M ONDO JEAN CLEOPHAS Enseignant a l issea: PH-D
TABLE DES MATIERES TABLE DES MATIERES 0 INTRODUCTION 2 I- Traitement des données et visualisation des séries de l indice CAC 40 et du rendement du CAC 40 3 I-1 Traitements des données manquantes 3 I-2 Visualisation de la série de l indice du CAC 40 et de la série des rendements du taux de change 3 I-3 Etude des propriétés statistiques de la série des rentabilités de l indice CAC 40 4 II- Modélisation du processus générateur de la série des rendements du CAC 40 5 II-1 Méthodologie retenue 5 II-2 Identification du processus générateur de la série des taux de rendements du CAC 40 5 II-3 Estimation du processus générateur des données de la série 6 CONCLUSION 9 Léo-Spencer Keungne 1
Introduction Le cours de séries temporelles approfondies permet aux élèves ingénieurs statisticiens économistes de pouvoir aller au-delà des hypothèses généralement admises lors de la modélisation de la composante résiduelle de certains processus générateurs de données des séries temporelles relatives à la constance de la variance de ces processus dans le temps. Pourtant, cette variabilité de la volatilité est une caractérisation propre des séries financières (Valery Mignon et al, 2002).C est ainsi qu il est initié aux techniques de modélisation des séries temporelles susceptibles de prendre en compte cette volatilité de la variance conditionnelle des processus aléatoires dans le temps au nombre desquels les modèles ARCH( Autoregressive Conditionnal Heteroskedasticity) et GARCH ( Generalized ARCH). Ce projet s inscrit dans le cadre de la mise en pratique des notions que nous avons acquises durant le cours sur la modélisation des processus aléatoires conditionnellement héteroscedastiques. La rentabilité d un indice boursier est un indicateur important dans les décisions d investissement des potentiels investisseurs. En effet, lorsque les anticipations des investisseurs relativement a la rentabilité des projets sont optimistes, alors ces derniers sont incites à investir dans l économie d un pays tandis que lorsque la rentabilité d un indice boursier sont élevées, les investisseurs gagneraient à investir dans les entreprises cotées sur le marche boursier en question. Voila la raison pour laquelle les investisseurs tout comme les gestionnaires des marchés boursiers s attèlent quotidiennement a déterminer des prévisions de très bonnes qualité concernant l évolution des rentabilités sur les marches boursiers et sur les risques relatifs aux diverses actions constituant les différents portefeuilles sur ces marchés. Ce constat rend davantage d actualité la nécessité de modéliser l évolution de la rentabilité des différents indices boursiers tout en tenant compte des risques relatifs aux portefeuilles côtés sur ces marchés financiers. Dans le cadre de cette étude, nous avons choisi de nous appesantir sur la modélisation de la série des valeurs de l indice du marché boursier français CAC 40. La suite de ce rapport s articule ainsi qu il suit : dans une première partie, nous nous appesantirons sur la présentation des données que nous avons utilisées dans le cadre de cette étude, sur les traitements statistiques que nous les avons apportées ainsi que sur l étude des propriétés statistiques de la série du rendement l indice français du CAC 40. La seconde partie de ce rapport est consacrée à la modélisation de l évolution des rendements du CAC 40 français. Nous terminerons sur quelques remarques relatives aux perspectives de cette étude. Il est important de souligner que les différents graphiques et estimations réalisées dans la présente étude l ont été sur le logiciel statistique R.2.7. Les différents codes que nous avons réalisés ont été attachés dans un programme que nous sommes disposés à joindre à ce rapport au cas où la nécessité s impose. Léo-Spencer Keungne 2
I- Traitement des données et visualisation des séries de l indice CAC 40 et du rendement du CAC 40 I-1 Traitements des données manquantes Les données que nous avons utilisées dans le cadre de cette étude proviennent du site internet www.econstats.com. Ces données sont journalières et couvrent la période allant du 02 juin 2008 au 06 juin 2009. Toutefois, en raison du fait que la bourse n ouvre en général pas durant les weekends, nous n avons pas pu disposer des données durant plusieurs jours. Aussi, il est important de noter qu en raison des jours fériés nous n avons pas également pu disposer des données concernant l évolution de l indice CAC 40 durant plusieurs jours. Nous avons alors choisi en raison de la longueur de l absence d informations suffisantes pouvant nous permettre de traiter les données manquantes dans le cadre de cette étude de supprimer toutes les dates comportant les données manquantes dans notre échantillon et de modéliser l évolution de la série privée de ces dates. Cette hypothèse forte suppose que les données que nous avons supprimées n ont pas d impact significatif sur les processus générateurs des différentes séries sur lesquelles nous effectuerons nos analyses. I-2 Visualisation de la série de l indice du CAC 40 et de la série des rendements du taux de change L observation de l évolution de la série du CAC 40 sur la période d étude que nous avons retenue laisse clairement apparaître que celle-ci n est pas stationnaire. En effet, le graphique 1 ci-dessous laisse apparaître que sur la période d étude que nous avons retenue, la valeur de l indice CAC 40 à la clôture du marché boursier présente une tendance à la baisse. S agissant de la série des taux de rendements de l indice boursier CAC 40, le graphique 1 ci-dessous nous donne de constater que cette série est très volatile. On observe toutefois des regroupements de la volatilité de cette série : les faibles variations de cette série ont tendance à être suivies par des faibles variations tandis que des fortes variations ont également tendance à être suivies par des fortes variations. Toutefois, il est important de souligner que les valeurs de la rentabilité du CAC 40 ont tendance à osciller au fil du temps autour d une moyenne, ce qui laisse présager que la série des rendements du CAC 40 français pourrait être stationnaire à l ordre 1. Les observations ci-dessus mentionnées nous permettent d affirmer que la série des rendements du CAC 40 pourrait être modélisée grâce à un modèle ARCH ou à un modèle GARCH. Toutefois, il est important de souligner qu avant toute modélisation ARCH ou GARCH, il est important de procéder à une étude des moments de la série afin de s assurer que la série des rentabilités de l indice CAC 40 présente les propriétés statistiques des séries temporelles appartenant à cette classe de modèle. Léo-Spencer Keungne 3
o Graphique 1:Evolution de la série de l indice CAC 40 et évolution de sa rentabilité I-3 Etude des propriétés statistiques de la série des rentabilités de l indice CAC 40 Les processus ARCH et GARCH étant des processus symétriques, leur coefficient d asymétrie est censé être égal à 0. Aussi, ils sont caractérisés par une espérance nulle et par un coefficient d aplatissement supérieur à 3. Autrement dit, leurs queues de distributions sont plus épaisses que celle d une loi normale. Ainsi, pour modéliser l évolution de la rentabilité de l indice CAC 40 par ces modèles, il est important de vérifier que notre série de données possède les mêmes propriétés statistiques. Nous avons estimé l espérance, la variance, le coefficient d aplatissement et le coefficient d asymétrie du taux de rendement de l indice CAC 40. Les résultats de nos calculs sont résumés dans le tableau 1 ci-dessous :. Etude des moments de la série des rendements du CAC 40 Moyenne -0,0034 variance 0,0008 Asymétrie 0,4515 Applatissement 5,6427 Tableau 1 : Etude des moments de la série des rentabilités de l indice CAC 40 Il ressort de la lecture du tableau ci-dessous que le coefficient d espérance mathématique estimée de cette série est sensiblement nulle. La variance de la série est également très proche de zéro. Le Léo-Spencer Keungne 4
coefficient d aplatissement de cette série est égal à 5, 64, valeur largement supérieure à 3 (valeur du coefficient de kurtosis de la loi normale). Cet excès de kurtosis témoigne d une probabilité très élevée d occurrence des valeurs extrêmes dans la série. Il est aussi important de souligner que le coefficient d asymétrie de cette série est différent de 0 (valeur théorique du coefficient de skewness pour une loi normale). Ceci illustre la présence d une certaine asymétrie dans la série que nous étudions. Cette asymétrie traduit le fait que la volatilité de la série est plus importante après une hausse du taux de rendement qu après une baisse de ce dernier. En effet, la valeur positive prise par le coefficient d asymétrie de la série indique la distribution de la série des rentabilités est étalée à droite et donc que les rentabilités réagissent davantage à un choc positif qu à un choc négatif. Toutefois, en dépit de cette valeur non nulle du coefficient d asymétrie, nous avons choisi de modéliser l évolution des rendements du CAC 40 grâce à un modèle ARCH ou un modèle GARCH en raison du fait que la valeur de ce coefficient d asymétrie demeure tout de même assez proche de zéro. II- Modélisation du processus générateur de la série des rendements du CAC 40 II-1 Méthodologie retenue Afin de modéliser l évolution des rendements du taux de rendement de l indice CAC 40, nous commencerons dans un temps par générer la série des carrés des rendements de l indice CAC 40. Cette nouvelle série nous permettra dans un premier temps d identifier les processus générateurs potentiels de la série des rendements du CAC 40 à travers l examen de ses autocorrélogrammes simples et partiels. Nous estimerons ensuite tous les modèles potentiels que nous avons retenus et grâce au critère d information d AKAIKE, nous retiendrons le modèle susceptible d ajuster le mieux l évolution de la série des rendements du CAC 40. Nous terminerons enfin par une présentation des résultats du modèle estimé. II-2 Identification du processus générateur de la série des taux de rendements du CAC 40 Comme ci-dessus mentionné, l identification du processus générateur de la série des rentabilités de l indice CAC 40 commence par un examen du corrélogramme de la série des carrés des rendements du CAC 40. En effet, cette observation nous permet de déduire si cette série suit un processus ARMA (P, Q). Nous pourrons alors affirmer si tel est le cas que la série des rendements du CAC40 peut être modélisée par un modèle GARCH (max (P, Q), Q). L examen des corrélogrammes simples et partiels Léo-Spencer Keungne 5
de la série des carrés du taux de rendement de l indice CAC 40 français présentée par le graphique 2 ci-dessous nous donne de relever qu il n est pas aisé d identifier clairement le processus générateur de la série des taux de rendements au carré. Il serait toutefois judicieux à la lecture de ce graphique d envisager que cette série pourrait être modélisée grâce à un ARMA (P, Q), avec ( p, q) 1,2,3,4, 5 * 1,2,3,4, 5. Ce faisant, nous postulons que la série des rendements de l indice CAC 40 pourrait être modélisée grâce à un modèle GARCH (P, Q) avec ( p, q) 1,2,3,4, 5 * 1,2,3,4, 5. Graphique 2 : Corrélogrammes simples et partiels de la série des carrés des rendements de l indice CAC 40 II-3 Estimation du processus générateur des données de la série Avant de procéder à l estimation des différents modèles ci-dessus mentionnés, il est important de rappeler la spécification théorique d un modèle GARCH (P, Q). Un processus aléatoire X suit un processus GARCH (P, Q) si pour à chaque instant t, il peut se mettre sous la forme : t t Léo-Spencer Keungne 6
t t t t i Projet de Séries temporelles p q 2 t 0 i ti j tj j i1 j1 i i 1 j1 0,1, 0 0,..., X h où N i p h X h, 0 j 1,..., q p q 1 j L estimation des différents modèles à l aide du logiciel R nous a conduits à retenir le modèle GARCH(2,5) comme celui qui minimise le critère d AKAIKE avec une valeur du critère d information d AKAIKE étant égale à -882,8226. Nous avons alors estimé ce modèle et nous avons obtenu les résultats ci-dessous : Estimate S td. Error t value Pr (> t ) α0 1.688e-05 3.063e-05 0.551 0.582 α1 4.370e-02 9.929e-02 0.440 0.660 α2 2.051e-01 1.302e-01 1.575 0.115 β1 3.659e-02 4.692e-01 0.078 0.938 β2 1.397e-01 3.805e-01 0.367 0.714 β3 2.849e-01 4.794e-01 0.594 0.552 β4 2.111e-01 4.880e-01 0.433 0.665 β5 8.605e-02 5.223e-01 0.165 0.869 Tableau 2:Résultats de l estimation du modèle GARCH (2,5) sur la série des rendements du CAC 40 Il ressort de la lecture du tableau ci-dessus qu aucun coefficient du modèle que nous avons estimé n est significatif. Ce faisant, il est alors délicat d interpréter un tel modèle. Nous avons alors rejeté ce modèle et opté pour l estimation d un modèle GARCH (1,1). En effet, ce modèle correspond à la seconde valeur minimale du critère d AKAIKE à savoir -872.4281. Les résultats des estimations de ce modèle nous sont synthétisés dans le tableau ci-dessous : Léo-Spencer Keungne 7
Estimate Std. Error t value Pr(> t ) α0 1.461e-05 1.493e-05 0.979 0.3276 α1 1.413e-01 5.596e-02 2.525 0.0116 * β1 8.560e-01 5.178e-02 16.530 <2e-16 *** Tableau 3:Estimation des paramètres d un modèle GARCH (1,1) sur la série des rendements du CAC 40 Il ressort de la lecture du tableau ci-dessus qu à l exception du terme constant de la composante ARCH du modèle ci-dessus estimé, les autres coefficients du modèle sont tous significatifs au seuil de 5%. Par ailleurs, le test de normalité des résidus de Jarque Bera nous conduit à rejetter au seuil de 5% l hypothèse de normalité des résidus de ce modèle, la p_value de ce test que nous avons obtenue ayant été de 1.001e-06. Par contre, le test d autocorrélation des résidus de Ljung Box nous a conduits à ne pas rejetter au seuil de 5% l hypothèse d autocorrélation des résidus du modèle, la p_value de ce test étant de 0.3486. Finalement, nous avons retenu ce modèle comme processus générateur de la série du CAC 40 français. Il se met sous la forme suivante : t t t t t 0,1, X h oùn et h 1.46e-05 1.41e-01*X 8.56e-01*h 2 t-1 t-1 Cette modèle pourrait alors nous aider à faire des prévisions sur l évolution du taux de rendement de l indice CAC 40. Notons aussi que nous avons procéder à des simulations des valeurs prédites du taux de rendement de l indice CAC 40 sur la période d étude (le logiciel R) que nous avons comparées aux valeurs effectives de la série sur la période d étude. Nous n avons toutefois pas joint ces graphiques à ce document, mais la procédure nécessaire à leur obtention figure dans le programme joint à ce document. Léo-Spencer Keungne 8
Conclusion L objectif de ce rapport était la modélisation d une série temporelle financière à l aide d un modèle ARCH ou GARCH en vue de mettre en pratique les connaissances théoriques reçues dans le cadre du cours de séries temporelles. Nous avons appliqué ces connaissances à la série du CAC 40 français durant la période allant de juin 2008 à mars 2009 et nous sommes parvenus à la conclusion selon laquelle cette série peut être modélisée par un processus GARCH (1 ; 1). Toutefois, comme tout travail intellectuel, ce rapport présente certainement plusieurs limites dont la correction pourrait considérablement améliorer le contenu du présent rapport. Nous avons fait des choix aui n ont pas forcément été les meilleurs ou du moins les bons. Notons tout d abord, qu à ce stade du cours, nous ne disposons pas encore de tous les éléments pouvant nous permettre de tester la stationnarité des variables. En effet, une application incorrecte de ces tests pourrait nous conduire à obtenir des résultats qui quoique flatteurs seraient totalement erronés. Aussi, la non nullité des coefficients d asymétrie mentionnée dans l étude descriptive suggère probablement d envisager une modélisation de cet indice qui prend en considération cette asymétrie de la distribution du rendement de l indice. Par ailleurs, le rejet de l hypothèse de normalité des résidus suggère qu il serait judicieux de rechercher les distributions réelles des paramètres estimés par des méthodes de simulation afin de procéder aux tests de significativité des coefficients du modèle que nous avons utilisés. Notons enfin que le traitement des données manquantes que nous avons réalisées n a pas été inspiré d un fondement théorique reconnu. Nous envisageons au cours de prochaines études intégrer des corrections de toutes ces limites tout en comptant sur les différents éclairages de l enseignant pour produire davantage des rapports de bien meilleure qualité. Léo-Spencer Keungne 9