FIN1003 Économétrie financière Sébastien Blais Département des sciences administratives, UQO 23 novembre 2016
Vocabulaire de la semaine dernière valeur retardée d ordre j (j-ième retard) première différence, première différence logarithmique j-ième autocovariance et autocorrélation autorégression d ordre 1 (AR(1)) prévision et erreur de prévision autorégression d ordre p (AR(p)) modèle auto-régressif à retards échelonnés (ARE(p,q)) racine de l erreur quadratique moyenne de prévision (REQMP)
Aujourd hui 1 Intervalle de prévision 2 REQMP hors échantillon 3 Causalité de Granger 4 Choix de modèle 5 Propriétés de l estimateur des MCO des paramètres d un mod Ruptures Tendances
Intervalle de prévision On peut estimer l EQMP hors échantillon, ou à l aide de l estimation des paramètres du modèle. L erreur de prévision est la différence entre la valeur observée (Y T+1 ) et la valeur prédite (Ŷ T+1 T ). Pour un ARE(1,1), Y T+1 Ŷ T+1 T = [β 0 +β 1 Y T +δ 1 X T + u T+1 ] [ˆβ0 + ˆβ 1 Y T + ˆδ ] 1 X T [ (YT+1 ) 2 ] EQMP = E Ŷ T+1 T = Var[u T+1 ] + Var [(ˆβ0 β 0 ) + ) ) ] (ˆβ1 β 1 Y T + (ˆδ1 δ 1 X T. Le premier terme (Var[u T+1 ]) peut être estimé par SER 2. Le second, où F est la statistique de test associée à H 0 : β 0 +β 1 Y T +δ 1 X T = 0. par ŶT+1 T 2 F
Aujourd hui 1 Intervalle de prévision 2 REQMP hors échantillon 3 Causalité de Granger 4 Choix de modèle 5 Propriétés de l estimateur des MCO des paramètres d un mod Ruptures Tendances
REQMP hors échantillon Comparons, hors échantillon, les prévisions de l inflation produites par un AR(1) et un AR(4). Échantillon d estimation: 1961Q1-1995Q4 (140 observations) Échantillon de validation: 1996q1-2005Q1 (37 observations) On obtient un REQMP de 1,351 pour l AR(1) et de 1,354 pour l AR(4): selon ce critère, on préfère l AR(1).
Aujourd hui 1 Intervalle de prévision 2 REQMP hors échantillon 3 Causalité de Granger 4 Choix de modèle 5 Propriétés de l estimateur des MCO des paramètres d un mod Ruptures Tendances
Causalité de Granger On dit que X cause Y au sens de Granger si les retards de X aident à prévoir Y. En d autres terme, X cause Y si les coefficients associés aux retards de X sont significatifs: on fait un test F.
Aujourd hui 1 Intervalle de prévision 2 REQMP hors échantillon 3 Causalité de Granger 4 Choix de modèle 5 Propriétés de l estimateur des MCO des paramètres d un mod Ruptures Tendances
Sélection de l ordre des retards - section 10.5 Comment choisir p (ou p et q) dans un modèle AR(p) (ou un ARE(p,q))? 2 approches 1 Séquence de tests t 2 Critères d information Remarque: Ces procédures définissent en fait des estimateurs de p (ou de p et q), ˆp (ou ˆp et ˆq).
Séquence de tests t La procédure est la suivante: 1 On choisit une valeur assez grande de p. Par exemple, p=6. 2 On estime le modèle AR(6) et on test H 0 : β 6 = 0. 3 Si on rejette la nulle, on garde p=6 et on arrête la procédure. 4 Si on ne rejette pas la nulle, on reprend l étape 2 avec p=5. La procédure s arrête donc lorsque le dernier coefficient est significatif. Comme on l a souligné au chapitre 4, on ne connaît pas vraiment la probabilité de rejeter la nulle lorsqu on fait une séquence de tests corrélés. Exercice: Estimation de p pour un modèle AR(p) du taux de variation de l inflation.
Critère d information Un critère d information est une mesure du pouvoir explicatif qui permet de comparer des modèles. Nous en présentons deux: 1 Critère d information bayésien (BIC) ( ) SCR BIC = ln +(p+1) ln(t) T T 2 Critère d information d Akaike (AIC) ( ) SCR AIC = ln +(p+1) 2 T T Remarques: On préfère le BIC parce qu il donne un estimateur consistant de p. L AIC tend à surestimer p. Exercice: Estimation de p pour un modèle AR(p) du taux de variation de l inflation.
Aujourd hui 1 Intervalle de prévision 2 REQMP hors échantillon 3 Causalité de Granger 4 Choix de modèle 5 Propriétés de l estimateur des MCO des paramètres d un mod Ruptures Tendances
Hypothèses classiques Jusqu à présent, nous nous sommes appuyés sur 3 hypothèses pour obtenir les propriétés de l estimateur des MCO 1 E[u X] = 0 2 u i indépendamment distribués 3 u i identiquement distribués Est-ce que ces hypothèses sont satisfaites lorsqu on analyse des séries temporelles?
1. E[u X] = 0 ] Cette hypothèse garantit que E[ˆβ = β On doit la lire comme E[u t Y 1, Y 2,..., Y T ] = 0 pour tout t = 1,..., T Elle est violée dans les modèles autorégressifs. Par exemple Y t = β 0 +β 1 Y t 1 + u t implique que Y t et u t sont corrélés et donc quee[u t Y t ] 0. L estimateur des MCO est donc biaisé (vers 0) lorsqu on l utilise pour estimer les paramètres d un modèle autorégressif. Heureusement, 1 ˆβ demeure consistant 2 Ŷ t t 1 est la meilleure prévision de Y t lorsque E[u t Y 1, Y 2,..., Y t 1 ] = 0 en termes de REQMP.
2. u i indépendamment distribués Cette hypothèse simplifie le calcul de l erreur-type de l estimateur, ˆσˆβ. Elle est violée dès qu on omet un régresseur autocorrélé (le terme d erreur est alors autocorrélé et n est donc pas indépendamment distribué) Exemple: Supposons que Inf t = β 0 +β 1 Inf t 1 +δ 1 Chom t 1 + u t mais qu on estime le modèle Inf t = β 0 +β 1 Inf t 1 + v t. On a alors v t = δ 1 Chom t 1 + u t et v t est autocorrélé si le chômage l est. La section 11.4 présente un estimateur de l erreur-type de ˆβ qui est robuste à l hétéroscédasticité et à l autocorrélation. On devrait toujours utiliser cet estimateur lorsqu on analyse des séries temporelles.
3. (u i ) identiquement distribués On se demande ici si la distribution Y t (et donc celle de u t ) est la même pour tout t. Si c est le cas, on dit que Y t est stationnaire. Nous présentons 2 types de non-stationnarité: 1 les tendances (intuitivement, lorsque les évènements passés s accumulent pour constituer le présent) tendances déterministes: une variable qui croît à une certain taux à chaque période. Exemple: Y t = β 0 +αt+u t. Calculez E[Y t ] et E[Y t Y t 1 ]. tendance stochastique: une variable aléatoire s ajoute à chaque période. Exemple (marche aléatoire): Y t = Y t 1 + u t. 2 les ruptures (intuitivement, les paramètres ne sont pas les mêmes après un événement économique) Exemple: Y t = β 0 +β 1 Y t 1 + u t avant l ALENA et Y t = β 2 +β 3 Y t 1 + u t après.
Questions Pour chaque type de non-stationnarité, 1 Quelles sont les propriétés de l estimateur des MCO? 2 Comment les détecter (tests)?
Ruptures Une rupture est un changement de valeur de certains (ou tous) coefficients à un certain moment. On la modélise à l aide d un régresseur binaire, par exemple { 0, avant la rupture; D t = 1, après la rupture. Pour un AR(1), on aurait donc Y t = β 0 +β 1 Y t 1 +γ 0 D t +γ 1 Y t 1 D t + u t. Autrement dit, on a Y t = β 0 +β 1 Y t 1 + u t avant la rupture et Y t = (β 0 +γ 0 )+(β 1 +γ 1 ) Y t 1 + u t après. Exercice: Modéliser une rupture au premier trimestre de 1982 pour les coefficients associés au chômage dans un ARE(4,4).
Tester la présence d une rupture On présente deux cas 1 Lorsque le moment de la rupture est connu: test de Chow 2 Lorsque le moment de la rupture n est pas connu: test du rapport de vraisemblance de Quandt (test du RVQ)
1. Test de Chow Lorsque la date de rupture est connue, il suffit de tester la nulle d absence de rupture avec une statistique F. Exemple: Pour on teste Y t = β 0 +β 1 Y t 1 +γ 0 D t +γ 1 Y t 1 D t + u t. H 0 : γ 0 = γ 1 = 0. Exercice: Tester la présence d une rupture au premier trimestre de 1982 pour les coefficients associés au chômage dans un ARE(4,4).
Lorsque la date de rupture n est pas connue, on calcule la statistique F d un test de Chow pour toutes les dates raisonnables et on prend la plus grande. On choisit d abord l intervalle de dates raisonnables. Exemple: entre 0,15T et 0,85T (70% de l échantillon) On calcule la statistique F pour chaque période et on prend la plus grande, qu on note RVQ. (si T=100, on doit estimer 70 régressions et calculer 70 statistiques F) Pour calculer la p-valeur, on doit connaître la distribution de RVQ. Ce n est pas une distribution standard Les valeurs critiques dépendent du nombre de contraintes (q) et de la taille de l intervalle de dates Le tableau 10.6 présente les valeurs critiques pour un intervalle de 70% de l échantillon Exercice: Tester la présence d une rupture pour les coefficients associés au chômage dans un ARE(4,4). 2. Test du RVQ
Tendances stochastiques Une marche aléatoire Y t = Y t 1 + u t est un exemple de tendance stochastique. Une marche aléatoire avec dérive Y t = β 0 + Y t 1 + u t en est un autre. On peut facilement montrer que ce ne sont pas des processus stationnaires en calculant leur variance, Var(Y t ) = Var(Y t 1 )+Var(u t ). Si Y t était stationnaire, on aurait Var(Y t ) = Var(Y t 1 ), ce qui impliquerait que Var(u t ) = 0. C est impossible, puisqu une variance est toujours positive. Y t ne peut donc pas être stationnaire.
Une autre manière de comprendre qu une marche aléatoire n est pas un processus stationnaire en calculant sa variance consiste à écrire Y t de la manière suivante, à partir d une valeur Y 0 : Y 1 = Y 0 + u 1 Y 2 = Y 1 + u 2 = Y 0 + u 1 + u 2 Y t = Y 0 + u 1 + u 2 +...+u t Si les u t sont i.i.d. de variance σ 2, on a Var[Y t ] = Var[Y 0 ]+tσ 2. La variance dépend donc de t: elle n est pas la même pour toutes les observations.
Vocabulaire de la semaine critère d information, AIC, BIC processus stationnaire rupture tests de Chow et du RVQ tendance déterministe et stochastique marche aléatoire, avec et sans dérive