Master 2: Econométrie 2 Partie 1 Michel BEINE michel.beine@uni.lu Université du Luxembourg Master 2: Econométrie 2 p. 1/22
Manuel La partie économétrique du cours est basé sur le livre Introductory Econometrics, a Modern Approach (second edition) de Jeffrey M. Wooldridge, édition Thomson South-Western. Sur le site web : http://www.swcollege.com/bef/wooldridge/... wooldridge2e/wooldridge2e.html il y a des données nécessaires pour les exercices et plusieurs liens intéressants. Master 2: Econométrie 2 p. 2/22
Plan du cours (Partie 1 Économétrie 2) Chapitre 1. Rappels économétriques. Chapitre 2. Corrélation sérielle et hétéroscédasticité. Chapitre 3. Méthodes simples de panel. Chapitre 4. Méthodes avancées de panel. Chapitre 5. Estimation par variables instrumentales. Chapitre 6. Modèles à équations simultanées. Master 2: Econométrie 2 p. 3/22
Rappels Structure des données Master 2: Econométrie 2 p. 4/22
Structure des données Il existe 3 types de données. Chaque type de données peut appeler des techniques économétriques particulières. Données Cross-section. Séries temporelles. Données de Panel. Master 2: Econométrie 2 p. 5/22
Données Cross-section Échantillon d individus, ménages, firmes,..., pris à un point du temps donné. Important: on peut souvent supposer que les obs. = échantillon aléatoire simplifie l analyse. Données très utilisées en économie et sciences sociales micro appliquée: marché du travail, finances publiques, organisation industrielle, économie spatiale, démographie, économie de la santé, etc. Example: Wage1.wf1. Master 2: Econométrie 2 p. 6/22
Séries temporelles Séries chronologiques. Ex: PNB, importations, indices de prix, etc. Important: Rarement indépendantes au court du temps complexifie l analyse. Différentes fréquences: annuel, trimestriel, mensuel, hebdomadaire, journalier, intra-journalier. Données très utilisées en macro-économie et en finance. Example: PRMINWGE.wf1. Master 2: Econométrie 2 p. 7/22
Données de panel Série temporelle pour chaque unité/individu. Important: la même unité est observée plusieurs fois au court du temps. Example: WAGEPAN.wf1. Master 2: Econométrie 2 p. 8/22
Rappels Modèle de régression simple Master 2: Econométrie 2 p. 9/22
Modèle de régression simple Objectif: estimer un modèle du type De manière générale: wage = β 0 + β 1 educ + u. (1) y = β 0 + β 1 x + u. (2) (2) est supposé tenir sur la population d intérêt. u est le terme d erreur (aléas) = facteurs non-observés autres que x qui affectent y. u et x sont des variables aléatoires. Interprétation Ceteris Paribus: Si u = 0 (autres facteurs inchangés) y = β 1 x. Master 2: Econométrie 2 p. 10/22
Modèle de régression simple Pour estimer β 0 et β 1 et garder cette interprétation CP il faut faire certaines hypothèses. E(u) = 0: normalisation on ne perd rien. E(u x) = E(u): pour toute valeur de x, la moyenne des u correspondantes est la même. implique la non-corrélation (linéaire). Ex: wage = β 0 + β 1 educ + u E(abil 8) = E(abil 16). En combinant ces 2 hypothèses: E(u x) = E(u) = 0: hyp. moyenne cond. nulle. E(y x) = β 0 + β 1 x: fonction de régression de la population. Master 2: Econométrie 2 p. 11/22
Estimation de β 0 et β 1 (x i,y i ) : i = 1,...,n = échantillon aléatoire de taille n tiré de la population. y i = β 0 + β 1 x i + u i, i. E(u) = 0 E(y β 0 β 1 x) = 0. E(u x) = 0 Cov. nulle entre u et x E[(y β 0 β 1 x)x] = 0. Pour obtenir ˆβ 0 et ˆβ 1 on va résoudre ce système en remplaçant E(.) par son équivalant empirique 1/n n i=1 (.). Master 2: Econométrie 2 p. 12/22
Estimation de β 0 et β 1 n n 1 (y i ˆβ 0 ˆβ 1 x i ) = 0 (3) i=1 n n 1 [(y i ˆβ 0 ˆβ 1 x i )x i ] = 0 (4) i=1 ˆβ 0 = y ˆβ 1 x (5) n ˆβ i=1 1 = (x i x)(y i y) n i=1 (x i x) 2 si > 0. (6) Estimation de β 0 et β 1 par la méthode des moments. Master 2: Econométrie 2 p. 13/22
Moindres carrés ordinaires (MCO) min b0,b 1 n i=1 (y i b 0 b 1 x i ) 2 2 équations de premier ordre : 2 2 n (y i ˆβ 0 ˆβ 1 x i ) = 0 (7) i=1 n [(y i ˆβ 0 ˆβ 1 x i )x i ] = 0 (8) i=1 ˆβ 0 = y ˆβ 1 x (9) n ˆβ i=1 1 = (x i x)(y i y) n i=1 (x i x) 2 si > 0. (10) Estimation de β 0 et β 1 par la méthode des MCO donne les même ˆβ 0 et ˆβ 1. Master 2: Econométrie 2 p. 14/22
Propriétés des estimateurs MCO SLR=Simple Linear Regression. SLR.1 y = β 0 + β 1 x + u linéaire en les paramètres. SLR.2 (x i,y i ) : i = 1,...,n échantillon aléatoire de taille n tiré de la population. SLR.3 E(u x) = 0 moyenne conditionnelle nulle. Permet de dériver les propriétés des MCO conditionnellement aux valeurs de x i dans notre échantillon. Techniquement identique à supposer x i fixes dans des échantillons répétés (pas très réaliste). SLR.4 n i=1 (x i x) 2 0 variation dans les x. Théorème 2.1: Sous les hypothèses SLR.1 - SLR.4, E(ˆβ 0 ) = β 0 et E(ˆβ 1 ) = β 1. Master 2: Econométrie 2 p. 15/22
Propriétés des estimateurs MCO SLR.5 V ar(u x) = σ 2 homoscédasticité. Théorème 2.2: Sous les hypothèses SLR.1 - SLR.5, V ar(ˆβ 0 ) = σ2 n 1 n i=1 x2 i n i=1 (x i x) 2 V ar(ˆβ 1 ) = σ 2 n i=1 (x i x) 2 Théorème 2.3: Sous les hypothèses SLR.1 - SLR.5, E(ˆσ 2 ) = σ 2, où ˆσ 2 = 1 n 2 n i=1 û2 i. Master 2: Econométrie 2 p. 16/22
Rappels Modèle de régression multiple Master 2: Econométrie 2 p. 17/22
Modèle de régression multiple Objectif: estimer un modèle du type wage = β 0 + β 1 educ + β 2 exper + u. (11) De manière générale: y = β 0 + β 1 x 1 +... + β k x k + u. (12) OLS: min n b0,b 1,...,b k i=1 (y i b 0 b 1 x i1... b k x ik ) 2. Master 2: Econométrie 2 p. 18/22
Modèle de régression multiple Exemple: y = β 0 + β 1 x 1 + β 2 x 2 + u. Comment obtenir β 1? Régresser x 1 sur x 2 : ˆx 1 = ˆα 0 + ˆα 1 x 2. Calculer ˆr 1 = x 1 ˆx 1. ˆβ 1 = n i=1 ˆr i1y i n i=1 ˆr2 i1. β 1 est bien l effet net de x 1 sur y, où net signifie après avoir tenu compte de l effet des autres variables. Master 2: Econométrie 2 p. 19/22
Goodness-of-Fit Il est possible de décomposer la variabilité observée sur y, c-à-d SST n i=1 (y i y) 2, en 2 quantités: SSE n i=1 (ŷ i y) 2 : variabilité expliquée par le modèle; SSR n modèle. i=1 û2 i : variabilité non-expliquée par le SST = SSE + SSR. On peut donc définir une mesure de qualité de la régression (GoF): R 2 = SSE/SST compris entre 0 et 1. Master 2: Econométrie 2 p. 20/22
Propriétés des estimateurs MCO MLR=Multiple Linear Regression. MLR.1 y = β 0 + β 1 x 1 +... + β k x k + u linéaire en les paramètres. MLR.2 (x 1i,...,x ki,y i ) : i = 1,...,n échantillon aléatoire de taille n tiré de la population. MLR.3 E(u x 1,...,x k ) = 0 moyenne conditionnelle nulle. MLR.4 n i=1 (x ji x) 2 0 j = 1,...,k et pas de relation linéaire parfaite entre les x j variation dans les x j et pas de collinéarité parfaite. Théorème 3.1: Sous les hypothèses MLR.1 - MLR.4, E(ˆβ j ) = β k j = 0,...,k. Master 2: Econométrie 2 p. 21/22
Propriétés des estimateurs MCO MLR.5 V ar(u x 1,...,x k ) = σ 2 homoscédasticité. Théorème 3.2: Sous les hypothèses MLR.1 - MLR.5, V ar(ˆβ j ) = σ 2 (1 R 2 j ) n i=1 (x ij x j ) 2 où R 2 j est le R2 de le régression de x j sur les autres x (+ une constante). Théorème 3.3: Sous les hypothèses MLR.1 - MLR.5 (appelées hypothèses de Gauss-Markov), E(ˆσ 2 ) = σ 2, où ˆσ 2 = 1 n k 1 n i=1 û2 i. Théorème 3.4 où théorème de Gauss-Markov: Sous les hypothèses MLR.1 - MLR.5, ˆβ j est BLUE, i = 0,...,k. Master 2: Econométrie 2 p. 22/22
Rappels sur l Inférence Master 2: Econométrie 2 p. 23/22
Hypothèse de normalité Pour faire de l inférence statistique, il faut ajouter une hypothèse supplémentaire: MLR.6 u N(0,σ 2 ) et indépendant des x j normalité. Les hypothèses MLR.1 - MLR.6 sont appelées hypothèses classiques du modèle linéaire (CLM) = Gauss-Markov + normalité. CLM MCO à la variance minimale. Comment justifier cette hypothèse de normalité des résidus? Si u est la somme de beaucoup de facteurs non-observés différents, on peut appeler le théorème central limite pour justifier la normalité. Master 2: Econométrie 2 p. 24/22
Théorème Central Limite Soit Y 1,Y 2,...,Y n un échantillon de variables aléatoires de moyenne µ et de variance σ 2. Z n = Y n µ σ/ n N(0,1). suit asymptotiquement une distribution Si Y χ 2 (1), µ = 1 et σ 2 = 2. Master 2: Econométrie 2 p. 25/22
Inférence Théorème 4.1: Sous les hypothèses MLR.1 - MLR.6, ˆβ j N(β j,v ar(ˆβ j )), i = 0,...,k, où σ V ar(ˆβ j ) = 2 n Exemple. (1 R 2 j ) i=1 (x ij x j ) 2. Théorème 4.2: Sous les hypothèses MLR.1 - MLR.6, ˆβ j β j t se(ˆβ j ) n k 1, i = 0,...,k, où se(ˆβ j ) = V ar(ˆβ j ) et σ 2 est remplacé par ˆσ 2. On peut donc tester H 0 : β j = a j contre H 1 : β j <,, > a j. Master 2: Econométrie 2 p. 26/22
P-valeur P-valeur: Quelle est le plus petit niveau de significativité auquel H 0 serait rejeté. Comment la calculer? Prendre la t-stat et regarder à quel pourcentile elle correspond dans la distribution de Student appropriée. Rejeter H 0 si la P-Valeur < au seuil fixé (ex: 5%). Master 2: Econométrie 2 p. 27/22
Tests multiples de restrictions linéaires Si H 0 : β j = 0 pour j 0, 1,...,k. Ex: H 0 : β 1 = β 2 = 0. et H 1 : H 0 n est pas vrai. 1) Estimer le modèle non contraint. 2) Estimer le modèle contraint. 3) Calculer la statistique F (SSR c SSR nc )/q SSR nc /(n k 1), où SSR dénote la somme des carrés des résidus et les indices c et nc signifient respectivement contraint et non-contraint. Sous H 0, F F q,n k 1, où F =Fisher. Rejet H 0, si F > c α, où c = F α q,n k 1. Master 2: Econométrie 2 p. 28/22
Exercices récapitulatifs Exercice 4.12. Exercice 4.17. Exercice 4.19. Master 2: Econométrie 2 p. 29/22
Rappels propriétés asymptotiques des MCO: Chapitre 5 Master 2: Econométrie 2 p. 30/22
Propriétés exactes des MCO Pour prouver le caractère non-biaisé et BLUE des MCO nous avons imposé des hypothèses assez fortes (MLR.1-MLR.5). Idem pour effectuer de l inférence statistique (MLR.6: normalité). Ces propriétés sont vraies quel que soit la taille de l échantillon ( n). On parle dès lors de propriété exacte, d échantillon fini, ou encore de petit échantillon. Master 2: Econométrie 2 p. 31/22
Propriétés asymptotiques des MCO Dans certains cas, le rejet de certaines hypothèses ne signifie pas que les MCO sont invalides. Ex: non-normalité de u. En effet, les MCO peuvent être encore valides en grand échantillon sous des hypothèses plus faibles. Étudier les propriétés statistiques pour n grand = étudier les propriétés asymptotiques. Nouveau concept: CONVERGENCE. Master 2: Econométrie 2 p. 32/22
Propriétés asymptotiques des MCO Pour rappel. Théorème 3.1: Sous les hypothèses MLR.1 - MLR.4, E(ˆβ j ) = β k j = 0,...,k. Pour rappel. MLR.3 E(u x 1,...,x k ) = 0 moyenne conditionnelle nulle. On a vu que E(u x 1 ) = 0 implique Cov(u,x 1 ) = 0. Définition: plim = Limite en probabilité = valeur vers laquelle un estimateur converge lorsque la taille de l échantillon tend vers l infini. Voir page 741. Hors, il est possible de montrer que: plim ˆβ 1 = β 1 + Cov(x 1,u) V ar(x 1 ) = β 1, si Cov(u,x 1 ) = 0. Master 2: Econométrie 2 p. 33/22
Propriétés asymptotiques des MCO Il est possible de relâcher MLR.3 pour prouver tout de même que les MCO sont convergents. MLR.3 E(u) = 0 et Cov(x j,u) = 0 j = 1,...,k moyenne nulle et correlation nulle. Sous les hypothèses MLR.1 - MLR.2 - MLR.3 - MLR.4, ˆβ j est un estimateur convergent de β j, j = 1,...,k. Master 2: Econométrie 2 p. 34/22
Normalité asymptotique La normalité ne joue aucun rôle dans le caractère non-biasés des MCO ni dans leur caractère BLUE. Par contre, pour effectuer de l inférence statistique nous avons supposé que u N(0,σ 2 ) et donc que la distribution de y x 1,...,x k est normale. distribution symétrique autour de sa moyenne. peut prendre des valeurs sur R. plus de 95% des observations sont comprises entre 2 écart-types. Master 2: Econométrie 2 p. 35/22
Normalité asymptotique Devons nous abandonner les t-stats si u n est pas normalement distribué? Non: on fait appel au théorème central limite pour conclure que les MCO satisfont la normalité asymptotique. Si n grand, ˆβ j est approximativement N(β j,v ar(ˆβ j )). Illustration via une Simulation de Monte-Carlo: Prg, Output n=2000,output n=30. Master 2: Econométrie 2 p. 36/22
Rappels Hétéroscédasticité: Chapitre 8 Master 2: Econométrie 2 p. 37/22
Conséquences de l hétéroscédasticité Une fois de plus l hétéroscédasticité n a pas d influence sur le caractère non-biaisé ou convergent des MCO. Par contre la formule traditionnelle de V ar(ˆβ j ) donne un estimateur biaisé de la variance des estimateurs si l hypothèse d homoscédasticité est violée. Inférence incorrecte si on utilise cette formule. MCO ne sont plus BLUE. Solution 1: Corriger cette formule Écart-types robustes à l hétéroscédasticité (White, 1980). Solution 2: Déterminer la source de cette hétéroscédasticité et la prendre en compte dans l estimation Moindres Carrés Pondérés. Master 2: Econométrie 2 p. 38/22
Corrélation sérielle et hétéroskedasticité: Chapitre 2 Master 2: Econométrie 2 p. 39/22
Section 1: Corrélation sérielle Master 2: Econométrie 2 p. 40/22
Biais des MCO et autocorrélation Supposons que y t = β 0 + β 1 x t + u t. Supposons que le terme d erreur suit un AR(1) : u t = ρu t 1 + e t avec ρ < 1 et e t iid(0,σ 2 e). Chapitre 10: TS.1-TS.3 MCO non-biaisés pour autant que x soit strictement exogène. Chapitre 11: TS.1 -TS.3 MCO consistant pour autant que y t soit faiblement dépendant et E(u t x t ) = 0. Rien n est dit sur le fait que u t ne puisse pas suivre un AR(1). Par contre les MCO ne sont plus BLUE car violation de TS.5 et TS.5. Master 2: Econométrie 2 p. 41/22
Efficience-Inférence des MCO Estimation du modèle y t = β 0 + β 1 x t + u t par MCO, où u t supposé iid(0,σ 2 ) et pour simplifier x = 0. Rappelons que u t suit en réalité un AR(1). ˆβ 1 = β 1 + SSTx 1 n i=1 x tu t, où SST x = n i=1 x2 t. V ar(ˆβ 1 ) = SST 2 x = SST 2 x = V ar( n x t u t ) i=1 n x 2 tv ar(u t ) + 2 i=1 σ 2 SST x + 2 σ2 SST 2 x n 1 n t t=1 j=1 n 1 t=1 ρ j x t x t+j n t j=1 x t x t+j E(u t u t+j ) Master 2: Econométrie 2 p. 42/22
Efficience-Inférence des MCO La formule traditionnelle ignore le second terme. Si ρ > 0 on sous-estime V ar(ˆβ 1 ). Si ρ < 0 on sur-estime V ar(ˆβ 1 ). Question: Supposons que u t = e t + αe t 1. Montrez que la formule traditionnelle pour calculer V ar(ˆβ 1 ) est incorrecte si α 0. Master 2: Econométrie 2 p. 43/22
Tester la présence d autocorrélation Dans le modèle général: y t = β 0 + β 1 x t1 +... + β k x tk + u t comment tester la présence de corrélation sérielle? Deux types de tests: 1. Tests basés sur l hypothèse que X est strictement exogène: t-test ou DW. 2. Tests basés sur l hypothèse que X n est pas strictement exogène. Master 2: Econométrie 2 p. 44/22
Si X est strictement exogène Supposons que y t = β 0 + β 1 x t + u t. Nous voulons tester si le terme d erreur suit un AR(1) : u t = ρu t 1 + e t avec ρ < 1. H 0 : ρ = 0. Développons tout d abord un test valide quand n est grand et quand X est strictement exogène. Hypothèses supplémentaires disant en quelque sorte que e t est iid: E(e t u t 1,u t 2,...) = 0 et V ar(e t u t 1 ) = V ar(e t ) = σ 2 e. Si les u t étaient observés on pourrait utiliser le Théorème 11.2 pour valider l utilisation asymptotique des t-tests dans la régression u t = ρu t 1 + e t. Que ce passe-t-il si on remplace u t par û t? A noter que û t dépend de ˆβ 0 et de ˆβ 1. Master 2: Econométrie 2 p. 45/22
Marche à suivre pour le t-test Estimer y t = β 0 + β 1 x t + u t et obtenir û t. Estimer û t = ρû t 1 + e t. Utiliser un t-test pour tester H 0 : ρ = 0 contre H 1 : ρ < > 0. Master 2: Econométrie 2 p. 46/22
Test de Durbin-Watson Le test de Durbin-Watson est un autre test pour tester la corrélation sérielle d ordre 1 sous l hypothèse que X est strictement exogène. La statistique DW = n t=2 (û t û t 1 ) 2 n t=1 û2 t d une régression du type y t = β 0 + β 1 x 1t +... + β k x kt + u t. Il est facile de montrer que DW 2(1 ˆρ)., où û t est le résidu Durbin et Watson (1951) ont dérivé la distribution de DW conditionnellement à X sous l hypothèse que les hypothèses du modèle linéaire classique sont vérifiées (incluant la normalité). La distribution de DW dépend de n,k, et du fait qu on a inclut une constante ou pas. Master 2: Econométrie 2 p. 47/22
Test de Durbin-Watson Notons que n t=2 (û t û t 1 ) 2 = n t=2 û2 t + n t=2 û2 t 1 2 n t=2 ûtû t 1. Si ˆρ = 1 DW = 0. Si ˆρ = 1 DW = 4. Si ˆρ = 0 DW = 2. H 0 : ρ = 0 contre généralement H 1 : ρ > 0. Durbin et Watson (1951) reportent des valeurs critiques inférieures d L et supérieures d U. Si d L DW d U, on ne rejette pas H 0. La plupart des logiciels économétriques reportent DW mais pas les valeurs critiques. Master 2: Econométrie 2 p. 48/22
Table de Durbin-Watson pour H 1 : ρ > 0 Master 2: Econométrie 2 p. 49/22
Si X n est pas strictement exogène Durbin (1970 propose un autre test valable si X n est pas strictement exogène, par exemple si le modèle contient y t 1 comme variable explicative. i) Estimer le modèle y t = β 0 + β 1 x t1 +... + β k x tk + u t et obtenir û t, t = 1, 2,...,n. ii) Estimer le modèle û t = γ 0 +γ 1 x t1 +...+γ k x tk +ρû t 1, t = 2, 3,...,n et obtenir ˆρ ainsi que tˆρ. iii) Utiliser tˆρ de la manière usuelle pour tester H 0 : ρ = 0 contre H 1 : ρ < > 0. On régresse û t sur x t et û t 1 et donc on permet à chaque x tj d être corrélé avec u t 1. tˆρ a approximativement une distribution en t si n est grand. Master 2: Econométrie 2 p. 50/22
Tester un AR(q) i) Estimer le modèle y t = β 0 + β 1 x t1 +... + β k x tk + u t et obtenir û t, t = 1, 2,...,n. ii) Estimer le modèle û t = γ 0 + γ 1 x t1 +... + γ k x tk + ρ 1 û t 1 +... + ρ q û t q, t = q + 1,q + 2,...,n. iii) Effectuer le F-test suivant H 0 : ρ 1 =... = ρ q = 0 contre H 1 : un des ρ j < > 0, j = 1,...,q. Si les x t sont supposés strictement exogènes, on peut les omettre dans les étapes i) et ii). A noter que ces tests supposent V ar(u t x t,u t 1,...,u t q ) = σ 2. Il existe une version de ces tests robuste à l hétéroskedasticité comme on le verra plus loin. Master 2: Econométrie 2 p. 51/22
Tester un AR(q) Une alternative a F -test est d utiliser un Lagrange Multiplier (LM) Test: LM = (n q)r 2 û, où R 2 û est le R2 de la régression û t = γ 0 + γ 1 x t1 +... + γ k x tk + ρ 1 û t 1 +... + ρ q û t q, t = q + 1,q + 2,...,n. Sous H 0,LM χ 2 q asymptotiquement. Ce test est connu sous le nom de test de Breusch-Godfrey. Il est test est disponible en Eviews (avec le F -test). Exemple: Taux d intérêt US obligataire à 3 mois. ci3 t = α 0 + α 1 ci3 t 1. Master 2: Econométrie 2 p. 52/22
Correction pour corrélation sérielle Si on détecte de la corrélation sérielle, on peut modifier le modèle initial pour tenter d obtenir un modèle dynamiquement complet (ex: AR(1) AR(2)). Dans certains cas nous ne sommes pas intéressé par modéliser cette dynamique l intérêt réside plutôt dans les autres variables incluses dans le modèle. Mais l inférence est compromise Que faire? Calculer des écart-types robustes à n importe quelle forme de corrélation sérielle. Master 2: Econométrie 2 p. 53/22
Écart-types robustes Considérons le modèle y t = β 0 + β 1 x t1 +... + β k x tk + u t, t = 1,...,n. Comment obtenir un écart-type pour ˆβ 1 robuste à la corrélation sérielle? x t1 = δ 0 + δ 2 x t2... + δ k x tk + r t, où E(r t ) = 0 et Corr(r t,x tj ) = 0, j 2. Il est possible de montrer que Avar(ˆβ 1 ) = V ar n ( i=1 r tu t), n ( i=1 E(r2 t )) 2 où Avar dénote la variance asymptotique. Sous l hypothèse TS.5, a t r t u t est non corrélé sériellement et donc la formule traditionnelle de V ar(ˆβ 1 ) est valide. Par contre si TS.5 ne tient pas, Avar(ˆβ 1 ) doit tenir compte de la corrélation entre a t et a s t s. Master 2: Econométrie 2 p. 54/22
Écart-types robustes Newey et West (1987) et Wooldridge (1989) ont montré que Avar(ˆβ 1 ) peut être estimé de la manière suivante. i) Estimer par MCO y t = β 0 + β 1 x t1 +... + β k x tk + u t, t = 1,...,n. se(ˆβ 1 ) dénote l écart-type de ˆβ 1 et ˆσ l écart-type de û t. ii) Estimer la régression auxiliaire: x t1 = δ 0 + δ 2 x t2... + δ k x tk + r t. iii) Calculer â t = ˆr t û t, t = 1,...,n. iv) Pour une valuer g > 0 donnée, calculer: ˆv = n t=1 â2 t + 2 g h=1 [1 h/(g + 1)]( n t=h+1 âtâ ) t h. g contrôle la quantité" de corrélation sérielle que nous permettons. Master 2: Econométrie 2 p. 55/22
Écart-types robustes Ex: g = 1, ˆv = n t=1 â2 t + n t=2 âtâ t 1. v) L écart-type robuste à la corrélation sérielle de ˆβ 1 est: se (ˆβ 1 ) = [se(ˆβ 1 )/ˆσ 2 ] ˆv. On peut montrer que cet estimateur est aussi robuste à toute forme d hétéroskedasticité cas plus général de ce qui est exposé au Chapitre 8. Comment choisir g? La théorie nous dit que g doit croître avec n. Master 2: Econométrie 2 p. 56/22
Choix de g Certains travaux ont suggéré pour: - des données annuelles g = 1, 2; - des données trimestrielles g = 4, 8; - des données mensuelles g = 12, 24. Newey et West (1987) recommandent de prendre la partie entière de 4(n/100) 2/9 implémenté en Eviews. Exemple: Taux d intérêt US obligataire à 3 mois. ci3 t = α 0 + α 1 ci3 t 1. Master 2: Econométrie 2 p. 57/22
Section 2: Hétéroscédasticité Master 2: Econométrie 2 p. 58/22
Hétéroscédasticité Pour beaucoup de séries temporelles, l hypothèse TS.4 ou TS.4 d homoscédasticité est violée. Exemple: Rendements journaliers du NYSE n affecte pas le caractère non-biaisé ou convergent des MCO mais invalide l inférence statistique traditionnelle. Il existe deux manières d aborder le problème lié à l hétéroscédasticité. i) Corriger les écart-types pour effectuer de l inférence correctement. ii) Modéliser la dynamique présente dans la variance. Master 2: Econométrie 2 p. 59/22
Écart-types robustes à la White (1980) White (1980) propose une méthode permettant de rendre les écart-types robustes à toute forme d hétéroscédasticité. offre une solution intéressante, pour autant que l intérêt ne se porte que sur la modélisation de la moyenne conditionnelle. Eviews, ainsi que beaucoup d autres logiciels économétriques, offre cette option. Il est possible de montrer que la formule de White (1980) est un cas particulier de la formule de Newey et West (1987) qui permet de tenir compte également d une possible autocorrélation des résidus. Exemple: AR(1) sur NYSE Master 2: Econométrie 2 p. 60/22
Tester la présence d hétéroscédasticité Avant de modéliser la dynamique présente dans la variance, il est judicieux de tester la présence d hétéroscédasticité afin d avoir une meilleure idée de la spécification à adopter. Pour appliquer les tests présentés ci-dessous il faut supposer que les résidus u t sont non corrélé sériellement tester avant. Test de Breusch-Pagan: u 2 t = δ 0 + δ 1 x t1 +... + δ k x tk + v t ; H 0 : δ 1 =... + δ k = 0. Pour utiliser un F -test, il faut que les écart-types des MCO soient valables et donct que v t satisfasse TS.4 ou TS.4 et TS.5 ou TS.5. Exemple: AR(1) sur NYSE: Estimer û 2 t = α 0 + α 1 return t 1 + e t Master 2: Econométrie 2 p. 61/22
Modèles ARCH Considérons un modèle simple: y t = β 0 + β 1 z t + u t. Une caractéristique largement admise des séries financières à fréquence élevée est que la variance n est pas constante au court du temps et qu il existe des grappes de volatilité. Si la variance en t est grande, elle le sera probablement demain et les jours qui suivent. Si la variance en t est petite, elle le sera probablement demain et les jours qui suivent. Engle (1982) a proposé un modèle appelé ARCH: Autoregressive Conditional Heteroskedasticity. Master 2: Econométrie 2 p. 62/22
Modèles ARCH La caractéristique du modèle ARCH(1) est que: E(u 2 t u t 1,u t 2,...) = E(u 2 t u t 1) = α 0 + α 1 u 2 t 1, alors que E(u 2 t u t 1,u t 2,...) = 0. Les u t sont non corrélés sériellement alors que les u 2 t le sont. Conditions de positivité: E(u 2 t u t 1) > 0, t α 0 > 0 et α 1 0. Si α 1 = 0 homoscédasticité. on peut tester la présence d effets ARCH en estimant ce modèle (sur û t ), voir une version plus étendue (plus de retards). On peut tester α 1,...,α q = 0 en utilisant un LM test ou F test. Master 2: Econométrie 2 p. 63/22
Chapitre 3: Pooling de données cross-section ou méthodes simples de données de panel: Master 2: Econométrie 2 p. 64/22
Pooling Une série cross-section (ou en coupes) constitue bien souvent un ensemble de données relatives à des unités (individus, firmes, etc.) interrogées à un moment donné. Dans certains cas, l enquête est répétée plusieurs fois donnant lieu à des échantillons différents, représentatifs de la population. La technique du pooling suppose que les différents échantillons sont chaque fois tirés aléatoirement de la population. On n observe pas nécessairement les mêmes unités. On dispose de plusieurs échantillons indépendants. Par conséquent, Corr(u t,u s ) = 0, t s et donc on peut donc (sous réserve) empiler les enquêtes et effectuer une analyse MCO traditionnelle. Master 2: Econométrie 2 p. 65/22
Panel Par contre, lorsqu on observe la même unité au court du temps, on parle de données de panel ou longitudinales. Par conséquent, on ne peut pas supposer que les observations sont indépendantes. Un facteur non-observé (comme le QI) qui affecte le salaire d un individu en 1995 va également affecter son salaire en 2000 = hétérogénéité non observée. Requiert des techniques particulières pour traiter ce problème. Empiler les échantillons et utiliser les MCO donne des estimateurs biaisés. Master 2: Econométrie 2 p. 66/22
Technique de pooling Beaucoup d enquêtes auprès des ménages sont répétées au court du temps. Vu que le taux d attrition est souvent assez grand, on veille à interroger de nouvelles personnes pour accroître l échantillon. On a alors des échantillons indépendants. Pourquoi effectuer plusieurs enquêtes? Pour avoir plus d observations et donc plus de précision dans l estimation des paramètres et des écarts-type. Master 2: Econométrie 2 p. 67/22
Technique de pooling Pour effectuer des tests nécessitant l utilisation d observations à différents moments du temps. Exemple : Pour tester l efficacité d une politique économique il faut des observations avant et après la mise en oeuvre de la politique. Etude de cas : La base de données FERTIL1.wf1 concerne l étude de Sanders (1994) sur la fertilité aux USA. Fréquence : une enquête tous les 2 ans de 1972 à 1984 7 vagues. La question posée est Comment évolue la fertilité au court du temps? après avoir contrôlé pour des facteurs tels que éducation, âge, race, région (à 16 ans), environnement (à 16 ans). Master 2: Econométrie 2 p. 68/22
Variable dépendante : KIDS Variable Coefficient Std. Error t-statistic Prob. C -7.742457 3.051767-2.537040 0.0113 EDUC -0.128427 0.018349-6.999272 0.0000 AGE 0.532135 0.138386 3.845283 0.0001 AGESQ -0.005804 0.001564-3.710324 0.0002 BLACK 1.075658 0.173536 6.198484 0.0000 EAST 0.217324 0.132788 1.636626 0.1020 NORTHCEN 0.363114 0.120897 3.003501 0.0027 WEST 0.197603 0.166913 1.183867 0.2367 FARM -0.052557 0.147190-0.357072 0.7211 OTHRURAL -0.162854 0.175442-0.928248 0.3535 TOWN 0.084353 0.124531 0.677367 0.4983 SMCITY 0.211879 0.160296 1.321799 0.1865 Y74 0.268183 0.172716 1.552737 0.1208 Y76-0.097379 0.179046-0.543881 0.5866 Y78-0.068666 0.181684-0.377945 0.7055 Y80-0.071305 0.182771-0.390136 0.6965 Y82-0.522484 0.172436-3.030016 0.0025 Y84-0.545166 0.174516-3.123871 0.0018 R-squared 0.129512 Mean dependent var 2.743136 Adjusted R-squared 0.116192 S.D. dependent var 1.653899 S.E. of regression 1.554847 Akaike info criterion 3.736447 Sum squared resid 2685.898 Schwarz criterion 3.816627 Log likelihood -2091.224 F-statistic 9.723282 Durbin-Watson stat 2.010694 Prob(F-statistic) 0.000000 Master 2: Econométrie 2 p. 69/22
Données de Panel à 2 périodes Supposons maintenant que nous disposons des données individuelles pour lesquelles un individu est observé en t = 1 et t = 2. Exemple : la base de donnée CRIME2 comprend des données sur les taux de criminalité et de chômage pour 46 villes américaines en 1982 et 1987. Estimation pour l année 1987 : Résultat. Comment expliquer ce résultat? Si chômage augmente, le crime diminue. Variables omises observables? On pourrait contrôler pour des facteurs tels que (la distribution de) l âge, éducation, etc. Master 2: Econométrie 2 p. 70/22
Données de Panel à 2 périodes Variables omises non-observables? On peut imaginer que certains de ces facteurs sont constants au court du temps et certains varient au court du temps. y it = β 0 + δ 0 d2 t + β 1 x it + a i + u it,t = 1, 2. i unité et t temps. d2 t = 0 si t = 1 et d2 t = 1 si t = 2 intercept différent pour t = 1 ou 2. a i capture tous les facteur non-observé affectant y it effet non-observé,fixe ou individuel. Ce modèle s appelle donc modèle à effet non-observé ou à effet fixe. u it est le terme d erreur idiosyncratique ou variant dans le temps. Master 2: Econométrie 2 p. 71/22
Exemple crmrte it = β 0 + δ 0 d87 t + β 1 unem it + a i + u it,t = 1, 2. a i reprend tous les autres facteurs affectant le taux de criminalité qui ne varient pas entre t = 1 et 2. caractéristiques géographiques (localisations aux USA). caractéristiques démographiques (age, race, éducation, etc.) : à vérifier. certaines villes peuvent avoir leurs propres méthodes pour comptabiliser les crimes. Comment estimer β 1? Pooling? Master 2: Econométrie 2 p. 72/22
Pooling y it = β 0 + δ 0 d2 t + β 1 x it + v it,t = 1, 2. v it = a i + u it. Pour estimer ce modèle par MCO il faut supposer que a i est non corrélé avec x it sinon v it (erreur composé) serait corrélé avec x it. Si ce n est pas le cas les MCO donne lieu à un biais d hétérogénéité non observée. Biais dû à l omission d une variable constante au court du temps. Exemple : CRIME2. 92 observations: 46 villes et 2 périodes. Master 2: Econométrie 2 p. 73/22
Panel Si a i est corrélé avec x it, la technique du pooling est donc inappropriée. Solution simple : estimer un modèle en différence première. y i1 = β 0 + β 1 x i1 + a i + u i1 (t = 1) y i2 = (β 0 + δ 0 ) + β 1 x i2 + a i + u i2 (t = 2). Par conséquent, (y i2 y i1 ) = δ 0 + β 1 (x i2 x i1 ) + (u i2 u i1 ) y i = δ 0 + β 1 x i + u i. Master 2: Econométrie 2 p. 74/22
Panel y i = δ 0 + β 1 x i + u i peut être estimé par MCO si les hypothèses traditionnelles sont validées. En particulier, il faut que Corr( u i, x i ) = 0, ce qui est naturellement vrai si Corr(u it,x it ) = 0, t = 1, 2. Dans notre exemple Corr( u i, unem i ) = 0? Faux si par exemple si l effort d application de la loi ( u it ) augmente plus dans des villes où le taux de chômage diminue Corr(u it,unem it ) < 0 biais des MCO. Important : on ne peut estimer par cette méthode l effet de variables constantes au court du temps (z i ). Exemple : Distance par rapport à la capitale z i = 0. Exemple : CRIME2. Master 2: Econométrie 2 p. 75/22
Modèle en DP pour T > 2 y it = δ 0 + δ 2 d2 t + δ 3 d3 t + β 1 x it1 +... + β k x itk + a i + u it, où t = 1, 2 et 3 3N observations. on a considéré ici 2 variables auxiliaires temporelles en plus de l intercept. Si Corr(a i,x itj ) 0 j = 1,...,k ˆβ j obtenu par MCO sur des données poolées sont biaisés et inconsistants. utiliser les techniques de panel si Corr(x itj,u is ) = 0 t,s et j, c-à-d si exogénéité stricte des x itj après contrôle des effets fixes a i. Pour éliminer a i on peut différencier les séries. Exemple : y i2 = y i2 y i1 et y i3 = y i3 y i2. Master 2: Econométrie 2 p. 76/22
Modèle en DP pour T > 2 y it = δ 2 d2 t + δ 3 d3 t + β 1 x it1 +... + β k x itk + u it, où t = 2 et 3 2N observations. Estimer le modèle par MCO sur les données poolées si les autres hypothèses des MCO sont validées. Il est important de vérifier que corr( u it, x itj ) = 0 j = 1,...,k et t = 2, 3. Notons que cette équation n a pas d intercept on ne peut pas calculer de R 2. Mais d2 t = 1 si t = 2 ( 1 si t = 3) et d3 t = 1 si t = 3 (0 si t = 2). y it = α 0 + α 3 d3 t + β 1 x it1 +... + β k x itk + u it. Master 2: Econométrie 2 p. 77/22
Panel Balancé Idem si T > 3. Si T est le même pour tous les individus on a un panel balancé. Si T > 2 il faut évidemment vérifier que u it n est pas corrélé sériellement. Master 2: Econométrie 2 p. 78/22
Hypothèses de l estimateur à DP 7 hypothèses sous-jacentes à l estimation par DP : FD.1 i Le modèle s écrit : y it = β 1 x it1 + β 2 x it2 +... + β k x itk + a i + u it,t = 1, 2,...,T. FD.2 On dispose d un échantillon aléatoire pour chaque dimension en coupes transversales ( cross-section ). FD.3 E(u it X i,a i ) = 0 L espérance conditionnelle du terme d erreur est nulle t E( u it X i ) = 0 pour t = 2,...,T. FD.4 Chaque variable explicative change dans le temps (au moins pour certains i) et il n y a pas de relation linéaire parfaite entre les variables explicatives. FD.5 t,v ar( u it X i ) = V ar( u it ) = σ 2 u. FD.6 t s,cov( u it, u is X i ) = 0. Master 2: Econométrie 2 p. 79/22
Hypothèses de l estimateur à DP FD.7 (Hypothèse de normalité) : Conditionnellement à X i, les u it sont indépendamment et identiquement distribués suivant une N(0,σ 2 u). Sous les hypothèses FD.1-FD.6, l estimateur par DP est BLUE (conditionnellement à X). Sous les hypothèses FD.1-FD.7, l estimateur DP est normalement distribué. Master 2: Econométrie 2 p. 80/22
Illustration Cette illustration concerne l effet de l alcool au volant. Quel est l effet des taxes et des lois sur l alcool au volant sur la mortalité liée à un accident de voiture? Données sur mortalité liée à un accident de voiture, taxes sur l alcool, lois sur l alcool au volant et d autres variables concernant 48 états américains contigus. Fréquence : Annuel de 1982 à 1988 7 années. Modèle simple : FatalityRate = α 0 + α 1 BeerTax + u, où FatalityRate = nombre annuel de morts suite à un accident de voiture par 10.000 personnes (aux USA) = 10000 mrall, et BeerTax = taxe réelle sur un casier de bière. Master 2: Econométrie 2 p. 81/22
MCO pour les années 1982 et 1988 Fatality rate (par 10.000) 4 3 2 1982 ^FatalityRate = 2.01 + 0.15 BeraTax (0.15) (0.13) Fatality rate (par 10.000) 4 3 2 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 Bear Tax (Dollars par caise en $1988) 1988 ^FatalityRate = 2.86 + 0.44 BeraTax (0.11) (0.13) 0.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 Bear Tax (Dollars par caise en $1988) Master 2: Econométrie 2 p. 82/22
Eviews - Workfile Eviews. - Programme Eviews. Code Eviews : Equation OLS FatalityRate = alpha_0 + alpha_1 BeerTax + u for year 1982 smpl 1982 1982 states.ls(h) vfrall? c beertax? freeze(eq_ols_1982) states Master 2: Econométrie 2 p. 83/22
Eviews Dependent Variable: VFRALL? Method: Pooled Least Squares Sample: 1982 1982 Included observations: 1 Number of cross-sections used: 48 Total panel (balanced) observations: 48 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. C 2.010381 0.149573 13.44082 0.0000 BEERTAX? 0.148460 0.132605 1.119565 0.2687 R-squared 0.013324 Mean dependent var 2.089106 Adjusted R-squared -0.008126 S.D. dependent var 0.667772 S.E. of regression 0.670480 Sum squared resid 20.67898 F-statistic 0.621164 Prob(F-statistic) 0.434658 Master 2: Econométrie 2 p. 84/22
Eviews Dependent Variable: VFRALL? Method: Pooled Least Squares Sample: 1988 1988 Included observations: 1 Number of cross-sections used: 48 Total panel (balanced) observations: 48 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. C 1.859073 0.114612 16.22053 0.0000 BEERTAX? 0.438755 0.127865 3.431391 0.0013 R-squared 0.134003 Mean dependent var 2.069594 Adjusted R-squared 0.115177 S.D. dependent var 0.521183 S.E. of regression 0.490251 Sum squared resid 11.05591 F-statistic 7.117958 Prob(F-statistic) 0.010503 Master 2: Econométrie 2 p. 85/22
Modèle en différence première - Ce résultat contre intuitif peut s expliquer par le fait que certaines variables omises sont corrélées avec BeerT ax estimateur biaisé. - Si ces variables sont constantes au court du temps, on peut estimer un modèle de panel en différence première. - Exemple : attitudes culturelles vis-à-vis de l alcool et de la conduite constant au court du temps (t) mais varie entre les états (i). Code Eviews : Equation OLS on first difference for t=1982 and 1988 --> T=2 smpl 1982 1988 states.genr dbtax?=beertax?-beertax?(-6) states.genr dvfrall?=vfrall?-vfrall?(-6) states.ls(h) dvfrall? c dbtax? freeze(eq_ols_fd) states Master 2: Econométrie 2 p. 86/22
Eviews Dependent Variable: DVFRALL? Method: Pooled Least Squares Sample(adjusted): 1988 1988 Included observations: 1 after adjusting endpoints Number of cross-sections used: 48 Total panel (balanced) observations: 48 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. C -0.072037 0.065355-1.102239 0.2761 DBTAX? -1.040973 0.355006-2.932267 0.0052 R-squared 0.119194 Mean dependent var -0.019512 Adjusted R-squared 0.100046 S.D. dependent var 0.415349 S.E. of regression 0.394025 Sum squared resid 7.141752 F-statistic 6.224897 Prob(F-statistic) 0.016248 Master 2: Econométrie 2 p. 87/22
Méthodes de panel avancées: Chapitre 4 Master 2: Econométrie 2 p. 88/22
Objectif Dans le chapitre précédent, nous avons vu l approche du pooling ainsi qu une méthode pour prendre en compte l hétérogénéité non observée : differences premières. Dans ce chapitre, 2 autres méthodes. Estimation par effets fixes comme pour les premières différences, cette méthode élimine les effets individuels a i avant estimation ainsi que l effet des variables constantes dans le temps. Estimation avec effets aléatoires si effet individuel non corrélé avec les variables explicatives. Ces 2 méthodes sont mises en oeuvre dans la plupart des logiciels économétriques comme Eviews, Rats et PcGive. Master 2: Econométrie 2 p. 89/22
Effets fixes Transformation par différences premières élimine les effets individuels a i. Méthode alternative meilleure sous certaines hypothèses : transformation par effets fixes. Modèle : y it = β 1 x it + a i + u it,t = 1, 2,...,T. Pour chaque i, la moyenne temporelle des y it est : où y i = 1 T T i=1 y it. y i = β 1 x i + a i + u i, Master 2: Econométrie 2 p. 90/22
Effets fixes Par conséquent, y it y i = β 1 (x it x i ) + (u it u i ),t = 1, 2,...,T. Ou encore, ÿ it = β 1 ẍ it + ü it, où ÿ it = y it y i est la valeur de y en déviation par rapport à sa moyenne temporelle. La transformation par effets fixes est aussi appelé transformation within. On peut remarquer que a i a disparu : on peut donc estimer le modèle ÿ it = β 1 ẍ it + ü it par MCO poolés Estimateur à effets fixes ou estimateur within (estimateur EF). Master 2: Econométrie 2 p. 91/22
Effets fixes On peut généraliser ce modèle au cas multivarié : y it = β 1 x it1 + β 2 x it2 +... + β k x itk + a i + u it,t = 1, 2,...,T. Le modèle à EF correspondant est alors : ÿ it = β 1 ẍ it1 + β 2 ẍ it2 +... + β k ẍ itk + ü it. Ceci peut également s estimer par MCO. L estimateur par effets fixes est non biaisé sous l hypothèse de variables explicatives exogènes ou sous l hypothèse que u it est non corrélé avec ces variables explicatives pour toutes les périodes (exogénéité stricte). Master 2: Econométrie 2 p. 92/22
Hypothèses de l estimateur à EF 7 hypothèses sous-jacentes à l estimation par EF : FE.1 i Le modèle s écrit : y it = β 1 x it1 + β 2 x it2 +... + β k x itk + a i + u it,t = 1, 2,...,T. FE.2 On dispose d un échantillon aléatoire pour chaque dimension en coupes transversales ( cross-section ). FE.3 E(u it X i,a i ) = 0 L espérance conditionnelle du terme d erreur est nulle t. FE.4 Chaque variable explicative change dans le temps (au moins pour certains i) et il n y a pas de relation linéaire parfaite entre les variables explicatives. FE.5 t,v ar(u it X i,a i ) = V ar(u it ) = σ 2 u. FE.6 t s,cov(u it,u is X i,a i ) = 0. Master 2: Econométrie 2 p. 93/22
Hypothèses de l estimateur à EF FE.7 (Hypothèse de normalité) : Conditionnellement à X i et a i, les u it sont indépendamment et identiquement distribués suivant une N(0,σ 2 u). Sous les hypothèses FE.1-FE.6, l estimateur par EF est BLUE (conditionnellement à X et à a i ). L estimateur en première différence est donc moins précis du fait de l absence de l hypothèse FE.6. Sous les hypothèses FE.1-FE.7, l estimateur EF est normalement distribué BLUE (conditionnellement à X et à a i ). Master 2: Econométrie 2 p. 94/22
Effets fixes : suite L estimateur de panel à effets fixes permet une corrélation entre a i et les variables explicatives pour n importe quelle période. Comme l estimateur élimine les a i, toute variable constante dans le temps sera également éliminée : ẍ it = 0 pour tout i et t si x it est constant dans le temps on ne peut pas inclure des variables constantes dans le temps. Master 2: Econométrie 2 p. 95/22
Estimation par effets fixes : suite Le nombre de degrés de liberté dans le modèle à effets fixes est égal à NT N k = N(T 1) k pour chaque i on perd 1 degré de liberté car on doit estimer x i. On peut néanmoins introduire des variables constantes dans le temps qui vont interagir avec des variables qui varient dans le temps. Exemple : impact de de l éducation sur le salaire pas possible d estimer le return car éducation constante dans le temps (en général); néanmoins, en multipliant educ par le temps, on peut voir si le rendement de l éducation évolue dans le temps. Master 2: Econométrie 2 p. 96/22
Régression par variable dummy Idée de l estimation par EF : le paramètre a i doit être estimé pour chaque i. Pour T 2, une solution est de mettre une variable dummy pour chaque coupe transversale (chaque i). Régression par variable dummy mise en oeuvre lorsque N pas trop élevé. Cette méthode donne exactement les même valeurs estimées ˆβ j que l estimation sur ÿ it. Avantage : le nombre de degrés de liberté correct est calculé directement. Master 2: Econométrie 2 p. 97/22
Estimation des effets individuels L estimation des valeurs estimées â i peut être d un intérêt économique. On peut en effet étudier leur distribution sur tous les i. On peut calculer les â i après estimation par effets fixes : â i = y i ˆβ 1 x i1... ˆβ k x ik,i = 1,...,N. Attention, certains logiciels reportent l intercept. Cet intercept reporté peut être la moyenne pour tous les i des â i à ne pas confondre avec les â i. Sous les hypothèses FE.1-FE.4, l estimation des a i est non biaisée. Néanmoins, pout T fixe, elle n est pas consistante quand N. On obtient de meilleurs estimateurs de a i avec T large. Master 2: Econométrie 2 p. 98/22
Effets fixes vs. première différence Les 2 méthodes permettent de traiter le problème de l hétérogénéité non observée. Laquelle choisir? Pour T = 2, les 2 méthodes donnent des résultats strictement identiques Estimateur en PD permet d estimer aisément des écarts-type robustes à l hétéroscédasticité. Pour T 3, il faut comparer les estimateurs sur base de leur efficience relative (les 2 sont non biaisés sous FE.1-FE.4 et consistants). Si les u it sont non autocorrélés (FE.6) l estimateur EF est plus efficient. Master 2: Econométrie 2 p. 99/22
Effets fixes vs. première différence Si les u it sont très autocorrélés (FE.6) l estimateur PD est plus efficient. A l extrême, si les u it suivent une marche aléatoire, alors u it sera non autocorrélé l estimateur PD est préférable. Dans les cas intermédiaires (autocorrélation positive mais ρ < 1), il est préférable d utiliser les 2 estimateurs. Pour tester l hypothèse de non autocorrélation, on peut utiliser les u it après estimation en PD. si non autocorrélation, estimateur PD meilleur; si autocorrélation négative importante, alors estimateur EF préférable car l estimateur PD crée de l autocorrélation par sur-différenciation. Master 2: Econométrie 2 p. 100/22
Effets fixes vs. première différence Prudence dans l utilisation de l estimateur EF lorsque N pas très large (ex: N = 20) et T large (ex: T = 30). En effet, sous FE.1-FE.7, la distribution de l estimateur EF est correcte N et T. Par contre, problème avec l estimateur à EF si une des hypothèses violées et que N petit et T large. Exemple : cas de racines unités l estimateur PD rendra la série stationnaire. Si non normalité, utiliser estimateur PD car FE.7 pas nécessaire. Si hétéroscédasticité, on peut utiliser estimateur PD avec écarts-type robustes. Master 2: Econométrie 2 p. 101/22
Effets fixes vs. première différence D un autre côté, l utilisation de l estimateur à EF est moins sensible à une violation de l hypothèse d exogénéité, surtout avec T large. Si hypothèse d exogénéité pose problème (exemple : variables dépendantes retardées), alors l estimateur EF est préférable. Pour conclure : choix non trivial entre méthodes EF et PD. Master 2: Econométrie 2 p. 102/22
Illustration - Revenons à l exemple sur l effet de l alcool au volant. - Considérons maintenant les 7 vagues de données. Code Eviews : Equation Fixed Effects smpl 1982 1988 states.ls(h,f) vfrall? c beertax? freeze(eq_ols_ef) states Master 2: Econométrie 2 p. 103/22
Illustration Dependent Variable: VFRALL? Method: Pooled Least Squares Sample: 1982 1988 Included observations: 7 Number of cross-sections used: 48 Total panel (balanced) observations: 336 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. BEERTAX? -0.655874 0.188154-3.485841 0.0006 Fixed Effects _AL--C 3.477630 _AZ--C 2.909903... _WY--C 3.249126 R-squared 0.905015 Mean dependent var 2.040444 Adjusted R-squared 0.889129 S.D. dependent var 0.570194 S.E. of regression 0.189859 Sum squared resid 10.34537 F-statistic 56.96916 Durbin-Watson stat 1.286873 Prob(F-statistic) 0.000000 Master 2: Econométrie 2 p. 104/22
Effets fixes dans un panel non cylindré Si pour certaines années, il y a des observations manquantes pour un nombre d individus i, alors on a un panel non balancé ou non cylindré. Si panel non balancé, on peut utiliser l estimateur à EF sous une condition cruciale. Condition cruciale : la raison pour laquelle on a des observations manquantes ne doit pas être corrélée aux u it Ceci garantit l existence d un échantillon aléatoire pour chaque coupe (FE.2). Exemple : panel de firmes pour étudier si le degré de syndicalisation affecte la profitabilité des firmes; si certaines firmes absentes pour des raisons de faible profitabilité (faillites, fusions, acquisitions), alors FE.2 est violée phénomène d attrition estimateurs biaisés. Master 2: Econométrie 2 p. 105/22
Estimation avec effets aléatoires Modèle de base : y it = β 1 x it1 + β 2 x it2 +... + β k x itk + a i + u it. Avec les estimateurs EF ou PD, le but est d éliminer les a i car ils sont sensés être corrélés avec les x itj. Supposons maintenant que Cov(x itj,a i ) = 0,t = 1, 2,...,T;j = 1, 2,...,k. Dans ce cas l estimateur à EF est non efficient et il est préférable d utiliser un estimateur à effets aléatoires (estimateur EA). Master 2: Econométrie 2 p. 106/22
Hypothèses de l estimation avec EA 3 hypothèses supplémentaires aux hypothèses FE.1, FE.2, FE.3, FE.5, FE.6 : RE.3 La valeur attendue des a i étant donnés les X i est constante : E(a i X i ) = β 0. RE.4 Il n y a pas de relation linéaire parfaite entre les variables explicatives. RE.5 La variance des a i est constante, conditionnellement aux X i : V ar(a i X i ) = σ 2 a. Master 2: Econométrie 2 p. 107/22
Estimation avec EA Comment estimer les β j sous les hypothèses précédentes? Quid si on estime le modèle par MCO poolés? Ceci produit des estimateurs de β j consistants mais non efficients car les erreurs seront autocorrélées. Le modèle est en effet : y it = β 0 + β 1 x it1 + β 2 x it2 +... + β k x itk + ν it, avec ν it = a i + u it. Exemple : T = 2 ν 11 = a 1 + u 11 et ν 12 = a 1 + u 12. Donc Corr(ν i1,ν i2 ) 0 de part la présence de a i dans les 2 termes. A cause des a i, les ν it sont donc autocorrélés : Cov(ν it,ν is ) = σ2 a σa+σ > 0,t s, avec 2 u 2 σ2 a = V ar(a i ) et σu 2 = V ar(u it ). Master 2: Econométrie 2 p. 108/22
Estimation avec EA Comme Cov(ν it,ν is ) 0, l estimation par MCO poolés donnent des estimateurs inefficients (écarts-type biaisés) et des statistiques en t invalides. Le modèle doit être estimé par Moindres carrés généralisés (MCG). Les MCG impliquent une transformation du modèle qui élimine cette autocorrélation : y it λy i = β 0 (1 λ) + β 1 (x it1 λx i1 ) + β 2 (x it2 λx i2 ) +... + (β k x itk λx ik ) + (ν it λν i ). On peut montrer (non démontré ici) que : λ = 1 [ σ 2 u σ 2 u+tσ 2 a ]1 2. Master 2: Econométrie 2 p. 109/22
Estimation avec EA L estimateur à EA est simplement l estimateur MCO poolé du modèle sur y it λy i. On voit que selon les valeurs de σ 2 u et de σ 2 a, 0 λ 1 données quasi en déviation par rapport à leur moyenne l estimateur à EA est basé sur un modèle dans lequel on soustrait une fraction de la moyenne temporelle de chaque variable. Pour λ = 0, on retrouve les MCO poolés. Pour λ = 1, on retrouve l estimateur EF. Comme on ne retranche plus la totalité de la moyenne, on peut inclure dans le modèle à EA des variables constantes dans le temps. Master 2: Econométrie 2 p. 110/22
Estimation par MCG faisable (FGLS) λ est inconnu il faut l estimer : MCG faisables. [ ˆλ = 1 1 1+T ˆσ2 a ˆσ 2 u ]1 2. Ceci requiert donc de trouver les estimateur de σa 2 et de σu 2 basés sur modèle de départ estimé par MCO poolés. T 1 t=1 T s=t+1 (ˆν itˆν is ), ˆσ a 2 = [NT(T 1)/2 (k +1)] 1 N i=1 où ˆν it sont les résidus du modèle MCO poolé. On peut alors calculer : ˆσ 2 u = ˆσ 2 ν ˆσ 2 a où ˆσ 2 ν est le carré de l erreur de régression du modèle de base. Lorsque l on utilise ˆλ à la place de λ, on obtient l estimateur à effets aléatoires. Master 2: Econométrie 2 p. 111/22
Propriétés de l estimateur à EA Sous les hypothèses FE.1, FE.2, RE.3, RE.4, RE.5, FE.6, l estimateur EA est consistant si N >> pour T fixe. De plus, l estimateur EA est approximativement nominalement distribué pour N grand et les écarts-type standards sont valides. Pour N petit et T large, les propriétés sont beaucoup moins connues prudence. Master 2: Econométrie 2 p. 112/22
Effets fixes vs. effets aléatoires Le choix entre EF et EA réside dans la nature perçue des a i. Si on ne peut pas considérer que les a i sont le resultat de tirages aléatoires dans une population, alors on doit les considérer comme des paramètres fixes à estimer estimateur à effets fixes. Exemple : données portant sur les provinces d un pays. Sinon, il faut évaluer si les a i sont corrélés ou non avec les x it. Si non corrélés estimateur à effets aléatoires. Pour évaluer le degré de corrélation, on peut comparer les valeurs estimées par EF et EA idée du test d Hausman(1978) (pas vu ici). Master 2: Econométrie 2 p. 113/22
Illustration: équation de salaire On estime une équation de salaire pour des hommes. On considère 7 variables explicatives : - 3 facteurs constants dans le temps : educ, black, hispan. - 4 facteurs variables dans le temps : exper,exper 2,married,union. Néanmoins, exper s accroît de 1 chaque année non variable en DP. On envisage 3 méthodes : MCO poolés, EF, EA. Master 2: Econométrie 2 p. 114/22
Résultats d estimation Var Expl Pool EA EF educ 0.091 0.092 - (0.005) (0.011) black -0.139-0.139 - (0.024) (0.048) hispan 0.016 0.022 - (0.021) (0.043) exper 0.067 0.106 - (0.014) (0.015) exper 2-0.0024-0.0047-0.0052 (0.0008) (0.0007) (0.0007) married 0.108 0.064 0.047 (0.016) (0.017) (0.018) U nion 0.182 0.106 0.080 (0.017) (0.018) (0.019) Master 2: Econométrie 2 p. 115/22
Commentaires Il n est pas possible d inclure les 4 premières variables dans le modèle à effets fixes. Pour les 4 premières variables, les coefficients sont similaires entre Pool et EA. Néanmoins, les écarts-type sont différents : l estimateur des MCO poolés donnent des écarts-type biaisés car il ignore l autocorrélation (positive). Pour les variables variables dans le temps, on observe des coefficients assez différents entre MCO poolés d une part et EA et EF d autre part. ˆλ = 0.643 l estimateur EA est plus proche de l estimateur EF que du MCO poolé. Master 2: Econométrie 2 p. 116/22
Chapitre 5: Estimation par variables instrumentales et doubles moindres carres Master 2: Econométrie 2 p. 117/22
Utilisation des variables instrumentales L utilisation de la méthode des variables instrumentales (VI) se justifie dans différents contextes Variables explicatives endogènes. Problème d erreurs de mesures sur certaines variables. Ex : revenu déclaré. Problème d omission de variables explicatives appropriées. Master 2: Econométrie 2 p. 118/22
Variables explicatives endogènes Dans ce contexte, l utilisation de VI donne lieu à une nouvelle méthode d estimation : les doubles moindres carrés. Méthode très populaire, notamment pour estimer modèles macroéconomiques à plusieurs équations. Des exemples spécifiques seront developpés dans le chapitre 16: modèles à équations simultanées. Exemple: Relation entre le taux de meurtre et taille des forces de polices. Le taux de meurtre dépend de la taille des forces de polices et la taille des forces de polices dépend du taux de meurtre : problème de simultanéité. Master 2: Econométrie 2 p. 119/22
Erreurs de mesure Problème d erreurs de mesures sur certaines variables explicatives. Exemple : revenu déclaré Master 2: Econométrie 2 p. 120/22
Omission de variables explicatives Omission de variables explicatives appropriées mène à un biais d estimation des coefficients de régression. Ce biais peut être éliminé si l on dispose de variables proxy. Quid si pas de proxy. Dans un contexte de données de panel, élimination du biais par différenciation si variable omise est indépendante du temps. Quid si la variable omise dépend du temps ou si l intérêt se porte sur des variables qui ne varient pas dans le temps (éliminées par différentiation)? Master 2: Econométrie 2 p. 121/22
Illustration: variables omises Master 2: Econométrie 2 p. 122/22
Exemple: relation salaire-éducation Le vrai modèle de régression est : wage = β 0 + β 1 educ + β 2 abil + e. Problème : on n observe pas abil (compétence). On peut utiliser le QI comme variable proxy de abil Quid si indisponible? Si on ignore abil Le modèle de régression devient : wage = β 0 + β 1 educ + u. u englobe abil si abil est corrélé avec educ, viole l hypothèse SLR.3 E(u x) = 0 biais dans l estimation de β 1. Master 2: Econométrie 2 p. 123/22
Modèle de régression simple Le modèle de régression s écrit : y = β 0 + β 1 x + u. A cause de l omission de certaines variables : Cov(x,u) 0 (13) les MCO donnent des estimateurs biaisés Idée des VI : utiliser une information additionnelle sous la forme d une variable observable z qui remplit 2 conditions: Condition 1: Cov(z,u) = 0. Condition 2: Cov(z,x) 0. Master 2: Econométrie 2 p. 124/22
Conditions 1 des VI Condition 1. Dans la population, Cov(z,u) = 0. z est dite exogène dans le modèle de régression. Dans le contexte d omission des variables,z n a pas d effet partiel sur y conditionnellement à x et u. Il est impossible de tester cette hypothèse faire appel à la théorique économique. Master 2: Econométrie 2 p. 125/22
Conditions 2 des VI Condition 2. Cov(z,x) 0. z est corrélée avec la variable explicative x On peut tester cette hypothèse : x = π 0 + π 1 z + ν. Comme π 1 = Cov(z,x)/V ar(z), condition 2 tient ssi on rejette l hypothèse H 0 : π 1 = 0 contre hypothèse alternative H 1 : π 1 0. Master 2: Econométrie 2 p. 126/22
Exemples et contre-exemples de VI Revenons à la relation salaire-education; Regardons quelques candidats de VI pour educ. Trouver z tel que Cov(z,abil) = 0 et Cov(z,educ) 0. Derniers numéros de sécurité sociale de l individu: Condition 1 OK; Condition 2 non remplie. QI : Condition 2 OK mais Condition 1 violée car QI corrélé avec abil et donc u. Master 2: Econométrie 2 p. 127/22
Exemples et contre-exemples de VI Education de la mère: Condition 2 OK (les parents éduqués ont plus de chance d avoir des enfants éduqués) ; Condition 1 moins évidente car corrélation compétence-éducation de la mère pas claire Voir la théorie économique. Nombre de frères et soeurs pendant l enfance: condition 2 OK car souvent beaucoup de frères et soeurs corrélés avec niveau d éducation faible; condition 1 vraissemblable. Master 2: Econométrie 2 p. 128/22
Estimation et Inférence par la méthode des variables instrumentales Master 2: Econométrie 2 p. 129/22
Estimateurs des VI Si l on dispose d une bonne VI, on peut estimer de manière consistente l équation y = β 0 + β 1 x + u.. Les 2 conditions des VI permettent d identifier β 1, c est-à-dire d écrire β 1 en termes de moments des variables observables:cov(z,y) = Cov(z,β 0 + β 1 x + u) = β 1 Cov(z,x) + Cov(z,u). Voir pp. 712-713 pour les propriétés de calcul des covariances. Si Cov(z,u) = 0, alors β 1 = Cov(z,y) Cov(z,x) Cov(z,x) 0. qui existe ssi Master 2: Econométrie 2 p. 130/22
Estimateurs des VI L estimateur par VI de β 1 : ˆβ 1 = n i=1 (z i z)(y i y) n i=1 (z i z)(x i x). Remarque : si x = z (cas de x exogène), alors on retrouve l estimateur des MCO. Dans ce cas,x est son propre instrument. L estimateur de l intercept est simplement: ˆβ 0 = y ˆβ 1 y. Sous les conditions 1 et 2, plim(ˆβ 1 ) = β 1 ˆβ 1 est convergent. Master 2: Econométrie 2 p. 131/22
Inférence avec les estimateurs des VI Les estimateurs VI sont comme les estimateurs MCO asymptotiquement distribués normalement. Pour faire de l inférence, on a donc besoin d un estimateur de la variance de ˆβ 0 et ˆβ 1. On fait l hypothèse d homoscédasticité : E(u 2 z) = V ar(u) = σ 2. Sous conditions 1 et 2 des VI et cette hypothèse, alors la variance asymptotique de ˆβ 1 est égale à σ 2 nσ 2 xρ 2 x,z où ρ xz est la corrélation entre x et z. Un estimateur consistent de σ 2 peut s obtenir comme pour les MCO par : ˆσ 2 = 1 n 2 n i=1 û2 i. Master 2: Econométrie 2 p. 132/22
Inférence avec les Estimateurs des VI La variance asymptotique de β 1 peut également s écrire ˆσ : 2 SCT x R où SCT x,z 2 x = n i=1 x2 i. Ceci permet de comparer avec la variance asymptotique de β 1 estimé par MCO qui est pour rappel : ˆσ 2 SCT x. On voit que plus R 2 x,z (R 2 de la régression de X i sur Z i ) est faible (instruments faibles), plus la précision de l estimateur des VI est faible. Comme R 2 x,z < 1, la variance des estimateurs VI et des DMC est toujours plus élevée que celle des MCO : le coût de l estimation des VI se paye en termes de précision de l estimateur. Master 2: Econométrie 2 p. 133/22
Illustration Regardons ce que l estimation par VI donne dans le cas de la relation salaire-education(ex 15.1) pour les hommes MCO sur log(wage) = β 0 + β 1 educ + u. Exemple: wage2.wf1. Endogénéité du niveau d éducation pose problème. On peut utiliser l éducation du père comme VI de educ Cette variable remplit la condition 2 des VI : une régression de educ sur fathereduc montre une corrélation positive et significative. L estimation par VI donne un impact plus faible (0.059 vs 0.109) et des écart-types plus élevés que ceux obtenus par MCO (0.035 vs 0.014): on perd la significativité de l éducation. Master 2: Econométrie 2 p. 134/22
Propriétés des VI avec instruments faibles Instruments faibles = VI pour lesquelles corrélation entre x et z est faible conséquences non désirables. Rappel pour les MCO : plim ˆβ 1 = β 1 + Cov(x,u) V ar(x) = β 1 + Corr(x,u) σ u σ x = β 1, si Corr(x,u) = 0. Pour les VI : plim ˆβ 1 = β 1 + [ Corr(z,u) Corr(z, x) ( σu σ x )]. (14) Master 2: Econométrie 2 p. 135/22
Propriétés des VI avec instruments faibles Si Corr(z,x) est faible, une faible corrélation entre z et u donne lieu à un estimateur largement inconsistent. Et ce, même si Corr(z,u) est faible. En termes de consistence, les VI sont préférables aux MCO ssi Corr(z,u) Corr(z,x) < Corr(x,u). Même en cas d endogénéité, les MCO peuvent être préférables : tout dépend de la corrélation entre la VI et x. Master 2: Econométrie 2 p. 136/22
Illustration Relation entre le poids du bébé à la naissance et le nombre de cigarettes fumées par la mère. Exemple: BWGHT.wf1. Problème : le nombre de cigarettes peut être corrélé avec des facteurs de santé non observés dans la régression corrélation entre x et u. Idée de VI : prix des cigarettes dans la région d habitation : faiblement corrélé avec le nombre de cigarettes (effet positif et non significatif): instrument faible. : résultat de la régression par VI : effet du nombre de cigarette positif sur le poids du bébé m is non significatif car écart-type très élevé. Instruments faibles (non valables) biais d estimation Master 2: Econométrie 2 p. 137/22 important.
Estimation par VI en régression multiple Master 2: Econométrie 2 p. 138/22
régression multiple Exemple : log(wage) = β 0 + β 1 educ + β 2 exper + u. y 1 = β 0 + β 1 y 2 + β 2 z 1 + u 1 Equation structurelle objet : estimation des β j. y 1 : variable dépendante ou endogène log(wage) y 2 : variable explicative endogène (corrélée avec u 1 ) educ z 1 : variable explicative exogène (non corrélée avec u 1 ) exper. E(u 1 ) = 0,Corr(u 1,z 1 ) = 0 mais Corr(u 1,y 2 ) 0 Si estimation par MCO: tous les β j seront biaisés. Master 2: Econométrie 2 p. 139/22
régression multiple z 1 ne peut pas servir d instrument pour y 2 recourt à z 2, une VI. Hypothèses cruciales: E(u 1 ) = 0, Cov(z 1,u 1 ) = 0, Cov(z 2,u 1 ) = 0 E(z 1,u 1 ) = E(z 2,u 2 ) = 0. Approche par la méthode des moments n (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0 i=1 n z i1 (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0 i=1 n z i2 (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0. i=1 Master 2: Econométrie 2 p. 140/22
régression multiple 3 équations linéaires pour 3 inconnues (β 0,β 1,β 2 ). si z 2 = y 2 (y 2 exogène), on retrouve les conditions du premier ordre des MCO La variable instrumentale z 2 doit être conditionnellement corrélée avec y 2 : y 2 = π 0 + π 1 z 1 + π 2 z 2 + ν 2. Il s agit d un exemple d équation en forme réduite : la variable endogène est exprimée exclusivement en termes de variables exogènes. La condition d identification (généralisation de la condition 2 vue précédemment) est :π 2 0. Master 2: Econométrie 2 p. 141/22
Exemple de régression multiple Lien éducation-salaire : 5 variables exogènes expérience, expérience au carré, dummy pour noir, dummy pour zone urbaine et dummy pour état du sud. Exemple: CARD.raw. Une VI candidate pour educ: dummy pour habitation proche d une école (nearc4). Vérification de la condition 2 (condition d identification) par une régression de educ sur nearc4 et les 5 autres variables exogènes coefficient de nearc4 positif et significatif : condition 2 remplie pour VI. L estimation par VI donne un impact plus élevé de l éducation sur le salaire que les MCO (0.132 vs 0.075) mais une plus grande incertitude (0.055 vs 0.003). Master 2: Econométrie 2 p. 142/22
Doubles Moindres Carrés Master 2: Econométrie 2 p. 143/22
Variable explicative endogène unique Soit le modèle de régression : y 1 = β 0 + β 1 y 2 + β 2 z 1 + u. On dispose de 2 variables exogènes exclues : z 2 et z 3 2 restrictions d exclusion. Si z 2 et z 3 sont corrélées avec y 2, on dispose de 2 VI potentielles. Dans ce cas, on va choisir la combinaison linéaire des variables exogènes z 1,z 2,z 3 la plus corrélée avec y 2 y 2. Master 2: Econométrie 2 p. 144/22
Variable explicative endogène unique Soit l équation en forme réduite : y 2 = π 0 + π 1 z 1 + π 2 z 2 + π 3 z 3 + ν 2. Les hypothèses sont les suivantes: E(ν 2 ) = 0, Cov(z 1,ν 2 ) = 0,Cov(z 2,ν 2 ) = 0 et Cov(z 3,ν 2 ) = 0. On trouve y 2 à partir de y 2 = π 0 + π 1 z 1 + π 2 z 2 + π 3 z 3. La condition d identification devient : π 1 0 ou π 2 0 Cette condition peut s évaluer en testant H 0 :π 1 = 0 et π 2 = 0 à l aide d un F-test. Master 2: Econométrie 2 p. 145/22
Les doubles moindres carrés (DMC) La méthode des DMC met en oeuvre ce qu on vient de voir à travers 2 étapes. Étape 1 : On estime la meilleure combinaison linéaire des VI en régressant par MCO y 2 sur z 1,z 2 et z 3 ŷ 2 = ˆπ 0 + ˆπ 1 z 1 + ˆπ 2 z 2 + ˆπ 3 z 3. Étape 2 : on utilise ŷ 2 comme instrument de y 2. La troisième condition des moments devient : n i=1 ŷ i2 (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0. (15) L étape 2 implique donc simplement d utiliser ŷ 2 obtenu en première étape comme régresseur : y 1 = β 0 + β 1 ŷ 2 + β 2 z 1 + ν 2. Master 2: Econométrie 2 p. 146/22
Illustration des DMC Reprenons l exemple de la relation salaire-éducation. On dispose de l équation structurelle : log(wage) = β 0 + β 1 educ + β 2 exper + β 3 exper 2 + u 1. exper et exper 2 sont non corrélés avec u 1. On va utiliser l éducation des parents comme VI : f atheduc et motheduc. L equation en forme réduite s écrit donc : educ = π 0 + π 1 exper + π 2 exper 2 + π 3 motheduc + π 4 fatheduc + ν 2. La condition d identification requiert donc : π 3 0 ou π 4 0, ce qui peut se tester par un test classique en F. Master 2: Econométrie 2 p. 147/22
Illustration des DMC Exemple: Rendements de l education pour les femmes actives MROZ.raw. Le test en F à partir de l équation en forme réduite donne une valeur de 55.40, ce qui correspond à une p-value de.0000 instruments qui satisfont la condition 2. La régression dans la forme structurelle par DMC donne un rendement de l éducation (des femmes) (coefficient β 1 ) de 0.061 et à peine significatif (gonflement de l écart-type 0.031). Master 2: Econométrie 2 p. 148/22
Extensions liées aux VI Master 2: Econométrie 2 p. 149/22
Variables endogènes multiples Cas de plusieurs variables endogènes exemple : y 2 et y 3 : y 1 = β 0 + β 1 y 2 + β 2 y 3 + β 3 z 1 + β 4 z 2 + u 1 où z 1 et z 2 sont des variables exogènes. Condition nécessaire d identification = Condition d ordre ou de rang : On a besoin d au moins autant de variables exogènes exogènes exclues (de l équation structurelle) que de variables endogènes présentes (dans l équation structurelle). Dans l exemple, l identification requiert 2 variables exogènes z 3 et z 4 qui doivent être significatives dans l équation en forme réduite. Master 2: Econométrie 2 p. 150/22
Erreurs de mesure sur variables Vrai modèle de régression: y 1 = β 0 + β 1 x 1 + β 2x 2 + u où x 1 est observé avec erreur on n observe que x 1: x 1 = x 1 + e y 1 = β 0 + β 1 x 1 + β 2 x 2 + (u β 1 e 1 ) Ceci crée un problème d endogénéité : corrélation entre x 1 et le terme d erreur (u β 1 e 1 ) MCO biaisés. Solution: trouver une VI pour x 1. Dans le cas des problèmes de mesure, idée est de trouver une variable z 1 corrélée avec x 1 mais dont l erreur de mesure est non corrélée avec e 1. Master 2: Econométrie 2 p. 151/22
Erreurs de mesure sur variables Exemples salaire annuel reporté par travailleurs (erreurs de mesure) : VI = salaire reporté par l employeur. Revenu annuel d un ménage : VI = niveau annuel de l épargne du ménage. Niveau d éducation reporté par les travailleurs : VI= nombre d années d éducation reporté par frère jumeau ou soeur jumelle. Master 2: Econométrie 2 p. 152/22
Test d endogénéité y 1 = β 0 + β 1 y 2 + β 2 z 1 + β 3 z 2 + u 1 Supposons que z 1 et z 2 sont des variables exogènes et z 3 et z 4 variables exclues. Comment tester si y 2 est endogène? Test d Hausman (1978) basé sur la comparaison entre valeurs estimées par MCO et par DMC. Pour voir si différences sont significatives, procédure en 3 étapes. Master 2: Econométrie 2 p. 153/22
Test d endogénéité d Hausman Étape 1: estimation de la forme réduite : y 2 = π 0 + π 1 z 1 + π 2 z 2 + π 3 z 3 + π 4 z 4 + ν 2. Si problème d endogénéité, ν 2 est corrélé avec u 1 et y 1 Étape 2: on récupère le résidu ˆν 2, contrepartie observable de ν 2. Étape 3: On estime par MCO y 1 = β 0 + β 1 y 1 + β 2 z 1 + β 3 z 2 + δ 1ˆν 2 + error et on teste par un test en t H 0 : δ 1 = 0; On conclut à l endogénéité de y 2 si rejet de H 0. Master 2: Econométrie 2 p. 154/22
Exemple de test d endogénéité On récupère le résidu ˆν 2 de l equation : educ = π 0 + π 1 exper + π 2 exper 2 + π 3 motheduc + π 4 fatheduc + ν 2. On inclut ˆν 2 dans l équation structurelle : log(wage) = β 0 + β 1 educ + β 2 exper + β 3 exper 2 + δ 1ˆν 2 + u 1. Le test en t de H 0 : δ 1 = 0 est égale à 1.67 Evidence limitée d endogénéité de educ doute Il est préférable d utiliser conjointement MCO et DMC. Master 2: Econométrie 2 p. 155/22
Test de suridentification De manière générale, on ne peut pas tester la condition 1 des VI càd Cov(z,u) = 0. Néanmoins une exception importante : lorsque l on dispose d au moins 1 restriction de suridentifcation. Le nombre de restrictions de suridentification = nombre d instruments excédentaires par rapport au nombre de variables endogènes. Exemple : y 1 = β 0 + β 1 y 2 + β 2 z 1 + β 3 z 2 + u 1. Si on dispose de 2 VI z 3 et z 4, on dispose d 1 condition de suridentification. Master 2: Econométrie 2 p. 156/22
Test de suridentification Pourquoi est-ce possible? on peut estimer les β avec une VI, récupérer les résidus et tester la corrélation par rapport à l autre VI pas possible si on ne dispose que d une seule VI. 3 étapes. Étape 1:Estimer l équation structurelle par VI et récupérer les résidus û 1. Étape 2: Régresser sur toutes les variables exogènes et récupérer le R-carré R 2 1. Sous hypothèse de non corrélation entre les VI et u 1 (validité de la condition 2), nr1 2 est distribué suivant une loi du χ 2 q ou q est le nombre de condition de suridentification. Master 2: Econométrie 2 p. 157/22
Test de suridentification Étape 3: Si nr1 2 excède la valeur critique (à 5% par exemple), on rejette la validité de la condition 2 et on conclut qu au moins une des 2 VI n est pas exogène. Rendements de l education pour femmes actives. En régressant le résidu des DMC û 1 sur exper et exper 2,motheduc et fatheduc, on obtient R1 2 =.0009 nr1 2 = 428(0.0009) =.3852 qui est faible par rapport à une distribution en χ 2 1 (p valeur =.535) L éducation des parents satisfont au test de suridentification. Master 2: Econométrie 2 p. 158/22
Chapitre 6: Modèles à équations simultanées Master 2: Econométrie 2 p. 159/22
Simultanéité Dans le chapitre précédent, nous avons vu 2 raisons principales d utilisation de la méthode des variables instrumentales (VI. 1) Problème d erreurs de mesure. 2) Problème d omission de variables explicatives appropriées. Dans chaque cas, le problème donne lieu à un problème d endogénéité. Dans ce chapitre, on va étudier en détails une autre raison importante: le problème de simultanéité. Master 2: Econométrie 2 p. 160/22
Simultanéité Le problème de simultanéité: Une ou plusieurs variables explicatives sont déterminées conjointement avec la variable dépendante, par exemple à travers une relation d équilibre. Les problèmes de simultanéité se posent par excellence dans les modèles à équations simultanées (MES). La méthode d estimation des VI et des DMC s applique pour estimer les modèles à équations simultanées alors que l estimation par MCO génère des estimateurs biaisés biais de simulatnéité. Master 2: Econométrie 2 p. 161/22
Caractéristique des MES Exemple de MES: Offre et demande de travail. Equation d offre de travail: h s = α 1 w + β 1 z 1 + u 1. Equation structurelle avec h s = offre de travail,w = salaire et z 1 = facteurs exogènes. Problème : La condition ceteris paribus n est pas respectée les variation de w ne sont pas exogènes car w est un salaire observé à l équilibre (demande de travail=offre de travail). Master 2: Econométrie 2 p. 162/22
Caractéristique des MES Equation de demande de travail: h d = α 2 w + β 2 z 2 + u 2. Equation structurelle avec h d = demande de travail,w = salaire et z 2 facteurs exogènes (de la demande). A l équilibre, pour chaque individu i, on a : h id = h is. On obtient alors un MES: h is = α 1 w i + β 1 z i1 + u i1 h id = α 2 w i + β 2 z i2 + u i2. MES à 2 équations dans leur forme structurelle; h i et w i sont des variables endogènes;z i1 et z i2 sont des variables exogènes. Master 2: Econométrie 2 p. 163/22
Autres exemples de MES Relation taux de meurtre et taille des forces de polices. Equation explicative des meurtres par ville: murdpc = α 1 polpc + β 10 + β 11 incpc + u 1 murdpc = Taux de meurtre par habitant;polpc =nombre de policiers par habitant; incpc:revenu par habitant. Equation explicative du nombre de policiers : polpc = α 2 murdpc + β 20 + autresfacteurs + u 2. polpc et murdpc sont 2 variables endogènes d un MES à 2 équations. Master 2: Econométrie 2 p. 164/22
Biais de simultanéité L utilisation des MCO pour estimer les équations structurelles d un MES donne lieu à un biais. Soit un MES à 2 équations: y 1 = α 1 y 2 + β 1 z 1 + u 1 y 2 = α 2 y 1 + β 2 z 2 + u 2. Trouvons la forme réduite de y 2 : y 2 = α 2 (α 1 y 2 + β 1 z 1 + u 1 ) + u 2. Ceci se réécrit comme : y 2 = π 21 z 1 + π 22 z 2 + ν 2, avec π 21 = α 1β 1 1 α 2 α 1 ; π 22 = β 2 1 α 2 α 1 ; ν 2 = α 2u 1 +u 2 1 α 2 α 1. Master 2: Econométrie 2 p. 165/22
Biais de simultanéité On peut estimer par MCO de manière consistente cette forme réduite car z 1 et z 2 sont exogènes et donc non corrélés avec u 1 et u 2 et donc ν 2. L estimation de la forme structurelle par MCO donne lieu à un estimateur biaisé. Exemple :équation y 1 = α 1 y 2 + β 1 z 1 + u 1 y 2 est corrélé avec u 1 Pourquoi? y 2 = f(ν 2 = α 2u 1 +u 2 1 α 2 α 1 ). Plus formellement : Cov(y 2,u 1 ) = Cov(ν 2,u 1 ) = [ α 2 1 α 2 α 1 ]E(u 2 1 ) = [ α 2 1 α 2 α 1 ]σ 2 1 Si α 2 0 (cas d un MES), alors MCO biaisés. Master 2: Econométrie 2 p. 166/22
Biais de simultanéité Rappels : plim ˆα 1 = α 1 + Cov(y 2,u 1 ) V ar(y 2 ). Le biais (asymptotique) de simultanéité aura le même signe que la covariance entre ν 2 et u 1. Le biais de simulatnéité dépend des paramètres α 2 et α 1. Exemple : si α 2 > 0 et α 2 α 1 < 1, alors le biais asymptotique sera positif l effet de y 2 sera surestimé. Master 2: Econométrie 2 p. 167/22
Identification d un MES à 2 équations Considérons le cas d un MES à 2 équations. y 1 = β 10 + α 1 y 2 + β 1 z 1 + u 1 y 2 = β 20 + α 2 y 1 + β 2 z 2 + u 2 Les variables z 1 et z 2 représentent un ensemble de respectivement k 1 et k 2 variables exogènes (avec une possible intersection entre les 2): z 1 β 1 = β 11 z 11 + β 12 z 12 +... + β 1k1 z 1k1 z 2 β 2 = β 21 z 21 + β 22 z 22 +... + β 2k2 z 2k2. Master 2: Econométrie 2 p. 168/22
Identification d un MES à 2 équations La présence ou non de ces variables z i va permettre de définir des restrictions d exclusion qui permettront de définir la condition d identification (condition d ordre) de chaque équation. Condition de rang pour l identification d une équation structurelle : La première équation dans un MES à 2 équations est identifiée ssi la seconde équation contient au moins une variable exogène (avec un coefficient β 2i non nul) qui est exclu de la première équation. Master 2: Econométrie 2 p. 169/22
Exemples d identification Modèle de demande et d offre. Equation d offre : q = α 1 p + β 1 z 1 + u 1 α 1 = élasticité de la quantité offerte par rapport au prix p Equation de demande: q = α 2 p + u 2 α 2 = élasticité de la quantité demandée par rapport au prix p. Dans ce MES, l offre n est pas identifiée; la demande est identifiée. Master 2: Econométrie 2 p. 170/22
Exemples d identification Modèle : offre de travail des femmes mariées 2 équations structurelles Equation d offre de travail (heures travaillées) : hours = α 1 log(wage) + β 10 + β 11 educ + β 12 age + β 13 kidslt6 + β 14 nwifeinc + u 1 ; kidslt6 =nombre d enfants <6ans;nwif einc =revenu non salarial de la femme mariée. Equation de salaire: log(wage) = α 2 hours + β 20 + β 21 educ + β 22 exper + β 23 exper 2 + u 2. A partir des équations structurelles, la condition d identification de l équation d offre de travail : β 22 0 ou β 23 0. Master 2: Econométrie 2 p. 171/22
Exemples d identification L identification requiert :β 12 0 ou β 13 0 ou β 14 0. On peut évaluer cela aussi en terme de forme réduite : log(wage) = π 20 + π 21 educ + π 22 kidslt6 + π 23 nwifeinc + π 24 age + π 25 exper + π 26 exper 2 + ν 2. L identification de l équation de salaire requiert : π 25 0 ou π 26 0. Pourquoi? Master 2: Econométrie 2 p. 172/22
Estimation par DMC L estimation par DMC peut se faire pour une équation identifiée. Dans ce cas, les VI sont simplement les variables exogènes de l autre équation. Exemple : Offre de travail des femmes mariées. Master 2: Econométrie 2 p. 173/22
MES à plus 2 équations Considérons le cas d un MES à 3 équations y 1 = α 12 y 2 + α 13 y 3 + β 11 z 1 + u 1 y 2 = α 21 y 1 + β 21 z 1 + β 22 z 2 + β 23 z 3 + u 2 y 3 = α 32 y 2 + β 31 z 1 + β 32 z 2 + β 33 z 3 + β 34 z 4 + u 3. Les conditions d identification sont des conditions nécessaire mais non suffisantes Il n est pas facile de déterminer les équations identifiées mais plus facile de déterminer les équations non identifiées. Equation explicative de y 3 est clairement non identifiée car il n y a pas de restrictions d exclusion. Master 2: Econométrie 2 p. 174/22
MES à plus 2 équations Condition d ordre pour l identification :Une équation dans un MES respecte la condition d ordre pour l identification si le nombre de variables exogènes exclues de l équation est plus grand ou égal au nombre de variables explicatives endogènes de l équation La condition d ordre est une condition nécessaire mais non suffisante conditions suffisantes plus difficiles à déterminer Master 2: Econométrie 2 p. 175/22
MES à plus 2 équations La seconde équation (y 2 = α 21 y 1 + β 21 z 1 + β 22 z 2 + β 23 z 3 + u 2 ) est identifiée ssi β 34 0. Dans ce cas, l équation est juste identifiée car on a 1 variable endogène explicative (y 1 ) et 1 VI (z 4 ) L identification d une équation dépend de la valeur des paramètres des autres équations. La première équation est sur-identifiée car on dispose de 3 VI (z 1,z 2,z 3 ) pour 2 variables endogènes (y 2,y 3 ). Master 2: Econométrie 2 p. 176/22
MES en séries temporelles Exemple type : Modèle keynésien en économie fermée C t = β 0 + β 1 (Y t T t ) + β 2 r t + u t1 I t = γ 0 + γ 1 r t + u t2 Y t C t + I t + G t. T t =taxes, r t =taux d intérêt, I t =Investissement, G t =dépenses publiques. 3 équations pour 3 variables endogènes : C t, I t et Y t. Troisième équation est une identité. Si r t est exogène, alors la seconde équation peut s estimer par MCO. La première équation (Consommation) doit s estimer par DMC (Y t endogène), 3 instruments : (T t, G t et r t ). Master 2: Econométrie 2 p. 177/22
MES en séries temporelles Le modèle keynésien est aujourd hui peu estimé pour 2 raisons. 1. On a besoin d hypothèses d exogénéité qui sont discutables r t n est pas exogène; pour l estimation par DMC, T t et G t doivent être exogènes, ce qui n est pas garanti. 2. Le modèle est statique irréaliste. Quid si on met de la dynamique? I t = γ 0 + γ 1 r t + γ 2 Y t 1 + u t2. Master 2: Econométrie 2 p. 178/22
MES en séries temporelles Peut-on considérer Y t 1 comme exogène? Oui (si u t2 non autocorrélé) : Y t 1 est une variable dite prédéterminée si r t est exogène, l équation peut être estimée par MCO. Puisque Y t 1 est exogène, il peut également être considéré comme un instrument potentiel. Master 2: Econométrie 2 p. 179/22
MES en séries temporelles: exemple relation consommation-revenu: test de l hypothèse du revenu permannent gc t = β 0 + β 1 gy t + β 2 r3 t + u t. gc t est le taux de croissance de la consommation variable I(0). gy t est le taux de croissance de la consommation variable I(0). r3 t est le taux d intérêt réel à 3 mois variable I(0). gc t et gy t sont mutuellement dépendentes simultanéité estimation par DMC. Master 2: Econométrie 2 p. 180/22
MES en séries temporelles: exemple L hypothèse du revenu permanent (HRP) implique: 1. β 0 = β 1 = 0. 2. u t est non autocorrélé. Instruments valides : valeurs retardées de gc t, gy t et r3 t. estimation par DMC montre que HRP est rejetée (H 0 : β 1 = 0 rejetée). Régresser û t sur û t 1 Rejet de H 0 : processus AR(1). Master 2: Econométrie 2 p. 181/22