Économétrie II L3 Économétrie L3 MASS Prof. Philippe Polomé, U. Lyon 2 Année 2012-2013 1 Ch. 5. t : E (ε t x t ) = 0 : Endogénéité 1. E (ε t )=0 t : Espérance nulle 2. var (ε t )=σ 2 t : Homoscédasticité 3. cov(ε t,ε s )=0 t = s : Pas d autocorrélation 4. E (ε t x t )=0 t : Exogénéité 5. La matrice X est de plein rang : Pas de multicolinéarité 6. Le modèle est correctement spécifié 7. La variable dépendante Y est continue 1.1 Définition & conséquences 1.2 Source 1. Hétérogénéité inobservée Source 1. Hétérogénéité inobservée : Variable omise FIGURE 1 Endogénéité 1
Le modèle correctement spécifié est Y = β 0 + β 1 x 1 + β 2 x 2 + ε Mais le modèle estimé est Y = β 0 + β 1 x 1 + ν L effet du régresseur manquant se retrouve dans l erreur du modèle estimée : ν = β 2 x 2 + ε 1.2.1 Proxy Modèle Y = β 0 + β 1 x 1 + β 2 x 2 + ε z corrélée à x 2 : x 2 = δ 0 + δ 1 z + µ La variable proxy est substituée à la variable inobservée dans Y = β 0 + β 1 x 1 + β 2 x 2 + ε On peut estimer Y = π 0 + π 1 x 1 + π 2 z + ξ Que dit ce modèle sur le précédent? Y = β 0 + β 1 x 1 + β 2 (δ 0 + δ 1 z + µ)+ξ = β 0 + β 2 δ 0 + β 1 x 1 + β 2 δ 1 z + β 2 µ + ε = π 0 + π 1 x 1 + π 2 z + ξ Donc si µ n est pas corrélé avec x 1, estimer Y = π 0 + π 1 x 1 + π 2 z + ξ par MCO est sans bias et consistante pour β 1 = π 1 Source 1. Hétérogénéité inobservée : Coefficients aléatoires Modèle vrai Y i = β 0 + ξ 1i x 1i + η i avec ξ 1i aléatoire t.q. ξ 1i = γ 1 + µ 1i On estime Y i = β 0 + β 1 x 1i + ε i donc ε i = µ 1i x i + η i β 1 = γ 1 1.3 Source 2. Erreurs de mesure Modèle y = β 0 + β 1 x 1 + ε On n observe pas x 1 mais bien x 1 = x 1 + ν ν est une erreur de mesure Classical Error-in-Variables (CEV) Équation estimée : avec x 1 y = β 0 + β 1 (x 1 + ν)+(ε β 1ν)=β 0 + β 1 x 1 + µ Donc, cov(x 1, µ)=cov(x 1 + ν,ε β 1ν)= β 1 σ 2 ν = 0 Pour autant que l erreur de mesure ν pas corrélée avec x 1 1.4 Source 3. Simultanéité y = β 0 + β 1 x + ε (x cause y) et x = γ 0 + γ 1 y + µ (y cause x) Donc : x(y) mais y(ε) donc x(ε) d où corrélation entre x et l erreur dans y = β 0 + β 1 x + ε Exemple de simultanéité : modèle keynésien Deux équations : forme structurelle = forme économique Consommation C t = β 0 + β 2 Y t + ε t avec Y le PIB Identité comptable Y t = C t + I t avec I l investissement, ici exogène Forme réduite = toutes les endogènes à gauche C t = 1 1 β 1 [β 0 + β 1 I t + ε t ]=δ 0 + δ 1 I t + µ t 2
Y t = 1 1 β 1 [β 0 + I t + ε t ]=γ 0 + γ 1 I t + ν t 1.5 Estimation en présence d endogénéité Méthode des Moments MM Soit A un estimateur de β, alors on peut écrire Y XA = ˆε Hypothèse exogénéité E (ε X)=0 On peut que montrer que cela implique E (Xε)=0 Stratégie méthode des moments C est-à-dire on veut A tel que X ˆε = 0 Donc : X (Y XA)=0 : ce sont les CPO de moindres carrés A =(X X) X Y = ˆβ Hypothèse exogénéité E (ε X)=0 ne tient plus Supposons qu on puisse trouver un ensemble de variables Z ou instruments telles que Z et X soient de mêmes dimensions E (ε Z)=0 Corr (Z, X) soit élevée Donc Z permet d inverser la relation Y = Xβ + ε via Z Y = Z XA+ Z ε Si on a PlimZ ε = 0 (à la limite Z et ε ne sont pas corrélés) Alors : Estimateur Méthodes des Moments ( Variables Instrumentales VI) : A t.q. Z (Y XA)=0 A =(Z X) Z Y = ˆβ VI On peut démontrer que Σ ˆβVI = σε 2 Z X Z Z Z X À la limite si Z et X sont non-corrélés, alors Z X 0 et Σ ˆβVI = remplacer X par Z dans Y = Xβ + ε Si on le faisait, le modèle serait Y = Zγ + µ Et l estimateur MCO serait ˆγ MCO = Z Z Z Y Validité des instruments Soit Y = β 0 + β 1 x + ε x est endogène, on a un instrument z Si cov(z,ε) = 0 on peut montrer que Plim ˆβ 1VI = β 1 + cov(z,ε) cov(z,x) Donc que si cov(z,ε) = 0 alors ˆβ VI est inconsistant De plus Plim ˆβ 1VI = β 1 + σ εcorr (z,ε) σ x corr (z,x) Donc, si corr (z,ε) = 0 même faible, alors si corr (z,x) est faible (mauvais instrument), Plim ˆβ 1VI ne sera pas proche de β 1 Devoir #3 : VI Reprenez de ma feuille Tableur l exemple avec un régresseur endogène Générez un instrument Valide (= non-corrélé avec le terme d erreur) Bon (= corrélation élevée avec le régresseur endogène) Basez-vous directement sur la façon dont le régresseur a été généré Estimez les coefficients du modèle par VI Examinez comment les coefficients estimés varient en fonction de la corrélation de l instrument avec 3
le régresseur Illustrez qu un instrument non-valide amène à l inconsistance Examinez le degré d inconsistance en fonction de la corrélation de l instrument avec le régresseur Doubles moindres carrés MC2E (2SLS) Soit l équation structurelle Y = Xβ + ε Supposons que dans X, x k soit endogène et qu on dispose d un instrument z pour x k La matrice d instruments serait Z, identique à X sauf pour la dernière colonne dans laquelle on a remplacé x k par z Équation d instrumentation x k = δ 0 + δ 1 x 1 +...+ δ k x k + δ k z + µ = δz + µ Estimation MCO, valeurs ajustées de x k sont ˆx k = ˆδ 0 + ˆδ 1 x 1 +...+ ˆδ k x k + ˆδ k z = Z ˆδ Écrit de cette manière, on voit que ˆx k est un instrument valide pour x k si z est un instrument valide pour x k ˆX la matrice X dans laquelle on a remplacé x k par ˆx k Estimateur VI est ˆβ VI = ˆX X Meilleur que (Z X) Z Y car la corrélation entre ˆx k et x k devrait être plus élevée que entre z et x k L estimateur VI est équivalent à une estimation MCO en deux étapes (MC2E) : 1. Estimation de l équation d instrumentation x k = δz + µ 2. Remplace X par ˆX dans l équation structurelle : Y = π ˆX + ν (régression de 2nde étape) et on estime par MCO Preuve ˆπ MC2E = ˆX ˆX : c est ˆX ˆX et pas ˆX X comme dans ˆβVI On peut montrer que ˆπ MC2E = ˆβ VI = ˆX X On note qu on peut écrire ˆX = Z Z Pour la dernière colonne de ˆX, c est Z ˆδ Pour les autres, ce sont les colonnes de X (exogènes) ˆπ MC2E = ˆX ˆX = X Z Z Z Z Z = X Z Z = ˆX X = ˆβ VI Z 1.6 Tests Test 1. Hausman : Endogénéité MCO MC2E consistant consistant Aucun régresseur endogène efficient inefficient Au moins 1 régresseur endogène inconsistant consistant 4
2 autres tests : Définitions Equation structurelle : y 1 = β 0 + β 1 y 2 + β 2 x 1 + β 3 x 2 + µ 1 Forme réduite pour y 2 : y 2 = π 0 + π 1 x 1 + π 2 x 2 + π 3 x 3 + π 4 x 4 + ν 2 Test 2. Test de régression / de corrélation des erreurs On veut tester l endogénéité de y 2 Chaque x j est non-corrélé avec µ 1 y 2 non-corrélé avec µ 1 ssi ν 2 non-corrélé avec µ 1 Estimer y 2 = π 0 + π 1 x 1 + π 2 x 2 + π 3 x 3 + π 4 x 4 + ν 2 par MCO (consistant) On obtient ˆν 2 : une approximation à ν 2 Estimer y 1 = β 0 + β 1 y 2 + β 2 x 1 + β 3 x 2 + δ 1 ˆν 2 + erreur par MCO ˆν 2 significatif (t-stat) = ν 2 et µ 1 corrélés, donc y 2 endogène Test 3. OverID Restrictions sur-identifiées : Exogénéité de l instrument 1. Estimer l équation structurelle par VI en utilisant seulement x 3 comme instrument (a) Construire résidu empirique ˆµ 1MC2E = y 1 ˆβ 0 + ˆβ 1 y 2 + ˆβ 2 x 1 + ˆβ 3 x 2 2. Régresser résidu ˆµ 1MC2E sur toutes les variables exogènes du modèle (explicatives + instruments) (a) ˆµ 1MC2E = γ 0 + γ 1 x 1 + γ 2 x 2 + γ 3 x 3 + γ 4 x 4 + ξ (b) Calculer le R 2 de cette régression 3. Sous l hypothèse nulle (exogénéité des instruments) : nr 2 a χ 2 q 1.7 Applications Equation de salaire Fonction mincérienne de salaire : lnw = β 0 + β 1 educ + β 2 exper + β 3 exper 2 + ε Données card.gdt de Wooldridge Poids à la naissance Données bwght.gdt Wooldridge 1.8 Source 4. Échantillonnage Cas 1. Troncature (Truncation) P.e. si l inclusion dans l échantillon est y i c i (sélection de troncature) Alors ε i c i X i β : la sélection de troncature introduit une corrélation contemporaine entre l erreur et les régresseur(s) Cas 2. Troncature accidentelle On n observe y que si Zγ + ν > 0(equation de participation) soit le modèle y = Xβ + ε Il semble raisonnable de supposer que le terme d erreur (ν) de l équation de participation dans le marché du travail peut être corrélé au terme d erreur (ε) de l équation de salaire On écrit ν (ε) que certains régresseurs au moins soient commun à Z et à X Alors, on peut écrire l équation de sélection comme Xγ 1 +Wγ 2 > ν (ε) Donc, la troncature accidentelle provoque une corrélation entre X et ε : endogénéité 5