Chapitre 6 La méthode des variables instrumentales Licence Econométrie / MASS Econométrie II, 007-008 Martin Fournier Fournier@gate.cnrs.fr Econométrie/Mass. Présentation du problème La question de l endogénéité Econométrie/Mass. L hypothèse d éxogénéité Les MCO supposent l exogénéité des variables explicatives, i.e. Cov(x,u) = 0 Il existe de nombreuses situations où l on doit rejeter cette hypothèse La méthode des variables instrumentales permet de tenir compte de l endogénéité de certaines variables explicatives Econométrie/Mass 3
. Endogénéité et causalité Une première source d endogénéité concerne la possibilité d une causalité inverse. On estime : y = β 0 + β x + β x + u Alors qu il existe une causalité inverse telle que : x = δ 0 + δ x + Zγ + αy + v Cov(x,u) 0 Econométrie/Mass 4.3 Un exemple On cherche à estimer une équation de croissance économique : ln(pib t ) ln(pib t- ) = β 0 + β INV t + β EXP t + u INV : taux d investissement EXP : taux d exportations Or on sait que : INV t = δ 0 + δ PIB t- + Zδ + v et EXP t = γ 0 + γ PIB t- + Zγ + w Econométrie/Mass 5.4 Endogénéité et variable omise Supposons que le modèle sous-jacent est : y = β 0 + β x + β x + u mais que l on fasse une erreur de spécification en omettant la variable x. On estime donc : y = δ 0 + δ x + v avec v = β x + u Si les variables x et x sont corrélées alors x est également corrélé à v Econométrie/Mass 6
.5 Erreurs de mesure CEV «Classical Error-in-Variables» (CEV) : y = β 0 + β x + u Avec une observation avec erreur : x e = x x Équation estimée : y = β ( u β ) 0 + βx + e Avec x corrélé avec le terme d erreur u-β e. cov ( x, u β e ) = β cov( x, e ) = β σ e Econométrie/Mass 7. La méthode des variables instrumentales Le cas de la régression simple Econométrie/Mass 8. Objectifs Méthode qui permet d estimer des paramètres sans biais lorsqu une variable explicative est endogène (i.e. Cov(x,u) 0) Causalité inverse Biais de variable omise CEV Econométrie/Mass 9 3
. Les instruments y = β 0 + β x + β x + u avec Cov(x,u) 0 On appelle instrument pour la variable x une variable z qui vérifie les propriétés suivantes : ) z est une variable exogène : Cov(u) = 0 ) z est une variable corrélée avec la variable x : Cov(x ) 0 Econométrie/Mass 0.3 Trouver un instrument valide La théorie économique (et le bon sens) permettent (parfois) de trouver des instruments qu il peut être légitime de supposer exogènes (Cov(u) = 0) On peut en revanche aisément tester formellement la deuxième propriété (Cov(x ) 0) par un T-test à partir d une première estimation : x = π 0 + π z + v H 0 : π = 0 Econométrie/Mass.4 Variables instrumentales Régression simple Prenons le cas de la régression simple : y = β 0 + β x + u avec x endogène et z un instrument valide On peut écrire : L estimateur IV de β est donc donné par : Econométrie/Mass 4
.5 Variables instrumentales Régression simple () Sous l hypothèse d homoscédasticité E(u z) = σ = Var(u) On peut écrire la variance du paramètre estimé : Var Var ˆ ( ˆ β ) σ = nσ ρ x x, z ( ˆ ˆ σ β) = SST R x x, z Econométrie/Mass 3.6 IV versus OLS ( ˆ ˆ σ Var ˆ β ) = OLS SST ( ) x ˆ ˆ σ Var ˆ β IV = SSTxRx, z La variance de l estimateurs IV ne diffère de celle des MCO que par le R de la régression de x sur z Comme R <, La variance de l estimateurs IV est plus grande que celle des MCO NB : Mais l estimateur MCO est biaisé si Cov(x,u) 0! Plus la corrélation entre z et x est forte, plus la variance de l estimateur IV est faible Econométrie/Mass 4.7 Validité des instruments Il est souvent difficile de tester l hypothèse d exogénéité des instruments (Cov(u) = 0) Si l instrument n est pas exogène, l estimateur IV sera également biaisé : Corr( u) σ u IV : plim ˆ β = β + Corr( x) σ ~ σ u OLS: plim β = β + Corr( x, u) σ x L estimateur IV sera préféré si : Corr(u)/Corr(x) < Corr(x,u) Econométrie/Mass 5 x 5
.8 Variables instrumentales Doubles Moindres Carrés (SLS) y = β 0 + β x + u x = π 0 + π z + v L estimateur IV est équivalent à une estimation en deux étapes : ) Estimation de l équation d instrumentation : x = π 0 + π z + v xˆ = π 0 + πz ) Estimation de l équation d intérêt sur x y = δ 0 + δ xˆ + w Econométrie/Mass 6.9 IV Doubles Moindres Carrés () On peut montrer que : δ = MCO IV β La relation : y = δ 0 + δ xˆ + w peut être estimée par les MCO avec : δ MCO Cov( π 0 + π y) πcov( y) = = Var( π + π z) Cov( π + π x u) πcov( y) Cov( y) = = = β π Cov( x) Cov( u) Cov( x) 0 0 IV Econométrie/Mass 7 3. La méthode des variables instrumentales Le cas de la régression multiple Econométrie/Mass 8 6
3. IV et régression multiple Les estimations IV peuvent être étendues au cas de la régression multiple : y = β 0 + β y + β z + u avec y et y 3 endogènes et z et z exogènes Il est nécessaire d avoir au moins un instrument pour chaque variable Econométrie/Mass 9 3. IV et régressions multiples () Écrivons le modèle structurel comme : y = β 0 + β x + β x + u avec x endogène et x exogène Soit z un instrument pour x Cov(u) = 0 x = π 0 + π z + π x + v, avec π 0 NB : Cette équation régresse la variable endogène sur toutes les variables exogènes et l instrument Econométrie/Mass 0 3.3 Doubles Moindres Carrés - Two Stage Least Squares (SLS) y = β 0 + β x + β x + u Il est possible (et souhaitable) d avoir plusieurs instruments pour la même variable endogène : x = π 0 + π z + π z + π 3 z 3 + v Hypothèse : z et z 3 sont des instruments valides - Ils ne sont pas des déterminants directs de y - Ils sont non-corrélés avec le terme d erreur u - Ils sont corrélés avec y Econométrie/Mass 7
3.4 L estimateur IV et les SLS On peut montrer (cf. cours de M) que dans le cas général l estimateur IV est donné par : IV β = ( Z' X ) Z' Y avec Z : Ensemble des variables exogènes (explicatives non endogènes + instruments) Ce qui correspond à l estimateur des doubles moindres carrés : SLS Xˆ Xˆ β = ( ' ) Xˆ ' Y Avec Xˆ : Ensemble des variables explicatives simulées à partir de l équation d instrumentation : X = Zπ + v Econométrie/Mass 3.5 L estimateur IV et les SLS () X = Zπ + v IV SLS β = β MCO ˆ π = ( Z ' Z ) Z ' X MCO Xˆ = Z ˆ π = Z( Z ' Z) Z' X Y Xˆ SLS = β + u ˆ SLS β = ( Xˆ ' Xˆ ) = ' ' [( Z( Z ' Z) Z' X ) ( Z ( Z' Z ) Z ' X )] ( Z ( Z' Z) Z' X ) = ( Z' X ) Z ' Y Xˆ ' Y Econométrie/Mass 3 Y 3.6 Doubles Moindres Carrés : La forme de l instrumentation Remarque : Chacun des instruments pourrait être utilisé indépendamment comme instrument La meilleure forme d instrumentation est une combinaison linéaire de toutes les variables exogènes Remarque : Si les coefficients de l estimateur IV et de l estimateur SLS sont égaux, la variance des MCO pour l estimation de deuxième étape est invalide Econométrie/Mass 4 8
3.7 Nombre d instruments Lorsqu on a plusieurs variables endogènes, il faut avoir au moins autant d instruments que de variables endogènes Econométrie/Mass 5 4. Le cas particulier des erreurs de mesure Econométrie/Mass 6 4. Erreurs de mesure CEV et estimations IV Reprenons le modèle d erreur de mesure CEV y = β 0 + β x * + β x + u - On observe x au lieu de x * - x = x * + e - e est non corrélé avec x * et x - x est endogène Si l on peut trouver un instrument z pour x t.q. Corr(u) = 0 et Corr(x ) 0 Alors l estimation IV corrige le biais d atténuation Econométrie/Mass 7 9
5. Tester l endogénéité d une variable Econométrie/Mass 8 5. Test de Hausman On sait que : - Les estimateurs MCO et IV sont sans biais et convergents sous l hypothèse d exogénéité - Seul l estimateur IV reste sans biais si l hypothèse d exogénéité est rejetée - L estimateur MCO est préférable à l estimateur IV sous l hypothèse d exogénéité L idée du test de Hausman est de tester l égalité des estimateurs MCO et IV Test disponible sous tous les logiciels usuels Econométrie/Mass 9 5. Test de corrélation des erreurs y = β 0 + β x + β x + u x = π 0 + π z + π z + π 3 z 3 + v Si x est endogène et z un jeu d instruments valides alors le résidu de l équation d instrumentation v est corrélé au résidu de l équation d intérêt u Tester directement cette hypothèse Econométrie/Mass 30 0
5.3 Test de corrélation des erreurs () Procédure en 3 étapes : ) Estimation de l équation d instrumentation et création d une variables de résidus v ) Inclusion du résidu v comme variable explicative de l équation d intérêt 3) Test de significativité du coefficient associé à v Si le coefficient est statistiquement différent de zéro, l hypothèse d exogénéité est rejetée NB : Si l on a plusieurs variables endogène, il faut tester conjointement la significativité des résidus de chaque équation d instrumentation Econométrie/Mass 3 5.4 Tester des restrictions suridentifiées Si l on a un seul instrument pour la variable endogène, il est impossible de tester l absence de corrélation entre l instrument et le terme d erreur : Corr(u) = 0 Modèle «juste identifié» Si l on dispose de plusieurs instruments, le modèle est «sur-identifié» et il est possible de tester l exogénéité d un instrument Econométrie/Mass 3 5.5 Le test OverID Test en trois étapes : ) Estimation de l équation d intérêt par IV et construction du résidu empirique u ) Regression du résidu u sur toutes les variables exogènes du modèle (explicatives + instruments) 3) Test de la significativité jointe des coefficients estimé par un test du multiplicateur de Lagrange : Sous l hypothèse nulle (exogénéité des instruments) : LM = nr ~ χ q avec q le nombre d instruments en excès Econométrie/Mass 33
6. Exemple Econométrie/Mass 34 6. Exemple : Equation de salaire lnwage Expersq + U i = β + βeduci + β3experi + β4 Dependent Variable: LWAGE Method: Least Squares Sample (adjusted): 48 Included observations: 48 after adjustments i i Variable Coefficient Std. Error t-statistic Prob. C -0.504 0.9863 -.6879 0.0089 EDUC 0.07490 0.0446 7.598333 0.0000 EXPER 0.04567 0.0375 3.54906 0.007 EXPERSQ -0.0008 0.000393 -.06833 0.0397 MCO R-squared 0.5680 Mean dependent var.9073 Adjusted R-squared 0.50855 S.D. dependent var 0.7398 S.E. of regression 0.66640 Akaike info criterion.035509 Sum squared resid 88.305 Schwarz criterion.073445 Log likelihood -43.5990 F-statistic 6.866 Durbin-Watson stat.960988 Prob(F-statistic) 0.000000 Econométrie/Mass 35 6. Exemple : Equation de salaire () On suspecte l éducation d être endogène et on a instruments : éducation de la mère (motheduc) et du père (fatheduc) Dependent Variable: EDUC Method: Least Squares Sample: 48 Included observations: 48 Equation d instrumentation : Les instruments sont significatifs Variable Coefficient Std. Error t-statistic Prob. C 9.0640 0.4656.33958 0.0000 EXPER 0.0455 0.0405.3593 0.68 EXPERSQ -0.00009 0.0003-0.83857 0.40 MOTHEDUC 0.57597 0.035894 4.390609 0.0000 FATHEDUC 0.89548 0.033756 5.6573 0.0000 R-squared 0.47 Mean dependent var.65888 Adjusted R-squared 0.0404 S.D. dependent var.85376 S.E. of regression.038967 Akaike info criterion 4.74378 Sum squared resid 758.575 Schwarz criterion 4.3797 Log likelihood -909.768 F-statistic 8.3604 Durbin-Watson.939888 0.000000 stat Prob(F-statistic) Econométrie/Mass 36
6.3 Exemple : Equation de salaire (3) Dependent Variable: LWAGE Method: Two-Stage Least Squares Sample (adjusted): 48 Included observations: 48 after adjustments Instrument list: EXPER EXPERSQ MOTHEDUC FATHEDUC Résultats (automatisé) des Double Moindre Carrés (SLS) Variable Coefficient Std. Error t-statistic Prob. C 0.04800 0.40038 0.05 0.9044 EDUC 0.06397 0.03437.95304 0.055 EXPER 0.04470 0.0343 3.8839 0.00 EXPERSQ -0.000899 0.00040 -.37993 0.057 R-squared 0.35708 Mean dependent var.9073 Adjusted R-squared 0.9593 S.D. dependent var 0.7398 S.E. of regression 0.6747 Sum squared resid 93.000 Durbin-Watson stat.945659 Second-stage SSR.096 Econométrie/Mass 37 6.4 Exemple : Equation de salaire (4) Dependent Variable: LWAGE Method: Least Squares Sample: 48 Included observations: 48 Résultats (manuels) de l instrumentation Variable Coefficient Std. Error t-statistic Prob. C 0.04800 0.49756 0.459 0.9088 EDUCF 0.06397 0.0396.8669 0.063 EXPER 0.04470 0.04084 3.369 0.008 EXPERSQ -0.000899 0.0004 -.34408 0.0334 R-squared 0.049783 Mean dependent var.9073 Adjusted R-squared 0.043059 S.D. dependent var 0.7398 S.E. of regression 0.707456 Akaike info criterion.5500 Sum squared resid.096 Schwarz criterion.9956 Log likelihood -457.743 F-statistic 7.404565 Durbin-Watson stat.95869 Prob(F-statistic) 0.000076 Econométrie/Mass 38 6.5 Exemple : Test d endogénéité Dependent Variable: LWAGE Method: Least Squares Sample: 48 Included observations: 48 L endogénéité de l éducation ne peut pas être rejetée au seuil de 0% Variable Coefficient Std. Error t-statistic Prob. C 0.04800 0.394575 0.904 0.9030 EDUC 0.06397 0.030985.98499 0.048 EXPER 0.04470 0.0339 3.3367 0.0009 EXPERSQ -0.000899 0.000396 -.706 0.037 RESEDUC 0.05867 0.034807.6705 0.0954 R-squared 0.6350 Mean dependent var.9073 Adjusted R-squared 0.5449 S.D. dependent var 0.7398 S.E. of regression 0.66506 Akaike info criterion.03360 Sum squared resid 87.070 Schwarz criterion.080 Log likelihood -430.908 F-statistic 0.496 Durbin-Watson stat.93343 Prob(F-statistic) 0.000000 Econométrie/Mass 39 3