Introduction à l économétrie III. Modèle de régression linéaire multiple

4/9/3 Introducton à l économétre III. Modèle de régresson lnéare multple Claudo Araujo CRDI, Unversté d Auvergne Clermont-Ferrand, France www.cerd.org http://www.cerd.org/claudo-araujo/perso/. Spécfcaton du modèle et estmateurs a) Spécfcaton sous forme matrcelle Dans un modèle de régresson multple, l este k varables eplcatves, y comprs la constante. Par eemple, la demande d essence dépend du pr de l essence, des transports publcs, du revenu, e modèle de régresson multple est plus fleble pour eplquer la varable dépendante. On peut contrôler les autres facteurs nfluençant la varable eplquée et évter un bas d omsson. On mesure meu l effet partel de chacune des varables eplcatves. ncluson de varables non pertnente fortement corrélées avec les autres varables eplcatves condut à la multcolnéarté et rend les tests d nférence statstques mprécs. y β + β Écrture matrcelle : y y Y M y N X M N. Spécfcaton du modèle et estmateurs M N Y +... + β X K β K + + ε ε ( N ) ( N K ) ( K ) ( N ) K M K NK β β β M β K ε ε ε M ε N b) Calcul des estmateurs On cherche à mnmser la somme des erreurs mn( ε ε ) mn( Υ Χβ ) ( Υ Χβ ) au carré entre Y et Υˆ O X Y + X Xβ β. Spécfcaton du modèle et estmateurs O X X > β β ^ β (X X) - X (Xβ + ε ) ^ β β + (X X) - X ε Condton de premer ordre Condton de second ordre (matrce hessenne) ^ β (X X) - X Y ^ β β (X X) - X ε Claudo Araujo, CRDI

4/9/3 c) Multcolnéarté. Spécfcaton du modèle et estmateurs e problème de la multcolnéarté parfate (sngular matr) Une des varables est une combnason lnéare parfate des autres varables eplcatves. Pas un problème de données mas plutôt une erreur de spécfcaton du modèle. e problème de la multcolnéarté mparfate : Symptômes es varances estmées des coeffcents sont élevées. es varables consdérées ndvduellement ne sont pas sgnfcatves alors que globalement elle le sont Changements notables dans les coeffcents estmés lors d une pette modfcaton d échantllon Il y a présompton de multcolnéarté lorsque les coeffcents de détermnaton des varables deu à deu > R². Spécfcaton du modèle et estmateurs e problème de la multcolnéarté mparfate : Remèdes Une varable justfée sur le plan théorque ne dot pas être élmnée. élmnaton d une varable corrélé avec les varables eplcatves entraîne le rejet de l hypothèse d orthogonalté. Remplacer les varables par une nombre plus fable de combnason lnéares. Rdge regresson : régresson basé sur l erreur quadratque moyenne d un estmateur. Augmenter la talle de l échantllon. ercces pratques Calculez la valeur des paramètres du modèle suvant : y a + a + a + e Sot les matrces suvantes :. ( X X ) 3.5. 6.5 ; ( X y). ; e e. 96. 3.5 6.5. 4.3 3..6. Hypothèses de base d un modèle économétrque a) Hypothèses stochastques Hypothèse A : Hypothèse B : Hypothèse C : ε sut une dstrbuton normale : espérance mathématque de ε est nulle : Hypothèse d HOMOSCDASTICIT N(µ, σ²), (ε ) a varance de ε est constante :, V(ε ) (ε ²) σ² Claudo Araujo, CRDI

4/9/3. Hypothèses de base d un modèle économétrque. Hypothèses de base d un modèle économétrque Hypothèse D : Hypothèse : es termes aléatores sont ndépendants (covarance nulle) : Hypothèse d INDÉPNDANC SRI DS CARTS es écarts aléatores sont ndépendants des varables eplcatves Cov(,ε ) (X ε) Hypothèse d ORTHOGONAITÉ j, (ε ε j ) Hypothèses C + D : σ M V ( ε ) ( εε ) O Matrce varance - covarances des écarts aléatores : σ Ι M σ ² M N Ω σ ² O σ ² Matrce Identté. Hypothèses de base d un modèle économétrque b) Hypothèses structurelles Hypothèse F : Hypothèse G : Hypothèse H : Hypothèse I : Pas de restrcton a pror sur la valeur des coeffcents estmés a matrce X est de rang K, Rg(X)K, plen rang colonne Nombre d observatons et nombre de paramètres Multcolnéarté es varables X sont bornées dans leur ensemble Varables statonnares a matrce des varables X est non stochastque. Hypothèses de base d un modèle économétrque c) Caractérstques de la varable eplquée ensemble des hypothèses stochastques et structurelles permettent de caractérser l espérance, la varance et la dstrbuton de probablté de la varable eplquée. spérance condtonnelle Varance condtonnelle Dstrbuton condtonnelle V ( X,ε) Xβ Y ( Y X ) ( εε ) σ Ι Ω N ( X ) Y X ~ > N β,ω Claudo Araujo, CRDI 3

4/9/3 Y y. Hypothèses de base d un modèle économétrque Résdu εˆ ŷ Échantllon ˆ Xβˆ Y ε ( y) Écarts aléatores ( Y) Xβ Populaton a) estmateur este 3. Proprétés des estmateurs néarté du modèle par rapport au paramètres Possblté d effectuer un échantllonnage aléatore sur les varables X et Y Absence de colnéarté parfate entre les varables X Un haut degré de colnéarté entre les varables eplcatves ndut de la multcolnéarté N > K X 3. Proprétés des estmateurs b) stmateur sans bas erreur condtonnelle est nulle en moyenne ( ˆ β ) β ( X X ) X + ( ˆ β ) β + ( X X ) X ( ε ) D après l hypothèse B : (ε) ( ˆ β ) β ε 3. Proprétés des estmateurs omsson d une varable eplcatve mportante condut à un bas d omsson. mportance du bas dépend de la dépendance entre la varable omsse et les varables eplcatves ncluses dans la régresson. Supposons deu modèles : y ˆ ˆ ˆ ˆ β + β + β33 + ε (vra modèle) ~ ~ y β + β + ~ ε (modèlesous - dmensonné) e bas du paramètre est donnée par : e bas est d autant plus néglgeable que effet partel de 3 sur y est néglgeable es varables et 3 sont fablement corrélées a varance de est élevée ~ σ, ( β ) β β3 σ 3 Claudo Araujo, CRDI 4

4/9/3 3. Proprétés des estmateurs Sgne attendu du bas σ,3 > σ,3 < β 3 > Bas Postf Bas Négatf β 3 < Bas Négatf Bas Postf stmateur basé et convergence (consstance) Asymptotquement (lorsque N ) un estmateur convergent («consstant») donne une estmaton égale à la valeur vrae du paramètre. Un estmateur sans bas est nécessarement convergent («consstant») l nverse n est pas vra. 3. Proprétés des estmateurs c) stmateur effcace Un estmateur est effcace s la varance est la plus fable par rapport à n mporte quel autre estmateur lnéare sans bas ou basé. Un estmateur effcace peut être basé. Dans certanes crconstances, l peut être préférable de chosr un estmateur basé (plutôt que sans bas) s l a la varance mnmale. V ˆ Sβ ˆ ( β ) ( β β ) ˆ ( β β )( ˆ β β ) D après l hypothèse C (homoscédastcté) : S β σ σ ( X X ) X X ( X X ) X X ( ) Paramètre nconnu 3. Proprétés des estmateurs stmaton de σ² à partr de la varance des résdus ˆ ε Y Yˆ Y Xβ Démonstraton ABC page 5-5 n consdérant les hypothèses C et D : σ ( ) ( ˆ ε ˆ ε ) N K ˆ Degrés de lberté ddl σ ˆ stmateur sans bas de la matrce Var-Cov des paramètres estmés 3. Proprétés des estmateurs Somme carrés des résdus SCR ( ) ( ˆ β )( Y X Y X ˆ β ) N K Sˆ ( ˆ ε ˆ ε ) ( N K ) σ ˆ stmateur de la varance des écarts ( X ) β σ X Claudo Araujo, CRDI 5

4/9/3 d) stmateur BU 3. Proprétés des estmateurs Noton plus restrctve que la noton d estmateur effcace. e terme d erreur dot être homoscédastque. Il n y a pas de corrélaton sérelle des écarts (autocorrélaton). Il fournt les varances les plus fables dans la classe des estmateurs lnéares (effcace). S les hypothèses stochastques (A à ) ne sont pas volées, l estmateur MCO est le melleur estmateur lnéare sans bas. 3. Proprétés des estmateurs e) stmateur convergent, effcace, effcent estmateur est convergent quand la varance estmée des écarts aléatores tend vers zéro C est le cas lorsque le nombre d observatons tend vers l nfn. estmateur estmé converge en probablté vers le vra estmateur. Toutefos, un estmateur convergent n est pas forcément effcent (asymptotquement). n effet, l peut converger, lorsque N, vers une valeur qu ne correspond pas à la valeur vrae du paramètre. Un estmateur effcent est nécessarement convergent (pas l nverse). Un estmateur effcace est nécessarement convergent (pas l nverse). Un estmateur BU est nécessarement sans bas, donc effcace et convergent et, donc effcent. 3. Proprétés des estmateurs f) Influence de l ncluson d une varable superflue sur les proprétés de l estmateur Supposons deu modèles : y ˆ ˆ ˆ β + β + ε (vra modèle) ~ ~ ~ y ~ β + β + β33 + ε (modèlesurdmensonné) e paramètre β de la ème équaton est-l basé? ~ ( ) ( ) ( ) ˆ ~ σ, 3 β β + β3 3 3 σ β Quelque que sot le degré de corrélaton entre les varables eplcatves, l n y a pas de bas. ncluson d une varable non pertnente corrélée avec les autres varables eplcatves peut ntrodure de la multcolnéarté. e nombre des degrés de lberté dmnue (mprécson des tests d nférence statstque) ercces pratques Interprétaton d un modèle. Approche à la Koopmans (du partculer au général) On eplque, dans un premer temps, le salare des PDG par le proft généré par la socété. On élarg ensute, le modèle en ajoutant la varable mktval (valeur de marché de l entreprse). Données en coupe transversale 77. Interpréter les coeffcents de profts et de log(profts). Interpréter les coeffcents de profts et de log(mktval). Comparer les t-rato entre parenthèses à la valeur crtque (seul 5%). Interprétaton des tests (que nous apprend le t-rato test?) Claudo Araujo, CRDI 6

4/9/3 ercces pratques Sot les régressons smples estmées :. og-nveau : log( wage) 6.46 +.6 profts + ˆ ε ( 36.9 ) ( 5.7). og-log : log( wage) 5.58+.log( profts ) + ˆ ε Sot la régresson multple estmée :. og-nveau-log log wage 4.84+.9 profts +.3log mktval ( ) ( 36.96) ( 6.93) (.6) (.54) ( 4.5) ( ) + εˆ 4. Inférence statstque et ANOVA a) Test sur un paramètre Pour calculer un rato t de Student (t-rato test) sur chaque coeffcent, on dot d abord obtenr les estmatons des paramètres du modèle. On calcule ensute les écart-types de ces paramètres estmés (cf. estmateur effcace). On rejette H (β ) s t calculé > t table, cela sgnfe que le résultat est «sgnfcatf». S le coeffcent n est pas sgnfcatf, cela sgnfe que la varable n eplque pas les varaton de y. Il est prudent, en pratque d nclure une constante même s elle n est pas sgnfcatve. 4. Inférence statstque et ANOVA ercces pratques A partr de l eercce réalsé précédemment avec le modèle : y a + a + a + e Calculez la varance du terme d erreur Calculez les écart-types des paramètres estmés. crvez la matrce des varances covarances des erreurs et des paramètres. Calculez les t-rato, effectuez les test et nterpréter vos résultats. 4. Inférence statstque et ANOVA b) Test sur pluseurs paramètres S on mpose une seule contrante lnéare, on peut recourr au t de Student emprque pour tester cette contrante. Par eemple sot le modèle suvant : y β + β + β + β + ε 3 3 4 4 Pour tester l hypothèse nulle : β + β 3 On pose δ β β 3 δ (H) On test δ en calculant le t de Student emprque t ˆ δ Sˆ ˆ δ Claudo Araujo, CRDI 7

4/9/3 4. Inférence statstque et ANOVA Pour effectuer un test comportant plus d une restrcton lnéare, on dot recourr à l ANOVA. Rappel. On calcule le coeffcent de détermnaton : SC SCR R SCT SCT e coeffcent de détermnaton R² n est pas pertnent pour comparer le pouvor eplcatve entre pluseurs modèles ne comprenant pas le même degré de lberté. Il convent de calculer le coeffcent de détermnaton ajusté (ou corrgé) par les degrés de lberté. N SCR /( N K ) R R ( R ) N K SCT /( N ) 4. Inférence statstque et ANOVA Aucun test ne peut être drectement effectué sur le R² ajusté du modèle. Pour tester pluseurs restrctons, l faut recourr au F-test basé sur l analyse de la varance. Démarche : Dstnguer un modèle non-contrant (HA) et un modèle contrant (H) Après avor dentfer les modèles, on calcule une statstque F* (ou Fsher emprque) 4. Inférence statstque et ANOVA Test de Fsher - Snedecor On cherche au mons varable eplcatve sgnfcatve dans le modèle ercces pratques F * H : tous les coeffcents (sauf la constante) HA : l este au mons un coeffcent SC ( K ) N K R ~ > F SCR K R ( N K ) H rejetée s F * > F table ( K, N K ) S H n est pas rejetée (F * < F table ) aucune relaton lnéare sgnfcatve entre la varable eplquée et les varables eplcatves ddl ercces en travau drgés Problèmes pratques : Approche à la Koopmans : «specfc-to-general» Approche à la Hendry : «general-to-specfc» es conséquences statstques lées à l omsson d une varable pertnent sont plus graves que celles lées à l ncluson d une varable non pertnente. Claudo Araujo, CRDI 8