4/09/03 Introducton à l économétre II. Modèle de régresson lnéare smple Claudo Araujo CERDI, Unversté d Auvergne Clermont-Ferrand, France www.cerd.org http://www.cerd.org/claudo-araujo/perso/. Défnton et modélsaton économétrque a) Présentaton du modèle Une régresson économétrque permet de décrre et d évaluer la relaton entre une varable dépendante () et une ou pluseurs varables ndépendantes (x k ). Dans le modèle de régresson smple, k. Dans le modèle de régresson multple, k >. Afn d obtenr des nformaton des varables pour l ensemble d une populaton, on fat de l nférence statstque. Inférence statstque : consste à obtenr des nformatons sur la populaton à partr de l échantllon. Echantllon : sous-ensemble de la populaton étudée.. Défnton et modélsaton économétrque L estmaton du modèle peut être ponctuelle (obtenton d une valeur spécfque du paramètre) ou par ntervalle (la vrae valeur du paramètre est comprse dans un ntervalle de confance). Le plus souvent, on s ntéresse aux proprétés d une varable condtonnellement à d autres varables. Proprété condtonnelle : espérance d une varable condtonnelle à la varable x. E( x) f(x) Dépendante, endogène, explquée, régressant, de réponse Indépendante, exogène, explcatve, régresseur, de contrôle. Défnton et modélsaton économétrque Dans une régresson, la varable et la (ou les) varable(s) x est (sont) tratée(s) de manère asmétrque. La varable est supposée être aléatore ou stochastque. La (ou les) varable(s) x est (sont) supposée(s), au sens strct, avor des valeurs fxes d un échantllon à l autre. En rason du caractère aléatore de, les valeurs observées dévent de leur espérance condtonnelle. Cette dévaton est qualfée d écart aléatore (ε). Cas d une régresson lnéare smple : ( x, ε ) + x + ε Ε : ordonnée à l orgne (constante - ntercept) : pente, mesure l mpact margnal, ceters parbus, de x sur. Claudo Araujo, CERDI
4/09/03. Défnton et modélsaton économétrque b) Rôle des erreurs stochastques Calculer la valeur théorque de, sachant que : 000 et 0,8 ; dans le cas d une régresson lnéare. Revenu dsponble (x) Consommaton observée () Consommaton théorque C obs C th 9 000 8 70 8 00 30 9 500 8 800 8 600 00 000 9 700 9 800 00 000 0 500 0 600 00 3 500 00 800 600 000 9 674 Moenne. Défnton et modélsaton économétrque On remarque que la relaton spécfée entre et x ne peut pas être détermnste. Le processus de génératon des données (PGD) est nconnu. Il est souvent mpossble d observer la totalté des varables et x de la populaton. On dot ajouter un terme aléatore, ε (terme d erreur ou perturbaton stochastque) au processus. On peut obtenr une estmaton de ε ; le ε estmé est appelé résdu. + + ε x. Défnton et modélsaton économétrque Interprétaton de l écart aléatore : Du pont de vue statstque : réalsaton d une varable aléatore, aant sa propre dstrbuton de probablté pour chaque (ou t, dans le cas des TS). Du pont de vue économque : Erreur de spécfcaton : la seule varable explcatve n est pas suffsante pour rendre compte de la totalté du phénomène explqué. Erreur de mesure : les données ne représentent pas exactement le phénomène. Erreur de fluctuaton d échantllonnage : les observatons comprses dans l échantllon, et donc les estmatons, peuvent être dfférentes. Conséquences des termes aléatores. Défnton et modélsaton économétrque c) Méthodes d estmaton Méthode des moments Prncpe : l estmaton des moments de la populaton dovent être estmé par les moments de l échantllon (moenne, varance, ). On estme pluseurs paramètres. Il dot avor autant de condtons sur les moments que de paramètres à estmer. Dans le cas où le nombre de condtons sur le moments est supéreur au nombre de paramètres à estmer, le modèle est sur-dentfé : utlsaton de la méthode des moments généralsés (GMM). Estmateurs robuste (problème des ponts aberrants). Aucune hpothèse partculère concernant la dstrbuton des écarts aléatores est nécessare. Claudo Araujo, CERDI
4/09/03. Défnton et modélsaton économétrque Méthode du maxmum de vrasemblance Prncpe : des populatons dfférentes engendrent des échantllons dfférents. Il est plus vrasemblable qu un échantllon donné provenne d une populaton partculère. La méthode consste à estmer les paramètres nconnus de manère à maxmser la probablté d observer les sachant la valeur de x. On suppose que les (ε ) sont dstrbués normalement et ndépendamment (nd) de moenne + x et de varance σ².. Défnton et modélsaton économétrque Méthode des mondres carrés Prncpe : estmaton des moments de la dstrbuton de la populaton autours de zéro. Sot la régresson suvante : + x + ε On cherche les valeurs des coeffcents et qu mnmsent la somme des carrés des écarts aléatores. Exercces pratques Calculer la valeur théorque de demande d essence sachant que : 0.7 et 0,68 ; dans le cas d une régresson lnéare. Prx de l essence Demande d essence Demande théorque D obs D th 0.054 0.0 Travaller avec la source des 0.06 0.049 données qu est sur la plateforme pédagogque. 0.073 0.077 Données en log ; pérode de 0.66 0.5 960 à 995. 0.469 0.054 D f (P) Moenne. L estmaton des paramètres par les MCO a) La méthode des mondres carrés ordnares (MCO / OLS) Cette méthode consste à ajuster le nuage de ponts à l ade d une drote en mnmsant la dstance au carré entre chaque valeur observée et la drote d estmaton. Cette dstance mesure le résdu (ê) pour chaque observaton : eˆ ε ˆ Claudo Araujo, CERDI 3
4/09/03 4 3.}. L estmaton des paramètres par les MCO ê } ê 3 ê {.. { x x x 3 x 4. ê 4 ^ ^ E() + x x Les estmateurs des coeffcents sont obtenus en mnmsant la somme du carré des résdus (SCR) Mn ε x ˆ ( ˆ x ) ˆ Mn Condtons de er ordre Ο Ο 0 ; 0. L estmaton des paramètres par les MCO b) Calcul des estmateurs x ˆ n ˆ ˆ x 0 x 0 Mn Ο, Condtons de nd ordre Ο > 0 ; Ο > 0 Équatons normales. L estmaton des paramètres par les MCO On obtent les estmateurs et à partr des équatons normales : ˆ n ( x x )( ) n n ( x x ) x n x nx nx ˆ ˆ x C Cm () R - Rm (x) (R Rm)² (C Cm) * (R Rm) 504 000 4 000 000 3 008 000 874 500 50 000 3 000 6 86 000 000 000 86 000 56 500 6 50 000 3 85 000 SOMME 3 500 000 8 960 000. L estmaton des paramètres par les MCO En utlsant les données de consommaton et revenu, on obtent les valeurs suvantes pour les estmateurs : ^ 373,6 (ordonnée à l orgne) ; ^ 0,66 (pente de la drote) Le coeffcent mesure l mpact d une varaton du revenu sur la consommaton ( / x). Interprétaton (en supposant que x et soent mesurés en ) : S x vare d pont de %, vare de 0,66. e pas confondre régresson et corrélaton. Dans une régresson, les varables sont tratées de manère asmétrque ( : aléatore ; x : fxe). Quant à la corrélaton, les varables sont tratées de manère smétrque (x et : aléatores). Claudo Araujo, CERDI 4
4/09/03. L estmaton des paramètres par les MCO c) La corrélaton Lorsque deux phénomènes ont une évoluton commune, ls sont «corrélés». La corrélaton smple (multple) mesure le degré de lason exstant entre ces deux (pluseurs) phénomènes. La corrélaton entre les varables peut être postve, négatve ou non corrélées. Lnéare ou non lnéare. Le coeffcent de corrélaton lnéare smple permet de calculer l ntensté de la lason. Il vare entre et. ( x, ) cov ρx, σ σ x ( x x)( ) ( x x) ( ). L estmaton des paramètres par les MCO Ce coeffcent est calculé à partr d un échantllon d observatons et non pas sur la populaton. On peut tester la sgnfcatvté de ce coeffcent à l ade de la théore des tests statstques (t de Student emprque). Sot H0 : ρ x, 0 ; HA : ρ x, 0 On rejette H0 (ρ est sgnfcatvement dfférent de 0) au seul α (α 0,05) et à ddl, s : * α t > t Sot : n ρ * x, t ρ ( ) x, n. L estmaton des paramètres par les MCO Lmtes de la corrélaton La relaton testée est lnéare. Par exemple : l équaton d un cercle donné par : (x x)² + ( )² R² Les varables x et sont lées entre elles, mas leur covarance est nulle, ρ est donc 0. Une corrélaton dfférente de 0, n mplque pas une lason d ordre économque (ou phsque ou autre) corrélaton fortute. Par exemple : nombre de taches solares et taux de crmnalté. Exercces pratques Calculer le coeffcent de corrélaton. Lason entre rendement de maïs (x) d une parcelle de terre et la quantté d engras () Tracer le nuage de ponts, commenter, calculer le coeffcent de corrélaton et tester sa sgnfcaton (α 5%) Rendement Engras Rendement Engras Rendement Engras 6 0 8 3 3 4 8 4 9 8 34 4 3 8 6 3 4 3 36 Claudo Araujo, CERDI 5
4/09/03 3. Identfcaton et proprétés des estmateurs a) oton d un estmateur Sot les varables aléatores x et, leurs dstrbutons sont caractérsées par. La populaton orgnale est composée de toutes les valeurs de x et. Le paramètre est une des caractérstques paramétrque de cette populaton. x et/ou peuvent être contnu ou dscret. L estmaton de dépend de l nformaton de l échantllon, on peut la décrre par une formule d estmaton : l estmateur ˆ ˆ,, L, ; x, x, L, x ( ) L estmateur a des proprétés que l on dstngue selon la talle de l échantllon. Proprétés sur pett échantllon Sans bas s Effcace s les condtons suvantes sont satsfates: on-basé Varance mnmale Melleur Estmateur lnéare sans bas (BLUE) s les 3 condtons sont satsfates: Foncton lnéare des observaton de l échantllon on-basé Varance mnmale 3. Identfcaton et proprété des estmateurs Proprétés sur échantllon de talle nfne (proprétés asmptotques) E ( ˆ ) ( ) Asmptotquement sans bas s lm E ˆ Convergent s (consstant en «franglas») Effcence asmptotque, s les 3 condtons sont satsfates Dstrbuton asmptotque avec moenne et varance fnes Convergent Varance asmptotque mnmale n p lm ˆ 3. Identfcaton et proprété des estmateurs b) Proprétés sur petts échantllons L estmateur exste Modèle lnéare par rapport à ses paramètres. Foncton couramment utlsé pour lnéarser un modèle par rapport à ses paramètres : logarthme népéren (ou naturel). Proprété mportante : approxmaton d une varaton en proporton. Dfférents tpes de fonctons et nterprétaton de veau nveau : x Log nveau : % (00 ) x veau log : ( / 00) % x Log log : % ( ) % x 3. Identfcaton et proprété des estmateurs L estmateur est sans bas L erreur (condtonnelle) est, en moenne, nulle. E(ε x) 0 E(ε) 0 E(ε x) 0 E(ε) Cov(ε, x) 0 E(ε. x) 0 La varable x dot être strctement exogène par rapport au terme d erreur : x et ε ne sont pas corrélés au temps : E(ε t x t ) 0 Cov(ε t, x t ) 0 x n a aucun effet décalé sur le terme d erreur : E(ε t x t-s ) 0 Cov(ε t, x t-s ) 0, s > 0 Le terme d erreur n a aucun effet décalé sur x : E(ε t x t+s ) 0 Cov(ε t, x t+s ) 0 Cov(ε t-s, x t ) 0, s > 0 Sous ces hpothèses la valeur moenne des estmatons est égale à la valeur «vrae» du paramètre : ( ) E ˆ Claudo Araujo, CERDI 6
4/09/03 3. Identfcaton et proprété des estmateurs L estmateur est BLUE (best lnear unbased estmator) La varance de l erreur est constante (ou homoscédastque) Elle ne dépend pas de x et ne vare pas au cours du temps V(ε x) V(ε) E(ε ²) σ² Il n a pas de corrélaton sérelle dans les erreurs (ndépendance sérelle des écarts) Corr(ε t, ε s x) 0 Il n a pas de corrélaton entre les erreur à l nstant t et une erreur suvante (s > t) ou précédente (s < t). Sous l hpothèses de Gauss Markov (exstence, sans bas et effcence), l estmateur MCO est BLUE S une hpothèse est volée, l estmateur n est pas BLUE. Illustratons graphques f ( ˆ ) 3. Identfcaton et proprété des estmateurs Effcence on-basé f ( ˆ ) ˆ ( E ˆ ) ˆ 3. Identfcaton et proprété des estmateurs c) Proprétés sur grandes échantllons de talle nfne (proprété asmptotques) L estmateur est «consstant» (convergent) Un estmateur sans bas est nécessarement convergent, mas l nverse n est pas vra. Pour les données temporelles, l sufft que E(ε t x t ) 0 pour qu un estmateur sot convergent. Un estmateur effcent ne garantt pas, non plus, la convergence d un estmateur. f( ˆ ) ˆ 3. Identfcaton et proprété des estmateurs d) Caractérstques de base de la dstrbuton de Moenne Varance Erreur d échantllonnage Bas Erreur Quadratque Moen (MSE) E( ˆ ) Var ( ˆ ) E[ ˆ E( ˆ )] E( ˆ ) [ E( ˆ )] E ( ˆ ) ( ˆ ) E ˆ ˆ Il peut avor conflt entre absence de bas et varance mnmale. La mnmsaton de l EQM (MSE) est un moen d arbtrer Claudo Araujo, CERDI 7
4/09/03 Erreur Quadratque Moen (MSE) ( ˆ ) MSE E MSE E E E Varance mnmale f ( ˆ ) on-basé Basé Dsperson élevée [ ˆ E( ˆ ) + E( ˆ ) ] {[ ˆ E( ˆ )] + [ E( ˆ ) ]} [ ˆ E( ˆ )] + E[ E( ˆ ) ] + E[ ˆ E( ˆ )][ E( ˆ ) ] Varance 3. Identfcaton et proprété des estmateurs (Bas)² 0 ˆ 4. Inférence statstque a) ormalté des erreurs Les caractérstques de l échantllon reflètent, avec une certane marge d erreur, celles de la populaton. Pour pouvor ndure les paramètres nconnus () d une populaton sur un échantllon ssu de cette populaton, on pose l hpothèse de normaltés des erreurs Sot ε (0,σ ε ²) Sous les hpothèses du modèle de régresson lnéare classque : ˆ V ( ) ( 0,) t, (,) ˆ ˆ σ ˆ n 4. Inférence statstque b) Test sur un seul coeffcent : t rato Sot l équaton suvante : + x + ε Etapes pour effectuer un test sur un seul coeffcent:. Estmaton de,, σ ², σ ² par MCO ˆ * *. Calcul de la statstque t de Student emprque ˆ t * : valeur de sous H0 ˆ σ ˆ Lorsque * 0 et que le test est blatéral, t* est appelé le RATIO t de Student (t-rato test). 3. Précser les H0 et HA et chosr un seul de sgnfcatvté (talle du test, α). Seul fréquent : 0%, 5% ou %. 4. Sous les hpothèses du modèle de régresson classque, la statstque du t de Student emprque sut une lo de Student à K degrés de lberté (cte comprse ds k). 4. Inférence statstque 5. Utlser la table statstque (Student) pour obtenr la valeur crtque (quantle de la dstrbuton, au-delà duquel l hpothèse nulle est rejetée). Pour un test blatéral, avec k, α 0% et 30 ; ddl K 8 H0 : * HA : * f(t) ½ α (%) HA Régon de non rejet (H0) H0 ( α) 90 % ½ α (%) - t α/ + t α/ HA * t Pour un test unlatéral : H0 : * HA sot : > *, s parte drote HA sot : < *, s parte gauche Claudo Araujo, CERDI 8
4/09/03 4. Inférence statstque 6. Utlser la règle de décson suvante : Pour un test blatéral, H0 est rejetée s ˆ * α > t K ˆ S Pour un test unlatéral dans la parte drote, H0 est rejetée s ˆ * > Sˆ Pour un test unlatéral dans la parte gauche, H0 est rejetée s ˆ * α t K < Sˆ α t K 4. Inférence statstque c) Intervalle de confance. Estmaton de,, σ ², σ ² par MCO. Chox du seul de sgnfcatvté, α, pour obtenr un ntervalle de confance à ( α) %. Par exemple s α 0,05, ntervalle de confance 95%. 3. Utlser la table statstque de Student pour obtenr la valeur crtque, ddl K. 4. L ntervalle de confance est donnée par : {( ˆ α ) ˆ ( ˆ α ) ˆ t K S, } + t K S 5. On rejette H0, s * se trouve à l extéreur de l ntervalle de confance Le test blatéral sur coeffcent et l ntervalle de confance aboutssent toujours aux mêmes conclusons. 4. Inférence statstque d) Interprétaton et observatons Les tests d hpothèses permettent d évaluer la robustesse d un modèle estmé. Les tests d hpothèses économques sont condtonnés au non rejet de la spécfcaton économétrque. Le prncpe consste à comparer des paramètres. Confrontaton d une hpothèse nulle (ou restrente) H0 à une hpothèse alternatve (HA). Rappel : Aucune hpothèse ne peut être défntvement nfrmée. Elle est testé en lason avec d autres hpothèses auxlares. e pas rejeter H0 contre HA sgnfe que H0 est provsorement «acceptée». Cela ne sgnfe nullement l acceptaton de H0. S une hpothèse nulle est rejetée à α %, cela sgnfe que le résultat est qualfé de «sgnfcatf à α %». S H0 est rejetée à %, elle sera auss rejetée à 5 % et 0 %. Un résultat peut être sgnfcatf au nveau statstque mas margnal sur le plan économque. Schématquement : sous-régons on rejet de H0 Erreur de premère espèce Talle du test seul de sgnfcaton «p-value» 4. Inférence statstque Rejet de H0 α est la probablté de rejeter H0 sachant qu elle est vrae Claudo Araujo, CERDI 9
4/09/03 4. Inférence statstque Il n est pas exclu d accepter H0 sachant qu elle est fausse Erreur de deuxème espèce () La décson se tradut par erreurs : α et antagonstes H0 Décson HA Hpothèses H0 Pas d erreur α vraes HA Pussance d un test ( ) : pussance d un test. Mesure de la probablté de rejeter H0 sachant qu elle est fausse Plus la régon d acceptaton est grande plus est élevée L erreur de premère espèce est plus grave que l erreur de deuxème espèce Obs : ne pas confondre c α et Lcence avec les 3 paramètres du modèle 5. AOVA (Aalss Of VArance) a) Equaton fondamentale SCT SCE ( ) ( ˆ ) Cf. démonstraton dans l ABC d E page 55 SCR ( ˆ ) SCT SCE + SCR Somme des carrés explquée ε Somme des carrés des résdus 5. AOVA b) Coeffcent de détermnaton L ajustement par la drote des MCO est melleur quand SCE est proche de SCT Pour mesurer la qualté d ajustement (goodness-of-ft) on utlse le coeffcent de détermnaton, R². SCE SCR R SCT SCT Le R² vare entre 0 et. Plus le R² est proche de, meux est l ajustement de la drote de régresson. Mas l objectf n est pas de maxmser le R². Exercces pratques Calculer le coeffcent de détermnaton pour les modèle de consommaton. Vous devez calculer : SCT, SCE et SCR à partr du tableau contenant, le revenu dsponble et la consommaton observée. Calculer le coeffcent de détermnaton pour les modèle de demande d essence en foncton du prx. Claudo Araujo, CERDI 0