Master 2: Econométrie 2
|
|
|
- Ghislaine Vincent
- il y a 10 ans
- Total affichages :
Transcription
1 Master 2: Econométrie 2 Partie 1 Michel BEINE [email protected] Université du Luxembourg Master 2: Econométrie 2 p. 1/22
2 Manuel La partie économétrique du cours est basé sur le livre Introductory Econometrics, a Modern Approach (second edition) de Jeffrey M. Wooldridge, édition Thomson South-Western. Sur le site web : wooldridge2e/wooldridge2e.html il y a des données nécessaires pour les exercices et plusieurs liens intéressants. Master 2: Econométrie 2 p. 2/22
3 Plan du cours (Partie 1 Économétrie 2) Chapitre 1. Rappels économétriques. Chapitre 2. Corrélation sérielle et hétéroscédasticité. Chapitre 3. Méthodes simples de panel. Chapitre 4. Méthodes avancées de panel. Chapitre 5. Estimation par variables instrumentales. Chapitre 6. Modèles à équations simultanées. Master 2: Econométrie 2 p. 3/22
4 Rappels Structure des données Master 2: Econométrie 2 p. 4/22
5 Structure des données Il existe 3 types de données. Chaque type de données peut appeler des techniques économétriques particulières. Données Cross-section. Séries temporelles. Données de Panel. Master 2: Econométrie 2 p. 5/22
6 Données Cross-section Échantillon d individus, ménages, firmes,..., pris à un point du temps donné. Important: on peut souvent supposer que les obs. = échantillon aléatoire simplifie l analyse. Données très utilisées en économie et sciences sociales micro appliquée: marché du travail, finances publiques, organisation industrielle, économie spatiale, démographie, économie de la santé, etc. Example: Wage1.wf1. Master 2: Econométrie 2 p. 6/22
7 Séries temporelles Séries chronologiques. Ex: PNB, importations, indices de prix, etc. Important: Rarement indépendantes au court du temps complexifie l analyse. Différentes fréquences: annuel, trimestriel, mensuel, hebdomadaire, journalier, intra-journalier. Données très utilisées en macro-économie et en finance. Example: PRMINWGE.wf1. Master 2: Econométrie 2 p. 7/22
8 Données de panel Série temporelle pour chaque unité/individu. Important: la même unité est observée plusieurs fois au court du temps. Example: WAGEPAN.wf1. Master 2: Econométrie 2 p. 8/22
9 Rappels Modèle de régression simple Master 2: Econométrie 2 p. 9/22
10 Modèle de régression simple Objectif: estimer un modèle du type De manière générale: wage = β 0 + β 1 educ + u. (1) y = β 0 + β 1 x + u. (2) (2) est supposé tenir sur la population d intérêt. u est le terme d erreur (aléas) = facteurs non-observés autres que x qui affectent y. u et x sont des variables aléatoires. Interprétation Ceteris Paribus: Si u = 0 (autres facteurs inchangés) y = β 1 x. Master 2: Econométrie 2 p. 10/22
11 Modèle de régression simple Pour estimer β 0 et β 1 et garder cette interprétation CP il faut faire certaines hypothèses. E(u) = 0: normalisation on ne perd rien. E(u x) = E(u): pour toute valeur de x, la moyenne des u correspondantes est la même. implique la non-corrélation (linéaire). Ex: wage = β 0 + β 1 educ + u E(abil 8) = E(abil 16). En combinant ces 2 hypothèses: E(u x) = E(u) = 0: hyp. moyenne cond. nulle. E(y x) = β 0 + β 1 x: fonction de régression de la population. Master 2: Econométrie 2 p. 11/22
12 Estimation de β 0 et β 1 (x i,y i ) : i = 1,...,n = échantillon aléatoire de taille n tiré de la population. y i = β 0 + β 1 x i + u i, i. E(u) = 0 E(y β 0 β 1 x) = 0. E(u x) = 0 Cov. nulle entre u et x E[(y β 0 β 1 x)x] = 0. Pour obtenir ˆβ 0 et ˆβ 1 on va résoudre ce système en remplaçant E(.) par son équivalant empirique 1/n n i=1 (.). Master 2: Econométrie 2 p. 12/22
13 Estimation de β 0 et β 1 n n 1 (y i ˆβ 0 ˆβ 1 x i ) = 0 (3) i=1 n n 1 [(y i ˆβ 0 ˆβ 1 x i )x i ] = 0 (4) i=1 ˆβ 0 = y ˆβ 1 x (5) n ˆβ i=1 1 = (x i x)(y i y) n i=1 (x i x) 2 si > 0. (6) Estimation de β 0 et β 1 par la méthode des moments. Master 2: Econométrie 2 p. 13/22
14 Moindres carrés ordinaires (MCO) min b0,b 1 n i=1 (y i b 0 b 1 x i ) 2 2 équations de premier ordre : 2 2 n (y i ˆβ 0 ˆβ 1 x i ) = 0 (7) i=1 n [(y i ˆβ 0 ˆβ 1 x i )x i ] = 0 (8) i=1 ˆβ 0 = y ˆβ 1 x (9) n ˆβ i=1 1 = (x i x)(y i y) n i=1 (x i x) 2 si > 0. (10) Estimation de β 0 et β 1 par la méthode des MCO donne les même ˆβ 0 et ˆβ 1. Master 2: Econométrie 2 p. 14/22
15 Propriétés des estimateurs MCO SLR=Simple Linear Regression. SLR.1 y = β 0 + β 1 x + u linéaire en les paramètres. SLR.2 (x i,y i ) : i = 1,...,n échantillon aléatoire de taille n tiré de la population. SLR.3 E(u x) = 0 moyenne conditionnelle nulle. Permet de dériver les propriétés des MCO conditionnellement aux valeurs de x i dans notre échantillon. Techniquement identique à supposer x i fixes dans des échantillons répétés (pas très réaliste). SLR.4 n i=1 (x i x) 2 0 variation dans les x. Théorème 2.1: Sous les hypothèses SLR.1 - SLR.4, E(ˆβ 0 ) = β 0 et E(ˆβ 1 ) = β 1. Master 2: Econométrie 2 p. 15/22
16 Propriétés des estimateurs MCO SLR.5 V ar(u x) = σ 2 homoscédasticité. Théorème 2.2: Sous les hypothèses SLR.1 - SLR.5, V ar(ˆβ 0 ) = σ2 n 1 n i=1 x2 i n i=1 (x i x) 2 V ar(ˆβ 1 ) = σ 2 n i=1 (x i x) 2 Théorème 2.3: Sous les hypothèses SLR.1 - SLR.5, E(ˆσ 2 ) = σ 2, où ˆσ 2 = 1 n 2 n i=1 û2 i. Master 2: Econométrie 2 p. 16/22
17 Rappels Modèle de régression multiple Master 2: Econométrie 2 p. 17/22
18 Modèle de régression multiple Objectif: estimer un modèle du type wage = β 0 + β 1 educ + β 2 exper + u. (11) De manière générale: y = β 0 + β 1 x β k x k + u. (12) OLS: min n b0,b 1,...,b k i=1 (y i b 0 b 1 x i1... b k x ik ) 2. Master 2: Econométrie 2 p. 18/22
19 Modèle de régression multiple Exemple: y = β 0 + β 1 x 1 + β 2 x 2 + u. Comment obtenir β 1? Régresser x 1 sur x 2 : ˆx 1 = ˆα 0 + ˆα 1 x 2. Calculer ˆr 1 = x 1 ˆx 1. ˆβ 1 = n i=1 ˆr i1y i n i=1 ˆr2 i1. β 1 est bien l effet net de x 1 sur y, où net signifie après avoir tenu compte de l effet des autres variables. Master 2: Econométrie 2 p. 19/22
20 Goodness-of-Fit Il est possible de décomposer la variabilité observée sur y, c-à-d SST n i=1 (y i y) 2, en 2 quantités: SSE n i=1 (ŷ i y) 2 : variabilité expliquée par le modèle; SSR n modèle. i=1 û2 i : variabilité non-expliquée par le SST = SSE + SSR. On peut donc définir une mesure de qualité de la régression (GoF): R 2 = SSE/SST compris entre 0 et 1. Master 2: Econométrie 2 p. 20/22
21 Propriétés des estimateurs MCO MLR=Multiple Linear Regression. MLR.1 y = β 0 + β 1 x β k x k + u linéaire en les paramètres. MLR.2 (x 1i,...,x ki,y i ) : i = 1,...,n échantillon aléatoire de taille n tiré de la population. MLR.3 E(u x 1,...,x k ) = 0 moyenne conditionnelle nulle. MLR.4 n i=1 (x ji x) 2 0 j = 1,...,k et pas de relation linéaire parfaite entre les x j variation dans les x j et pas de collinéarité parfaite. Théorème 3.1: Sous les hypothèses MLR.1 - MLR.4, E(ˆβ j ) = β k j = 0,...,k. Master 2: Econométrie 2 p. 21/22
22 Propriétés des estimateurs MCO MLR.5 V ar(u x 1,...,x k ) = σ 2 homoscédasticité. Théorème 3.2: Sous les hypothèses MLR.1 - MLR.5, V ar(ˆβ j ) = σ 2 (1 R 2 j ) n i=1 (x ij x j ) 2 où R 2 j est le R2 de le régression de x j sur les autres x (+ une constante). Théorème 3.3: Sous les hypothèses MLR.1 - MLR.5 (appelées hypothèses de Gauss-Markov), E(ˆσ 2 ) = σ 2, où ˆσ 2 = 1 n k 1 n i=1 û2 i. Théorème 3.4 où théorème de Gauss-Markov: Sous les hypothèses MLR.1 - MLR.5, ˆβ j est BLUE, i = 0,...,k. Master 2: Econométrie 2 p. 22/22
23 Rappels sur l Inférence Master 2: Econométrie 2 p. 23/22
24 Hypothèse de normalité Pour faire de l inférence statistique, il faut ajouter une hypothèse supplémentaire: MLR.6 u N(0,σ 2 ) et indépendant des x j normalité. Les hypothèses MLR.1 - MLR.6 sont appelées hypothèses classiques du modèle linéaire (CLM) = Gauss-Markov + normalité. CLM MCO à la variance minimale. Comment justifier cette hypothèse de normalité des résidus? Si u est la somme de beaucoup de facteurs non-observés différents, on peut appeler le théorème central limite pour justifier la normalité. Master 2: Econométrie 2 p. 24/22
25 Théorème Central Limite Soit Y 1,Y 2,...,Y n un échantillon de variables aléatoires de moyenne µ et de variance σ 2. Z n = Y n µ σ/ n N(0,1). suit asymptotiquement une distribution Si Y χ 2 (1), µ = 1 et σ 2 = 2. Master 2: Econométrie 2 p. 25/22
26 Inférence Théorème 4.1: Sous les hypothèses MLR.1 - MLR.6, ˆβ j N(β j,v ar(ˆβ j )), i = 0,...,k, où σ V ar(ˆβ j ) = 2 n Exemple. (1 R 2 j ) i=1 (x ij x j ) 2. Théorème 4.2: Sous les hypothèses MLR.1 - MLR.6, ˆβ j β j t se(ˆβ j ) n k 1, i = 0,...,k, où se(ˆβ j ) = V ar(ˆβ j ) et σ 2 est remplacé par ˆσ 2. On peut donc tester H 0 : β j = a j contre H 1 : β j <,, > a j. Master 2: Econométrie 2 p. 26/22
27 P-valeur P-valeur: Quelle est le plus petit niveau de significativité auquel H 0 serait rejeté. Comment la calculer? Prendre la t-stat et regarder à quel pourcentile elle correspond dans la distribution de Student appropriée. Rejeter H 0 si la P-Valeur < au seuil fixé (ex: 5%). Master 2: Econométrie 2 p. 27/22
28 Tests multiples de restrictions linéaires Si H 0 : β j = 0 pour j 0, 1,...,k. Ex: H 0 : β 1 = β 2 = 0. et H 1 : H 0 n est pas vrai. 1) Estimer le modèle non contraint. 2) Estimer le modèle contraint. 3) Calculer la statistique F (SSR c SSR nc )/q SSR nc /(n k 1), où SSR dénote la somme des carrés des résidus et les indices c et nc signifient respectivement contraint et non-contraint. Sous H 0, F F q,n k 1, où F =Fisher. Rejet H 0, si F > c α, où c = F α q,n k 1. Master 2: Econométrie 2 p. 28/22
29 Exercices récapitulatifs Exercice Exercice Exercice Master 2: Econométrie 2 p. 29/22
30 Rappels propriétés asymptotiques des MCO: Chapitre 5 Master 2: Econométrie 2 p. 30/22
31 Propriétés exactes des MCO Pour prouver le caractère non-biaisé et BLUE des MCO nous avons imposé des hypothèses assez fortes (MLR.1-MLR.5). Idem pour effectuer de l inférence statistique (MLR.6: normalité). Ces propriétés sont vraies quel que soit la taille de l échantillon ( n). On parle dès lors de propriété exacte, d échantillon fini, ou encore de petit échantillon. Master 2: Econométrie 2 p. 31/22
32 Propriétés asymptotiques des MCO Dans certains cas, le rejet de certaines hypothèses ne signifie pas que les MCO sont invalides. Ex: non-normalité de u. En effet, les MCO peuvent être encore valides en grand échantillon sous des hypothèses plus faibles. Étudier les propriétés statistiques pour n grand = étudier les propriétés asymptotiques. Nouveau concept: CONVERGENCE. Master 2: Econométrie 2 p. 32/22
33 Propriétés asymptotiques des MCO Pour rappel. Théorème 3.1: Sous les hypothèses MLR.1 - MLR.4, E(ˆβ j ) = β k j = 0,...,k. Pour rappel. MLR.3 E(u x 1,...,x k ) = 0 moyenne conditionnelle nulle. On a vu que E(u x 1 ) = 0 implique Cov(u,x 1 ) = 0. Définition: plim = Limite en probabilité = valeur vers laquelle un estimateur converge lorsque la taille de l échantillon tend vers l infini. Voir page 741. Hors, il est possible de montrer que: plim ˆβ 1 = β 1 + Cov(x 1,u) V ar(x 1 ) = β 1, si Cov(u,x 1 ) = 0. Master 2: Econométrie 2 p. 33/22
34 Propriétés asymptotiques des MCO Il est possible de relâcher MLR.3 pour prouver tout de même que les MCO sont convergents. MLR.3 E(u) = 0 et Cov(x j,u) = 0 j = 1,...,k moyenne nulle et correlation nulle. Sous les hypothèses MLR.1 - MLR.2 - MLR.3 - MLR.4, ˆβ j est un estimateur convergent de β j, j = 1,...,k. Master 2: Econométrie 2 p. 34/22
35 Normalité asymptotique La normalité ne joue aucun rôle dans le caractère non-biasés des MCO ni dans leur caractère BLUE. Par contre, pour effectuer de l inférence statistique nous avons supposé que u N(0,σ 2 ) et donc que la distribution de y x 1,...,x k est normale. distribution symétrique autour de sa moyenne. peut prendre des valeurs sur R. plus de 95% des observations sont comprises entre 2 écart-types. Master 2: Econométrie 2 p. 35/22
36 Normalité asymptotique Devons nous abandonner les t-stats si u n est pas normalement distribué? Non: on fait appel au théorème central limite pour conclure que les MCO satisfont la normalité asymptotique. Si n grand, ˆβ j est approximativement N(β j,v ar(ˆβ j )). Illustration via une Simulation de Monte-Carlo: Prg, Output n=2000,output n=30. Master 2: Econométrie 2 p. 36/22
37 Rappels Hétéroscédasticité: Chapitre 8 Master 2: Econométrie 2 p. 37/22
38 Conséquences de l hétéroscédasticité Une fois de plus l hétéroscédasticité n a pas d influence sur le caractère non-biaisé ou convergent des MCO. Par contre la formule traditionnelle de V ar(ˆβ j ) donne un estimateur biaisé de la variance des estimateurs si l hypothèse d homoscédasticité est violée. Inférence incorrecte si on utilise cette formule. MCO ne sont plus BLUE. Solution 1: Corriger cette formule Écart-types robustes à l hétéroscédasticité (White, 1980). Solution 2: Déterminer la source de cette hétéroscédasticité et la prendre en compte dans l estimation Moindres Carrés Pondérés. Master 2: Econométrie 2 p. 38/22
39 Corrélation sérielle et hétéroskedasticité: Chapitre 2 Master 2: Econométrie 2 p. 39/22
40 Section 1: Corrélation sérielle Master 2: Econométrie 2 p. 40/22
41 Biais des MCO et autocorrélation Supposons que y t = β 0 + β 1 x t + u t. Supposons que le terme d erreur suit un AR(1) : u t = ρu t 1 + e t avec ρ < 1 et e t iid(0,σ 2 e). Chapitre 10: TS.1-TS.3 MCO non-biaisés pour autant que x soit strictement exogène. Chapitre 11: TS.1 -TS.3 MCO consistant pour autant que y t soit faiblement dépendant et E(u t x t ) = 0. Rien n est dit sur le fait que u t ne puisse pas suivre un AR(1). Par contre les MCO ne sont plus BLUE car violation de TS.5 et TS.5. Master 2: Econométrie 2 p. 41/22
42 Efficience-Inférence des MCO Estimation du modèle y t = β 0 + β 1 x t + u t par MCO, où u t supposé iid(0,σ 2 ) et pour simplifier x = 0. Rappelons que u t suit en réalité un AR(1). ˆβ 1 = β 1 + SSTx 1 n i=1 x tu t, où SST x = n i=1 x2 t. V ar(ˆβ 1 ) = SST 2 x = SST 2 x = V ar( n x t u t ) i=1 n x 2 tv ar(u t ) + 2 i=1 σ 2 SST x + 2 σ2 SST 2 x n 1 n t t=1 j=1 n 1 t=1 ρ j x t x t+j n t j=1 x t x t+j E(u t u t+j ) Master 2: Econométrie 2 p. 42/22
43 Efficience-Inférence des MCO La formule traditionnelle ignore le second terme. Si ρ > 0 on sous-estime V ar(ˆβ 1 ). Si ρ < 0 on sur-estime V ar(ˆβ 1 ). Question: Supposons que u t = e t + αe t 1. Montrez que la formule traditionnelle pour calculer V ar(ˆβ 1 ) est incorrecte si α 0. Master 2: Econométrie 2 p. 43/22
44 Tester la présence d autocorrélation Dans le modèle général: y t = β 0 + β 1 x t β k x tk + u t comment tester la présence de corrélation sérielle? Deux types de tests: 1. Tests basés sur l hypothèse que X est strictement exogène: t-test ou DW. 2. Tests basés sur l hypothèse que X n est pas strictement exogène. Master 2: Econométrie 2 p. 44/22
45 Si X est strictement exogène Supposons que y t = β 0 + β 1 x t + u t. Nous voulons tester si le terme d erreur suit un AR(1) : u t = ρu t 1 + e t avec ρ < 1. H 0 : ρ = 0. Développons tout d abord un test valide quand n est grand et quand X est strictement exogène. Hypothèses supplémentaires disant en quelque sorte que e t est iid: E(e t u t 1,u t 2,...) = 0 et V ar(e t u t 1 ) = V ar(e t ) = σ 2 e. Si les u t étaient observés on pourrait utiliser le Théorème 11.2 pour valider l utilisation asymptotique des t-tests dans la régression u t = ρu t 1 + e t. Que ce passe-t-il si on remplace u t par û t? A noter que û t dépend de ˆβ 0 et de ˆβ 1. Master 2: Econométrie 2 p. 45/22
46 Marche à suivre pour le t-test Estimer y t = β 0 + β 1 x t + u t et obtenir û t. Estimer û t = ρû t 1 + e t. Utiliser un t-test pour tester H 0 : ρ = 0 contre H 1 : ρ < > 0. Master 2: Econométrie 2 p. 46/22
47 Test de Durbin-Watson Le test de Durbin-Watson est un autre test pour tester la corrélation sérielle d ordre 1 sous l hypothèse que X est strictement exogène. La statistique DW = n t=2 (û t û t 1 ) 2 n t=1 û2 t d une régression du type y t = β 0 + β 1 x 1t β k x kt + u t. Il est facile de montrer que DW 2(1 ˆρ)., où û t est le résidu Durbin et Watson (1951) ont dérivé la distribution de DW conditionnellement à X sous l hypothèse que les hypothèses du modèle linéaire classique sont vérifiées (incluant la normalité). La distribution de DW dépend de n,k, et du fait qu on a inclut une constante ou pas. Master 2: Econométrie 2 p. 47/22
48 Test de Durbin-Watson Notons que n t=2 (û t û t 1 ) 2 = n t=2 û2 t + n t=2 û2 t 1 2 n t=2 ûtû t 1. Si ˆρ = 1 DW = 0. Si ˆρ = 1 DW = 4. Si ˆρ = 0 DW = 2. H 0 : ρ = 0 contre généralement H 1 : ρ > 0. Durbin et Watson (1951) reportent des valeurs critiques inférieures d L et supérieures d U. Si d L DW d U, on ne rejette pas H 0. La plupart des logiciels économétriques reportent DW mais pas les valeurs critiques. Master 2: Econométrie 2 p. 48/22
49 Table de Durbin-Watson pour H 1 : ρ > 0 Master 2: Econométrie 2 p. 49/22
50 Si X n est pas strictement exogène Durbin (1970 propose un autre test valable si X n est pas strictement exogène, par exemple si le modèle contient y t 1 comme variable explicative. i) Estimer le modèle y t = β 0 + β 1 x t β k x tk + u t et obtenir û t, t = 1, 2,...,n. ii) Estimer le modèle û t = γ 0 +γ 1 x t γ k x tk +ρû t 1, t = 2, 3,...,n et obtenir ˆρ ainsi que tˆρ. iii) Utiliser tˆρ de la manière usuelle pour tester H 0 : ρ = 0 contre H 1 : ρ < > 0. On régresse û t sur x t et û t 1 et donc on permet à chaque x tj d être corrélé avec u t 1. tˆρ a approximativement une distribution en t si n est grand. Master 2: Econométrie 2 p. 50/22
51 Tester un AR(q) i) Estimer le modèle y t = β 0 + β 1 x t β k x tk + u t et obtenir û t, t = 1, 2,...,n. ii) Estimer le modèle û t = γ 0 + γ 1 x t γ k x tk + ρ 1 û t ρ q û t q, t = q + 1,q + 2,...,n. iii) Effectuer le F-test suivant H 0 : ρ 1 =... = ρ q = 0 contre H 1 : un des ρ j < > 0, j = 1,...,q. Si les x t sont supposés strictement exogènes, on peut les omettre dans les étapes i) et ii). A noter que ces tests supposent V ar(u t x t,u t 1,...,u t q ) = σ 2. Il existe une version de ces tests robuste à l hétéroskedasticité comme on le verra plus loin. Master 2: Econométrie 2 p. 51/22
52 Tester un AR(q) Une alternative a F -test est d utiliser un Lagrange Multiplier (LM) Test: LM = (n q)r 2 û, où R 2 û est le R2 de la régression û t = γ 0 + γ 1 x t γ k x tk + ρ 1 û t ρ q û t q, t = q + 1,q + 2,...,n. Sous H 0,LM χ 2 q asymptotiquement. Ce test est connu sous le nom de test de Breusch-Godfrey. Il est test est disponible en Eviews (avec le F -test). Exemple: Taux d intérêt US obligataire à 3 mois. ci3 t = α 0 + α 1 ci3 t 1. Master 2: Econométrie 2 p. 52/22
53 Correction pour corrélation sérielle Si on détecte de la corrélation sérielle, on peut modifier le modèle initial pour tenter d obtenir un modèle dynamiquement complet (ex: AR(1) AR(2)). Dans certains cas nous ne sommes pas intéressé par modéliser cette dynamique l intérêt réside plutôt dans les autres variables incluses dans le modèle. Mais l inférence est compromise Que faire? Calculer des écart-types robustes à n importe quelle forme de corrélation sérielle. Master 2: Econométrie 2 p. 53/22
54 Écart-types robustes Considérons le modèle y t = β 0 + β 1 x t β k x tk + u t, t = 1,...,n. Comment obtenir un écart-type pour ˆβ 1 robuste à la corrélation sérielle? x t1 = δ 0 + δ 2 x t δ k x tk + r t, où E(r t ) = 0 et Corr(r t,x tj ) = 0, j 2. Il est possible de montrer que Avar(ˆβ 1 ) = V ar n ( i=1 r tu t), n ( i=1 E(r2 t )) 2 où Avar dénote la variance asymptotique. Sous l hypothèse TS.5, a t r t u t est non corrélé sériellement et donc la formule traditionnelle de V ar(ˆβ 1 ) est valide. Par contre si TS.5 ne tient pas, Avar(ˆβ 1 ) doit tenir compte de la corrélation entre a t et a s t s. Master 2: Econométrie 2 p. 54/22
55 Écart-types robustes Newey et West (1987) et Wooldridge (1989) ont montré que Avar(ˆβ 1 ) peut être estimé de la manière suivante. i) Estimer par MCO y t = β 0 + β 1 x t β k x tk + u t, t = 1,...,n. se(ˆβ 1 ) dénote l écart-type de ˆβ 1 et ˆσ l écart-type de û t. ii) Estimer la régression auxiliaire: x t1 = δ 0 + δ 2 x t δ k x tk + r t. iii) Calculer â t = ˆr t û t, t = 1,...,n. iv) Pour une valuer g > 0 donnée, calculer: ˆv = n t=1 â2 t + 2 g h=1 [1 h/(g + 1)]( n t=h+1 âtâ ) t h. g contrôle la quantité" de corrélation sérielle que nous permettons. Master 2: Econométrie 2 p. 55/22
56 Écart-types robustes Ex: g = 1, ˆv = n t=1 â2 t + n t=2 âtâ t 1. v) L écart-type robuste à la corrélation sérielle de ˆβ 1 est: se (ˆβ 1 ) = [se(ˆβ 1 )/ˆσ 2 ] ˆv. On peut montrer que cet estimateur est aussi robuste à toute forme d hétéroskedasticité cas plus général de ce qui est exposé au Chapitre 8. Comment choisir g? La théorie nous dit que g doit croître avec n. Master 2: Econométrie 2 p. 56/22
57 Choix de g Certains travaux ont suggéré pour: - des données annuelles g = 1, 2; - des données trimestrielles g = 4, 8; - des données mensuelles g = 12, 24. Newey et West (1987) recommandent de prendre la partie entière de 4(n/100) 2/9 implémenté en Eviews. Exemple: Taux d intérêt US obligataire à 3 mois. ci3 t = α 0 + α 1 ci3 t 1. Master 2: Econométrie 2 p. 57/22
58 Section 2: Hétéroscédasticité Master 2: Econométrie 2 p. 58/22
59 Hétéroscédasticité Pour beaucoup de séries temporelles, l hypothèse TS.4 ou TS.4 d homoscédasticité est violée. Exemple: Rendements journaliers du NYSE n affecte pas le caractère non-biaisé ou convergent des MCO mais invalide l inférence statistique traditionnelle. Il existe deux manières d aborder le problème lié à l hétéroscédasticité. i) Corriger les écart-types pour effectuer de l inférence correctement. ii) Modéliser la dynamique présente dans la variance. Master 2: Econométrie 2 p. 59/22
60 Écart-types robustes à la White (1980) White (1980) propose une méthode permettant de rendre les écart-types robustes à toute forme d hétéroscédasticité. offre une solution intéressante, pour autant que l intérêt ne se porte que sur la modélisation de la moyenne conditionnelle. Eviews, ainsi que beaucoup d autres logiciels économétriques, offre cette option. Il est possible de montrer que la formule de White (1980) est un cas particulier de la formule de Newey et West (1987) qui permet de tenir compte également d une possible autocorrélation des résidus. Exemple: AR(1) sur NYSE Master 2: Econométrie 2 p. 60/22
61 Tester la présence d hétéroscédasticité Avant de modéliser la dynamique présente dans la variance, il est judicieux de tester la présence d hétéroscédasticité afin d avoir une meilleure idée de la spécification à adopter. Pour appliquer les tests présentés ci-dessous il faut supposer que les résidus u t sont non corrélé sériellement tester avant. Test de Breusch-Pagan: u 2 t = δ 0 + δ 1 x t δ k x tk + v t ; H 0 : δ 1 =... + δ k = 0. Pour utiliser un F -test, il faut que les écart-types des MCO soient valables et donct que v t satisfasse TS.4 ou TS.4 et TS.5 ou TS.5. Exemple: AR(1) sur NYSE: Estimer û 2 t = α 0 + α 1 return t 1 + e t Master 2: Econométrie 2 p. 61/22
62 Modèles ARCH Considérons un modèle simple: y t = β 0 + β 1 z t + u t. Une caractéristique largement admise des séries financières à fréquence élevée est que la variance n est pas constante au court du temps et qu il existe des grappes de volatilité. Si la variance en t est grande, elle le sera probablement demain et les jours qui suivent. Si la variance en t est petite, elle le sera probablement demain et les jours qui suivent. Engle (1982) a proposé un modèle appelé ARCH: Autoregressive Conditional Heteroskedasticity. Master 2: Econométrie 2 p. 62/22
63 Modèles ARCH La caractéristique du modèle ARCH(1) est que: E(u 2 t u t 1,u t 2,...) = E(u 2 t u t 1) = α 0 + α 1 u 2 t 1, alors que E(u 2 t u t 1,u t 2,...) = 0. Les u t sont non corrélés sériellement alors que les u 2 t le sont. Conditions de positivité: E(u 2 t u t 1) > 0, t α 0 > 0 et α 1 0. Si α 1 = 0 homoscédasticité. on peut tester la présence d effets ARCH en estimant ce modèle (sur û t ), voir une version plus étendue (plus de retards). On peut tester α 1,...,α q = 0 en utilisant un LM test ou F test. Master 2: Econométrie 2 p. 63/22
64 Chapitre 3: Pooling de données cross-section ou méthodes simples de données de panel: Master 2: Econométrie 2 p. 64/22
65 Pooling Une série cross-section (ou en coupes) constitue bien souvent un ensemble de données relatives à des unités (individus, firmes, etc.) interrogées à un moment donné. Dans certains cas, l enquête est répétée plusieurs fois donnant lieu à des échantillons différents, représentatifs de la population. La technique du pooling suppose que les différents échantillons sont chaque fois tirés aléatoirement de la population. On n observe pas nécessairement les mêmes unités. On dispose de plusieurs échantillons indépendants. Par conséquent, Corr(u t,u s ) = 0, t s et donc on peut donc (sous réserve) empiler les enquêtes et effectuer une analyse MCO traditionnelle. Master 2: Econométrie 2 p. 65/22
66 Panel Par contre, lorsqu on observe la même unité au court du temps, on parle de données de panel ou longitudinales. Par conséquent, on ne peut pas supposer que les observations sont indépendantes. Un facteur non-observé (comme le QI) qui affecte le salaire d un individu en 1995 va également affecter son salaire en 2000 = hétérogénéité non observée. Requiert des techniques particulières pour traiter ce problème. Empiler les échantillons et utiliser les MCO donne des estimateurs biaisés. Master 2: Econométrie 2 p. 66/22
67 Technique de pooling Beaucoup d enquêtes auprès des ménages sont répétées au court du temps. Vu que le taux d attrition est souvent assez grand, on veille à interroger de nouvelles personnes pour accroître l échantillon. On a alors des échantillons indépendants. Pourquoi effectuer plusieurs enquêtes? Pour avoir plus d observations et donc plus de précision dans l estimation des paramètres et des écarts-type. Master 2: Econométrie 2 p. 67/22
68 Technique de pooling Pour effectuer des tests nécessitant l utilisation d observations à différents moments du temps. Exemple : Pour tester l efficacité d une politique économique il faut des observations avant et après la mise en oeuvre de la politique. Etude de cas : La base de données FERTIL1.wf1 concerne l étude de Sanders (1994) sur la fertilité aux USA. Fréquence : une enquête tous les 2 ans de 1972 à vagues. La question posée est Comment évolue la fertilité au court du temps? après avoir contrôlé pour des facteurs tels que éducation, âge, race, région (à 16 ans), environnement (à 16 ans). Master 2: Econométrie 2 p. 68/22
69 Variable dépendante : KIDS Variable Coefficient Std. Error t-statistic Prob. C EDUC AGE AGESQ BLACK EAST NORTHCEN WEST FARM OTHRURAL TOWN SMCITY Y Y Y Y Y Y R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) Master 2: Econométrie 2 p. 69/22
70 Données de Panel à 2 périodes Supposons maintenant que nous disposons des données individuelles pour lesquelles un individu est observé en t = 1 et t = 2. Exemple : la base de donnée CRIME2 comprend des données sur les taux de criminalité et de chômage pour 46 villes américaines en 1982 et Estimation pour l année 1987 : Résultat. Comment expliquer ce résultat? Si chômage augmente, le crime diminue. Variables omises observables? On pourrait contrôler pour des facteurs tels que (la distribution de) l âge, éducation, etc. Master 2: Econométrie 2 p. 70/22
71 Données de Panel à 2 périodes Variables omises non-observables? On peut imaginer que certains de ces facteurs sont constants au court du temps et certains varient au court du temps. y it = β 0 + δ 0 d2 t + β 1 x it + a i + u it,t = 1, 2. i unité et t temps. d2 t = 0 si t = 1 et d2 t = 1 si t = 2 intercept différent pour t = 1 ou 2. a i capture tous les facteur non-observé affectant y it effet non-observé,fixe ou individuel. Ce modèle s appelle donc modèle à effet non-observé ou à effet fixe. u it est le terme d erreur idiosyncratique ou variant dans le temps. Master 2: Econométrie 2 p. 71/22
72 Exemple crmrte it = β 0 + δ 0 d87 t + β 1 unem it + a i + u it,t = 1, 2. a i reprend tous les autres facteurs affectant le taux de criminalité qui ne varient pas entre t = 1 et 2. caractéristiques géographiques (localisations aux USA). caractéristiques démographiques (age, race, éducation, etc.) : à vérifier. certaines villes peuvent avoir leurs propres méthodes pour comptabiliser les crimes. Comment estimer β 1? Pooling? Master 2: Econométrie 2 p. 72/22
73 Pooling y it = β 0 + δ 0 d2 t + β 1 x it + v it,t = 1, 2. v it = a i + u it. Pour estimer ce modèle par MCO il faut supposer que a i est non corrélé avec x it sinon v it (erreur composé) serait corrélé avec x it. Si ce n est pas le cas les MCO donne lieu à un biais d hétérogénéité non observée. Biais dû à l omission d une variable constante au court du temps. Exemple : CRIME2. 92 observations: 46 villes et 2 périodes. Master 2: Econométrie 2 p. 73/22
74 Panel Si a i est corrélé avec x it, la technique du pooling est donc inappropriée. Solution simple : estimer un modèle en différence première. y i1 = β 0 + β 1 x i1 + a i + u i1 (t = 1) y i2 = (β 0 + δ 0 ) + β 1 x i2 + a i + u i2 (t = 2). Par conséquent, (y i2 y i1 ) = δ 0 + β 1 (x i2 x i1 ) + (u i2 u i1 ) y i = δ 0 + β 1 x i + u i. Master 2: Econométrie 2 p. 74/22
75 Panel y i = δ 0 + β 1 x i + u i peut être estimé par MCO si les hypothèses traditionnelles sont validées. En particulier, il faut que Corr( u i, x i ) = 0, ce qui est naturellement vrai si Corr(u it,x it ) = 0, t = 1, 2. Dans notre exemple Corr( u i, unem i ) = 0? Faux si par exemple si l effort d application de la loi ( u it ) augmente plus dans des villes où le taux de chômage diminue Corr(u it,unem it ) < 0 biais des MCO. Important : on ne peut estimer par cette méthode l effet de variables constantes au court du temps (z i ). Exemple : Distance par rapport à la capitale z i = 0. Exemple : CRIME2. Master 2: Econométrie 2 p. 75/22
76 Modèle en DP pour T > 2 y it = δ 0 + δ 2 d2 t + δ 3 d3 t + β 1 x it β k x itk + a i + u it, où t = 1, 2 et 3 3N observations. on a considéré ici 2 variables auxiliaires temporelles en plus de l intercept. Si Corr(a i,x itj ) 0 j = 1,...,k ˆβ j obtenu par MCO sur des données poolées sont biaisés et inconsistants. utiliser les techniques de panel si Corr(x itj,u is ) = 0 t,s et j, c-à-d si exogénéité stricte des x itj après contrôle des effets fixes a i. Pour éliminer a i on peut différencier les séries. Exemple : y i2 = y i2 y i1 et y i3 = y i3 y i2. Master 2: Econométrie 2 p. 76/22
77 Modèle en DP pour T > 2 y it = δ 2 d2 t + δ 3 d3 t + β 1 x it β k x itk + u it, où t = 2 et 3 2N observations. Estimer le modèle par MCO sur les données poolées si les autres hypothèses des MCO sont validées. Il est important de vérifier que corr( u it, x itj ) = 0 j = 1,...,k et t = 2, 3. Notons que cette équation n a pas d intercept on ne peut pas calculer de R 2. Mais d2 t = 1 si t = 2 ( 1 si t = 3) et d3 t = 1 si t = 3 (0 si t = 2). y it = α 0 + α 3 d3 t + β 1 x it β k x itk + u it. Master 2: Econométrie 2 p. 77/22
78 Panel Balancé Idem si T > 3. Si T est le même pour tous les individus on a un panel balancé. Si T > 2 il faut évidemment vérifier que u it n est pas corrélé sériellement. Master 2: Econométrie 2 p. 78/22
79 Hypothèses de l estimateur à DP 7 hypothèses sous-jacentes à l estimation par DP : FD.1 i Le modèle s écrit : y it = β 1 x it1 + β 2 x it β k x itk + a i + u it,t = 1, 2,...,T. FD.2 On dispose d un échantillon aléatoire pour chaque dimension en coupes transversales ( cross-section ). FD.3 E(u it X i,a i ) = 0 L espérance conditionnelle du terme d erreur est nulle t E( u it X i ) = 0 pour t = 2,...,T. FD.4 Chaque variable explicative change dans le temps (au moins pour certains i) et il n y a pas de relation linéaire parfaite entre les variables explicatives. FD.5 t,v ar( u it X i ) = V ar( u it ) = σ 2 u. FD.6 t s,cov( u it, u is X i ) = 0. Master 2: Econométrie 2 p. 79/22
80 Hypothèses de l estimateur à DP FD.7 (Hypothèse de normalité) : Conditionnellement à X i, les u it sont indépendamment et identiquement distribués suivant une N(0,σ 2 u). Sous les hypothèses FD.1-FD.6, l estimateur par DP est BLUE (conditionnellement à X). Sous les hypothèses FD.1-FD.7, l estimateur DP est normalement distribué. Master 2: Econométrie 2 p. 80/22
81 Illustration Cette illustration concerne l effet de l alcool au volant. Quel est l effet des taxes et des lois sur l alcool au volant sur la mortalité liée à un accident de voiture? Données sur mortalité liée à un accident de voiture, taxes sur l alcool, lois sur l alcool au volant et d autres variables concernant 48 états américains contigus. Fréquence : Annuel de 1982 à années. Modèle simple : FatalityRate = α 0 + α 1 BeerTax + u, où FatalityRate = nombre annuel de morts suite à un accident de voiture par personnes (aux USA) = mrall, et BeerTax = taxe réelle sur un casier de bière. Master 2: Econométrie 2 p. 81/22
82 MCO pour les années 1982 et 1988 Fatality rate (par ) ^FatalityRate = BeraTax (0.15) (0.13) Fatality rate (par ) Bear Tax (Dollars par caise en $1988) 1988 ^FatalityRate = BeraTax (0.11) (0.13) Bear Tax (Dollars par caise en $1988) Master 2: Econométrie 2 p. 82/22
83 Eviews - Workfile Eviews. - Programme Eviews. Code Eviews : Equation OLS FatalityRate = alpha_0 + alpha_1 BeerTax + u for year 1982 smpl states.ls(h) vfrall? c beertax? freeze(eq_ols_1982) states Master 2: Econométrie 2 p. 83/22
84 Eviews Dependent Variable: VFRALL? Method: Pooled Least Squares Sample: Included observations: 1 Number of cross-sections used: 48 Total panel (balanced) observations: 48 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. C BEERTAX? R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Sum squared resid F-statistic Prob(F-statistic) Master 2: Econométrie 2 p. 84/22
85 Eviews Dependent Variable: VFRALL? Method: Pooled Least Squares Sample: Included observations: 1 Number of cross-sections used: 48 Total panel (balanced) observations: 48 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. C BEERTAX? R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Sum squared resid F-statistic Prob(F-statistic) Master 2: Econométrie 2 p. 85/22
86 Modèle en différence première - Ce résultat contre intuitif peut s expliquer par le fait que certaines variables omises sont corrélées avec BeerT ax estimateur biaisé. - Si ces variables sont constantes au court du temps, on peut estimer un modèle de panel en différence première. - Exemple : attitudes culturelles vis-à-vis de l alcool et de la conduite constant au court du temps (t) mais varie entre les états (i). Code Eviews : Equation OLS on first difference for t=1982 and > T=2 smpl states.genr dbtax?=beertax?-beertax?(-6) states.genr dvfrall?=vfrall?-vfrall?(-6) states.ls(h) dvfrall? c dbtax? freeze(eq_ols_fd) states Master 2: Econométrie 2 p. 86/22
87 Eviews Dependent Variable: DVFRALL? Method: Pooled Least Squares Sample(adjusted): Included observations: 1 after adjusting endpoints Number of cross-sections used: 48 Total panel (balanced) observations: 48 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. C DBTAX? R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Sum squared resid F-statistic Prob(F-statistic) Master 2: Econométrie 2 p. 87/22
88 Méthodes de panel avancées: Chapitre 4 Master 2: Econométrie 2 p. 88/22
89 Objectif Dans le chapitre précédent, nous avons vu l approche du pooling ainsi qu une méthode pour prendre en compte l hétérogénéité non observée : differences premières. Dans ce chapitre, 2 autres méthodes. Estimation par effets fixes comme pour les premières différences, cette méthode élimine les effets individuels a i avant estimation ainsi que l effet des variables constantes dans le temps. Estimation avec effets aléatoires si effet individuel non corrélé avec les variables explicatives. Ces 2 méthodes sont mises en oeuvre dans la plupart des logiciels économétriques comme Eviews, Rats et PcGive. Master 2: Econométrie 2 p. 89/22
90 Effets fixes Transformation par différences premières élimine les effets individuels a i. Méthode alternative meilleure sous certaines hypothèses : transformation par effets fixes. Modèle : y it = β 1 x it + a i + u it,t = 1, 2,...,T. Pour chaque i, la moyenne temporelle des y it est : où y i = 1 T T i=1 y it. y i = β 1 x i + a i + u i, Master 2: Econométrie 2 p. 90/22
91 Effets fixes Par conséquent, y it y i = β 1 (x it x i ) + (u it u i ),t = 1, 2,...,T. Ou encore, ÿ it = β 1 ẍ it + ü it, où ÿ it = y it y i est la valeur de y en déviation par rapport à sa moyenne temporelle. La transformation par effets fixes est aussi appelé transformation within. On peut remarquer que a i a disparu : on peut donc estimer le modèle ÿ it = β 1 ẍ it + ü it par MCO poolés Estimateur à effets fixes ou estimateur within (estimateur EF). Master 2: Econométrie 2 p. 91/22
92 Effets fixes On peut généraliser ce modèle au cas multivarié : y it = β 1 x it1 + β 2 x it β k x itk + a i + u it,t = 1, 2,...,T. Le modèle à EF correspondant est alors : ÿ it = β 1 ẍ it1 + β 2 ẍ it β k ẍ itk + ü it. Ceci peut également s estimer par MCO. L estimateur par effets fixes est non biaisé sous l hypothèse de variables explicatives exogènes ou sous l hypothèse que u it est non corrélé avec ces variables explicatives pour toutes les périodes (exogénéité stricte). Master 2: Econométrie 2 p. 92/22
93 Hypothèses de l estimateur à EF 7 hypothèses sous-jacentes à l estimation par EF : FE.1 i Le modèle s écrit : y it = β 1 x it1 + β 2 x it β k x itk + a i + u it,t = 1, 2,...,T. FE.2 On dispose d un échantillon aléatoire pour chaque dimension en coupes transversales ( cross-section ). FE.3 E(u it X i,a i ) = 0 L espérance conditionnelle du terme d erreur est nulle t. FE.4 Chaque variable explicative change dans le temps (au moins pour certains i) et il n y a pas de relation linéaire parfaite entre les variables explicatives. FE.5 t,v ar(u it X i,a i ) = V ar(u it ) = σ 2 u. FE.6 t s,cov(u it,u is X i,a i ) = 0. Master 2: Econométrie 2 p. 93/22
94 Hypothèses de l estimateur à EF FE.7 (Hypothèse de normalité) : Conditionnellement à X i et a i, les u it sont indépendamment et identiquement distribués suivant une N(0,σ 2 u). Sous les hypothèses FE.1-FE.6, l estimateur par EF est BLUE (conditionnellement à X et à a i ). L estimateur en première différence est donc moins précis du fait de l absence de l hypothèse FE.6. Sous les hypothèses FE.1-FE.7, l estimateur EF est normalement distribué BLUE (conditionnellement à X et à a i ). Master 2: Econométrie 2 p. 94/22
95 Effets fixes : suite L estimateur de panel à effets fixes permet une corrélation entre a i et les variables explicatives pour n importe quelle période. Comme l estimateur élimine les a i, toute variable constante dans le temps sera également éliminée : ẍ it = 0 pour tout i et t si x it est constant dans le temps on ne peut pas inclure des variables constantes dans le temps. Master 2: Econométrie 2 p. 95/22
96 Estimation par effets fixes : suite Le nombre de degrés de liberté dans le modèle à effets fixes est égal à NT N k = N(T 1) k pour chaque i on perd 1 degré de liberté car on doit estimer x i. On peut néanmoins introduire des variables constantes dans le temps qui vont interagir avec des variables qui varient dans le temps. Exemple : impact de de l éducation sur le salaire pas possible d estimer le return car éducation constante dans le temps (en général); néanmoins, en multipliant educ par le temps, on peut voir si le rendement de l éducation évolue dans le temps. Master 2: Econométrie 2 p. 96/22
97 Régression par variable dummy Idée de l estimation par EF : le paramètre a i doit être estimé pour chaque i. Pour T 2, une solution est de mettre une variable dummy pour chaque coupe transversale (chaque i). Régression par variable dummy mise en oeuvre lorsque N pas trop élevé. Cette méthode donne exactement les même valeurs estimées ˆβ j que l estimation sur ÿ it. Avantage : le nombre de degrés de liberté correct est calculé directement. Master 2: Econométrie 2 p. 97/22
98 Estimation des effets individuels L estimation des valeurs estimées â i peut être d un intérêt économique. On peut en effet étudier leur distribution sur tous les i. On peut calculer les â i après estimation par effets fixes : â i = y i ˆβ 1 x i1... ˆβ k x ik,i = 1,...,N. Attention, certains logiciels reportent l intercept. Cet intercept reporté peut être la moyenne pour tous les i des â i à ne pas confondre avec les â i. Sous les hypothèses FE.1-FE.4, l estimation des a i est non biaisée. Néanmoins, pout T fixe, elle n est pas consistante quand N. On obtient de meilleurs estimateurs de a i avec T large. Master 2: Econométrie 2 p. 98/22
99 Effets fixes vs. première différence Les 2 méthodes permettent de traiter le problème de l hétérogénéité non observée. Laquelle choisir? Pour T = 2, les 2 méthodes donnent des résultats strictement identiques Estimateur en PD permet d estimer aisément des écarts-type robustes à l hétéroscédasticité. Pour T 3, il faut comparer les estimateurs sur base de leur efficience relative (les 2 sont non biaisés sous FE.1-FE.4 et consistants). Si les u it sont non autocorrélés (FE.6) l estimateur EF est plus efficient. Master 2: Econométrie 2 p. 99/22
100 Effets fixes vs. première différence Si les u it sont très autocorrélés (FE.6) l estimateur PD est plus efficient. A l extrême, si les u it suivent une marche aléatoire, alors u it sera non autocorrélé l estimateur PD est préférable. Dans les cas intermédiaires (autocorrélation positive mais ρ < 1), il est préférable d utiliser les 2 estimateurs. Pour tester l hypothèse de non autocorrélation, on peut utiliser les u it après estimation en PD. si non autocorrélation, estimateur PD meilleur; si autocorrélation négative importante, alors estimateur EF préférable car l estimateur PD crée de l autocorrélation par sur-différenciation. Master 2: Econométrie 2 p. 100/22
101 Effets fixes vs. première différence Prudence dans l utilisation de l estimateur EF lorsque N pas très large (ex: N = 20) et T large (ex: T = 30). En effet, sous FE.1-FE.7, la distribution de l estimateur EF est correcte N et T. Par contre, problème avec l estimateur à EF si une des hypothèses violées et que N petit et T large. Exemple : cas de racines unités l estimateur PD rendra la série stationnaire. Si non normalité, utiliser estimateur PD car FE.7 pas nécessaire. Si hétéroscédasticité, on peut utiliser estimateur PD avec écarts-type robustes. Master 2: Econométrie 2 p. 101/22
102 Effets fixes vs. première différence D un autre côté, l utilisation de l estimateur à EF est moins sensible à une violation de l hypothèse d exogénéité, surtout avec T large. Si hypothèse d exogénéité pose problème (exemple : variables dépendantes retardées), alors l estimateur EF est préférable. Pour conclure : choix non trivial entre méthodes EF et PD. Master 2: Econométrie 2 p. 102/22
103 Illustration - Revenons à l exemple sur l effet de l alcool au volant. - Considérons maintenant les 7 vagues de données. Code Eviews : Equation Fixed Effects smpl states.ls(h,f) vfrall? c beertax? freeze(eq_ols_ef) states Master 2: Econométrie 2 p. 103/22
104 Illustration Dependent Variable: VFRALL? Method: Pooled Least Squares Sample: Included observations: 7 Number of cross-sections used: 48 Total panel (balanced) observations: 336 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-statistic Prob. BEERTAX? Fixed Effects _AL--C _AZ--C _WY--C R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Sum squared resid F-statistic Durbin-Watson stat Prob(F-statistic) Master 2: Econométrie 2 p. 104/22
105 Effets fixes dans un panel non cylindré Si pour certaines années, il y a des observations manquantes pour un nombre d individus i, alors on a un panel non balancé ou non cylindré. Si panel non balancé, on peut utiliser l estimateur à EF sous une condition cruciale. Condition cruciale : la raison pour laquelle on a des observations manquantes ne doit pas être corrélée aux u it Ceci garantit l existence d un échantillon aléatoire pour chaque coupe (FE.2). Exemple : panel de firmes pour étudier si le degré de syndicalisation affecte la profitabilité des firmes; si certaines firmes absentes pour des raisons de faible profitabilité (faillites, fusions, acquisitions), alors FE.2 est violée phénomène d attrition estimateurs biaisés. Master 2: Econométrie 2 p. 105/22
106 Estimation avec effets aléatoires Modèle de base : y it = β 1 x it1 + β 2 x it β k x itk + a i + u it. Avec les estimateurs EF ou PD, le but est d éliminer les a i car ils sont sensés être corrélés avec les x itj. Supposons maintenant que Cov(x itj,a i ) = 0,t = 1, 2,...,T;j = 1, 2,...,k. Dans ce cas l estimateur à EF est non efficient et il est préférable d utiliser un estimateur à effets aléatoires (estimateur EA). Master 2: Econométrie 2 p. 106/22
107 Hypothèses de l estimation avec EA 3 hypothèses supplémentaires aux hypothèses FE.1, FE.2, FE.3, FE.5, FE.6 : RE.3 La valeur attendue des a i étant donnés les X i est constante : E(a i X i ) = β 0. RE.4 Il n y a pas de relation linéaire parfaite entre les variables explicatives. RE.5 La variance des a i est constante, conditionnellement aux X i : V ar(a i X i ) = σ 2 a. Master 2: Econométrie 2 p. 107/22
108 Estimation avec EA Comment estimer les β j sous les hypothèses précédentes? Quid si on estime le modèle par MCO poolés? Ceci produit des estimateurs de β j consistants mais non efficients car les erreurs seront autocorrélées. Le modèle est en effet : y it = β 0 + β 1 x it1 + β 2 x it β k x itk + ν it, avec ν it = a i + u it. Exemple : T = 2 ν 11 = a 1 + u 11 et ν 12 = a 1 + u 12. Donc Corr(ν i1,ν i2 ) 0 de part la présence de a i dans les 2 termes. A cause des a i, les ν it sont donc autocorrélés : Cov(ν it,ν is ) = σ2 a σa+σ > 0,t s, avec 2 u 2 σ2 a = V ar(a i ) et σu 2 = V ar(u it ). Master 2: Econométrie 2 p. 108/22
109 Estimation avec EA Comme Cov(ν it,ν is ) 0, l estimation par MCO poolés donnent des estimateurs inefficients (écarts-type biaisés) et des statistiques en t invalides. Le modèle doit être estimé par Moindres carrés généralisés (MCG). Les MCG impliquent une transformation du modèle qui élimine cette autocorrélation : y it λy i = β 0 (1 λ) + β 1 (x it1 λx i1 ) + β 2 (x it2 λx i2 ) (β k x itk λx ik ) + (ν it λν i ). On peut montrer (non démontré ici) que : λ = 1 [ σ 2 u σ 2 u+tσ 2 a ]1 2. Master 2: Econométrie 2 p. 109/22
110 Estimation avec EA L estimateur à EA est simplement l estimateur MCO poolé du modèle sur y it λy i. On voit que selon les valeurs de σ 2 u et de σ 2 a, 0 λ 1 données quasi en déviation par rapport à leur moyenne l estimateur à EA est basé sur un modèle dans lequel on soustrait une fraction de la moyenne temporelle de chaque variable. Pour λ = 0, on retrouve les MCO poolés. Pour λ = 1, on retrouve l estimateur EF. Comme on ne retranche plus la totalité de la moyenne, on peut inclure dans le modèle à EA des variables constantes dans le temps. Master 2: Econométrie 2 p. 110/22
111 Estimation par MCG faisable (FGLS) λ est inconnu il faut l estimer : MCG faisables. [ ˆλ = T ˆσ2 a ˆσ 2 u ]1 2. Ceci requiert donc de trouver les estimateur de σa 2 et de σu 2 basés sur modèle de départ estimé par MCO poolés. T 1 t=1 T s=t+1 (ˆν itˆν is ), ˆσ a 2 = [NT(T 1)/2 (k +1)] 1 N i=1 où ˆν it sont les résidus du modèle MCO poolé. On peut alors calculer : ˆσ 2 u = ˆσ 2 ν ˆσ 2 a où ˆσ 2 ν est le carré de l erreur de régression du modèle de base. Lorsque l on utilise ˆλ à la place de λ, on obtient l estimateur à effets aléatoires. Master 2: Econométrie 2 p. 111/22
112 Propriétés de l estimateur à EA Sous les hypothèses FE.1, FE.2, RE.3, RE.4, RE.5, FE.6, l estimateur EA est consistant si N >> pour T fixe. De plus, l estimateur EA est approximativement nominalement distribué pour N grand et les écarts-type standards sont valides. Pour N petit et T large, les propriétés sont beaucoup moins connues prudence. Master 2: Econométrie 2 p. 112/22
113 Effets fixes vs. effets aléatoires Le choix entre EF et EA réside dans la nature perçue des a i. Si on ne peut pas considérer que les a i sont le resultat de tirages aléatoires dans une population, alors on doit les considérer comme des paramètres fixes à estimer estimateur à effets fixes. Exemple : données portant sur les provinces d un pays. Sinon, il faut évaluer si les a i sont corrélés ou non avec les x it. Si non corrélés estimateur à effets aléatoires. Pour évaluer le degré de corrélation, on peut comparer les valeurs estimées par EF et EA idée du test d Hausman(1978) (pas vu ici). Master 2: Econométrie 2 p. 113/22
114 Illustration: équation de salaire On estime une équation de salaire pour des hommes. On considère 7 variables explicatives : - 3 facteurs constants dans le temps : educ, black, hispan. - 4 facteurs variables dans le temps : exper,exper 2,married,union. Néanmoins, exper s accroît de 1 chaque année non variable en DP. On envisage 3 méthodes : MCO poolés, EF, EA. Master 2: Econométrie 2 p. 114/22
115 Résultats d estimation Var Expl Pool EA EF educ (0.005) (0.011) black (0.024) (0.048) hispan (0.021) (0.043) exper (0.014) (0.015) exper (0.0008) (0.0007) (0.0007) married (0.016) (0.017) (0.018) U nion (0.017) (0.018) (0.019) Master 2: Econométrie 2 p. 115/22
116 Commentaires Il n est pas possible d inclure les 4 premières variables dans le modèle à effets fixes. Pour les 4 premières variables, les coefficients sont similaires entre Pool et EA. Néanmoins, les écarts-type sont différents : l estimateur des MCO poolés donnent des écarts-type biaisés car il ignore l autocorrélation (positive). Pour les variables variables dans le temps, on observe des coefficients assez différents entre MCO poolés d une part et EA et EF d autre part. ˆλ = l estimateur EA est plus proche de l estimateur EF que du MCO poolé. Master 2: Econométrie 2 p. 116/22
117 Chapitre 5: Estimation par variables instrumentales et doubles moindres carres Master 2: Econométrie 2 p. 117/22
118 Utilisation des variables instrumentales L utilisation de la méthode des variables instrumentales (VI) se justifie dans différents contextes Variables explicatives endogènes. Problème d erreurs de mesures sur certaines variables. Ex : revenu déclaré. Problème d omission de variables explicatives appropriées. Master 2: Econométrie 2 p. 118/22
119 Variables explicatives endogènes Dans ce contexte, l utilisation de VI donne lieu à une nouvelle méthode d estimation : les doubles moindres carrés. Méthode très populaire, notamment pour estimer modèles macroéconomiques à plusieurs équations. Des exemples spécifiques seront developpés dans le chapitre 16: modèles à équations simultanées. Exemple: Relation entre le taux de meurtre et taille des forces de polices. Le taux de meurtre dépend de la taille des forces de polices et la taille des forces de polices dépend du taux de meurtre : problème de simultanéité. Master 2: Econométrie 2 p. 119/22
120 Erreurs de mesure Problème d erreurs de mesures sur certaines variables explicatives. Exemple : revenu déclaré Master 2: Econométrie 2 p. 120/22
121 Omission de variables explicatives Omission de variables explicatives appropriées mène à un biais d estimation des coefficients de régression. Ce biais peut être éliminé si l on dispose de variables proxy. Quid si pas de proxy. Dans un contexte de données de panel, élimination du biais par différenciation si variable omise est indépendante du temps. Quid si la variable omise dépend du temps ou si l intérêt se porte sur des variables qui ne varient pas dans le temps (éliminées par différentiation)? Master 2: Econométrie 2 p. 121/22
122 Illustration: variables omises Master 2: Econométrie 2 p. 122/22
123 Exemple: relation salaire-éducation Le vrai modèle de régression est : wage = β 0 + β 1 educ + β 2 abil + e. Problème : on n observe pas abil (compétence). On peut utiliser le QI comme variable proxy de abil Quid si indisponible? Si on ignore abil Le modèle de régression devient : wage = β 0 + β 1 educ + u. u englobe abil si abil est corrélé avec educ, viole l hypothèse SLR.3 E(u x) = 0 biais dans l estimation de β 1. Master 2: Econométrie 2 p. 123/22
124 Modèle de régression simple Le modèle de régression s écrit : y = β 0 + β 1 x + u. A cause de l omission de certaines variables : Cov(x,u) 0 (13) les MCO donnent des estimateurs biaisés Idée des VI : utiliser une information additionnelle sous la forme d une variable observable z qui remplit 2 conditions: Condition 1: Cov(z,u) = 0. Condition 2: Cov(z,x) 0. Master 2: Econométrie 2 p. 124/22
125 Conditions 1 des VI Condition 1. Dans la population, Cov(z,u) = 0. z est dite exogène dans le modèle de régression. Dans le contexte d omission des variables,z n a pas d effet partiel sur y conditionnellement à x et u. Il est impossible de tester cette hypothèse faire appel à la théorique économique. Master 2: Econométrie 2 p. 125/22
126 Conditions 2 des VI Condition 2. Cov(z,x) 0. z est corrélée avec la variable explicative x On peut tester cette hypothèse : x = π 0 + π 1 z + ν. Comme π 1 = Cov(z,x)/V ar(z), condition 2 tient ssi on rejette l hypothèse H 0 : π 1 = 0 contre hypothèse alternative H 1 : π 1 0. Master 2: Econométrie 2 p. 126/22
127 Exemples et contre-exemples de VI Revenons à la relation salaire-education; Regardons quelques candidats de VI pour educ. Trouver z tel que Cov(z,abil) = 0 et Cov(z,educ) 0. Derniers numéros de sécurité sociale de l individu: Condition 1 OK; Condition 2 non remplie. QI : Condition 2 OK mais Condition 1 violée car QI corrélé avec abil et donc u. Master 2: Econométrie 2 p. 127/22
128 Exemples et contre-exemples de VI Education de la mère: Condition 2 OK (les parents éduqués ont plus de chance d avoir des enfants éduqués) ; Condition 1 moins évidente car corrélation compétence-éducation de la mère pas claire Voir la théorie économique. Nombre de frères et soeurs pendant l enfance: condition 2 OK car souvent beaucoup de frères et soeurs corrélés avec niveau d éducation faible; condition 1 vraissemblable. Master 2: Econométrie 2 p. 128/22
129 Estimation et Inférence par la méthode des variables instrumentales Master 2: Econométrie 2 p. 129/22
130 Estimateurs des VI Si l on dispose d une bonne VI, on peut estimer de manière consistente l équation y = β 0 + β 1 x + u.. Les 2 conditions des VI permettent d identifier β 1, c est-à-dire d écrire β 1 en termes de moments des variables observables:cov(z,y) = Cov(z,β 0 + β 1 x + u) = β 1 Cov(z,x) + Cov(z,u). Voir pp pour les propriétés de calcul des covariances. Si Cov(z,u) = 0, alors β 1 = Cov(z,y) Cov(z,x) Cov(z,x) 0. qui existe ssi Master 2: Econométrie 2 p. 130/22
131 Estimateurs des VI L estimateur par VI de β 1 : ˆβ 1 = n i=1 (z i z)(y i y) n i=1 (z i z)(x i x). Remarque : si x = z (cas de x exogène), alors on retrouve l estimateur des MCO. Dans ce cas,x est son propre instrument. L estimateur de l intercept est simplement: ˆβ 0 = y ˆβ 1 y. Sous les conditions 1 et 2, plim(ˆβ 1 ) = β 1 ˆβ 1 est convergent. Master 2: Econométrie 2 p. 131/22
132 Inférence avec les estimateurs des VI Les estimateurs VI sont comme les estimateurs MCO asymptotiquement distribués normalement. Pour faire de l inférence, on a donc besoin d un estimateur de la variance de ˆβ 0 et ˆβ 1. On fait l hypothèse d homoscédasticité : E(u 2 z) = V ar(u) = σ 2. Sous conditions 1 et 2 des VI et cette hypothèse, alors la variance asymptotique de ˆβ 1 est égale à σ 2 nσ 2 xρ 2 x,z où ρ xz est la corrélation entre x et z. Un estimateur consistent de σ 2 peut s obtenir comme pour les MCO par : ˆσ 2 = 1 n 2 n i=1 û2 i. Master 2: Econométrie 2 p. 132/22
133 Inférence avec les Estimateurs des VI La variance asymptotique de β 1 peut également s écrire ˆσ : 2 SCT x R où SCT x,z 2 x = n i=1 x2 i. Ceci permet de comparer avec la variance asymptotique de β 1 estimé par MCO qui est pour rappel : ˆσ 2 SCT x. On voit que plus R 2 x,z (R 2 de la régression de X i sur Z i ) est faible (instruments faibles), plus la précision de l estimateur des VI est faible. Comme R 2 x,z < 1, la variance des estimateurs VI et des DMC est toujours plus élevée que celle des MCO : le coût de l estimation des VI se paye en termes de précision de l estimateur. Master 2: Econométrie 2 p. 133/22
134 Illustration Regardons ce que l estimation par VI donne dans le cas de la relation salaire-education(ex 15.1) pour les hommes MCO sur log(wage) = β 0 + β 1 educ + u. Exemple: wage2.wf1. Endogénéité du niveau d éducation pose problème. On peut utiliser l éducation du père comme VI de educ Cette variable remplit la condition 2 des VI : une régression de educ sur fathereduc montre une corrélation positive et significative. L estimation par VI donne un impact plus faible (0.059 vs 0.109) et des écart-types plus élevés que ceux obtenus par MCO (0.035 vs 0.014): on perd la significativité de l éducation. Master 2: Econométrie 2 p. 134/22
135 Propriétés des VI avec instruments faibles Instruments faibles = VI pour lesquelles corrélation entre x et z est faible conséquences non désirables. Rappel pour les MCO : plim ˆβ 1 = β 1 + Cov(x,u) V ar(x) = β 1 + Corr(x,u) σ u σ x = β 1, si Corr(x,u) = 0. Pour les VI : plim ˆβ 1 = β 1 + [ Corr(z,u) Corr(z, x) ( σu σ x )]. (14) Master 2: Econométrie 2 p. 135/22
136 Propriétés des VI avec instruments faibles Si Corr(z,x) est faible, une faible corrélation entre z et u donne lieu à un estimateur largement inconsistent. Et ce, même si Corr(z,u) est faible. En termes de consistence, les VI sont préférables aux MCO ssi Corr(z,u) Corr(z,x) < Corr(x,u). Même en cas d endogénéité, les MCO peuvent être préférables : tout dépend de la corrélation entre la VI et x. Master 2: Econométrie 2 p. 136/22
137 Illustration Relation entre le poids du bébé à la naissance et le nombre de cigarettes fumées par la mère. Exemple: BWGHT.wf1. Problème : le nombre de cigarettes peut être corrélé avec des facteurs de santé non observés dans la régression corrélation entre x et u. Idée de VI : prix des cigarettes dans la région d habitation : faiblement corrélé avec le nombre de cigarettes (effet positif et non significatif): instrument faible. : résultat de la régression par VI : effet du nombre de cigarette positif sur le poids du bébé m is non significatif car écart-type très élevé. Instruments faibles (non valables) biais d estimation Master 2: Econométrie 2 p. 137/22 important.
138 Estimation par VI en régression multiple Master 2: Econométrie 2 p. 138/22
139 régression multiple Exemple : log(wage) = β 0 + β 1 educ + β 2 exper + u. y 1 = β 0 + β 1 y 2 + β 2 z 1 + u 1 Equation structurelle objet : estimation des β j. y 1 : variable dépendante ou endogène log(wage) y 2 : variable explicative endogène (corrélée avec u 1 ) educ z 1 : variable explicative exogène (non corrélée avec u 1 ) exper. E(u 1 ) = 0,Corr(u 1,z 1 ) = 0 mais Corr(u 1,y 2 ) 0 Si estimation par MCO: tous les β j seront biaisés. Master 2: Econométrie 2 p. 139/22
140 régression multiple z 1 ne peut pas servir d instrument pour y 2 recourt à z 2, une VI. Hypothèses cruciales: E(u 1 ) = 0, Cov(z 1,u 1 ) = 0, Cov(z 2,u 1 ) = 0 E(z 1,u 1 ) = E(z 2,u 2 ) = 0. Approche par la méthode des moments n (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0 i=1 n z i1 (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0 i=1 n z i2 (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0. i=1 Master 2: Econométrie 2 p. 140/22
141 régression multiple 3 équations linéaires pour 3 inconnues (β 0,β 1,β 2 ). si z 2 = y 2 (y 2 exogène), on retrouve les conditions du premier ordre des MCO La variable instrumentale z 2 doit être conditionnellement corrélée avec y 2 : y 2 = π 0 + π 1 z 1 + π 2 z 2 + ν 2. Il s agit d un exemple d équation en forme réduite : la variable endogène est exprimée exclusivement en termes de variables exogènes. La condition d identification (généralisation de la condition 2 vue précédemment) est :π 2 0. Master 2: Econométrie 2 p. 141/22
142 Exemple de régression multiple Lien éducation-salaire : 5 variables exogènes expérience, expérience au carré, dummy pour noir, dummy pour zone urbaine et dummy pour état du sud. Exemple: CARD.raw. Une VI candidate pour educ: dummy pour habitation proche d une école (nearc4). Vérification de la condition 2 (condition d identification) par une régression de educ sur nearc4 et les 5 autres variables exogènes coefficient de nearc4 positif et significatif : condition 2 remplie pour VI. L estimation par VI donne un impact plus élevé de l éducation sur le salaire que les MCO (0.132 vs 0.075) mais une plus grande incertitude (0.055 vs 0.003). Master 2: Econométrie 2 p. 142/22
143 Doubles Moindres Carrés Master 2: Econométrie 2 p. 143/22
144 Variable explicative endogène unique Soit le modèle de régression : y 1 = β 0 + β 1 y 2 + β 2 z 1 + u. On dispose de 2 variables exogènes exclues : z 2 et z 3 2 restrictions d exclusion. Si z 2 et z 3 sont corrélées avec y 2, on dispose de 2 VI potentielles. Dans ce cas, on va choisir la combinaison linéaire des variables exogènes z 1,z 2,z 3 la plus corrélée avec y 2 y 2. Master 2: Econométrie 2 p. 144/22
145 Variable explicative endogène unique Soit l équation en forme réduite : y 2 = π 0 + π 1 z 1 + π 2 z 2 + π 3 z 3 + ν 2. Les hypothèses sont les suivantes: E(ν 2 ) = 0, Cov(z 1,ν 2 ) = 0,Cov(z 2,ν 2 ) = 0 et Cov(z 3,ν 2 ) = 0. On trouve y 2 à partir de y 2 = π 0 + π 1 z 1 + π 2 z 2 + π 3 z 3. La condition d identification devient : π 1 0 ou π 2 0 Cette condition peut s évaluer en testant H 0 :π 1 = 0 et π 2 = 0 à l aide d un F-test. Master 2: Econométrie 2 p. 145/22
146 Les doubles moindres carrés (DMC) La méthode des DMC met en oeuvre ce qu on vient de voir à travers 2 étapes. Étape 1 : On estime la meilleure combinaison linéaire des VI en régressant par MCO y 2 sur z 1,z 2 et z 3 ŷ 2 = ˆπ 0 + ˆπ 1 z 1 + ˆπ 2 z 2 + ˆπ 3 z 3. Étape 2 : on utilise ŷ 2 comme instrument de y 2. La troisième condition des moments devient : n i=1 ŷ i2 (y i1 ˆβ 0 ˆβ 1 y i2 ˆβ 2 z i1 ) = 0. (15) L étape 2 implique donc simplement d utiliser ŷ 2 obtenu en première étape comme régresseur : y 1 = β 0 + β 1 ŷ 2 + β 2 z 1 + ν 2. Master 2: Econométrie 2 p. 146/22
147 Illustration des DMC Reprenons l exemple de la relation salaire-éducation. On dispose de l équation structurelle : log(wage) = β 0 + β 1 educ + β 2 exper + β 3 exper 2 + u 1. exper et exper 2 sont non corrélés avec u 1. On va utiliser l éducation des parents comme VI : f atheduc et motheduc. L equation en forme réduite s écrit donc : educ = π 0 + π 1 exper + π 2 exper 2 + π 3 motheduc + π 4 fatheduc + ν 2. La condition d identification requiert donc : π 3 0 ou π 4 0, ce qui peut se tester par un test classique en F. Master 2: Econométrie 2 p. 147/22
148 Illustration des DMC Exemple: Rendements de l education pour les femmes actives MROZ.raw. Le test en F à partir de l équation en forme réduite donne une valeur de 55.40, ce qui correspond à une p-value de.0000 instruments qui satisfont la condition 2. La régression dans la forme structurelle par DMC donne un rendement de l éducation (des femmes) (coefficient β 1 ) de et à peine significatif (gonflement de l écart-type 0.031). Master 2: Econométrie 2 p. 148/22
149 Extensions liées aux VI Master 2: Econométrie 2 p. 149/22
150 Variables endogènes multiples Cas de plusieurs variables endogènes exemple : y 2 et y 3 : y 1 = β 0 + β 1 y 2 + β 2 y 3 + β 3 z 1 + β 4 z 2 + u 1 où z 1 et z 2 sont des variables exogènes. Condition nécessaire d identification = Condition d ordre ou de rang : On a besoin d au moins autant de variables exogènes exogènes exclues (de l équation structurelle) que de variables endogènes présentes (dans l équation structurelle). Dans l exemple, l identification requiert 2 variables exogènes z 3 et z 4 qui doivent être significatives dans l équation en forme réduite. Master 2: Econométrie 2 p. 150/22
151 Erreurs de mesure sur variables Vrai modèle de régression: y 1 = β 0 + β 1 x 1 + β 2x 2 + u où x 1 est observé avec erreur on n observe que x 1: x 1 = x 1 + e y 1 = β 0 + β 1 x 1 + β 2 x 2 + (u β 1 e 1 ) Ceci crée un problème d endogénéité : corrélation entre x 1 et le terme d erreur (u β 1 e 1 ) MCO biaisés. Solution: trouver une VI pour x 1. Dans le cas des problèmes de mesure, idée est de trouver une variable z 1 corrélée avec x 1 mais dont l erreur de mesure est non corrélée avec e 1. Master 2: Econométrie 2 p. 151/22
152 Erreurs de mesure sur variables Exemples salaire annuel reporté par travailleurs (erreurs de mesure) : VI = salaire reporté par l employeur. Revenu annuel d un ménage : VI = niveau annuel de l épargne du ménage. Niveau d éducation reporté par les travailleurs : VI= nombre d années d éducation reporté par frère jumeau ou soeur jumelle. Master 2: Econométrie 2 p. 152/22
153 Test d endogénéité y 1 = β 0 + β 1 y 2 + β 2 z 1 + β 3 z 2 + u 1 Supposons que z 1 et z 2 sont des variables exogènes et z 3 et z 4 variables exclues. Comment tester si y 2 est endogène? Test d Hausman (1978) basé sur la comparaison entre valeurs estimées par MCO et par DMC. Pour voir si différences sont significatives, procédure en 3 étapes. Master 2: Econométrie 2 p. 153/22
154 Test d endogénéité d Hausman Étape 1: estimation de la forme réduite : y 2 = π 0 + π 1 z 1 + π 2 z 2 + π 3 z 3 + π 4 z 4 + ν 2. Si problème d endogénéité, ν 2 est corrélé avec u 1 et y 1 Étape 2: on récupère le résidu ˆν 2, contrepartie observable de ν 2. Étape 3: On estime par MCO y 1 = β 0 + β 1 y 1 + β 2 z 1 + β 3 z 2 + δ 1ˆν 2 + error et on teste par un test en t H 0 : δ 1 = 0; On conclut à l endogénéité de y 2 si rejet de H 0. Master 2: Econométrie 2 p. 154/22
155 Exemple de test d endogénéité On récupère le résidu ˆν 2 de l equation : educ = π 0 + π 1 exper + π 2 exper 2 + π 3 motheduc + π 4 fatheduc + ν 2. On inclut ˆν 2 dans l équation structurelle : log(wage) = β 0 + β 1 educ + β 2 exper + β 3 exper 2 + δ 1ˆν 2 + u 1. Le test en t de H 0 : δ 1 = 0 est égale à 1.67 Evidence limitée d endogénéité de educ doute Il est préférable d utiliser conjointement MCO et DMC. Master 2: Econométrie 2 p. 155/22
156 Test de suridentification De manière générale, on ne peut pas tester la condition 1 des VI càd Cov(z,u) = 0. Néanmoins une exception importante : lorsque l on dispose d au moins 1 restriction de suridentifcation. Le nombre de restrictions de suridentification = nombre d instruments excédentaires par rapport au nombre de variables endogènes. Exemple : y 1 = β 0 + β 1 y 2 + β 2 z 1 + β 3 z 2 + u 1. Si on dispose de 2 VI z 3 et z 4, on dispose d 1 condition de suridentification. Master 2: Econométrie 2 p. 156/22
157 Test de suridentification Pourquoi est-ce possible? on peut estimer les β avec une VI, récupérer les résidus et tester la corrélation par rapport à l autre VI pas possible si on ne dispose que d une seule VI. 3 étapes. Étape 1:Estimer l équation structurelle par VI et récupérer les résidus û 1. Étape 2: Régresser sur toutes les variables exogènes et récupérer le R-carré R 2 1. Sous hypothèse de non corrélation entre les VI et u 1 (validité de la condition 2), nr1 2 est distribué suivant une loi du χ 2 q ou q est le nombre de condition de suridentification. Master 2: Econométrie 2 p. 157/22
158 Test de suridentification Étape 3: Si nr1 2 excède la valeur critique (à 5% par exemple), on rejette la validité de la condition 2 et on conclut qu au moins une des 2 VI n est pas exogène. Rendements de l education pour femmes actives. En régressant le résidu des DMC û 1 sur exper et exper 2,motheduc et fatheduc, on obtient R1 2 =.0009 nr1 2 = 428(0.0009) =.3852 qui est faible par rapport à une distribution en χ 2 1 (p valeur =.535) L éducation des parents satisfont au test de suridentification. Master 2: Econométrie 2 p. 158/22
159 Chapitre 6: Modèles à équations simultanées Master 2: Econométrie 2 p. 159/22
160 Simultanéité Dans le chapitre précédent, nous avons vu 2 raisons principales d utilisation de la méthode des variables instrumentales (VI. 1) Problème d erreurs de mesure. 2) Problème d omission de variables explicatives appropriées. Dans chaque cas, le problème donne lieu à un problème d endogénéité. Dans ce chapitre, on va étudier en détails une autre raison importante: le problème de simultanéité. Master 2: Econométrie 2 p. 160/22
161 Simultanéité Le problème de simultanéité: Une ou plusieurs variables explicatives sont déterminées conjointement avec la variable dépendante, par exemple à travers une relation d équilibre. Les problèmes de simultanéité se posent par excellence dans les modèles à équations simultanées (MES). La méthode d estimation des VI et des DMC s applique pour estimer les modèles à équations simultanées alors que l estimation par MCO génère des estimateurs biaisés biais de simulatnéité. Master 2: Econométrie 2 p. 161/22
162 Caractéristique des MES Exemple de MES: Offre et demande de travail. Equation d offre de travail: h s = α 1 w + β 1 z 1 + u 1. Equation structurelle avec h s = offre de travail,w = salaire et z 1 = facteurs exogènes. Problème : La condition ceteris paribus n est pas respectée les variation de w ne sont pas exogènes car w est un salaire observé à l équilibre (demande de travail=offre de travail). Master 2: Econométrie 2 p. 162/22
163 Caractéristique des MES Equation de demande de travail: h d = α 2 w + β 2 z 2 + u 2. Equation structurelle avec h d = demande de travail,w = salaire et z 2 facteurs exogènes (de la demande). A l équilibre, pour chaque individu i, on a : h id = h is. On obtient alors un MES: h is = α 1 w i + β 1 z i1 + u i1 h id = α 2 w i + β 2 z i2 + u i2. MES à 2 équations dans leur forme structurelle; h i et w i sont des variables endogènes;z i1 et z i2 sont des variables exogènes. Master 2: Econométrie 2 p. 163/22
164 Autres exemples de MES Relation taux de meurtre et taille des forces de polices. Equation explicative des meurtres par ville: murdpc = α 1 polpc + β 10 + β 11 incpc + u 1 murdpc = Taux de meurtre par habitant;polpc =nombre de policiers par habitant; incpc:revenu par habitant. Equation explicative du nombre de policiers : polpc = α 2 murdpc + β 20 + autresfacteurs + u 2. polpc et murdpc sont 2 variables endogènes d un MES à 2 équations. Master 2: Econométrie 2 p. 164/22
165 Biais de simultanéité L utilisation des MCO pour estimer les équations structurelles d un MES donne lieu à un biais. Soit un MES à 2 équations: y 1 = α 1 y 2 + β 1 z 1 + u 1 y 2 = α 2 y 1 + β 2 z 2 + u 2. Trouvons la forme réduite de y 2 : y 2 = α 2 (α 1 y 2 + β 1 z 1 + u 1 ) + u 2. Ceci se réécrit comme : y 2 = π 21 z 1 + π 22 z 2 + ν 2, avec π 21 = α 1β 1 1 α 2 α 1 ; π 22 = β 2 1 α 2 α 1 ; ν 2 = α 2u 1 +u 2 1 α 2 α 1. Master 2: Econométrie 2 p. 165/22
166 Biais de simultanéité On peut estimer par MCO de manière consistente cette forme réduite car z 1 et z 2 sont exogènes et donc non corrélés avec u 1 et u 2 et donc ν 2. L estimation de la forme structurelle par MCO donne lieu à un estimateur biaisé. Exemple :équation y 1 = α 1 y 2 + β 1 z 1 + u 1 y 2 est corrélé avec u 1 Pourquoi? y 2 = f(ν 2 = α 2u 1 +u 2 1 α 2 α 1 ). Plus formellement : Cov(y 2,u 1 ) = Cov(ν 2,u 1 ) = [ α 2 1 α 2 α 1 ]E(u 2 1 ) = [ α 2 1 α 2 α 1 ]σ 2 1 Si α 2 0 (cas d un MES), alors MCO biaisés. Master 2: Econométrie 2 p. 166/22
167 Biais de simultanéité Rappels : plim ˆα 1 = α 1 + Cov(y 2,u 1 ) V ar(y 2 ). Le biais (asymptotique) de simultanéité aura le même signe que la covariance entre ν 2 et u 1. Le biais de simulatnéité dépend des paramètres α 2 et α 1. Exemple : si α 2 > 0 et α 2 α 1 < 1, alors le biais asymptotique sera positif l effet de y 2 sera surestimé. Master 2: Econométrie 2 p. 167/22
168 Identification d un MES à 2 équations Considérons le cas d un MES à 2 équations. y 1 = β 10 + α 1 y 2 + β 1 z 1 + u 1 y 2 = β 20 + α 2 y 1 + β 2 z 2 + u 2 Les variables z 1 et z 2 représentent un ensemble de respectivement k 1 et k 2 variables exogènes (avec une possible intersection entre les 2): z 1 β 1 = β 11 z 11 + β 12 z β 1k1 z 1k1 z 2 β 2 = β 21 z 21 + β 22 z β 2k2 z 2k2. Master 2: Econométrie 2 p. 168/22
169 Identification d un MES à 2 équations La présence ou non de ces variables z i va permettre de définir des restrictions d exclusion qui permettront de définir la condition d identification (condition d ordre) de chaque équation. Condition de rang pour l identification d une équation structurelle : La première équation dans un MES à 2 équations est identifiée ssi la seconde équation contient au moins une variable exogène (avec un coefficient β 2i non nul) qui est exclu de la première équation. Master 2: Econométrie 2 p. 169/22
170 Exemples d identification Modèle de demande et d offre. Equation d offre : q = α 1 p + β 1 z 1 + u 1 α 1 = élasticité de la quantité offerte par rapport au prix p Equation de demande: q = α 2 p + u 2 α 2 = élasticité de la quantité demandée par rapport au prix p. Dans ce MES, l offre n est pas identifiée; la demande est identifiée. Master 2: Econométrie 2 p. 170/22
171 Exemples d identification Modèle : offre de travail des femmes mariées 2 équations structurelles Equation d offre de travail (heures travaillées) : hours = α 1 log(wage) + β 10 + β 11 educ + β 12 age + β 13 kidslt6 + β 14 nwifeinc + u 1 ; kidslt6 =nombre d enfants <6ans;nwif einc =revenu non salarial de la femme mariée. Equation de salaire: log(wage) = α 2 hours + β 20 + β 21 educ + β 22 exper + β 23 exper 2 + u 2. A partir des équations structurelles, la condition d identification de l équation d offre de travail : β 22 0 ou β Master 2: Econométrie 2 p. 171/22
172 Exemples d identification L identification requiert :β 12 0 ou β 13 0 ou β On peut évaluer cela aussi en terme de forme réduite : log(wage) = π 20 + π 21 educ + π 22 kidslt6 + π 23 nwifeinc + π 24 age + π 25 exper + π 26 exper 2 + ν 2. L identification de l équation de salaire requiert : π 25 0 ou π Pourquoi? Master 2: Econométrie 2 p. 172/22
173 Estimation par DMC L estimation par DMC peut se faire pour une équation identifiée. Dans ce cas, les VI sont simplement les variables exogènes de l autre équation. Exemple : Offre de travail des femmes mariées. Master 2: Econométrie 2 p. 173/22
174 MES à plus 2 équations Considérons le cas d un MES à 3 équations y 1 = α 12 y 2 + α 13 y 3 + β 11 z 1 + u 1 y 2 = α 21 y 1 + β 21 z 1 + β 22 z 2 + β 23 z 3 + u 2 y 3 = α 32 y 2 + β 31 z 1 + β 32 z 2 + β 33 z 3 + β 34 z 4 + u 3. Les conditions d identification sont des conditions nécessaire mais non suffisantes Il n est pas facile de déterminer les équations identifiées mais plus facile de déterminer les équations non identifiées. Equation explicative de y 3 est clairement non identifiée car il n y a pas de restrictions d exclusion. Master 2: Econométrie 2 p. 174/22
175 MES à plus 2 équations Condition d ordre pour l identification :Une équation dans un MES respecte la condition d ordre pour l identification si le nombre de variables exogènes exclues de l équation est plus grand ou égal au nombre de variables explicatives endogènes de l équation La condition d ordre est une condition nécessaire mais non suffisante conditions suffisantes plus difficiles à déterminer Master 2: Econométrie 2 p. 175/22
176 MES à plus 2 équations La seconde équation (y 2 = α 21 y 1 + β 21 z 1 + β 22 z 2 + β 23 z 3 + u 2 ) est identifiée ssi β Dans ce cas, l équation est juste identifiée car on a 1 variable endogène explicative (y 1 ) et 1 VI (z 4 ) L identification d une équation dépend de la valeur des paramètres des autres équations. La première équation est sur-identifiée car on dispose de 3 VI (z 1,z 2,z 3 ) pour 2 variables endogènes (y 2,y 3 ). Master 2: Econométrie 2 p. 176/22
177 MES en séries temporelles Exemple type : Modèle keynésien en économie fermée C t = β 0 + β 1 (Y t T t ) + β 2 r t + u t1 I t = γ 0 + γ 1 r t + u t2 Y t C t + I t + G t. T t =taxes, r t =taux d intérêt, I t =Investissement, G t =dépenses publiques. 3 équations pour 3 variables endogènes : C t, I t et Y t. Troisième équation est une identité. Si r t est exogène, alors la seconde équation peut s estimer par MCO. La première équation (Consommation) doit s estimer par DMC (Y t endogène), 3 instruments : (T t, G t et r t ). Master 2: Econométrie 2 p. 177/22
178 MES en séries temporelles Le modèle keynésien est aujourd hui peu estimé pour 2 raisons. 1. On a besoin d hypothèses d exogénéité qui sont discutables r t n est pas exogène; pour l estimation par DMC, T t et G t doivent être exogènes, ce qui n est pas garanti. 2. Le modèle est statique irréaliste. Quid si on met de la dynamique? I t = γ 0 + γ 1 r t + γ 2 Y t 1 + u t2. Master 2: Econométrie 2 p. 178/22
179 MES en séries temporelles Peut-on considérer Y t 1 comme exogène? Oui (si u t2 non autocorrélé) : Y t 1 est une variable dite prédéterminée si r t est exogène, l équation peut être estimée par MCO. Puisque Y t 1 est exogène, il peut également être considéré comme un instrument potentiel. Master 2: Econométrie 2 p. 179/22
180 MES en séries temporelles: exemple relation consommation-revenu: test de l hypothèse du revenu permannent gc t = β 0 + β 1 gy t + β 2 r3 t + u t. gc t est le taux de croissance de la consommation variable I(0). gy t est le taux de croissance de la consommation variable I(0). r3 t est le taux d intérêt réel à 3 mois variable I(0). gc t et gy t sont mutuellement dépendentes simultanéité estimation par DMC. Master 2: Econométrie 2 p. 180/22
181 MES en séries temporelles: exemple L hypothèse du revenu permanent (HRP) implique: 1. β 0 = β 1 = u t est non autocorrélé. Instruments valides : valeurs retardées de gc t, gy t et r3 t. estimation par DMC montre que HRP est rejetée (H 0 : β 1 = 0 rejetée). Régresser û t sur û t 1 Rejet de H 0 : processus AR(1). Master 2: Econométrie 2 p. 181/22
MODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales
Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales Pierre Thomas Léger IEA, HEC Montréal 2013 Table des matières 1 Introduction 2 2 Spécifications
FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.
FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE
Modèles Estimés sur Données de Panel
Modèles Estimés sur Données de Panel Introduction Il est fréquent en économétrie qu on ait à composer avec des données à deux dimensions : - une dimension chronologique - une dimension spatiale Par exemple,
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Le modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE
UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS
Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES
1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Probabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
L Econométrie des Données de Panel
Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Modèle GARCH Application à la prévision de la volatilité
Modèle GARCH Application à la prévision de la volatilité Olivier Roustant Ecole des Mines de St-Etienne 3A - Finance Quantitative Décembre 2007 1 Objectifs Améliorer la modélisation de Black et Scholes
Introduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Le risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Température corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Régression linéaire. Nicolas Turenne INRA [email protected]
Régression linéaire Nicolas Turenne INRA [email protected] 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Chapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Théorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : [email protected] Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
STATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
NON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Résumé non technique
Résumé non technique Constats : selon le FMI, l indexation et l ajustement biennal du salaire social minimum sont des facteurs déterminants à la fois du différentiel d inflation et de l inflation au Luxembourg
Évaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Économétrie, causalité et analyse des politiques
Économétrie, causalité et analyse des politiques Jean-Marie Dufour Université de Montréal October 2006 This work was supported by the Canada Research Chair Program (Chair in Econometrics, Université de
Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061
Value at Risk 27 février & 13 mars 20061 CNAM Gréory Taillard CNAM Master Finance de marché et estion de capitaux 2 Value at Risk Biblioraphie Jorion, Philippe, «Value at Risk: The New Benchmark for Manain
Chapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Analyse de la relation entre primes de terme et prime de change dans un cadre d équilibre international
ANNALES D ÉCONOMIE ET DE STATISTIQUE. N 46 1997 Analyse de la relation entre primes de terme et prime de change dans un cadre d équilibre international Hubert de LA BRUSLERIE, Jean MATHIS * RÉSUMÉ. Cet
Une introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes
de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,[email protected]
Modèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Principe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
M2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
L Equilibre Macroéconomique en Economie Ouverte
L Equilibre Macroéconomique en Economie Ouverte Partie 3: L Equilibre Macroéconomique en Economie Ouverte On abandonne l hypothèse d économie fermée Les échanges économiques entre pays: importants, en
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Chapitre 4 : Régression linéaire
Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications
Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante
La survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Une étude de différentes analyses réalisées par le BIT
Association internationale de la sécurité sociale Quinzième Conférence internationale des actuaires et statisticiens de la sécurité sociale Helsinki, Finlande, 23-25 mai 2007 Comparaison des hypothèses
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
VI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches
Exemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Evaluer l ampleur des économies d agglomération
Pierre-Philippe Combes GREQAM - Université d Aix-Marseille Ecole d Economie de Paris CEPR Janvier 2008 Supports de la présentation Combes, P.-P., T. Mayer et J.-T. Thisse, 2006, chap. 11. Economie Géographique,
La théorie des anticipations de la structure par terme permet-elle de rendre compte de l évolution des taux d intérêt sur euro-devise?
ANNALES D ÉCONOMIE ET DE STATISTIQUE. N 62 2001 La théorie des anticipations de la structure par terme permet-elle de rendre compte de l évolution des taux d intérêt sur euro-devise? Éric JONDEAU * RÉSUMÉ.
Moments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Brock. Rapport supérieur
Simplification du processus de demande d aide financière dans les établissementss : Étude de cas à l Université Brock Rapport préparé par Higher Education Strategy Associates et Canadian Education Project
INF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet
Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar Florence Arestoff Baptiste Venet 1 Introduction : contexte du contrat de recherche Ce contrat de recherche fait suite
Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014
Attitude des ménages face au risque - M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014 Plan du cours 1. Introduction : demande de couverture et comportements induits pa 2. Représentations
Introduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
FORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. [email protected]. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier [email protected] http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Les indices à surplus constant
Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté
Le modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
Modélisation des carrières salariales. dans Destinie
INSTITUT NATIONAL DE LA STATISTIQUE ET DES ÉTUDES ÉCONOMIQUES Série des documents de travail de la Direction des Etudes et Synthèses Économiques G 990 Modélisation des carrières salariales dans Destinie
Suites numériques 3. 1 Convergence et limite d une suite
Suites numériques 3 1 Convergence et limite d une suite Nous savons que les termes de certaines suites s approchent de plus en plus d une certaine valeur quand n augmente : par exemple, les nombres u n
Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer
Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy
Durées d utilisation des facteurs et fonction de production : une estimation par la méthode des moments généralisés en système
Banque du Canada Bank of Canada Document de travail 2004-12 / Working Paper 2004-12 Durées d utilisation des facteurs et fonction de production : une estimation par la méthode des moments généralisés en
Cours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Principe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, [email protected] 2 Université
Econométrie et applications
Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet ([email protected]) Université Paris 1 & Ecole d Economie de Paris
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Le WACC est-il le coût du capital?
Echanges d'expériences Comptabilité et communication financière Dans une évaluation fondée sur la méthode DCF, l objectif premier du WACC est d intégrer l impact positif de la dette sur la valeur des actifs.
Etude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
IFT3245. Simulation et modèles
IFT 3245 Simulation et modèles DIRO Université de Montréal Automne 2012 Tests statistiques L étude des propriétés théoriques d un générateur ne suffit; il estindispensable de recourir à des tests statistiques
CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité
1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :
Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7
Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,
aux différences est appelé équation aux différences d ordre n en forme normale.
MODÉLISATION ET SIMULATION EQUATIONS AUX DIFFÉRENCES (I/II) 1. Rappels théoriques : résolution d équations aux différences 1.1. Équations aux différences. Définition. Soit x k = x(k) X l état scalaire
MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Econométrie pour la Finance
MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d Orléans Econométrie pour la Finance Modèles ARCH - GARCH Applications à la VaR Christophe Hurlin Documents et Supports Année Universitaire
Données longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
INCIDENCE DU COMMERCE EXTÉRIEUR SUR LE COMMERCE INTÉRIEUR : NOUVELLE ANALYSE DE LA COURBE EN «L» NOUVELLE ANALYSE DE LA COURBE EN «L»
INCIDENCE DU COMMERCE EXTÉRIEUR SUR LE COMMERCE INTÉRIEUR : NOUVELLE ANALYSE DE LA COURBE EN «L» INCIDENCE DU COMMERCE EXTÉRIEUR SUR LE COMMERCE INTÉRIEUR : NOUVELLE ANALYSE DE LA COURBE EN «L» ARTICLE
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Théorie Financière 2. Valeur actuelle Evaluation d obligations
Théorie Financière 2. Valeur actuelle Evaluation d obligations Objectifs de la session. Comprendre les calculs de Valeur Actuelle (VA, Present Value, PV) Formule générale, facteur d actualisation (discount
UNIVERSITÉ DU QUÉBEC À MONTRÉAL MARCHÉ DES CDS ET STABILITÉ FINANCIÈRE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIQUE PAR
UNIVERSITÉ DU QUÉBEC À MONTRÉAL MARCHÉ DES CDS ET STABILITÉ FINANCIÈRE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIQUE PAR GENNADII BONDARENKO JANVIER 2013 REMERCIEMENTS La réalisation
Que faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Une analyse économétrique multivariée du comportement des ménages
Revue de l OFCE n 66 / juillet 1998 Une analyse économétrique multivariée du comportement des ménages Françoise Charpin Professeur à l Université de Paris II, Conseiller scientifique à l OFCE Cette étude
Simulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Suites numériques 4. 1 Autres recettes pour calculer les limites
Suites numériques 4 1 Autres recettes pour calculer les limites La propriété suivante permet de calculer certaines limites comme on verra dans les exemples qui suivent. Propriété 1. Si u n l et fx) est
3. Conditionnement P (B)
Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Théorie Financière 8 P. rod i u t its dé dérivés
Théorie Financière 8P 8. Produits dit dérivés déié Objectifsdelasession session 1. Définir les produits dérivés (forward, futures et options (calls et puts) 2. Analyser les flux financiers terminaux 3.
