2ème séance Xavier Boutin Roland Rathelot Supélec février 2008
Plan Inférence
Hypothèse de normalité Même sous les hypothèses de Gauss-Markov, la distribution de ˆβ est susceptible d avoir n importe quelle forme Nécessaire d ajouter une hypothèse supplémentaire : hypothèse de normalité (H 6 ) : u est indépendant de x 1, x 2... x K et suit une loi normale centrée de variance σ 2.
Distribution de l estimateur Sous les hypothèses (H 1 )-(H 6 ), l estimateur des MCO est distribué : ˆβ j N (β j, Var(β j )) D où : ˆβ j β j N (0, 1) Var(βj )
Statistique de Student La quantité empirique correspondante est distribuée selon une loi de Student ˆβ j β j ˆV (β j ) t N K On en déduit une statistique de test pour l hypothèse nulle (H 0 ) : β j = 0 Cette statistique est ˆβ j ˆV (β j )
Statistique de Student La quantité empirique correspondante est distribuée selon une loi de Student ˆβ j β j ˆV (β j ) t N K On en déduit une statistique de test pour l hypothèse nulle (H 0 ) : β j = 0 Cette statistique est ˆβ j ˆV (β j )
Quelques rappels sur les tests cf mémo
Deux notions utiles la p-value : le plus petit niveau tel que l on rejette l hypothèse nulle l intervalle de confiance (pour un niveau α donné) : [ ] ˆβ c α ˆV ( ˆβ), ˆβ c α ˆV ( ˆβ)
Terminologie On dit β est significatif à 5% ou significativement différent de zéro à 5%. On dit On ne peut rejeter l hypothèse nulle d égalité de zéro à 5% Et jamais On accepte l égalité de β à 5%
Significativité Il faut distinguer Significativité statistique, relative au test de Student Significativité économique, relative à la magnitude réelle du coefficient estimé
Tester une restriction linéaire La statistique de Student peut être utilisée dans tous les cas où il y a une restriction linéaire l égalité d un coefficient à 0 l égalité d un coefficient à tout autre scalaire l égalité de deux coefficients entre eux toute relation linéaire entre deux ou plusieurs coefficients
Tester plusieurs restrictions linéaires Si l on souhaite tester un groupe de q restrictions linéaires : On estime le modèle non contraint : SCR 0 On estime le modèle contraint : SCR c On calcule la statistique de Fisher : F = SCR c SCR 0 SCR 0 Sous H 0, F F(q, N K) N K q
Tester plusieurs restrictions linéaires Si l on souhaite tester un groupe de q restrictions linéaires : On estime le modèle non contraint : SCR 0 On estime le modèle contraint : SCR c On calcule la statistique de Fisher : F = SCR c SCR 0 SCR 0 Sous H 0, F F(q, N K) N K q
Tester plusieurs restrictions linéaires (2) Quand est-ce utile? Significativité globale d une régression (F-test) Bloc d indicatrices (ex. diplôme) Spécifications non-linéaires (ex. exp + expérience au carré) Test de Chow
Plan Inférence
Retour sur la distribution de l estimateur des MCO Que signifie la distribution de ˆβ? Il s agit de ce que l on obtiendrait en tirant un nombre important (infini) d échantillons de taille N.
Convergence de l estimateur des MCO Convergence : propriété très importante pour un estimateur. Sous les hypothèses (H 1 )-(H 4 ), l estimateur des MCO ˆβ converge vers β, i.e. plim ˆβ = β Ceci est vrai sous une version plus faible de l hypothèse conditionelle des erreurs : il suffit de supposer E(u) = 0; Cov(u, X ) = 0
Normalité asymptotique Par un théorème centrale limite, on a, sous les hypothèses de Gauss-Markov, N( ˆβ β) N (0, σ 2 /A 2 ) où A 2 = plim 1 N (X X ) ˆσ 2 est un estimateur convergent de σ 2 j, ˆβ j β j N (0, 1) V (βj )
Inférence asymptotique Lorsque N est grand, et sans faire d hypothèse de normalité, On peut utiliser le test de Student (en utilisant une loi normale, équivalente à une loi de Student lorsque le nombre de degrés de liberté tend vers l infini) On peut utiliser le test de Fisher comme d habitude
Le comportement asymptotique de la variance Rappel : ˆV ( ˆβ j ) = ˆσ 2 (1 R 2 j )SCT j R 2 j ˆσ 2 converge vers σ 2, variance de l erreur converge vers une quantité entre 0 et 1, relative à la dépendance entre les variables explicatives SCT j /N converge vers Var(x j ) Donc la variance est en O(1/N) et l écart-type en O(1/ N)
Le test du Multiplicateur de Lagrange Pour tester la nullité jointe de q coefficients, une alternative à la statistique F est le test du Multiplicateur de Lagrange. Régression du modèle contraint : résidus ũ Régression auxiliaire des ũ sur les q variables explicatives sur lesquels on teste la nullité des coefficients : R 2 u Sous (H 0 ), NR 2 u χ 2 q ; sinon, il explose