U. Paris Ouest, M1 - Cours de Modélisation Appliquée Introduction aux modèles économétriques Laurent Ferrara Février 20 U. Paris Ouest L. Ferrara, 2012-
Plan de la présentation 1. Concepts 2. Modèles statistiques 3E 3. Exemples de modèles U. Paris Ouest L. Ferrara, 2012-
1C 1. Concepts Objectif Prendre des décisions à partir de l observation d un ensemble de données Méthode Construction d un modèle économétrique pour chaque type d étude Outils 1) Théorie de l information et concepts d optimalité construction d une population exhaustive : pas tjs facile. U. Paris Ouest Solution : échantillonnage U. Paris Ouest L. Ferrara, 2012-
2) Modèles économétriques: Modèles probabilistes : loi de distribution de l échantillon Modèles paramétriques : modèles de régression linéaire et nonlinéaire, modèles de séries chronologiques,. Chaque type de modèle fait appel à des paramètres (de la loi et/oudumodèle),a a priori inconnus qu il faudra estimer. On peut identifier de 2 types de paramètres : paramètres de loi de distribution ou paramètres de structure. 3) Estimation et tests : Inférence statistique basée sur l échantillon observé Contrôle de la qualité de l information o et de la décision prise associée au test U. Paris Ouest L. Ferrara, L. Ferrara, 2012-
Exemples : - Etude d une population p par sondage (élections, enquêtes d opinion auprès des ménages et des industriels ) - Explication de phénomènes macro-économiques et microéconomiques - Prévision (variables ab macro, taux de change, actifs financiers, ) - Prise de décision de politique économique par le gouvernement et la banque centrale U. Paris Ouest L. Ferrara, 2012-
2Mdèl 2. Modèles économétriques éti Définition formelle On appelle modèle au sens statistique la donnée d un triplet où : Ω est l ensemble (les données) ( Ω, F, IP) F est une tribu sur Ω IP est une famille de lois de proba. sur (Ω, F) tq : IP (IP ) θ θ qui dépend d un paramètre vectoriel θ Θ R k Θ U. Paris Ouest L. Ferrara, 2012-
Hypothèse clé de travail : Les individus interrogés sont identifiés à des variables aléatoires X = RouR d 1,, X n, à valeurs dans Ω (Ω R ), indépendantes et de même loi de distribution P θ (i.i.d.) Remarques : R1: En général, Ω R d, on travaille alors avec la tribu des boréliens d B R R2 : Quand Θ ( R d, B d ) on parle de modèle paramétrique R probabiliste. On connaît la loi P θ mais θ est inconnu. On va donc se servir de l échantillon qu on aura construit à partir des individus pour identifier ce paramètre θ. U. Paris Ouest L. Ferrara, 2012-
Définition: On appelle n-échantillon, le vecteur aléatoire : n X=(X 1,, X n )deloi P θ, suite finie de v.a. indépendantes et identiquement distribuées (iid) de loi P θ. Définition: On appelle observation une réalisation du vecteur aléatoire X, notée : x = (x 1,, x n ). Remarques : n n n R1: Le modèle statistique associé à X est : ( Ω, F, IP ) θ U. Paris Ouest L. Ferrara, 2012-
R2: La famille de lois P θ est supposée posséder une densité continue ou discrète (abus de language) f θ (x) p( x, θ) { } R3 : Δθ = x; fθ ( x) > 0 est le support de la loi P θ. R4 : Sous l hypothèse d indépendance : P n = P... P θ θ θ U. Paris Ouest L. Ferrara, 2012-
Définition: On appelle statistique toute fonction mesurable f tq: f: (X 1,, X n ) f(x 1,, X n ) R k, k étant la dimension de la statistique. Exemples : (X 1,, X n ) statistique de dimension n (X (1),, X (n) ) statistique de dimension n X 1 statistique de dimension 1 1/n i X i statistique de dimension 1 U. Paris Ouest L. Ferrara, 2012-
3E 3. Exemples de modèles Modèle Binomial Ω = {données} = {réponses à une question binaire (oui/non)} On interroge n individus, X i est la réponse de l individu i : X i = 1 si oui et X i = 0 si non X i est une va v.a. qui suit une loi de Bernouilli de paramètre θ inconnu tq : θ = probabilité que l individu réponde oui Le modèle statistique associé au vecteur aléatoire X est : Exemples? θ? { n 01 0,1 }, F n, B ( θ, )) ( n U. Paris Ouest L. Ferrara, 2012-
Modèle Multinomial Ω = {données} = {réponses à une question à plusieurs modalités} = {A j, j = 1,, J } θ j = probabilité que l individu i réponde A j On suppose qu il n y a pas de non réponses (= abstention) ie : j θ j = 1 On interroge n individus, X i est la réponse de l individu i : X i {A j, j = 1,, J } Le modèle statistique associé au vecteur aléatoire X est : Exemples? { } n n n A,..., A, F, M ( θ,..., θ )) ( 1 J 1 J Rem :L estimation de J-1paramètres suffit U. Paris Ouest L. Ferrara, 2012-
Modèle Log-Normal Sur n individus, on mesure une variable R i. On suppose qu il s agit d une variable continue positive R i ~ LogN (m,σ 2 ) ie Log(R ~ N (m,σ 2 i ) ) On a 2 paramètres d intérêt m et σ 2 Le modèle statistique associé au vecteur aléatoire X est : Exemples? ( R n, B R n,( LogN ) n ) U. Paris Ouest L. Ferrara, 2012-
Modèle linéaire Sur n individus, on mesure les variables X i et Y i, On suppose qu il existe une relation linéaire entre elles, ie: pour chaque i : Y i = a X i + b Les paramètres (a,b) sont inconnus La relation n est pas forcément déterministe, ie: il existe la va e telle e que : e ~ N (0,σ 2 i ) et Y i = a X i +b+e + i Les paramètres (a,b, σ 2 ) sont inconnus U. Paris Ouest L. Ferrara, 2012-
Exemple: Ramey and Ramey (AER)
Modèles de séries chronologiques gq Indice de la production industrielle en zone euro 0 120 110 100 90 80 70 60 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 0.015 0.010010 0.005 0.000-0.005-0.010-0.015-0.020 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 U. Paris Ouest L. Ferrara, 2012-
Modèles de séries chronologiques gq Les n individus i deviennent n dates t, On mesure une variable R t pour t = 1,, T Pb: Qu en est-il de l hypothèse i.i.d..d.? 1/ Indépendance : Hypothèse pas raisonnable 2/ Identiquement distribué : Hypothèse nécessaire U. Paris Ouest L. Ferrara, 2012-
Modèles de séries chronologiques gq Les n individus i deviennent n dates t, On suppose qu il existe une relation linéaire entre elles, ie: pour chaque i : Y t = a Y t-1 + b Les paramètres (a,b) sont inconnus La relation n est pas forcément déterministe, ie: il existe la va e telle e que : e ~ N (0,σ 2 i ) et Y t = a Y t-1 +b+e + i Les paramètres (a,b, σ 2 ) sont inconnus U. Paris Ouest L. Ferrara, 2012-
Modèles de séries chronologiques gq déterministes On suppose qu il existe une relation non forcément linéaire entre elles, ie: pour chaque i : Y t = f( θ, Y t-1 ) Les paramètres (θ ) sont inconnus Exemples: Chaos logistique, Rossler, Henon com nn = 10000 com aa = 3.75 com xx(1) = 0.8 do i=2,nn com xx(i) = aa*xx(i-1)*(1-xx(i-1)) enddo i U. Paris Ouest L. Ferrara, 2012-
Modèles de séries chronologiques gq déterministes (Rossler) U. Paris Ouest L. Ferrara, 2012-
Remarques Quel est le but du jeu de toute tentative de modélisation d une variable Y? Minimiser la variance résiduelle Y = partie déterministe + partie aléatoire Y = f(x) + ε Par indépendance, V(Y) = V(f(X)) + V(ε) U. Paris Ouest L. Ferrara, 2012-
Conclusion Un U modèle économétrique ét permet de faire un choix économique à partir d un ensemble d information Algorithme de modélisation statistique: Définir i l ensemble d information i n Spécifier le modèle statistique (= identifier P θ ) Construire une statistique pour le paramètre à estimer Etude de cette statistique (estimation et distribution) Validation / Contrôle Prise de décision / Prévision U. Paris Ouest L. Ferrara, 2012-
Conclusion Outils: Eléments de la théorie des probabilités Construction d échantillon Choix de la classe de modèle paramétrique Méthodes de spécification du modèle Estimation des paramètres Tests d hypothèses U. Paris Ouest L. Ferrara, 2012-