Principes de microéconomie Méthodes empiriques et théories modernes Étienne Wasmer L approche statistique des questions sociales Plan du chapitre 1. Que demande-t-on à un économiste? 2. Analyse statistique de données 3. et 4: Applications à l analyse économique 5. Conclusion 1
1. Introduction: Que demande-t-on à un économiste? 3 Quatre exemples de questions. Ex 1. Le salaire minimum crée-t-il du chômage? Ex 2. Peut-on relancer l activité économique par la consommation? (ou au contraire, la consommation est déterminée par la production?) Ex 3. La productivité (l employabilité) dépendelle du niveau d étude et si oui, de combien? Ex 4. Le stress au travail peut-il être expliqué par le chômage? 4 2
2. Analyse statistique de données All models are wrong but some are useful George-Edward Pelham Box 1919-5 Deux variables, différentes observations Variable y Droite de régression Nuage de points Variable x 6 3
Exemple: stress au travail et chômage 0,7 0,65 0,6 0,55 0,5 Stress 0,45 0,4 0,35 0,3 0,25 0,2 Gre y = 0,0184x 0,3103 US A Can Fra Swe Por UK Aus Nor Spa Ita Den Fin Aut Bel Ger Ire Net 0 2 4 6 8 10 12 14 Taux de chômage moyen sur la période 2001-2005 7 Définitions La méthode s appelle la régression linéaire simple. La droite de régression correspond à la relation linéaire qui approche au mieux les observations: Stress = ab.chômage NB: une droite se décrit avec ces deux paramètres Pente b Constante a Le mieux: vague. Il faut se donner un critère pour définir ce qui est mieux. 8 4
Méthode graphique: minimiser écarts Stress Droite de régression Moins bonne approximation Taux de chômage 9 La méthode statistique On cherche donc à retrouver a et b pour minimiser «les distances». La technique des «moindres carrés»: On choisit a et b de façon à minimiser la somme des distances au carré. Pourquoi au carré? Car propriétés particulières (cf. complément de cours en annexe). 10 5
Technique utilisée Historiquement: méthode des moindres carrés développée par Carl-Friedrich Gauss en 1795 à 18 ans. Adrien-Marie Legendre en 1805 à 53 ans. 11 Problème: trouver a et b de la droite Variable y (x3, y3) pente b (x1, y1) (x2, y2) Variable x 12 6
Calcul de a et de b avec 3 observations a et b doivent être calculés à partir des observations ils dépendent de x1, x2, x3, y1, y2, y3. appelons x et y les moyennes des x et y. a = y bx b = (x1-x)(y1-y)(x2-x)(y2-y)(x3-x)(y3-y) (x1-x)(x1-x)(x2-x)(x2-x)(x3-x)(x3-x) 13 Variable y Annexe y=abx Droite de régression (x3, y3) y (x1, y1) (x2, y2) x Variable x 14 7
Intuition de la formule (x3,y3) Variable y (x3, y3) Si y3 augmente pente b (x1, y1) (x2, y2) Variable x La pente b serait plus forte 15 Intuition du calcul de b Si x3 est plus grand que sa moyenne x Et que y3 augmente, alors b augmente. b = (x1-x)(y1-y)(x2-x)(y2-y)(x3-x)(y3-y) (x1-x)(x1-x)(x2-x)(x2-x)(x3-x)(x3-x) La formule mathématique formalise l intuition Traduit la covariation entre x et y. 16 8
Intuition de la formule Simplement que le numérateur traduit la covariation entre x et y. Peut-être positive (ici), négative ou nulle selon les observations. Plus d explications en complément de cours en ligne. Si plus d observations : Même formule étendue à x4, y4, etc 17 Approfondissement Notation nouvelle S(x,y) est la somme du produit des écarts à la moyenne de chaque variable. c-à-d S(x,y)= (x1-x)(y1-y)(x2-x)(y2-y)(x3-x)(y3-y) Permet une ré-écriture simple de b: b=s(x,y) / S (x,x) 18 9
Approfondissement La prédiction de la variable y est ab.x L écart entre la variable y s appelle le résidu, on le note e. C est aussi une erreur du modèle: écart entre réalité et ce qui est prédit. Le R 2 se calcule comme 1-S(e,e)/S(y,y). Approfondissement Propriétés des moindres carrés. Sous certaines hypothèses restrictives concernant les données (non énumérées ici), L estimation par les moindres carrés de b est non biaisée (pas d écart par rapport au «vrai» coefficient) le plus efficace (estimation précise) On l appelle «the BLUE estimator»: best linear unbiased estimator. 20 10
Stress au travail et chômage 0,7 0,65 0,6 0,55 0,5 Stress 0,45 0,4 0,35 0,3 0,25 0,2 Stress = 0.28 0.02*Chômage Gre y = 0,0184x 0,3103 US A Can Fra Swe Por UK Aus Nor Spa Ita Den Fin Aut Bel Ger Ire Net 0 2 4 6 8 10 12 14 Taux de chômage moyen sur la période 2001-2005 21 «Qualité» de la régression Il nous faut un nombre entre 0 et 1. Le R 2 (coefficient de détermination). C est la part de la variabilité (variance) du stress qui est expliquée par le chômage. Formule en complément. Ici R 2 était de 0.38. Il faut la précision de l estimation de a et b: Par exemple Stress = 0.28 0.02*Chômage (0.03) (0.005) Ce sont des écarts-types. 22 11
Autres généralisations Transformer les variables. Notamment prendre leur logarithme. n Si on estime économétriquement un modèle transformé en log: Log y = a ε.log x on estime une élasticité notée ε C est un nombre qui donne la variation en pourcents de y quand x augmente de 1%. NB: Si seul x ou y est pris en log, on estime une semiélasticité. 23 Autre généralisation Plus de variables explicatives: Régression multiple: 2 variables explicatives x, z Par exemple Chômage, Protection de l emploi. Trois paramètres à estimer (coefficients): a, b, c y=abxcz Autre exemple de régression multiple. 24 12
Analyse du prix du vin Bordeaux Wine Vintage Quality and the Weather, par Orley Ashenfelter; D. Ashmore et R. Lalonde. 1990-91: prix enchères à Londres pour des lots de 12 bouteilles (en dollars US) de crûs 1952-1980. Ex: 1960 1961 1962 1963 1964 Latour 464 5432 1064 471 1114 Lafite 494 4335 889 340 649 Prix: reflètent propension à payer qui dépend de la qualité du vin Méthode de régression multiple Essayer d expliquer le prix par un tout petit nombre de variables Température moyenne avril-septembre Précipitations en août et septembre Précipitations d octobre à mars Et. ancienneté du vin 13
Méthode de régression (multiple) Spécif. I (simple) Spécif. II (multiple) log(prix) = log(prix) = Age du vin* 0.035 (0.01) 0.024 (0.01) T (avr-sept.)* 0.62 (0.11) Pré. (août-sept.)* -0.39 (0.08) Pré. (oct-mars)* 0.12 (0.05) Vin = actif financier de Proportion rendement brut d au moins 2.4% expliquée (R²) 0.21 0.83 Réactions 83% expliqués avec 4 variables! The mere mention of the use of statistical analysis to analyze the quality of wine vintage has sent the wine trade press into a frenzy. ( ) Robert Parker, Jr., generally regarded as the most influential wine critic in America, calls the approach, «a Neanderthal way of looking at wine». ( ) Britain s Wine magazine: «the formula s self-evident siliness invited disrespect.» 14
Commentaire Ici, pas de problème de causalité inverse. Eventuellement problème de variables manquantes. Les problèmes en sciences sociales sont plus difficiles à résoudre. 3. Première application à l analyse économique: Prix et quantités 30 15
Lien entre prix d un bien et quantités Les quantités dépendent-elles positivement ou négativement des prix? Les deux: L économétrie tente de découvrir des courbes «théoriques». Parfois c est facile: exemple tabac. 31 En Angleterre Price and consumption of tobacco Joy Townsend, British Medical Bulletin 52:132-142 (1996) In the seventeenth century, James I of England initiated probably the first 'tax for health reasons' and raised tobacco tax 40-fold from 2 to 82 pence per pound, making tobacco more expensive than silver. 32 16
33 Par groupes: 34 17
Exemples de courbe de demande: Espagne FERNANDEZ E. ; GALLUS S. ; SCHIAFFINO A. ; LOPEZ- NICOLAS A. ; VECCHIA C. La ; BARROS H. ; TOWNSEND J., European journal of cancer prevention ISSN 0959-8278 We analysed the price elasticity of demand for cigarettes (effect of price of cigarettes on tobacco consumption) between 1965 and 2000 in Spain. The real price of blond cigarettes was significantly and inversely associated with blond cigarette consumption: on average, smoking prevalence decreased 1.25% for a 1% increase in the real price of cigarettes (significant price elasticity of - 1.25). For black cigarettes we found a lower but still high and significant elasticity of - 0.61. 35 En Europe Gallus S, Schiaffino A, La Vecchia C, Townsend J, Fernandez E. Istituto di Ricerche Farmacologiche Mario Negri, Milan, Italy. 52 countries of the European region. For each European country, data were collected on annual per adult cigarette consumption (2000), smoking prevalence (most recent), retail price of a pack of local and foreign brand cigarettes (around 2000), the gross domestic product adjusted by purchasing power parities, and the adult population (2000). Price elasticity of demand for cigarettes (that is, the change in cigarette consumption according to a change in tobacco price) across all the European countries, estimated by double-log multiple linear regression. RESULTS: Price elasticities for consumption were -0.46 and -0.74 for local and foreign brand, respectively. CONCLUSIONS: The result that, on average, in Europe smoking consumption decreases 5-7% for a 10% increase in the real price of cigarettes strongly supports an inverse association between price and cigarette smoking. 36 18
A Taïwan Effect of cigarette tax increase on cigarette consumption in Taiwan by J-M Lee, D-S Liao, C-Y Ye, W-Z Liao Objectives: This study evaluates the effect of a 5 New Taiwan Dollar (NT$5) Health and Welfare Tax increase on the consumption of domestic and imported cigarettes and cigars. Results: ( ) Total per capita consumption of cigarettes was reduced by 22.72 packs (18%). Price elasticities: Domestic cigarettes -0.644 Imported cigarettes -0.822 Cigars -0.047 37 4. Deuxième application à l analyse économique: Prix hédoniques 38 19
Théorie des prix hédoniques Les prix de biens ou services échangés dépendent de leurs caractéristiques. Le prix reflète le plaisir que procure le bien à travers ses caractéristiques. la difficulté (le coût) à fournir ces caractéristiques. c-à-d une combinaison de demande et d offre. Appelons z1, z2, z3 les caractéristiques d un bien. 39 Prix hédoniques Prix = fonction de z1, z2, z3. On peut appliquer le principe de la régression multiple. Application au prix des logements qui dépend de la présence d un parc, transports en commun, d une terrasse, d une exposition sud la présence de bonnes écoles. la qualité du bien et du voisinage Par exemple, le loyer au mètre carré est Plus élevé de 10.5% si cuisine séparée Plus faible de 4% si voisins trop bruyants Plus faible de 5.6% si vétuste (fenêtres ou sols en mauvais état) Plus faible de 5.6% si insécurité ou vandalisme Plus faible de 23.6% si logement HLM R2=0.40 40 20
Autres applications Application au prix du forfait des stations de ski. Dépend du nombre de pistes vertes, rouges, noires. Dépend du nombre de jours d enneigement. Dépend du nombre de jours d ensoleillement. 41 5. Conclusion 42 21
Conclusion L analyse statistique permet de trouver des «régularités» Economiques: Courbes de consommation. Courbes de prix hédoniques. Non-économiques. Ces régularités traduisent généralement des préférences ou des objectifs individuels ou collectifs. 43 Nombre de médailles, log du PIB tot2008 0 50 100 AUS RUS GBR FRA CHN KOR UKR ITA JPN BLR CAN ESP KEN NLD BRA JAM KAZ ARM AZE NZLHUN NOR POL GEO ETH HRV BGR DNK MNG ARG ATG ALB BHRAGO DZA AUT COMCPV BLZBTN DJIBDI CAF FJI COGCYP BENKHMCMR BFA BWA EST IRL FIN GRD GMB GABGHA BIH CIV BOL SLV CRI BGD CHL COL GRC GNB GUY GNQGIN HTIHND GTM HKG BEL IDN KGZ ISL LVA LTU UZB ROM ISR ZAF IND KIR LBR MDV LSOMRT MLT MWI LAO MLI MUS MKD MDG JOR LUX LBNLBY MAR NGA KWT MYSSAU IRNMEX FSM RWA NER MDA NAM PNGPRY MOZ NIC UGA NPLOMN PANDOM SVNSVK CZE CHE TUR SRB SWE KNA WSM VCTLCA SYC SUR SLESWZ TJK TCD ZAR SEN TZA SDN LKA SYR PER SGP PRT THA TONVUT SLB TMP ERITGO ZMBTTO URY YEM TUN ECUVNM ARE VEN PHL PAK EGY 20 22 24 26 28 30 logpib USA 44 22
Autre exemple de régression multiple Imaginons qu on veuille expliquer le nombre de médailles aux jeux olympiques 2008. Intérêt? Expliquer pour prédire. Pour parier en 2012. 45 Démarche Une ou plusieurs variables pouvant être associées au nombre de médailles. Par exemple: La population. La richesse (PIB par tête). Si on combine les deux: le PIB. 46 23
Deux étapes dans la régression En ignorant les aspects plus techniques et avec les moindres carrés: N Médailles = -76 3.37*logPIB R 2 = 0.27 (10) (0.43) 47 Ajouter d une nouvelle variable Etre membre permanent du conseil de sécurité de l ONU! ONU=1 si membre permanent, 0 sinon. N Médailles = -37 1.67*logPIB 63*ONU (6.4) (0.27) (3.5) R 2 =0.75! 48 24
Concepts clés du chapitre Méthodes. Régression simple. Régression multiple. Estimation de coefficients par les moindres carrés. R 2 d une régression. Elasticité. Théorie. Prix hédoniques. 49 25