Modèles non-linéaires pour données de panel



Documents pareils
Exemple PLS avec SAS

BIG Data et R: opportunités et perspectives

Données longitudinales et modèles de survie

Introduction au logiciel STATA

Analyse de la variance Comparaison de plusieurs moyennes

TD d économétrie appliquée : Introduction à STATA

Chapitre 3. Les distributions à deux variables

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Exercices sur SQL server 2000

Modèles pour données répétées

DOCUMENTATION MODULE BLOCKCATEGORIESCUSTOM Module crée par Prestacrea - Version : 2.0

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Wealth Effect on Labor Market Transitions

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

Modèle GARCH Application à la prévision de la volatilité

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

TABLE DES MATIERES. C Exercices complémentaires 42

Théorie Financière 8 P. rod i u t its dé dérivés

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Introduction à MATLAB R

Cours 7 : Utilisation de modules sous python

Évaluation de la régression bornée

«Bienvenue au Canada: on ne s inquiète pas de l assurance privée ici»

Data issues in species monitoring: where are the traps?

Gestion des données avec R

Modèles Estimés sur Données de Panel

Faits saillants et survol des résultats du sondage

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

France SMS+ MT Premium Description

Simulation de variables aléatoires

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Algorithmique et Programmation, IMA

POLICY: FREE MILK PROGRAM CODE: CS-4

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Programme

Face Recognition Performance: Man vs. Machine

Practice Direction. Class Proceedings

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

ONTARIO Court File Number. Form 17E: Trial Management Conference Brief. Date of trial management conference. Name of party filing this brief

Trafic aérien de passagers au Canada : une analyse exploratoire du modèle origine-destination de Transports Canada pour le marché intérieur

Exercice : la frontière des portefeuilles optimaux sans actif certain

Hedging delta et gamma neutre d un option digitale

Probabilités III Introduction à l évaluation d options

LOI SUR LA RECONNAISSANCE DE L'ADOPTION SELON LES COUTUMES AUTOCHTONES ABORIGINAL CUSTOM ADOPTION RECOGNITION ACT

Cours I. Prise en main du logiciel

PROBABILITES ET STATISTIQUE I&II

td3a correction session7az

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

La classification automatique de données quantitatives

M2-Images. Rendu Temps Réel - OpenGL 4 et compute shaders. J.C. Iehl. December 18, 2013

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

Plan du cours Cours théoriques. 29 septembre 2014

INSCRIPTION MASTER / MASTER S APPLICATION

Description du logiciel Modbus RTU

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

Évaluation du risque cardiovasculaire dans le contexte de l hypertension artérielle et de son traitement

Améliorations du schéma de nuage et de EDKF dans AROME/MésoNH

DOCUMENTATION - FRANCAIS... 2

Calcul Formel et Numérique, Partie I

EU- Luxemburg- WHO Universal Health Coverage Partnership:

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Analyse des correspondances avec colonne de référence

F-7a-v3 1 / Bourses de mobilité / Mobility Fellowships Formulaire de demande de bourse / Fellowship Application Form

Un exemple de régression logistique sous

Consolidation de jeux de données pour la prospective : la génération d une population synthétique pour les communes de Belgique

«Cours Statistique et logiciel R»

Support Orders and Support Provisions (Banks and Authorized Foreign Banks) Regulations

Les Taux de change. Grégory Corcos et Isabelle Méjean. ECO 434: Economie Internationale Ecole Polytechnique, 2ème Année

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Chapitre 5 : Flot maximal dans un graphe

UML : Unified Modeling Language

Université de XY University of XY. Faculté XY Faculty of XY

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Improving the breakdown of the Central Credit Register data by category of enterprises

Encryptions, compression et partitionnement des données

Recherche dans un tableau

Mémo d utilisation de ADE-4

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Institut français des sciences et technologies des transports, de l aménagement

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

Examen Final. Indications

Processus aléatoires avec application en finance

DOCUMENTATION - FRANCAIS... 2

L analyse de la gestion de la clientèle

4 Exemples de problèmes MapReduce incrémentaux

Etude des propriétés empiriques du lasso par simulations

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Définition d un Template

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

THE SUBJUNCTIVE MOOD. Twenty-nineth lesson Vingt-neuvième leçon

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Formulaire de candidature pour les bourses de mobilité internationale niveau Master/ Application Form for International Master Scholarship Program

données en connaissance et en actions?

WEB page builder and server for SCADA applications usable from a WEB navigator

Comprehensive study on Internet related issues / Étude détaillée sur les questions relatives à l Internet. November/Novembre 2014

SAS de base : gestion des données et procédures élémentaires

Transcription:

Modèles non-linéaires pour données de panel Guillaume Horny Banque de France et UCLouvain CEPII Guillaume Horny (Banque de France) Panels non-linéaires 2009 1 / 36

Typologie des modèles non-linéaires en panel Modèles poolés : g(e[y it X it ]) = X it β + u. Ecriture identique à celle en coupe. Implique toutefois d ajuster les matrices de variance pour la corrélation longitudinale Modèles à effets fixes : où u i peut être corrélé avec X it. Modèles à effets aléatoires : g(e[y it X it, u i ]) = X it β + u i, g(e[y it X it, u i ]) = X it β + u i, où u i suit une distribution et est indépendant de X it. Guillaume Horny (Banque de France) Panels non-linéaires 2009 2 / 36

Aperçu des modèles non-linéaires Différences avec les modèles linéaires: modèles à effets fixes sujets au problème des paramètres incidents lorsque N grand relativement à T modèles à effets aléatoires demandent généralement d utiliser des procédures d intégration numériques (cf transparent 45 de PS) Guillaume Horny (Banque de France) Panels non-linéaires 2009 3 / 36

Modèles non-linéaires traités ici Variable aléatoire: binaire: probit et logit continue et censurée: Tobit I et II Guillaume Horny (Banque de France) Panels non-linéaires 2009 4 / 36

Généralités sur les panels sous Stata Mise en forme des données : chaque observation correspond à un couple (i, t), pas de mise en forme wide, sinon utiliser la commande reshape l utilisateur doit déclarer les variables contenant les indices d individus et de temps pour pouvoir utiliser les fonctions pour données de panel : xtset id year Guillaume Horny (Banque de France) Panels non-linéaires 2009 5 / 36

Généralités sur les panels sous Stata (suite) Description du panel xtdescribe nous renseigne sur les séquences d observations pour les différents individus, xtsum, xttab nous renseignent sur les variations intra- et inter-individuelles de variables. Utile car les estimateurs à effets fixes sont peu précis lorsque les variations intra-individuelles sont faibles. xttab x y xttrans donne les proba de transitions d une période à l autre xttrans x Guillaume Horny (Banque de France) Panels non-linéaires 2009 6 / 36

Modèles binaires et Tobit I Guillaume Horny (Banque de France) Panels non-linéaires 2009 7 / 36

Commandes VA binaire continue et censurée poolé logit tobit probit effet fixe xtlogit,fe effet aléatoire xtlogit, re xttobit xtprobit, re Guillaume Horny (Banque de France) Panels non-linéaires 2009 8 / 36

Modèle poolé Commande en panel identique à celle en coupe, avec un ajustement pour la corrélation longitudinale: logit y x, vce(cluster id) probit y x, vce(cluster id) Guillaume Horny (Banque de France) Panels non-linéaires 2009 9 / 36

Modèles à effets fixes Problème des paramètres incidents: N effets fixes u i + K régresseurs (N + K) paramètres, (N + K) lorsque N, on doit éliminer les u i, possible pour modèles Logit, d où le Logit conditionnel, pas de solution pour le Probit, pas de procédure sous Stata pour l estimateur de Hahn et Newey (2004) du Tobit FE. Commande: xtlogit y x, fe Guillaume Horny (Banque de France) Panels non-linéaires 2009 10 / 36

Modèles à un effet aléatoire Contribution à la vraisemblance de l individu i: [ T ] f (y i1,..., y it X i1,..., X it, β, γ) = f (y it X it, u i, β) h(u i γ)du i. Pour un seul effet aléatoire: U t=1 l intégrale n admet généralement pas de soution analytique, mais c est une intégrale simple pour l individu i. les procédures d intégration numériques marchent bien Commandes pour des u i gaussiens: xtlogit y x, re xtprobit y x, re xttobit y x, ll(0) intpoints(20) Guillaume Horny (Banque de France) Panels non-linéaires 2009 11 / 36

Extensions à plusieurs effets aléatoires Pour capturer des corrélations multiniveaux, on peut vouloir spécifier plusieurs effets aléatoires Exemple: des pays peuvent être regroupés (OCDE, zones géographiques...) la contribution à la vraisemblance de chaque groupe contient une intégrale multiple Module GLLAMM add-on gratuit pour Stata (www.gllamm.org), intégration numérique par une procédure de quadrature gaussienne adaptative. + flexible, permet de spécifier de nombreuses variations autour des modèles usuels, - syntaxe peu intuitive, méthode générique d intégration. Guillaume Horny (Banque de France) Panels non-linéaires 2009 12 / 36

Exemple données issues de la Rand Health Insurance Experiment différentes couvertures maladies ( coinsurances ) sont assignés pour plusieurs années à des ménages panel non-cylindré données préparées pour Deb et Trivedi (2002) disponibles à: http://www.stata-press.com/data/mus.html Guillaume Horny (Banque de France) Panels non-linéaires 2009 13 / 36

Exemple: code complet use mus18data.dta, clear list id year in 1/10 describe dmdu med mdu lcoins ndisease female age lfam child id year xtset id year xtdescribe xtsum age lfam child xttrans dmdu global xlist lcoins ndisease female age lfam child logit dmdu $xlist, vce(cluster id) estimates store POOLED xtlogit dmdu $xlist, fe nolog estimates store FE xtlogit dmdu $xlist, re nolog estimates store RE estimates table POOLED FE RE, equations(1) se b(%8.4f) stats(n ll) Guillaume Horny (Banque de France) Panels non-linéaires 2009 14 / 36

Exemple. list id year in 1/10 +---------------+ id year --------------- 1. 125024 1 2. 125024 2 3. 125024 3 4. 125024 4 5. 125024 5 --------------- 6. 125025 1 7. 125025 2 8. 125025 3 9. 125025 4 10. 125025 5 +---------------+ Guillaume Horny (Banque de France) Panels non-linéaires 2009 15 / 36

Exemple describe dmdu med mdu lcoins ndisease female age lfam child id year storage display variable name type format variable label ----------------------------------------------------------------- dmdu float %9.0g any MD visit = 1 if mdu > 0 med float %9.0g medical exp excl outpatient men mdu float %9.0g number face-to-fact md visits lcoins float %9.0g log(coinsurance+1) ndisease float %9.0g count of chronic diseases -- ba female float %9.0g female age float %9.0g age that year lfam float %9.0g log of family size child float %9.0g child id float %9.0g person id, leading digit is sit year float %9.0g study year Guillaume Horny (Banque de France) Panels non-linéaires 2009 16 / 36

Exemple. xtset id year panel variable: time variable: delta:. xtdescribe id (unbalanced) year, 1 to 5, but with gaps 1 unit id: 125024, 125025,..., 632167 year: 1, 2,..., 5 Delta(year) = 1 unit Span(year) = 5 periods (id*year uniquely identifies each observation) Guillaume Horny (Banque de France) Panels non-linéaires 2009 17 / 36

Exemple Distribution of T_i: min 5% 25% 50% 75% 95% 1 2 3 3 5 5 Freq. Percent Cum. Pattern ---------------------------+--------- 3710 62.80 62.80 111.. 1584 26.81 89.61 11111 156 2.64 92.25 1... 147 2.49 94.74 11... 79 1.34 96.07..1.. 66 1.12 97.19.11.. 33 0.56 97.75..111 33 0.56 98.31.1111 29 0.49 98.80...11 71 1.20 100.00 (other patterns) ---------------------------+--------- 5908 100.00 XXXXX Guillaume Horny (Banque de France) Panels non-linéaires 2009 18 / 36

Exemple. xtsum age lfam child -----------------+--------------------------------------------+------- Variable Mean Std. Dev. Min Max Obs age overall 25.71844 16.76759 0 64.27515 N between 16.97265 0 63.27515 n within 1.086687 23.46844 27.96844 T-bar lfam overall 1.248404.5390681 0 2.639057 N between.5372082 0 2.639057 n within.0730824.3242075 2.44291 T-bar child overall.4014168.4901972 0 1 N between.4820984 0 1 n within.1096116 -.3985832 1.201417 T-bar Guillaume Horny (Banque de France) Panels non-linéaires 2009 19 / 36

Exemple. xttrans dmdu any MD any MD visit = 1 if visit = 1 mdu > 0 if mdu > 0 0 1 Total -----------+----------------------+---------- 0 58.87 41.13 100.00 1 19.73 80.27 100.00 -----------+----------------------+---------- Total 31.81 68.19 100.00 Guillaume Horny (Banque de France) Panels non-linéaires 2009 20 / 36

Exemple estimates table POOLED FE RE, equations(1) se b(%8.4f) stats(n ll) ----------------------------------------------- Variable POOLED FE RE -------------+--------------------------------- lcoins -0.1572-0.2404 0.0109 0.0163 ndisease 0.0503 0.0782 0.0040 0.0055 female 0.3092 0.4631 0.0446 0.0663 age 0.0043-0.0342 0.0073 0.0022 0.0184 0.0032 lfam -0.2048 0.4788-0.3022 0.0470 0.2597 0.0645 child 0.0922 0.2705 0.1935 0.0728 0.1685 0.1002 _cons 0.6039 0.8630 0.1108 0.1569 -------------+--------------------------------- Guillaume Horny (Banque de France) Panels non-linéaires 2009 21 / 36

Tobit II Guillaume Horny (Banque de France) Panels non-linéaires 2009 22 / 36

Tobit II poolé Commande: heckman y1 x1, select(y2 = x2) vce(cluster id) Guillaume Horny (Banque de France) Panels non-linéaires 2009 23 / 36

Tobit II à effets fixes y 1it = { y 1it if y 2it = 1 if y 2it = 0, y 1it = X 1it β 1 + u 1i + w 1it, y 2it = 1[y l 2it 0] y 2it = X 2it β 2 + w 2it, où w 1it et w 2it peuvent être corrélés. Procédure: estimation des T modèles de sélections, calcul des T ratios de Mills correspondant λ t, régression linéaire de y 1 sur (X 1, d 1 λ1,..., d T λt ). Guillaume Horny (Banque de France) Panels non-linéaires 2009 24 / 36

Tobit II à effets fixes (suite) Programme: *** Etape 1: estimation des T modèles de sélection probit y2 x2 if date == 1 predict xb1, xb... *** Etape 2: calcul des termes de correction gen d1m1 = d1 * normalden(xb1) / normal(xb1)... *** Etape 3: régression linéaire regress y1 x1 d1m1 d2m2... Guillaume Horny (Banque de France) Panels non-linéaires 2009 25 / 36

Tobit II : modèle avec un facteur de charge y 1it = { y 1it if y 2it = 1 if y 2it = 0, y 1it = X 1it β 1 + λu i + w 1it, y 2it = 1[y l 2it 0] y 2it = X 2it β 2 + u i + w 2it, où w 1it et w 1it sont indépendants. Si w 1, w 2 et u i sont normaux centrés réduits, on a: ( var[(λu i + w 1it, u i + w 2it ) λ ] = 2 ) + 1 λ. λ 2 Pas de routine pré-programmée, mais estimation possible avec GLLAMM. Guillaume Horny (Banque de France) Panels non-linéaires 2009 26 / 36

Tobit II : réécriture du modèle avec un facteur de charge Soient: q it = (y 1it, y 2it ), d 1it = 1[q l it = y 1it ], d 2it = 1[q l it = y 2it ]. La variable q it est une VA: normale lorsque d 1it = 1 de Bernouilli (donc binomiale) lorsque d 2it = 1. Guillaume Horny (Banque de France) Panels non-linéaires 2009 27 / 36

Exemple données simulées échantillon de 100 individus, observés sur 5 périodes. Guillaume Horny (Banque de France) Panels non-linéaires 2009 28 / 36

Exemple *** simulation des données <SNIP>. list id date x1 u y1 y2 in 1/10, clean id date x1 u y1 y2 1. 1 1 -.15982537.65174226 -.4322912 1 2. 1 2-1.1814841.65174226.5927979 1 3. 1 3.92545607.65174226 4.320402 1 4. 1 4-1.5261284.65174226. 0 5. 1 5.89645764.65174226 2.787327 1 6. 2 1.9960802.60328083 3.428029 1 7. 2 2.33409693.60328083. 0 8. 2 3.18082472.60328083. 0 9. 2 4.52460684.60328083 1.147292 1 10. 2 5.09943156.60328083 1.928639 1 Guillaume Horny (Banque de France) Panels non-linéaires 2009 29 / 36

Exemple. *** création de q: empile y1 et y2 dans une unique variable resp. *** créé une variable num_eq, = 1 lorsque resp=y1et =2 pour resp=y2. clonevar resp1 = y1 (160 missing values generated). clonevar resp2 = y2. gen row = _n. reshape long resp, i(row) j(num_eq) (note: j = 1 2) Data wide -> long ------------------------------------------------------- Number of obs. 500 -> 1000 Number of variables 13 -> 13 j variable (2 values) -> num_eq xij variables: resp1 resp2 -> resp ------------------------------------------------------- Guillaume Horny (Banque de France) Panels non-linéaires 2009 30 / 36

Exemple. *** créé les indicatrices d1 et d2.. tab num_eq, gen(d). <SNIP>. sort id date num_eq. list id date num_eq row x1 u y1 y2 in 1/11, clean id date num_eq row x1 u y1 y2 1. 1 1 1 1 -.15982537.65174226 -.4322912 1 2. 1 1 2 1 -.15982537.65174226 -.4322912 1 3. 1 2 1 2-1.1814841.65174226.5927979 1 4. 1 2 2 2-1.1814841.65174226.5927979 1 5. 1 3 1 3.92545607.65174226 4.320402 1 6. 1 3 2 3.92545607.65174226 4.320402 1 7. 1 4 1 4-1.5261284.65174226. 0 8. 1 4 2 4-1.5261284.65174226. 0 9. 1 5 1 5.89645764.65174226 2.787327 1 10. 1 5 2 5.89645764.65174226 2.787327 1 11. 2 1 1 6.9960802.60328083 3.428029 1 Guillaume Horny (Banque de France) Panels non-linéaires 2009 31 / 36

Exemple. *** mise en forme des variables explicatives. *** 1ère équation. gen d1_x1 = d1*x1. gen d1_x2 = d1*x2.. *** 2d équation. foreach var in x1 x2 x3 { 2. gen d2_ var = d2* var 3. } Guillaume Horny (Banque de France) Panels non-linéaires 2009 32 / 36

Exemple *** estimation eq fac: d2 d1 gllamm resp d1_x1 d1_x2 d1 d2_x1 d2_x2 d2_x3 d2, nocons /* */ i(id) family(gauss binom) link(ident probit) /* */ fv(num_eq) lv(num_eq) eq(fac) adapt nip(15) Guillaume Horny (Banque de France) Panels non-linéaires 2009 33 / 36

GLLAMM Consulter www.gllamm.org pour: le manuel ( 140 pages) des fichiers de données pour s entraîner une liste des papiers utilisant GLLAMM Guillaume Horny (Banque de France) Panels non-linéaires 2009 34 / 36

Conclusion Points forts et faibles de Stata: + fonctions pour les modèles usuels pour données de panel + les méthodes en 2 étapes sont faciles à programmer + extensions possibles avec GLLAMM aux modèles multiniveaux ou à équations simultanées, grâce aux facteurs de charge - au delà, Stata très peu flexible Alternatives pour les économètres créatifs: R, GAUSS, Matlab... Guillaume Horny (Banque de France) Panels non-linéaires 2009 35 / 36

Merci de votre attention! guillaume.horny@banque-france.fr Guillaume Horny (Banque de France) Panels non-linéaires 2009 36 / 36