TD d économétrie appliquée : Introduction à STATA



Documents pareils
Ecran principal à l ouverture du logiciel

AGASC / BUREAU INFORMATION JEUNESSE Saint Laurent du Var - E mail : bij@agasc.fr / Tel : CONSIGNE N 1 :

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Microsoft Excel : tables de données

ContactForm et ContactFormLight - Gestionnaires de formulaire pour Prestashop Edité par ARETMIC S.A.

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.

BIRT (Business Intelligence and Reporting Tools)

MISE AU POINT FINANCIÈRE GUIDE DE L UTILISATEUR. Le logiciel MISE AU POINT FINANCIÈRE est offert sous licence par EquiSoft.

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Installation et utilisation de Cobian Backup 8

Guide d utilisation 2012

1) Installation de Dev-C++ Téléchargez le fichier devcpp4990setup.exe dans un répertoire de votre PC, puis double-cliquez dessus :

Tutoriel D utilisation. Du PGI Open line d EBP

Formation. Module WEB 4.1. Support de cours

Université de Picardie - Jules Verne UFR d'economie et de Gestion

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

Europresse.com. Pour bibliothèque d enseignement Pour bibliothèque publique. Consulter facilement la presse. Guide version 1.

Formation tableur niveau 1 (Excel 2013)

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Comment se connecter au VPN ECE sous vista

Gestion des références bibliographiques. Comment simplifier la gestion des références bibliographiques?

Objectif. Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +.

Introduction au logiciel STATA

Comment bien débuter sa consolidation?

ASP Journal Alert Guide d utilisation

Introduction à Eclipse

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

Initiation à Mendeley AUT2012

Document d accompagnement pour l utilisation du Cartable en ligne Lycée des Métiers Fernand LÉGER 2013/2014

1 - Se connecter au Cartable en ligne

Sommaire. Images Actives Logiciel libre développé par le CRDP de l académie de Versailles 2 Rue Pierre Bourdan Marly le Roi

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Travaux pratiques avec RapidMiner

A LA DÉCOUVERTE DE ZOTERO 4.0

Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1

Direction générale statistique et information économique. Manuel d usage : l application web pour l enquête sur la structure des entreprises

Tutoriel : Utilisation du serveur de calcul à distance de PSE

RECOPLUS LOGICIEL DE GESTION DES RECOMMANDES NOTICE D UTILISATION DE RECOPLUS RESEAU. N de série

EXCEL TUTORIEL 2012/2013

Formation Word/Excel. Présentateur: Christian Desrochers Baccalauréat en informatique Clé Informatique, 15 février 2007

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

LES TOUT PREMIERS PAS

SUGARCRM MODULE RAPPORTS

Module Communication - Messagerie V6. Infostance. Messagerie

CREER ET ANIMER SON ESPACE DE TRAVAIL COLLABORATIF

Zotero est une extension du navigateur Firefox. Il est possible de télécharger Firefox gratuitement sur le site:

Page Paragraphe Modification Mise en page du document Le bouton "Format de page" est maintenant "Page"

Créer son questionnaire en ligne avec Google Documents

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Cours pratique Excel. Dans chacune des feuilles, les donnés sont déjà entrées afin de gagner du temps.

Guide d'utilisation Coffre fort Primobox

TUTORIEL Qualit Eval. Introduction :

Dragon Naturally Speaking 13

Manuel d utilisation du site web de l ONRN

R00 Installation du logiciel R sous Windows

SOMMAIRE. Accéder à votre espace client. Les Fichiers communs. Visualiser les documents. Accéder à votre espace client. Changer de Workspace

Procédure d installation Smart Map 3

Guide d utilisation des services My Office

Révision salariale - Manager

Tutoriels. 01 Utiliser Praat. 02 Transcrire sous Praat en utilisant les conventions VALIBEL. Sylviane Bachy. Rédaction octobre 2005

Tutoriel : Ecrire un article sur le site de la TEAM GSAS

ECOWIN PRO. A retenir

GUIDE D UTILISATION DU BROWSER DE BEYOND 20/20

La Clé informatique. Formation Excel XP Aide-mémoire

POVERELLO KASONGO Lucien SIO 2, SISR SITUATION PROFESSIONNELLE OCS INVENTORY NG ET GLPI

GUIDE DE PRISE EN MAIN

SOMMAIRE GUIDE D UTILISATION DU WEBMAIL. vous guide

Tapez le titre de la page «BASTIA ville méditerranéenne», puis allez deux fois à la ligne à l aide de la touche Entrée.

Utilisation du logiciel Epson Easy Interactive Tools

26 Centre de Sécurité et de

FEN FICHE EMPLOIS NUISANCES

Aide Webmail. L environnement de RoundCube est très intuitif et fonctionne comme la plupart des logiciels de messagerie traditionnels.

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont

Les tableaux croisés dynamiques

Etudes de marché : les sources

Traitement des données avec Microsoft EXCEL 2010

Fiches d aide à l utilisation

GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

Une ergonomie intuitive

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Gestion de références bibliographiques

GUIDE Excel (version débutante) Version 2013

Tutoriel de formation SurveyMonkey

TUTORIAL REUTERS. Utilisation de l'utilitaire de recherche Reuters

IP Remote Controller

Le service de création de site Internet : Mode d emploi. La Création de Site Internet

Sommaire. I.1 : Alimentation à partir d un fichier Access (.mdb)...2

Mode d Emploi. Résult Arc Logiciel de Gestion de Compétitions. Droits d utilisation Informations Générales. 1/. Présentation de Résult Arc

Guide pour le bon fonctionnement des applications académiques avec Internet Explorer 7.x

Guide de l utilisateur Usagers d œuvres

USTL - Licence ST-A 1ère année Initiation à la programmation TP 1

Fiche Pratique. Présentation du problème. Le cas le plus simple. Un cas plus compliqué. MAJ le 15/12/2011

Manuel d utilisation de Form@Greta

Vos outils CNED COPIES EN LIGNE GUIDE DE PRISE EN MAIN DU CORRECTEUR. 8 CODA GA WB 01 13

Créer vos données sources avec OpenOffice, adieu Excel

Création d un formulaire de contact Procédure

Guide d installation du logiciel Proteus V.8 Sous Windows Vista, 7, 8

MEGA ITSM Accelerator. Guide de Démarrage

Transcription:

Ecole normale supérieure (ENS) Département d économie TD d économétrie appliquée : Introduction à STATA Marianne Tenand marianne.tenand@ens.fr

OBJECTIFS DU TD Découvrir le logiciel d économétrie STATA, très utilisé par les économistes pour l analyse empirique de données Connaître les grands principes de fonctionnement et les commandes de base Savoir importer des données et faire une analyse descriptive à l aide de STATA Etre capable d utiliser le logiciel pour réaliser une analyse économétrique Mettre en œuvre les concepts et techniques vus dans le cours de D. Roy TD appliqué, sur ordinateur

DÉROULEMENT DU TD Le TD se déroulera sur 12 séances de 2h : A. Présentation du logiciel STATA B. Prise en main et exercices C. Reproduction d un article d économie : Acemoglu, Cantoni, Johnson et Robinson (2011), «The consequences of radical reform : The French Revolution», AER, 101 D. Projet en binôme ou individuel Définir une question de recherche Trouver les données Exploiter les données à l aide des outils économétriques pertinents (cf. cours de Delphine Roy) Évaluation : présentation orale le jeudi 28 mai

SAS OU STATA? Cours de D. Roy : SAS / ce TD : STATA pourquoi faut-il connaître ces deux logiciels? Utilisation différenciée sur le marché du travail : STATA : instituts de recherche, organisations internationales SAS : service public (Insee et Services statistiques ministériels en particulier), banques SAS ou STATA pour les groupes privés d analyse économique et de conseil D un point de vue technique : SAS : traitement de bases de données de grande taille plus facile STATA : plus facile d accès, plus intuitif, une communauté plus active (forums d aide en ligne, nouvelles commandes téléchargeables gratuitement)

SAS OU STATA? Deux logiciels payants Des tarifs spéciaux pour étudiants, et notamment des étudiants des établissements d enseignement supérieur ayant acquis une licence académique STATA à l ENS Ce ne sont pas les seuls logiciels utilisés par les économistes : R : entièrement gratuit, disponible en ligne, avec grande communauté d utilisateurs MathLaB, Python, etc. SAS et STATA : plus limités que ces logiciels pour la programmation, mais optimaux pour l analyse économétrique standard

INDICATIONS BIBLIOGRAPHIQUES Manuels : User Manuel, pdf qui décrit les principes de fonctionnement essentiels et les commandes de base http://www.stata.com/manuals13/u.pdf (version 13) Stata Reference Manual : dictionnaire de Stata en plusieurs volumes (papier) Stata Graphics Manual : pour faire des beaux (et bons!) graphiques http://www.stata.com/manuals13/g.pdf (version 13) Cameron and Trivedi (2010), «Microeconometrics using Stata», Stata Press, 706 p. Manuel très bien fait, qui présente les différentes techniques d estimation en microéconométrie et montre comment les mettre en œuvre sur Stata Quelques éléments sur la gestion des données et sur la programmation

INDICATIONS BIBLIOGRAPHIQUES (et surtout) Internet : Des tutoriels faits par les universités : Tutoriel d Antoine Bozio http://www.parisschoolofeconomics.com/bozioantoine/fr/documents/stata.pdf Guides de Princeton University, UCLA et la LSE : http://data.princeton.edu/stata/default.html http://www.ats.ucla.edu/stat/stata/ (notamment la section sur les graphiques) http://www.lse.ac.uk/methodology/tutorials/stata/home.aspx Une aide en ligne accessible depuis Stata : Avec la commande net search suivi des mots-clefs, vous pourrez accéder aux ressources en ligne référencées par le logiciel Les forums d aide : à consommer sans trop de modération

OÙ TROUVER DES DONNÉES? Il existe de nombreuses sources de données gratuites, accessibles en ligne et utilisables sans condition particulière Certaines données sont gratuites mais à accès contrôlé : Les données disponibles via le Réseau Quételet (données françaises essentiellement, mais aussi certaines bases internationales) peuvent être utilisées à des fins de recherche universitaire, mais une demande individuelle (motivée) doit être faite par chaque utilisateur Certaines données sont dites confidentielles (accès via le CASD ou seulement «en interne» des organismes producteurs). Droit d accès accordé au compte-gouttes Enfin, certaines données sont payantes Certaines données locales, certaines données d entreprises

UTILISER DES DONNÉES Attention à toujours respecter certaines règles élémentaires de déontologie scientifique : Toujours citer ses sources, même lorsqu elles sont gratuites ; Respecter scrupuleusement les conditions d utilisation quand il y en a (personnes autorisées à exploiter les données, degré d agrégation minimum des résultats, etc.) c est votre réputation de chercheur (en herbe) et celle de votre établissement qui sont en jeu! Enjeu de long terme : convaincre les administrations d ouvrir davantage leurs bases de données Davantage de données / données plus précises : permet de réduire le nombre d hypothèses nécessaires à l identification des paramètres dans les modèles économétriques

QUELQUES SITES DE DONNÉES GRATUITES Grandes enquêtes françaises : Réseau Quételet http://www.reseau-quetelet.cnrs.fr/spip/?lang=fr Enquêtes récurrentes (Enq. Emploi, Budget des Familles, ), enquêtes ponctuelles (Santé et itinéraire professionnel, ), recensements, données administratives, données d entreprises, panels (Génération 98) Producteurs : Insee, Drees, Dares, Cereq, Sites des grandes organisations internationales : Banque Mondiale : http://data.worldbank.org/ OCDE : http://www.oecd-ilibrary.org/statistics (accès via le réseau de l ENS) Eurostat : http://ec.europa.eu/eurostat/data/database Données agrégées sur l économie américaine : Site de la Fed de Saint Louis («Fred»), qui inclut des outils de mise en forme («Data tools») : http://research.stlouisfed.org/fred2/

PRÉSENTATION DE STATA Nous allons présenter STATA de manière sommaire ; Reportez-vous à la notice explicative d Antoine Bozio ou aux manuels pour davantage d informations 1. L environnement STATA 2. Lire les données sous STATA 3. Sauvegarder les données et le travail 4. Chercher de l aide 5. Décrire les données 6. Travailler sur les données

1. L ENVIRONNEMENT STATA

LES DIFFÉRENTES FENÊTRES STATA Fenêtre COMMAND (bandeau du bas) : permet de taper les commandes, qui peuvent être exécutées par la touche «ENTREE» Fenêtre RESULTS (plus grande fenêtre) : décrit les résultats des commandes et indique le cas échéant pourquoi STATA n a pas pu réaliser la commande Fenêtre REVIEW (en haut à gauche) : liste l ensemble des commandes réalisées ; en rouge apparaissent celles qui ont échoué. On peut cliquer sur une des commandes listées dans cette fenêtre pour qu elle apparaisse à nouveau dans la fenêtre Command. Fenêtre VARIABLES (en haut à droite) : donne la liste des variables de la base chargée par STATA, avec leur label (ce qu elles veulent dire) On peut cliquer sur une variable listée dans cette fenêtre pour qu elle apparaisse directement dans la fenêtre Command. Fenêtre PROPERTIES (en bas à droite) : indique les propriétés des variables et de la base de données

LA BARRE D OUTILS Bandeau situé tout en haut (Image) Permet d effectuer certaines commandes de base sans passer par la fenêtre COMMAND : Charger une base «Voir» les données Editer les données (= les modifier) Créer ou charger un do-file (cf. plus bas) Faire des graphiques

2. COMMENT LIRE LES DONNÉES? Une base de données STATA est un tableau : Une ligne = un individu statistique (un ménage, un individu, une entreprise, un pays, une maladie, etc.) Une colonne = une variable (âge, salaire, lieu, secteur d activité, taux de pauvreté, etc.) Une cellule = valeur d une variable pour un individu statistique Plusieurs types de variables : Variables numériques (numeric) : âge, année, durée passée en emploi, Variables caractères (string): pays, nom de l entreprise,

2. LA COMMANDE USE Première étape : «charger» des données dans STATA La commande use : Pour les cas où vous disposez des données sous forme STATA(.dta) Taper dans la fenêtre COMMAND l instruction : Use «Chemin_du_fichier\Nom_du_fichier.dta» OU dans la barre d outils, cliquer sur l onglet «ouvrir» et trouver le fichier Différences avec SAS : pas de libname, pas besoin de point-virgule, pas de run

2. LA COMMANDE INSHEET La commande insheet : Pour les cas où vous disposez des données sous forme Excel(.xls) ou CSV (.csv) Taper dans la fenêtre Command l instruction : Insheet using «Chemin_du_fichier\Nom_du_fichier.xls» A faire au préalable sur votre fichier Excel ou CSV : Le séparateur des décimales sous STATA est le point avant le chargement du fichier, transformer toutes les virgules en points (sinon les variables avec des virgules seront lues comme des variables string par STATA) Indiquer sur la première ligne le nom des variables pour qu il soit enregistré correctement par STATA Toujours vérifier en regardant les données que les données sont correctement lues par STATA

2. PB DE MÉMOIRE INSUFFISANTE Dans certains cas, la mémoire vive dégagée par défaut par STATA est insuffisante Du rouge apparaît dans votre fenêtre RESULTS Deux solutions : Avant d ouvrir la base : Commande set memory Xm Commande set maxvar X Lorsque la base à charger est grosse Une fois la base ouverte : Commande compress Utile lorsque certains traitements statistiques demandent beaucoup de mémoire (puissance) Inutile si c est l ouverture de la base elle-même qui pose problème!

3. SAUVEGARDER LES DONNÉES ET LE TRAVAIL Vous pouvez vouloir sauvegarder plusieurs aspects de votre travail : Les données, si vous les avez modifiées (ajout de labels, création de variables, concaténation, suppression d observations, etc.) Vos commandes successives (traitement des données, économétrie) Les résultats de vos commandes (graphiques, sorties de résultats, etc.) Des commandes différentes Pour travailler de manière efficace sur STATA, il faut utiliser un fichier.do (appelé do-file) Permet de conserver en mémoire les commandes faites et de pouvoir retrouver les mêmes résultats à chaque fois

3. LE DO-FILE Pour ouvrir un do-file : Icone «do-file editor» dans la barre d outils Ouvre une nouvelle fenêtre, l éditeur de do-files, dans lequel vous pouvez ouvrir vos do-files sauvegardés ou en composer un nouveau Pour utiliser un do-file : On écrit nos commandes dans le do-file plutôt que de les écrire dans la fenêtre COMMAND (et on sauvegarde le do-file) On sélectionne les instructions qu on veut réaliser et on clique sur l icone «Execute selection (do)» (flèche à côté d une feuille) dans l éditeur de do-files Permet d avoir sur un fichier l ensemble des commandes qu on a réalisées, ou qu on veut réaliser Constitue le «programme» Permet de sauvegarder et de réutiliser plus tard son programme

3. LE LOG-FILE Le log-file permet de conserver les résultats obtenus au cours d une session de travail STATA Le log-file enregistre les résultats de l ensemble des commandes lancées Pour ouvrir un log-file : Taper la commande : log using nom_du_fichier.log Ou cliquer sur l icone «log Begin/Close/Suspend/Resume«(sorte de petit cahier avec des lignes) Pour fermer un do-file : Taper la commande : log close Cliquer sur le même icone que pour l ouverture, et sélectionner «close»

3. LES DONNÉES Pour sauvegarder les données elles-mêmes, suite à des modifications : La commande la plus simple est save : save nom_fichier_de_données.dta Ne marche que si le fichier de données n existe pas déjà (sécurité pour éviter de détruire des données) Si le fichier de données existe déjà et qu on veut enregistrer les modifications des données dessus, il faut ajouter l option replace : save nom_fichier_de_données.dta, replace Si on ne veut pas enregistrer les changements dans les données, on ferme simplement la base : Commande clear

4. CHERCHER DE L AIDE Vous pouvez (allez) oublier certaines commandes. L essentiel avec STATA c est de savoir comment trouver l information. Plusieurs possibilités : Chercher dans les manuels Chercher sur Internet Dans STATA : Le logiciel intègre une version abrégée du User Manual * Pour y accéder il suffit de taper la commande help, suivi du nom de la commande sur laquelle on veut avoir des informations Ex : help regress Vous pouvez aussi lancer une recherche sur Internet à partir de STATA avec la commande findit : Ex: findit regress

5. DÉCRIRE LES DONNÉES Regarder la base de données brutes Pour visualiser la base de données, taper la commande browse ou edit : une fenêtre avec l ensemble des observations apparaît Attention, edit vous permet de faire des changements dans les données La commande list permet aussi de voir l ensemble des données mais dans la fenêtre RESULTS Pas très lisible! On peut aussi taper la commande list suivie d une variable : dans la fenêtre RESULTS il apparaît la valeur prise par cette variable pour chaque individu de la base ex : list salaire

5. DÉCRIRE LES DONNÉES La commande describe La commande describe donne des informations de base sur les variables : Type de variable Label Format de compression Elle peut être abrégée en desc On peut ajouter un nom de variable après describe pour que les informations soient données uniquement pour cette variable Ex : describe salaire

5. DÉCRIRE LES DONNÉES La commande summarize La commande summarize affiche dans la fenêtre Results le nombre d observations, la valeur moyenne, le min, le max et l écart type pour chaque variable Elle peut être abrégée en sum Si on veut davantage de détails sur la distribution (médiane, percentiles, etc.), on peut ajouter l option detail (qu on peut abréger en d) Ex : summarize, detail OU sum, d On peut l utiliser suivie d un nom de variable ; les statistiques sont alors données uniquement sur cette variable Ex : sum salaire

5. DÉCRIRE LES DONNÉES La commande tabulate La commande tabulate donne le nombre d observations et la fréquence de chaque valeur d une variable. Elle peut être utilisée pour regarder la distribution d une variable Elle peut être abréger en tab Ex : tabulate salaire OU tab salaire Si on place deux noms de variables à la suite de cette commande, elle donne un tableau de distribution croisée Usage très fréquent! Ex : sum salaire année

A VOUS DE JOUER