Econométrie des données d'enquête

Documents pareils

Faut-il pondérer? ...Ou l'éternelle question de l'économètre confronté à un problème de sondage. Laurent Davezies et Xavier D'Haultf uille.

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

1 Imputation par la moyenne

Théorie des sondages : cours 5

Non-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

Chapitre 3 - L'enquête descriptive simple

672ZA Auxiliaires d'assurances

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Les Français et le chauffage. Résultats de l étude menée

LES AMORTISSEMENTS : CALCULS ENREGISTREMENTS

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet

Description des variables de la base de données. a. Attractivité démographique pour les différents types de population

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Copropriété: 31, rue des Abondances Boulogne-Billancourt

Saint-Vallier-de-Thiey Bar-sur-Loup. Grasse. Grasse-sud

Introduction à l approche bootstrap

1 Complément sur la projection du nuage des individus

LA DYNAMIQUE DU GOUVERNEMENT D ENTREPRISE

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

SERIE 1 Statistique descriptive - Graphiques

Evaluation de la variabilité d'un système de mesure

SAS ENTERPRISE MINER POUR L'ACTUAIRE

23. Interprétation clinique des mesures de l effet traitement

Introduction à la Statistique Inférentielle

Évaluations aléatoires : Comment tirer au sort?

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

La nouvelle planification de l échantillonnage

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Élément 424b Introduction à la statistique descriptive

Gestion de comptes. - Rapport d étude. Auteur Pôle Banque Finance et Assurance. N étude Février Gestion de comptes

Développement du télétravail, Quel rôle pour les acteurs publics? Sylvie Mathon, CETE Nord Picardie

AQUITAINE. Suivi de la Demande touristique ~

Regard financier sur les petites villes (3 000 à habitants) Juin 2014

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

Un moyen simple d'être plus favorable aux familles Les points les plus importants du Family Score en un coup d'œil

Couples de variables aléatoires discrètes

Santé environnement. Description du budget espace-temps et estimation de l exposition de la population française dans son logement

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

I. S. F. ET DELOCALISATIONS FISCALES UN IMPACT DIFFICILE A MESURER FAUTE D UN TABLEAU DE BORD SATISFAISANT

Fiche synthétique du Compte Administratif 2013 de la commune d'amuré

Investissement dans la construction de nouveaux bâtiments résidentiels (travaux mis en place) Méthodologie

EVALUATION DE L'IMPACT ECONOMIQUE DU TOURISME DANS LE PAYS HORLOGER

Plan de Continuité d'activité Concepts et démarche pour passer du besoin à la mise en oeuvre du PCA

Fixer son prix à l export

SOMMAIRE. Comment suis-je informé(e) de mes droits? Quel sera le montant net de ma retraite? Comment ma retraite est-elle versée?

Le groupe CSS. La société CEGI intervient depuis la Martinique au cœur des systèmes de gestion de nos clients. La société existe depuis 1973!

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

PRESENTATION BIENVENUE DANS NOTRE. Créer une société Offshore pour les acheteurs et investisseurs étrangers. Options et avantages

MODÈLE CROP DE CALIBRATION DES PANELS WEB

Les probabilités. Chapitre 18. Tester ses connaissances

éclairages QUI SONT LES ALLOCATAIRES INDEMNISÉS PAR L ASSURANCE CHÔMAGE? Près de 3 demandeurs d emploi sur 5 sont couverts par l Assurance chômage

La mobilité professionnelle revêt

DCG 6. Finance d entreprise. L essentiel en fiches

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

OTT Observatoire du Travail Temporaire. L intérim dans le secteur du BTP

L IMPACT DE LA MUTUALISATION SUR LES RESSOURCES HUMAINES

Estimation et tests statistiques, TD 5. Solutions

Statistique Descriptive Élémentaire

Dérivés Financiers Contrats à terme

RÈGLES ET PRATIQUES EN COMPTABILITÉ DE GESTION FACTURATION INTERNE Août 2000

DOCUMENT DE TRAVAIL : ENQUÊTE ANNUELLE SUR LES DANS LES PME DE SEINE-SAINT SAINT DENIS (Données 2012)

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

LE PLAN D'AMÉLIORATION DE LA FONCTION MARKETING

Principe d un test statistique

CECOP. Centre d études et de connaissances sur l opinion publique. Les Français, leur épargne et leur retraite

Programme ESSEC Gestion de patrimoine

ACCRÉDITATION DES CENTRES PRIVÉS ET DES PROGRAMMES DE FORMATION PROFESSIONNELLE EN HAÏTI. Formulaire de demande d une autorisation de fonctionnement

Etude des propriétés empiriques du lasso par simulations

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Estimer le coût de revient d un produit agroalimentaire : la méthode du coût direct simplifié

À l'intention des parents

OFFICE DE TOURISME DE L OISE : «JE VEUX FAIRE/REFAIRE UN SITE INTERNET EN UTILISANT LE SRIT»

jçíçêáë~íáçå=éí=ãçäáäáí =W=ÇÉë= ÅçãéçêíÉãÉåíë=éäìë=ê~íáçååÉäë=\==

Les Français et le stockage de données numériques

Algorithmes d'apprentissage

Auchan Consumer Zoom clients pour mesurer et optimiser vos actions marketing. Une offre unique au service des industriels.

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Dossier 1 : L'organisation du service et la maîtrise des flux de clientèle

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

L analyse de la gestion de la clientèle

Annexe A de la norme 110

Marketing social. PPA Mars 2007

L IMPÔT SUR LA FORTUNE

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

L investissement en EHPAD

FONCTION DE DEMANDE : REVENU ET PRIX

Annexe 6 : Modèle de déclaration de candidature à remplir par chaque candidat

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Valeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse

Les enseignants, acteurs majeurs du développement personnel

Construire un tableau de bord par Marc Maisonneuve

Critères de qualité des projets

Transcription:

Econométrie des données d'enquête Groupe de lecture - Réunion 1 Marine GUILLERM et Ronan LE SAOUT INSEE, division MAEE 24 Novembre 2014 Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 1 / 25

Introduction Survol des enjeux théoriques Les données d'enquête, construites à partir de la théorie des sondages, sont largement utilisées pour des études économiques avec des méthodes économétriques. Des liens économétrie/sondages mal connus ou mal compris. Peu de prise en compte des traitements d'enquête (plan de sondage, repondération et calage, imputation) en économétrie. Peu d'informations sur les traitements d'enquête accessibles aux chargés d'études dans les bases de diusion. Des logiciels qui intègrent le traitement des données d'enquête. Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 2 / 25

Introduction Survol des enjeux théoriques A travers la lecture de textes, des objectifs pratiques : Quel est l'impact des traitements d'enquête sur les modèles économétriques? Que peut faire le chargé d'études avec les informations limitées dont il dispose (poids naux, strates du plan de sondage...)? Quelles informations pourraient être ajoutées aux bases de diusion pour améliorer les traitements économétriques? L'exemple de l'enquête Patrimoine pour illustrer ces questions. Objectif de cette première réunion : valider les thématiques, les textes et l'organisation. Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 3 / 25

Sommaire Survol des enjeux théoriques 1 Survol des enjeux théoriques 2 3 Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 4 / 25

Pourquoi pondérer? Survol des enjeux théoriques On dispose de données d'enquête, chaque individu k a une probabilité d'inclusion π k d'un échantillon s. On cherche à mesurer l'eet d'un traitement 1 k Gpe Traité sur une variable d'intérêt Y k Y k = α + β 1 k Gpe Traité + ε k L'estimateur des MCO non pondéré, ˆβ MCO = Y Gpe Traité&s Y Gpe Non Traité&s. L'estimateur d'horvitz-thompson, ˆβ HT = Y j /π j Y k /π k. j Gpe Traité&s k Gpe Non Traité&s En général ˆβMCO ˆβ HT... et mieux vaut pondérer. Comment dénir le en général? Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 5 / 25

La pondération en économétrie Ce n'est initialement pas un problème de sondage mais d'hétéroscédasticité. Le cadre est celui d'un modèle de population Ȳg = β X g + ε g avec ε g = σ2 n g et n g le nombre d'individus de chaque groupe g. La matrice de variance est alors connue, V ( ε) = W 1 σ 2 avec W = Diag (n g ). On peut appliquer les moindres carrés généralisés sur le modèle sphérisé W 1/2 Ȳg = W 1/2 β X g + W 1/2 ε g. L'estimateur est ˆβ ( ) 1 ( ) = X W X X W Y de variance ( ( 1 ˆV ˆβ) = X W X) σ2 (sous hypothèse d'homoscédasticité). Pondérer un modèle économétrique (avec les options pond des logiciels) est donc une hypothèse sur la variance des observations et non sur le tirage des individus mais... Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 6 / 25

La pondération en tenant compte du plan de sondage Si on pouvait observer l'ensemble des individus, les estimateurs du modèle Y = β X + ε serait ˆβ = (X X) 1 X Y ( ˆV ˆβ) = (X X) 1 ˆV (X ˆε) (X X) 1 Pondérer avec une perspective sondages revient à estimer ces quantités à l'aide d'estimateurs d'horvitz-thompson ) 1 ) ˆβ s = (X sw X s (X sw Y s On retrouve l'estimateur précédent! Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 7 / 25

La pondération en tenant compte du plan de sondage Il n'y a pas d'hypothèse sur la distribution des résidus. La variance de cet estimateur correspond à la variance empirique sur tous les échantillons possibles : V ( ˆβ) = s p(s) [ ˆβs E( ˆβ)] 2 avec E( ˆβ) = s p(s) ˆβ s On l'estime par : ( ) ˆV ˆβ) = (X ( 1 ) 1 sw X s G Sondages X sw X s G Sondages dépend du plan de sondage, avec notamment un terme multiplicatif (1 f), f étant le taux de sondage (qui peut être diérent par strates, grappes...). Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 8 / 25

Pourquoi prendre en compte le plan de sondage? Problème : si c'est un recensement f = 1, la variance est nulle. Est-ce vraiment ce que veut l'économètre? Pourquoi dans ce cas l'économètre calcule une précision? Avec une régression pondérée, il est possible de robustier la variance en dénissant des clusters et en autorisant certaines formes d'hétéroscédasticité ( ( 1 ˆV ˆβ) = X W X) ( ) 1 G Econométrie X W X Il n'y a pas de terme multiplicatif (1 f). N'est-ce pas préférable pour l'économètre (qui ne connaît pas le détail du plan de sondage)? Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 9 / 25

Théorie des sondages et Econométrie L'approche sondages classique : la population est nie, l'aléa est dans le tirage, il n'y a pas de modèle ; L'approche économétrique classique : il y a une super-population générée par un modèle probabiliste ; Une approche modèle qui permet de rapprocher ces 2 paradigmes? Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 10 / 25

L'estimation sur un domaine Il est courant dans une étude économique de sélectionner seulement une partie de l'échantillon Par exemple, les femmes mariées conjoints de salarié pour étudier un modèle d'ore de travail. Cette sélection tient à la question et pas au plan de sondage. L'eectif de ces sous-populations dans l'échantillon est aléatoire (idem pour notre exemple de groupe traité). Quelles implications pour l'économètre? Quelles relations avec l'estimation sur domaine? Quel sens a l'appariement de 2 échantillons d'enquête avec des plans de sondage diérents (mais qui ont par exemple été coordonnés)? Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 11 / 25

Les traitements de la non-réponse La repondération pour tenir compte de la non-réponse totale est-il une manière ecace de traiter la sélection des répondants? Quid de la diérence entre poids de tirage et poids naux? Le calage peut-il être perçu comme des équations de moments économétriques? Les méthodes d'imputation type stochastique (hot-deck) ou déterministes engendrent-elles des erreurs de mesure d'un point de vue économétrique? Comment tenir compte de ce qui n'est pas observé en économétrie (identication partielle)? Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 12 / 25

Sommaire Survol des enjeux théoriques 1 Survol des enjeux théoriques 2 3 Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 13 / 25

Description de l'enquête Mesure des actifs immobiliers, nanciers et professionnels des ménages tous les 6 ans ; Plan de sondage (France métropolitaine) Tirage à deux degrés : 1) zones d'action enquêteur (ZAE) ; 2) stratication ne à partir des chiers scaux de la taxe d'habitation. Prise en compte de l'extrême concentration du patrimoine, sur-représentation des agriculteurs... une importante variabilité des poids de tirage. Repondération pour corriger de la non-réponse totale par score de propension à répondre Modèle Logit pour expliquer la réponse et construire des strates de réponse homogène ; Repondération au sein des classes par la moyenne des taux de réponse. Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 14 / 25

Description de l'enquête Calage sur marges (nombre de ménages, pyramide des âges, csp et diplôme de la personne de référence, tranche d'unité urbaine, ZEAT et type de ménage). Montants des actifs obtenus soit en clair, soit avec des cartes. Les montants sont ensuite imputés (non-réponse partielle ou déclaration en tranches) de manière stochastique. Modèle économétrique auquel on ajoute des résidus simulés sous containtes de respect des tranches initiales. Faible imputation des variables qualitatives par hot-deck stratié équilibré. Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 15 / 25

Contenu de la base de diusion Pas les poids de tirage. Pas les strates de tirage, de repondération ou de calage. = Obligation d'approximer ces informations pour en tenir compte. La variable de pondération permet les exploitations locales : Métropole, Réunion et Antilles (ensemble Guadeloupe - Martinique - Guyane). Aucune autre exploitation régionale que celles précitées n'est possible. Pondérations spéciques pour les modules secondaires. Pour repérer les ménages pour lesquels une imputation a été réalisée, il y a la variable _drap 0 (sans objet), 1 (réponse), -1 (ne sait pas), -2 (refus de répondre). Quand il y a une incohérence entre la variable et la variable _drap associée, c'est qu'une imputation a été réalisée. Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 16 / 25

Sommaire Survol des enjeux théoriques Modèles linéaires Modèles non linéaires 1 Survol des enjeux théoriques 2 3 Modèles linéaires Modèles non linéaires Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 17 / 25

Modèles linéaires Modèles non linéaires Régression non pondérée Sous SAS PROC REG DATA = matable; MODEL y = x1 x2; RUN;QUIT; Sous STATA reg y x1 x2 Sous R summary(lm(y ~ x1+x2,data=matable)) ˆβ =(X X) 1 X Y ˆV ( ˆβ) =ˆσ 2 (X X) 1 avec ˆσ 2 = û û n p et û = Y X ˆβ Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 18 / 25

Modèles linéaires Modèles non linéaires Régression pondérée Sous SAS PROC REG DATA = matable; MODEL y = x1 x2; WEIGHT pond; RUN;QUIT; Sous STATA reg y x1 x2 [aweight=pond] Sous R summary(lm(y ~ x1+x2,data=matable,weights=pond)) ˆβ =(X W X) 1 X W Y avec W = Diag(w k ) ˆV ( ˆβ) =ˆσ 2 (X W X) 1 Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 19 / 25

Modèles linéaires Modèles non linéaires En tenant compte du plan de sondage Sous SAS PROC SURVEYREG DATA = matable; WEIGHT pond; MODEL y = x1 x2; RUN; STRATA pour dénir les strates CLUSTER pour dénir les grappes. Sous STATA reg y x1 x2 [pweight=pond] Ou pour dénir des plans de sondage plus complexes (grappes, clusters) : svyset [pweight=pond] svy: reg y x1 x2 Sous R library(survey) mondesign<-svydesign(ids=~0,strata=null, weights=~pond,data=matable) summary(svyglm(y ~ x1+x2,design=mondesign)) ids pour dénir les grappes, STRATA pour dénir les grappes. On obtient le même ˆβ qu'avec une PROC REG pondérée. L'estimateur de la variance est de la forme : ˆV ( ˆβ) = (X sw X s ) 1 G (X sw X s ) 1 G dépend du plan de sondage. Voir Le Guennec (2005). Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 20 / 25

Enquête Patrimoine Survol des enjeux théoriques Modèles linéaires Modèles non linéaires Variable d'intérêt : Le log du patrimoine brut Modèle 1 : régression non pondérée Modèle 2 : régression pondérée Modèle 3 : Avec la procédure SURVEYREG. Le sondage est stratié par ZAE notamment, mais l'information n'est pas disponible dans la base. On dénit dans la procédure un sondage à probabilités inégales. On ne tient pas compte d'autres traitements : le calage, les imputations. Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 21 / 25

Enquête Patrimoine Survol des enjeux théoriques Modèles linéaires Modèles non linéaires Variable d'intérêt : Le log du patrimoine brut Variable Modèle 1 Modèle 2 Modèle 3 Age 0, 16 (0,0078) 0, 14 (0,0077) 0, 14 (0,011) Age 2 Ouvrier spécialisé Ouvrier qualié Technicien Personnel de catégorie B Agent de maîtrise Personnel de catégorie A Ingénieur, cadre Personnel de catégorie C, D Employé Directeur général 0, 0012 (0,00007) 4, 46 (0,22) 5, 57 (0,21) 6, 60 (0,22) 6, 79 (0,23) 6, 83 (0,23) 7, 53 (0,22) 7, 79 (0,22) 5, 77 (0,22) 5, 49 (0,21) 8, 30 (0,26) 0, 00098 (0,00007) 4, 64 (0,20) 5, 86 (0,20) 6, 88 (0,21) 7, 13 (0,22) 7, 26 (0,22) 7, 71 (0,22) 7, 95 (0,21) 6, 00 (0,21) 5, 60 (0,19) 7, 95 (0,30) 0, 00098 (0,000096) 4, 64 (0,28) 5, 86 (0,27) 6, 88 (0,29) 7, 13 (0,29) 7, 26 (0,29) 7, 71 (0,29) 7, 95 (0,28) 6, 00 (0,29) 5, 60 (0,28) 7, 95 (0,40) Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 22 / 25

Modèles linéaires Modèles non linéaires Enquête Patrimoine - Modèle non linéaire (1/2) Variable Proc logistic Proc logistic pondérée Proc surveylogistic Poids normalisés Coe. OR Coe. OR Coe. OR Constante 0, 6099 (0,1274) 0, 5901 (0,1107) 0, 5901 (0,1516) CSP Ouvrier spécialisé 1, 71 (0,14) 0, 181 1, 86 (0,12) 0, 16 1, 86 (0,16) Ouvrier qualié 1, 00 0, 37 1, 10 0, 33 1, 10 (0,12) (0,11) (0,14) Technicien 0, 14 0, 87 0, 27 0, 76 0, 27 (0,15) (0,12) (0,17) Personnel de catégorie 0, 22 0, 80 0, 36 0, 70 0, 36 B (0,15) (0,13) (0,17) Agent de maîtrise ref. ref. ref. Personnel de catégorie 0, 62 1, 85 0, 40 1, 50 0, 40 A (0,15) (0,14) (0,18) Ingénieur, cadre 0, 70 2, 02 0, 37 1, 45 0, 37 (0,13) (0,12) (0,16) Personnel de catégorie 0, 79 0, 45 0, 94 0, 39 0, 94 C, D (0,14) (0,12) (0,16) Employé 1, 05 0, 35 1, 22 0, 30 1, 22 (0,12) (0,11) (0,14) Directeur général 0, 90 2, 46 0, 21 1, 23 0, 21 (0,26) (0,26) (0,40) 0, 16 0, 33 0, 76 0, 70 1, 50 1, 45 0, 39 0, 30 1, 23 Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 23 / 25

Modèles linéaires Modèles non linéaires Enquête Patrimoine - Modèle non linéaire (2/2) Variable Proc logistic Proc logistic pondérée Proc surveylogistic Poids normalisés Coe. OR Coe. OR Coe. OR Taille de l'uu Commune rurale 1, 53 4, 63 1, 49 4, 42 1, 49 4, 42 (0,08) (0,072) (0,10) UU de moins de 5 000 0, 88 2, 41 0, 84 2, 32 0, 84 2, 32 hbts (0,12) (0,11) (0,14) UU de 5 000 à 9 999 0, 67 1, 95 0, 55 1, 74 0, 55 1, 74 hbts (0,12) (0,11) (0,15) UU de 10 000 à 19 0, 49 1, 63 0, 51 1, 66 0, 51 1, 66 999 hbts (0,11) (0,10) (0,14) UU de 20 000 à 49 0, 11 1, 11 0, 065 1, 067 0, 065 1, 07 999 hbts (0,10) (0,095) (0,13) UU de 50 000 à 99 0, 051 0, 95 0, 062 0, 94 0, 062 0, 94 999 hbts (0,10) (0,095) (0,11) UU de 100 000 à 199 0, 12 1, 13 0, 11 1, 12 0, 11 1, 12 999 hbts (0,11) (0,096) (0,13) UU de 200 000 à 1 ref. ref. ref. 999 999 hbts UU de Paris 0, 31 (0,079) 0, 74 0, 42 (0,071) 0, 65 0, 42 (0,094) Age Moins de 30 ans 2, 01 (0,13) 0, 13 1, 98 (0,099) 0, 14 1, 98 (0,16) 30-40 ans 0, 59 0, 56 0, 54 0, 58 0, 54 (0,085) (0,072) (0,097) 40-50 ans ref. ref. ref. 50-60 ans 0, 58 1, 78 0, 48 1, 62 0, 48 (0,082) (0,074) (0,092) Plus de 60 ans 0, 87 2, 38 0, 80 2, 22 0, 80 (0,070) (0,064) (0,083) 0, 65 0, 14 0, 58 1, 62 2, 22 Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 24 / 25

Quelques remarques sur les logiciels Modèles linéaires Modèles non linéaires Les estimateurs peuvent être très diérents. Quels critères statistiques pour le choix du modèle, pondéré ou non pondéré? La multiplication de la variance par (1 f) est optionnelle. Est-ce là introduire une hypothèse de sur-population avec une perspective sondages? Analyse possible par domaine dans SAS et Stata. Plusieurs méthodes pour le calcul de variance dans Stata : taylor linearized, bootstrap, jackknife, balanced repeated replicate, successive dierence replicate. Stata permet de tenir compte de la poststratication mais que faire quand les strates de tirage ou de poststratication ne sont que partiellement connues? Marine GUILLERM et Ronan LE SAOUT Econométrie des données d'enquête 24 Novembre 2014 25 / 25