La nouvelle planification de l échantillonnage



Documents pareils
Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Famille multirésidence : recensement et sources alternatives

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

La diffusion des résultats statistiques du recensement de la population

Les Français et le chauffage. Résultats de l étude menée

Théorie des sondages : cours 5

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Sociologie des joueurs en ligne

COMPTE EPARGNE-TEMPS. En application du décret n du 29 avril 2002 portant création du CET dans la fonction publique de l Etat 1/11

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Chapitre 3 : INFERENCE

La qualité des services mobiles en France métropolitaine

Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet

Collecte Nicole Cadenel 12/11/2014

Aspects théoriques et algorithmiques du calcul réparti L agglomération

ECTS CM TD TP. 1er semestre (S3)

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Observatoire Economique et Statistique d Afrique Subsaharienne

Annexe commune aux séries ES, L et S : boîtes et quantiles

TABLE DES MATIERES. C Exercices complémentaires 42

Principe d un test statistique

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Séance 4. Gestion de la capacité. Gestion des opérations et de la logistique

Introduction à l approche bootstrap

Le recensement, c est quoi? campagne 2011

Brock. Rapport supérieur

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Structure typique d un protocole de recherche. Préparé par Johanne Desrosiers dans le cadre d une formation au réseau FORMSAV

Echantillonnage Non uniforme

Associations Dossiers pratiques

Table des matières. I Mise à niveau 11. Préface

CAISSE REGIONALE DU CREDIT AGRICOLE MUTUEL D AQUITAINE

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Les allocataires des minima sociaux: CMU, état de santé et recours aux soins

données en connaissance et en actions?

VENTILATION POUR LE CONFORT D ETE

NOTE D INFORMATION n 01 Janvier 2014

Évaluations aléatoires : Comment tirer au sort?

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Le patrimoine des ménages retraités : résultats actualisés. Secrétariat général du Conseil d orientation des retraites

TP N 57. Déploiement et renouvellement d une constellation de satellites

Santé des TPE face à la crise

FOURNITURE DE 23 VÉHICULES LÉGERS OU UTILITAIRES POUR LES SERVICES DE CHAMBÉRY MÉTROPOLE. Cahier des charges. Barberaz. Barby.

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Stratégie de moyens digitaux, création d outils de communication on-line et d achat d espaces publicitaires on-line pour la Monnaie de Paris

Les groupes de médecine familiale (GMF) Sondage Omniweb. Dossier septembre 2012

E-ASSURÉS RECHERCHE LE PROFIL DES PERSONNES ASSURANCE SANTÉ DES A LA SUR INTERNET D UNE PUBLIÉ PAR. 2 e ÉDITION

Solution logicielle IDEA

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

Études épidémiologiques analytiques et biais

Anticiper la gestion d'un séisme dommageable Anticipare la gestione dei danni di un terremoto

Lambotte J.-M. Géographe-Urbaniste. Chercheur au Lepur ULg. Semaine Universitaire Luxembourgeoise de l'environnement - Libramont

Cet article s attache tout d abord

La prise en compte des revenus du patrimoine dans la mesure des inégalités

POINTS DE VUE DES CANADIENS SUR LA COUVERTURE DES MÉDICAMENTS D ORDONNANCE

Développements récents de la méthode des scores de la Banque de France

IFT3245. Simulation et modèles

MATHÉMATIQUES. Mat-4104

Les chefs d entreprises de PME-PMI face à la propriété industrielle

Focus. Lien entre rémunération du travail et allocation de chômage

Statistique : Résumé de cours et méthodes

RAPPORT FINAL. Étude sur la littératie financière chez les jeunes POR #

Statistiques Descriptives à une dimension

MODÈLE CROP DE CALIBRATION DES PANELS WEB

E-ASSURÉS RECHERCHE LE PROFIL DES PERSONNES ASSURANCE SANTÉ DES A LA SUR INTERNET D UNE PUBLIÉ PAR. 23 e ÉDITION

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Bulletin de service Bureaux d agents, de courtiers en immeubles et d évaluateurs de biens immobiliersetdes autres activités liées à l immobilier

La mesure des prix dans les domaines de la santé et de l action sociale : quelques problèmes méthodologiques

Le point sur les marchés des pensions. des pays de l OCDE OCDE

Table des matières: Guidelines Fonds de Pensions

Resolution limit in community detection

Baromètre des professions Février 2015

Réunion d information sur la formation professionnelle continue

Recommandation de RECOMMANDATION DU CONSEIL. concernant le programme national de réforme du Luxembourg pour 2015

L évolution des modes de communication, comment adapter les enquêtes en population générale? L expérience de l enquête KABP VIH/sida 2010

Prix du gaz et de l électricité dans l Union européenne en 2011

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

DISPOSITIF EN FAVEUR DU POUVOIR D ACHAT DES FONCTIONNAIRES GIPA 2008

Base de données sociales sur Paris

note d Temps de travail des enseignants du second degré public : pour une heure de cours, une heure de travail en dehors 13.13

Quelques mots sur la méthodologie utilisée pour le suivi des diplômés de Master

1. Vocabulaire : Introduction au tableau élémentaire

INTRODUCTION. Cadre d évaluation de la qualité des données (CEQD) (juillet 2003)

Avis du Comité consultatif du secteur financier. sur l équivalence du niveau de garantie en assurance emprunteur

S informer sur. Les obligations

FICHE SIGNALETIQUE. Cœur de Flandre. 1. Profil Territoire. 2 Profil Fiscal

Âge effectif de sortie du marché du travail

Transcription:

La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages

Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage issue du RP Les nouvelles contraintes liées aux NCEE Les adaptations nécessaires de l échantillonnage 2

Principe du nouveau Recensement (1) Recensement en continu => base de sondage rafraîchie d année en année Création de cinq groupes de rotation du RP : chaque année, un seul groupe est impacté par le Recensement Distinction entre petites et grandes communes Petites communes : - Chaque petite commune est affectée aléatoirement à l un des cinq groupes de rotation du RP - Une année donnée, toutes les communes du groupe de rotation impacté sont recensées exhaustivement 3

Principe du nouveau Recensement (2) Distinction entre petites et grandes communes Grandes communes : Dans une grande commune donnée, répartition aléatoire des adresses entre les cinq groupes de rotation du RP Au bout d un cycle de 5 ans de RP : Recensement exhaustif des logements des petites communes Recensement d environ 40% des logements des grandes communes 4

Unités primaires = les zones d action enquêteur (1) Mise en place d un échantillon maître Comment construire les ZAE? Réaliser une partition du territoire Fraîcheur : chaque ZAE doit contenir des logements des 5 groupes de rotation (GR) du RP Volume : chaque GR doit comporter au moins 300 résidences principales Respect des limites régionales Étendue géographique la plus faible possible 5

Unités primaires = les ZAE (2) Distinction entre petites et grandes communes : En petites communes : - Une ZAE est constituée de plusieurs petites communes - Une ZAE comporte au moins une commune de chaque GR - Algorithme déterministe pour construire les ZAE de manière à minimiser leur étendue En grandes communes : - Une grande commune = une ZAE - Une ZAE comporte bien des logements de chaque GR Résultat : 3 832 ZAE dont : 2 898 ZAE «petites communes» (PC) 934 ZAE «grandes communes» (GC) 6

Unités primaires = les ZAE (3) Exemple de ZAE PC contiguë Z17434 7

Unités primaires = les ZAE (4) Exemple de ZAE PC non contiguë Z85046 vague 1 2 3 4 5 8

Tirage de 1er degré (1) Objectif du tirage des ZAE (i.e. constitution de l Echantillon-Maître) : concentrer le tirage des échantillons pour 1. Diminuer les coûts de collecte 2. Embaucher un réseau d enquêteurs fixe Méthodologie : Allocation : 567 ZAE Probabilités d inclusion proportionnelles au nombre de résidences principales d après le RP 1999 Stratification par région avec allocations proportionnelles Equilibrage sur le nombre total de résidences principales, le revenu fiscal total et la taille d unité urbaine 9

Tirage de 1er degré (2) Résultat : 567 ZAE qui forment l Echantillon-Maître : 286 ZAE PC 281 ZAE GC dont 80 ZAE dites «exhaustives» (probabilité d inclusion égale à 1) Illustration : ZAE de l EM en PACA Répartition géographique des ZAE non uniforme problème pour la collecte en cas d absence d un enquêteur sur sa zone 10

Calage des poids de sondage des ZAE de l EM Poids de sondage initial = inverse de la probabilité d inclusion de la ZAE calculée au moment du tirage des ZAE en 2007, d après les données du RP 1999 Les ZAE de l EM sont représentatives de la population au 01/01/1999 Chaque campagne de Recensement rafraîchit la base de sondage => nécessité de caler l échantillon de ZAE EM sur la dernière campagne de Recensement En utilisant les poids calés, les ZAE EM sont représentatives de la base de sondage mise à jour 11

Tirage de 2nd degré : les logements (1) Base de sondage annuelle = les résidences principales appartenant : 1. Aux ZAE de l EM 2. Et au groupe de rotation correspondant à la campagne de Recensement la plus récente Exception : certaines enquêtes particulières sont tirées dans un cycle complet du RP. Ex. «Cadre de vie et sécurité» 12

Tirage de 2nd degré : les logements (2) Méthodologie du tirage des logements Tirage à deux degrés : calcul d allocations par ZAE permettant de minimiser la dispersion des poids de sondage = allocations théoriques Pour les ZAE PC : Pour les ZAE GC : W log = ω * PC ZAE calé ZAE N n GRi ZAE ZAE W log GC ZAE = ω calé ZAE * Nˆ n GRi ZAE ZAE 13

Tirage de 2nd degré : les logements (3) Méthodologie du tirage des logements Possibilité de mettre des bornes min et max pour prendre en compte la charge des enquêteurs Tirage systématique dans chaque ZAE Tirage en deux phases dans le cas d enquêtes à champs restreints ou à sous/sur représentations (stratification) 14

Les nouvelles conditions d emploi des enquêteurs (NCEE) Le nouveau cadre prévoit de : 1. Connaître la charge d enquête pour l ensemble des enquêtes qui seront sur le terrain l'année N dès la fin du 1 er semestre de l'année N-1 2. Estimer pour chaque enquêteur la charge de travail induite et vérifier qu elle est compatible avec sa quotité annuelle préalablement fixée => À partir de 2013, les allocations par ZAE pour les enquêtes de l'année N doivent être calculées au 2 ème trimestre de l année N-1 15

L impact des NCEE en amont de la collecte (1) Pour les enquêtes collectées au 1er semestre 2015, aucun changement par rapport aux années précédentes : Tirage des échantillons aux mois de mai et juin 2014 dans la campagne RP 2013 (disponible depuis février 2014) En effet, on ne dispose pas d une base de sondage plus «fraîche» avant le début de la collecte 16

L impact des NCEE en amont de la collecte (2) Pour les enquêtes collectées au 2nd semestre 2015 : Tirage des échantillons aux mois de mai et juin 2015 dans la campagne RP 2014 (disponible depuis février 2015) => on utilise la base de tirage la plus «fraîche» possible Problème : les allocations de FA par ZAE doivent être connues au mois de juin 2014 pour les enquêtes sur le terrain en 2015 17

Solution : anticiper les allocations par ZAE Pour une enquête donnée, les allocations par ZAE dépendent : de la taille de l échantillon de la taille de la ZAE (nombre total de résidences principales ou effectifs dans le champ de l enquête, d après la dernière campagne de Recensement) du poids de sondage de la ZAE Pour les enquêtes collectées au 2nd semestre de l année N, il s agit de s approcher des allocations théoriques qui seraient tirées dans la campagne RP N-1 : à partir des tailles des ZAE connues dans une ancienne campagne RP et des poids de sondage associés 18

Quel millésime de campagne RP utiliser? (1) La campagne de Recensement connue la plus récente? Idée : anticiper les allocations à tirer dans la campagne N à partir des effectifs présents dans la campagne N-1 Avantage : donne la représentation des ZAE la plus récente, i.e. correspondant le mieux à la représentation présente des ZAE dans la population Inconvénient : grandes disparités entre les groupes de rotation du RP au sein d une même ZAE - Entre deux campagnes successives, le ratio du nombre de logements dépasse les 3 fois pour plus de la moitié des ZAE - La moitié des ZAE «PC» ont été contraintes au moins une fois à la borne supérieure et au moins une fois à la borne inférieure pour les 4 dernières campagnes RP 19

Quel millésime de campagne RP utiliser? (2) La dernière campagne de Recensement qui correspond au même groupe de rotation? Idée : anticiper les allocations à tirer dans la campagne N à partir des effectifs présents dans la campagne N-5 Pour les ZAE PC, la campagne N-5 correspond aux mêmes communes que la campagne N Hypothèses : A cinq ans d intervalle, les tailles relatives des communes ne sont pas bouleversées et leurs caractéristiques (tranches d âge, PCS, ) non plus 20

Comparaison des solutions envisagées (1) Les allocations «anticipées» s écartent-elles des allocations théoriques issues du tirage? Calcul par ZAE de l écart relatif entre allocations théoriques et «anticipées» Comparaison «toutes choses égales par ailleurs» (poids de sondage initiaux utilisés dans tous les cas) entre le calcul d allocations : via la campagne RP N-1 via la campagne RP N-5 21

Comparaison des solutions envisagées (2) Simulation d un échantillon en 1 phase de 30 000 logements, tirés dans l Echantillon-Maître : Allocations théoriques du tirage dans la campagne RP N = 2013, avec les poids de sondage initiaux des ZAE Allocations «anticipées» calculées à l aide des poids de sondage initiaux des ZAE, depuis : - la campagne RP N-1 = 2012 - la campagne RP N-5 = 2008 Ecart relatif calculé : Ecart relatif ZAE ( Allocation anticipée ) ( Allocation théorique ZAE = Allocation théorique ZAE ZAE ) 22

Comparaison des solutions envisagées (3) Résultats A partir de la campagne RP N-1 = 2012 23

Comparaison des solutions envisagées (4) Résultats A partir de la campagne RP N-5 = 2008 24

Comparaison des solutions envisagées (5) A cinq ans d intervalle, les tailles relatives des ZAE, pour un même groupe de rotation, évoluent peu La campagne N-5 permet de bien anticiper la taille des ZAE pour la campagne N La campagne N-5 est donc bien meilleure pour estimer les allocations par ZAE 25

Quel jeu de poids utiliser? Printemps 2014 : Calcul anticipé des allocations pour les enquêtes du 2nd semestre 2015 (tirage dans la campagne RP 2015) La campagne RP 2015 n est pas encore disponible => les poids des ZAE calés sur la campagne 2015 n existent pas Recourir aux poids de sondage initiaux des ZAE? Ou recourir aux poids des ZAE calés sur la campagne N- 5 = 2010? 26

Comparaison des solutions envisagées (1) Quel est l effet, «toutes choses égales par ailleurs», des pondérations utilisées sur la qualité des allocations? Pour un tirage de 30 000 logements dans la campagne RP 2013, comparaison entre les allocations : calculées à partir des poids calés sur la campagne 2013, i.e. les allocations théoriques calculées à partir de pondérations plus anciennes, i.e. les allocations «anticipées» i. les poids de sondage des ZAE calés sur la campagne RP N-5 = 2008 ii. les poids de sondage initiaux des ZAE 27

Comparaison des solutions envisagées (2) Résultats : calculs par ZAE des écarts relatifs entre allocations théoriques et «anticipées» Quantile Minimum 25% Médiane 75% Maximum 0 Poids de sondage initiaux -0.8333333-0.0769231 0.0588235 1.0869565217 Poids de sondage calés campagne RP 2008-0.5833333-0.3577236-0.0487805 0.1875000 7.2608696 28

Comparaison des solutions envisagées (3) Conclusion : les allocations calculées à l aide des poids calés sur la campagne RP N-5 peuvent être très éloignées des allocations théoriques Les calages des ZAE pour les campagnes RP 2008 et 2013 ont mené à des poids calés parfois très variables Paramètres de calage différents entre les campagnes RP 2008 et 2013 : choix de bornes LO et UP différentes variables de calage différentes Impact des franchissements de seuil de certaines communes 29

Méthode de calcul anticipé d allocations Décision : calculer les allocations pour les enquêtes du 2nd semestre 2015, tirées dans la campagne RP 2014 : en utilisant les effectifs par ZAE recensés dans la campagne N-5 = 2009 et les poids de sondage initiaux des ZAE Comme avant l entrée en vigueur des NCEE : borner les allocations afin de ne pas sous/surcharger des enquêteurs 30

Tirage des échantillons Enquêtes du 1er semestre 2015 : tirage des échantillons - en mai/juin 2014 - dans la campagne RP 2013 - allocations directes du tirage, minimisant la dispersion des poids de sondage des logements sous contraintes (i.e. utilisant les poids des ZAE calés sur le RP 2013) Enquêtes du 2nd semestre 2015 : tirage des échantillons - en mai/juin 2015 - dans la campagne RP 2014 - allocations anticipées (calculées en mai/juin 2014 dans la campagne RP 2009, en utilisant les poids de sondage initiaux des ZAE) = paramètres exogènes du tirage 31

Merci de votre attention! Contact M. Pierre-Arnaud Pendoli Tél. : 01 41 17 50 57 Courriel : pierre-arnaud.pendoli@insee.fr Insee 18 bd Adolphe-Pinard 75675 Paris Cedex 14 www.insee.fr Informations statistiques : www.insee.fr / Contacter l Insee 09 72 72 4000 (coût d un appel local) du lundi au vendredi de 9h00 à 17h00