L échantillonnage des enquêtes ménages - hors Emploi et DOM - Enquêtes et Sondages - CNAM - UE STA 108 Sylvie Rousseau 12/01/07
Sommaire I. Les principes généraux II. La principale base de sondage : l échantillon-maître III. L échantillonnage d une enquête 2
I. Principes généraux I.1. Objectif d une enquête-ménages I.2. Cadre institutionnel I.3. Définition d un ménage I.4. L unité d échantillonnage I.5. Principes d échantillonnage I.6. Modes de collecte 3
I.1. Objectif d une enquête-ménages Fournir de l information sur la population pour éclairer le débat social Exemples : un seuil de revenu ; la proportion de locataires ; l état de santé moyen de la population ; 4
I.2. Cadre institutionnel Programme d enquêtes annuel visé par le Conseil National de l information Statistique (publié au JO). Le CNIS assure la concertation entre les producteurs et les utilisateurs de statistiques publiques. Enquêtes «d'intérêt général et de qualité statistique», ayant successivement reçu : Avis d'opportunité : l'enquête répond à un besoin d'intérêt public, elle ne fait pas double emploi avec d'autres sources statistiques ; Avis de conformité attestant de la qualité de l'opération. Loi sur le secret statistique (1951) Loi "Informatique et libertés" (1978) 5
I.3. Définition d un ménage ménage-logement» : ensemble des personnes habitant le même logement au titre de leur résidence principale «ménage-unité de vie» : ensemble des personnes partageant la même résidence habituelle et le même budget 6
I.4. L unité d échantillonnage C est le logement «ordinaire» En l absence de registres de population Grâce au recensement de la population et au suivi de la construction neuve On construit des échantillons de logts ordinaires On atteint les ménages et/ou les individus par l'intermédiaire de leur logement 7
I.5. Principes d échantillonnage Echantillons probabilistes de logements Tous les logements principaux possèdent la même probabilité de participer à l enquête i.e. chaque logt tiré représente w ménages Ex : w 2 000 pour une enquête de taille 10 000 à moins de viser davantage certaines populations Un même logt ne peut-être interrogé pour des enquêtes distinctes entre deux recensements 8
I.6. Modes de collecte Enquêtes généralement en face à face Quelques enquêtes par téléphone Camme, ré-interrogations Loyers et Charges Coûts de collecte Stabilité du réseau d'enquêteurs localisation de l échantillon 9
Conclusion Tirage des échantillons en 2 temps 1 ère phase de localisation des enquêtes, i.e. tirage de bases de sondage intermédiaires: l Echantillon-Maître (EM99) pour les logts recensés en 1999 La Base de Sondage des Logements Neufs (BSLN) pour les logements construits après mars 1999 10 2 ème phase de tirage des échantillons des enquêtes dans ces 2 bases de sondage intermédiaires
II. La principale base de sondage: l Echantillon-Maître (EM) Entre contraintes pratiques et désir de précision Etablir une réserve de logements localisée pour alimenter la plupart des enquêtes ménages hors DOM, enquête Emploi, enquêtes locales, Optimiser la précision des résultats nationaux 11
12
1. Taille de l EM99 2 022 889 logements 7 % des logts recensés en mars 99 Réserve calibrée dans l optique des prévisions suivantes : 10 enquêtes nationales par année, de 10 000 ménages chacune en moyenne, pendant 6 ans (d octobre 2001 à fin 2007) 13
2. Constitution de l EM99 L EM s obtient selon un tirage stratifié à 1 ou 2 degrés selon la strate 14
Stratification Communes rurales =>UP UU de moins de 20000 habitants UU de 20000 à 100000 habitants UU de plus de 100000 habitants UU de Paris Choix d'up Choix d'up Choix d'up UP rurales UP "petit urbain" UP "moyen urbain" Choix de districts Choix de districts Choix de districts Exhaustif en logements districts de strate 2 districts de strate 3 districts de strate 4 EM 15
a. Stratification quadrillant le territoire selon les régions et la densité d habitat Collecte des enquêtes en Direction Régionale Le degré d urbanisation explique assez bien le comportement des ménages (ex : logement, conditions de vie, ) Cette stratification est un élément de qualité 16
87 strates de tirage Strate de gestion Nombre de communes* au RP 99 Nombre d unités urbaines au RP 99 Nombre de régions 0 30 611-22 1 3 167 1 762 22 2 1 097 180 22 3 1 294 52 20 4 396 1 1 Total 36 565 1 995 87 * : tous arrondissements compris 17
Stratification Communes rurales =>UP UU de moins de 20000 habitants UU de 20000 à 100000 habitants UU de plus de 100000 habitants UU de Paris Choix d'up Choix d'up Choix d'up UP rurales UP "petit urbain" UP "moyen urbain" Choix de districts Choix de districts Choix de districts Exhaustif en logements districts de strate 2 districts de strate 3 districts de strate 4 EM 18
b. Localisation des enquêtes dans des UP (i) Définition des UP En strates 0, 1 et 2, une UP correspond au rayon d action d un enquêteur En strates 2, 3 et 4 une UP = une UU 19
20 b. Localisation des enquêtes dans des UP (i) Définition des UP En strate 0, une UP est formée de : - une ou plusieurs communes rurales contigües -situées dans la même région -où résident des ménages au profil de revenu voisin - ayant entre 1 800 à 3 600 logements principaux plus de 30 000 communes rurales regroupées en 2 227 UP En strate 1, une UP est formée de : - de 1 ou 2 UU proches de la même région - de profil de revenu moyen le plus semblable possible -d au moins 1 800 logements principaux
21 b. Localisation des enquêtes dans des UP (ii) Calibrage des UP réserve minimale En strates 0, 1 et 2, chaque UP contient au moins 30 10 6 = 1800 logements 1 UP = 1 enquêteur 10 enquêtes /an pendant 6 ans 30interviews Dans les strates 2, 3 et 4 : UP de plus de 20000 habitants (tirage d US)
b. Localisation des enquêtes dans des UP (ii) Calibrage des UP allocations d UP Dans une des strates 0, 1 ou 2 d une région donnée de taille 400 000 logts par exemple, on retiendra : 400000 1 = 10 UP 2000 20 On enquête environ 1 UP = 1 enquêteur 1 logement sur 2000 20 interviews 22
b. Localisation des enquêtes dans des UP (ii) Calibrage des UP allocations d UP Dans les strates 3 et 4, toutes les UP sont retenues et impactées avec un taux de sondage moyen de 1/2000 Unité Urbaine Nombre d'habitants Nombre de logts principaux Nombre de FA Nombre d enquêteurs Angoulême 100 000 46 000 23 1 Reims 215 000 94 000 47 Nantes 500 000 234 000 117 Lille 1 001 000 388 000 194 2 4 7 Paris 9 644 507 4 039 349 2 020 80 23
b. Localisation des enquêtes dans des UP (iii) Tirage des UP Stratifié dans 66 strates de tirage croisant 22 régions et les 3 strates de gestion 0, 1 et 2 A probabilités inégales des UP proportionnellement à leur nombre de résidences principales dans la strate de tirage Equilibré sur des critères de revenu et d'âge au niveau de groupes de régions revenu net total imposable (source DGI 1996) effectifs des 3 tranches d'âges [0,19], [20,59] et [60,+] ans (source RP99) 24
Stratification Communes rurales =>UP UU de moins de 20000 habitants UU de 20000 à 100000 habitants UU de plus de 100000 habitants UU de Paris Choix d'up Choix d'up Choix d'up UP rurales UP "petit urbain" UP "moyen urbain" Choix de districts Choix de districts Choix de districts Exhaustif en logements districts de strate 2 districts de strate 3 districts de strate 4 EM 26
c. Choix de districts dans les UP retenues de plus de 20 000 habitants Uniquement en strates de gestion 2, 3 et 4 Tirage stratifié par groupes de communes pour garantir la dispersion géographique des districts Tirage à probabilités égales des districts dans l UU (ex : 1 district sur 20 en strates 3 et 4) Tirage équilibré sur l UU par la méthode du Cube sur les critères de revenu et d âge 27
Stratification Communes rurales =>UP UU de moins de 20000 habitants UU de 20000 à 100000 habitants UU de plus de 100000 habitants UU de Paris Choix d'up Choix d'up Choix d'up UP rurales UP "petit urbain" UP "moyen urbain" Choix de districts Choix de districts Choix de districts Exhaustif en logements districts de strate 2 districts de strate 3 districts de strate 4 EM 29
d. Désignation des logts retenus dans l EM Strates 0 et 1 : tous les logts des UP tirées Strates 2, 3 et 4 : tous les logts des US sélectionnées dans les UP tirées 30
31
Ile de France 32
33 Bretagne
Quelques données numériques sur l'echantillon-maître Strate 0 Strate 1 Strate 2 Strate 3 Strate 4 Total Nombre d UP au RP99 2 227 975 180 52 1 3 435 Nombre d UP-EM 128 75 93 52 1 349 Nombre de communes EM Nombre total de logements RP99 Nombre total de logements EM Proportion de logements EM 2 018 284 610 1317 415 4 644 7 382 976 4 934 454 3 839 7 988 4 549 934 28 696 693 099 156 451 776 444 978 497 962 399 845 228 328 2 022 889 6 9 13 5 5 7
Remarque En vue du tirage des enquêtes dans l EM (qui obéit à un plan stratifié par groupes de communes), on a construit des groupes de communes en strates 0 et 1, avec : - une commune en strate 1 - un regroupement de communes rurales d au moins 100 logements en strate 0 35
III. Echantillonnage d une enquête 36 On échantillonne surtout des logements recensés comme principaux On sélectionne également des résidences secondaires, occasionnelles ou vacantes au RP99 pour tenir compte des changements intervenus depuis 1999 On tire des logements neufs avec la même probabilité que les principaux (i.e. tous possèdent la même pondération)
III. Echantillonnage d une enquête Des enquêtes impactent davantage certaines catégories de populations 1/2 1/3 2/3 1/1 37 Mais après tirage de l échantillon d une telle enquête, l EM doit continuer d être «représentatif» pour les enquêtes ultérieures Tirage en 2 phases 1) Tirage de S 1 (n 1 > n ) dans l EM, à probas égales 2) Tirage de S 2 dans S 1 de taille n, à probas inégales Enfin marquage dans l EM des unités de S 1
III. Echantillonnage d une enquête On impacte toutes les UP de l EM Plan stratifié par groupes de communes Tirage systématique des logts, dans chaque strate, sur un fichier trié par catégorie de logt au RP Si besoin, tirage en 2 phases 38
39
Conclusion et perspectives Le contexte du nouveau recensement Enjeux organisationnels et choix méthodologiques Choix des critères de stratification Zones d emploi, activités économiques dominantes, Prix du locatif, proximité à des équipements, D autres modes de collecte Internet, téléphone De nouveaux besoins Panel de ménages, enquêtes locales 40
Bibliographie www.cnis.fr www.insee.fr L'échantillon maître de 1999 et application au tirage des unités primaires par la macro "Cube", L.Wilms, Journées de Méthodologie Statistique, 2002. La correction de la non-réponse par repondération et par imputation, N.Caron, Document de travail n M0502, http://www.insee.fr/fr/nom_def_met/methodes/doc_travail/docs_ doc_travail/m0502.pdf Techniques de sondage, P.Ardilly, Technip, 2006 La méthode de partage des poids, P. Lavallée, Dunod, 2004 41