La méthode de recensement le calcul des populations et la précision F.Dupont 14 mai séminaire INED le recensement rénové de la population Page 1
Contenu de l exposé Rappel du plan de sondage Estimation : le calcul des pondérations Exploitation statistique Précision et qualité Page 2
Rappel du plan de sondage Page 3
Rappel du plan de sondage Population et variables du principal Ménages (plus de 98 % de ( population la Communautés (internats, maisons de 2% ( retraite Habitations mobiles et sans-abris 0.01% Communes de moins de 10 000 habitants exhaustive tous les 5 ans exhaustive tous les 5 ans exhaustive tous les 5 ans Communes de 10 000 habitants et plus par échantillon sur le cycle de 5 ans ( année (8 % chaque exhaustive tous les 5 ans (dates différentes selon les ( communes exhaustive tous les 5 ans (simultanément pour toutes les ( 2011 communes : 2006, puis Page 4
Rappel du plan de sondage ( d habitants Communes -10 000 h ( 30 millions Echantillon de communes ( ans (1/5ème tous les Equilibré au niveau régional sur variables RP 1999 Nombre de logements en collectif Critères démographiques Nombre de logements Sexe âge 5 tranches Population des départements couvre ménages + communautés + mobiles et sans abris l'équilibrage est robuste sur 1990-1999 Page 5
Rappel du plan de sondage (exemple du Bas-Rhin) "communes 2004«(moins de 10 000 habitants) Haguenau "communes 2005" (moins de 10 000 habitants) Saverne "communes 2006" (moins de 10 000 habitants) Strasbourg "communes 2007" (moins de 10 000 habitants) "communes 2008" (moins de 10 000 habitants) Communes concernées chaque année (10 000 habitants ou plus) Sélestat Page 6 En 2009, on recommence
Communes +10 000 ( 30 millions ( d hab Ménages Echantillon d adresses d issu du RIL (sauf( ( dom Environ 8% des logements enquêtés chaque année Sans recouvrement sur 5 ans Adresses neuves d une année vue sur 5 ans Grandes adresses vues sur 5 ans si pas de changement de seuil Pour la population hors ménage Sans abris tous les 5 ans à partir de 2006 Communautés : tous les 5 ans Page 7
Echantillon issu du Ril Initialisation des 5 groupes en 2004 Petites adresses équilibrées sur variables RP 1999 nombre de logement nombre de logements collectifs/individuels cinq tranches d âge Sexe Tirage annuel dans le groupe de l'année Petites adresses équilibrées sur variables nombre de logement nombre de logements collectifs/individuels Nombre de logement au sein de chaque iris Taux de sondage en adresse tel que le nombre global de logement est le plus proche possible de 40% Page 8
Un répertoire d adresses R.I.L réparti en 5 groupes disjoints dans lesquels sont tirés les échantillons Page 9
Au terme de 5 ans, on obtient environ 40% de logements : %communes 20,0% 18,0% 16,0% 14,0% 12,0% 10,0% 8,0% 6,0% 4,0% 2,0% 0,0% < 38% > 42% Page 10 %logements
l estimation : le calcul des poids Page 11
Les grandes lignes de l estimation Les principes ( municipale ) Population statistique = Population légale Populations ramenées à l'année médiane cette année : 01/01/2006 Concrètement on prend le fichier de données des collectes de 2004 à 2008 que l on pondère : 3 niveaux : Logement Individu Famille Page 12
Les grandes lignes de l estimation Pour toutes les communes Tous les individus d un logement ont le même poids Tous les individus d une même famille ont le même poids En grande commune tous les individus d une même adresse ont le même poids En petite commune enquêtée en 2004 et 2005 (extrapolée) tous les poids des individus (resp logements) de la commune ne sont pas égaux Enquêtée en 2006,2007,2008 les poids des individus sont égaux Page 13
Le calcul des poids 1. Communes de plus de 10 000 h 1.1 Ménages Population Nombre moyen de personne par logement Appliqué au nombre total de logement de l'année médiane 2006 ( iris ) Au niveau infra communal Poids Poids sondage x nombre logement Ril médian nombre logement estimé sur l'échantillon avec poids sondage ( 2006 Ril médian 2006 = Ril 2005 (juillet2005)+ril 2006(juillet 2 Page 14
Le calcul des poids ( 01/03/2006 1.2 Communautés (référence si enquêtées en 2004 ou 2005 ( 0 Suppression des comunautés fermées en 2006 (poids Ajout des communautés crées depuis la collecte et avant 2006 imputation ( 1 par clonage des données non collectées (clonage env 8 000pers) (poids si enquêtées en 2006 ( poids1 ) Données de la collecte Page 15
La population des ménages Communes de moins de 10 000 habitants Extrapolation du nombre de logements commune enquêtée en 2004 1000 950 900 924 975 850 858 800 1999 2000 2001 2002 2003 2004 2005 2006 logements recensés logements selon la TH Page 16
La population des ménages Communes de moins de 10 000 habitants Pour passer du nombre de logements au nombre de personnes, on tient compte de la baisse tendancielle de la taille des ménages Nombre moyen de personnes par ménage 3,4 3,2 3 2,8 2,6 2,4 2,2 2 1962 1968 1975 1982 1990 1999 2004 Source : Insee, recensements de la population Page 17
Le calcul des poids ( 01/03/2006 1.2 Communautés (référence si enquêtées en 2007 ou 2008 On travaille communauté par communauté pour obtenir une donnée de ( interpolation ) population intermédiaire entre 1999 et collecte Si la communauté est ouverte en 2007 et 2008 on pondère la collecte par ( 2007/pop2006 pop 2008/pop2006 ou pop Page 18 Si la communauté existait en 1999 et qu elle est fermée en 2008 ou en 2007. On obtient un peu de population : elle compte pour 2/9 ou 1/8 de sa population de 1999. Les individus sont clonés pour obtenir des variables. ( concernés (Env 14 000 individus
La population des ménages Communes de moins de 10 000 habitants Rétropolation de la population des ménages commune enquêtée en 2008 1050 1000 950 976 1010 900 850 858 800 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 population recensée Page 19
Le calcul des poids 1.3 habitations mobiles et personnes sans abris enquêtées en 2006 Données de la collecte Données seront maintenues constantes jusqu'en 2011 nouvelle collecte Poids de 1 Page 20
Page 21 Le calcul des poids 2. Communes de moins de 10 000 h 2.1 Communautés même méthode qu'en grande commune 2.2Habitations mobiles et personnes sans abris même méthode qu'en grande commune 2.3 Ménages si enquêtées en 2006 ( poids1 ) Données de la collecte si enquêtées en 2007 ou 2008 Données de la collecte pondérée pour obtenir une donnée intermediaire entre 1999 et collecte très proche de la collecte (ex poids = pop 2008/pop2006 ( pop2008-pop1999 ) et pop 2006=pop2008-2/9
Le calcul des poids si enquêtées en 2004 ou 2005 Extrapolation de la population collectée en 2004 ou 2005 grâce à l'évolution du nombre de logement de la TH et un différentiel d'évolution du nombre de personnes par ménage Poids = évolution logement TH2004/2006 x (évolution annuelle nbre pers par ménage 1999-2004) 2 x facteur calage pour réconcilier évolution logement et ménage Page 22
Exploitation statistique Page 23
Plan de sondage Complémentaire Ménages (plus de 98 % de ( population la Communautés (internats, maisons de ( retraite Habitations mobiles et sans-abris Communes de moins de 10 000 habitants Tirage 1/4 Tirage 1/4 Tirage1/4 Communes de 10 000 habitants et plus Identique principal Tirage 1/4 Tirage 1/4 Page 24
Poids du complémentaire Complémentaire Ménages (plus de 98 % de ( population la Communautés (internats, maisons de ( retraite Habitations mobiles et sans-abris Communes de moins de 10 000 habitants Poids principal x 4 Poids principal x 4 Poids principal x 4 Communes de 10 000 habitants et plus Identique principal Poids principal x 4 Poids principal x 4 Page 25
Quelques points importants Redressement non réponse Le ménagem ne répondr pas : si logement principal FLNE feuille de logement non enquêté imputation de la réponse d'un ménage de même taille le plus proche possible géographiquement Losrque le nombre de personne n est pas renseignée (cas minoritaire) imputation nombre de personne de chaque FLNE Si Logement secondaire, vacant occasionnel : imputation de la réponse d'un logement de même statut le plus proche possible géographiquement Page 26 Le ménagem ne répondr pas à certaines questions : imputation de la réponse d'un ménage le plus proche possible géographiquement et selon certains critères : comme au RP1999
Qualité statistique Page 27
La précision... Précision population et variables du principal Source rapport CNIS 2004 Niveau commune et iris Tranche Précision (CV) d effectifs >50 000 <1% 20 000-50 000 1,5% 10 000-20 000 2,0% 6 000-10 000 2,5% 3 000-6 000 3,0% 2 000-3 000 3,5% 1 000-2 000 4,5% 500-1 000 6% 250-500 8% <250 >8% Page 28
La précision... Précision complementaire : elle est meilleure qu au RP1999 Source rapport CNIS 2004 Niveau Iris Nom bre de fam illes monoparentales de l'iris 300 250 Incertitude RP99 (tiret) Incertitude Nouveau recensement (trait plein) 200 150 100 50 Page 29 0 IRIS
...n'est qu'un des élements de la qualité finale Qualité population : Qualité sondage Qualité du RIL Qualité TH Qualité répertoire communautés Qualité collecte dont taux de FLNE Qualité variables : Qualité de la population Pour le complémentaire : qualité sondage 1/4 ( réponse Qualité réponse du répondant (dont taux de Qualité saisie codage Qualité Qualité des redressements Page 30
Pour en savoir plus Bibliographie Hors série recensement mai 2005 Documents en ligne sur insee.fr sur le calcul des populations légales Rapport du CNIS : 2004 Rapport sur la qualité : à venir en ligne sur insee.fr Page 31