Méthodologie d'estimation dans l'enquête Sans-Domicile 2012. Alexandre Lebrère



Documents pareils
Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

Non-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011

Théorie des sondages : cours 5

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Guide méthodologique : Enquêtes en ligne

Enquête sur les investissements dans l industrie

ACTIVITÉS SUPPLÉMENTAIRES UNE JOURNÉE QUOTIDIENNE

Certificat de Qualification Professionnelle

AQUITAINE. Suivi de la Demande touristique ~

Notoriété et perception de l IAE

Nos offres séminaires Château de Beaulieu Marc Meurin

Investissement dans la construction de nouveaux bâtiments résidentiels (travaux mis en place) Méthodologie

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Salles de réception Domaine de la Printanière TARIFS 2015

Culturetravel. L histoire du Blues. Du 4 au 16 juin evenementsetvoyages

Analyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts

Présentation des plateformes d accueil de Forum réfugiés Cosi. 13 septembre 2012

Politique Biathlon Canada sur les voyages et les dépenses

L'Obésité : une épidémie?

Les Français et la publicité sur les Réseaux Sociaux

Plan d actions 26 janvier 2009

présente Métro, boulot, dodo enquête sur la vie de bureau

Les Français et le courrier publicitaire. Rapport

PLANIFICATION & GESTION DE PROJETS

Santé environnement. Description du budget espace-temps et estimation de l exposition de la population française dans son logement

1 Imputation par la moyenne

Institut économique de Montréal. Rapport d un sondage omnibus. Juin 2005

Regards de Français sur les objets connectés dans le domaine de l assurance

Chaque équipe est dirigée par un responsable qui dispose d une autonomie pour l utilisation de son budget de fonctionnement et d investissement.

Bienvenue à l hôtel Saint-Laurent

E M. Management de la sûreté et de la sécurité. Executive Master. Janvier jours de formation. Modules de 4 journées / mois.

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Les Français, l Ecole et le métier d enseignant

Vie et santé des jeunes sans domicile ou en situation précaire Enquête INED, Paris et petite couronne, février-mars 1998

Bienvenue au. Vue sur l entrée. Le patio

Règlement du concours «Alaska à l'abordage»

IT SecuDay Geneva 2015 : Les apports du Big Data à la sécurité informatique

Les groupes de médecine familiale (GMF) Sondage Omniweb. Dossier septembre 2012

Sondage exclusif Les Français et l esprit d entreprise

7 e Camp de leadership sur la coopération Caisses populaires acadiennes. Information et fiche d inscription

Chapitre 3 - L'enquête descriptive simple

Projet de Classe de 5 G. Séjour du 12 au 14 février 2009

Evaluation générale de la qualité des données par âge et sexe

d évaluation de la toux chez l enfant

Service des Relations Internationales. Livret d hébergement

La nouvelle planification de l échantillonnage

Créer un site internet participatif avec Yeswiki

Les Français, les Maires et les dirigeants de PME/PMI et le nouveau paysage énergétique

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

DÉCISIONS À PRENDRE AVANT DE COMMENCER

Elaboration des documents méthodologiques des comptes nationaux selon le SCN 1993 et préparation du passage au SCN 2008

L évolution des modes de communication, comment adapter les enquêtes en population générale? L expérience de l enquête KABP VIH/sida 2010

ITS Switzerland - EPFL 29/10/2014 La stratégie d information multimodale du Grand Lyon : la coopération public/privée pour la mobilité urbaine et l

Les TPE et PME face aux technologies de l information. Zone 3 villes de plus de habitants. Zone 4 zone rurale

Bilan de la concertation sur le PEDT

Formulaire Inscription Jeunes

Partir à l étranger n a jamais été aussi facile. Grande-Bretagne / Irlande

EVENEMENTS. jdscenter. Centre de Conférences. jdscenter

QUESTIONNAIRE DE RECENSEMENT DES BESOINS EN MODES DE GARDE POUR LA PETITE ENFANCE COMMUNE DE L ILE-ROUSSE

Le baromètre. Dauphine-Crédit Foncier. de l immobilier résidentiel. Tendance globale

Le classement des villes les plus gay-friendly de France

Formations de formateurs

MINISTERE DE L'ECONOMIE ET DU DEVELOPPEMENT SECRETARIAT GENERAL INSTITUT NATIONAL DE LA STATISTIQUE ET DE LA DEMOGRAPHIE

Rencontres d affaires franco italiennes à l occasion du salon SOLAR EXPO de Milan (Milan, 08 09/05/2013) Un évènement de «The Innovation Cloud»

Décembre 2009 Nobody s Unpredictable

Visuel du 21 au 25 avril

Formulaire n 1 : Identification de la structure

Chapitre 11 METHODOLOGIE D ENQUÊTES

Interview de Hugo, coordinateur de l espace de coworking de La Cordée Perrache (Lyon)

SONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ

Et si on utilisait le vélo?

Car Insurance Survey. L assurance automobile RC chez les jeunes. Statistics Belgium. Rapport final

Programme de bourses universitaires conjoint Japon-Banque mondiale (JJ/WBGSP) Programme régulier. Formulaire de demande de bourse 2012

Convention Foyer des Jeunes Travailleurs Institut de Formation de l Artisanat

Restauration Etat du Marché ->La consommation de cigarettes en CHR en Rapport Online CHD Expert

TMS des agents de l Etat en abattoir de boucherie : construction des indices pour l'enquête par questionnaire

REK Commission d experts Comptabilité & Contrôle de gestion

Les Français et les complémentaires santé

médicale canadienne, l Institut canadien d information sur la santé, Santé Canada et le Collège royal des médecins et chirurgiens du Canada.

LA PROCEDURE D'EVALUATION A.NA.PSY.p.e. EST LE RESULTAT D'UNE RECHERCHE

POLITIQUE RELATIVE AUX FRAIS DE DÉPLACEMENT,

Les services proposés par le

SEMINAIRES. Déjeuner au restaurant de l hôtel pour apprécier les différentes saveurs de nos produits régionaux

Règlement jeu concours gratuit sans obligation d achat «Opération VIP Partouche Poker tour»

Association suisse des experts fiscaux diplômés Conférence du 25 novembre 2010 relative à la LTVA du 12 juin 2009

Les Français et le chauffage. Résultats de l étude menée

COMMUNIQUÉ PRESSE CIM DATE 22/04/2015

Sommaire La méthodologie Les résultats de l'étude... 4

Nous vous remercions de l intérêt que vous portez à notre hôtel Kyriad Vannes Centre-Ville.

LA TETE DANS LES ETOILES!

ENQUÊTE DE SATISFACTION SUR LA QUALITÉ DE L'ACCUEIL EN PRÉFECTURE DE LA DRÔME PRÉSENTATION DES RÉSULTATS 2012

SONDAGE AUPRÈS DES ÉTUDIANTS CANADIENS

L analyse de la gestion de la clientèle

Cycle de formation certifiante Sphinx

Indicateur n 13 : Evolution des effectifs et des dépenses de personnel des établissements de santé

casino DINARD N 10 : Décembre Janvier - Février 2015

TRANSPORT EN COMMUN - SERVICE DE DESCENTE ENTRE DEUX ARRÊTS VISANT EN EXCLUSIVITÉ LES FEMMES : DISCRIMINATION FONDÉE SUR LE SEXE?

Université Senghor, 5-16 décembre 2004

Transcription:

Méthodologie d'estimation dans l'enquête Sans-Domicile 2012 Alexandre Lebrère 05/12/2013

Plan Introduction: Le problème posé 1. L apurement des questionnaires 2. Le calage des prestations 3. L'imputation des semainiers et l'échantillonnage indirect Séminaire SMS/DSDS Sans-domicile 05/12/2013

Introduction : position du problème On dispose en sortie de collecte de trois ensembles de questionnaires : Questionnaires longs (francophones) : QIL Questionnaires courts francophones : QAAF Questionnaires courts non francophones : QAANF On dispose d'autre part de différents jeux de poids : Poids agglomération Poids service x jour Poids contact Poids prestation

Introduction : position du problème L'information collectée concerne : Les questionnaires individuels, Les services, Les service x jours (= contacts). On veut obtenir des poids individuels Sur la population des usagers de services d'aide, Sur la population des usagers francophones Sur la population des usagers non francophones Deux questions sont posées : représenter au mieux l'univers des prestations avec l'information disponible, et passer d'un poids prestation à un poids individuel.

Introduction : Que faire? La démarche suivie pour obtenir des poids individuels est la suivante : 1. Obtention des poids services x jours remarque : le tirage des réserves impose un traitement complexe. 2. Les poids prestations sont calés sur l'information disponible au niveau service x jours et QILQAAF remarque : l'estimation du nombre de prestations est disponible à ce stade. 3. Un partage des poids est effectué pour obtenir des poids individuels. On sépare les populations francophone et non francophone.

1. Apurement des données Apurement des données indispensables : - concernant les services - nécessaires au calage - concernant le semainier

1. Apurement des données : infos sur le service Fusions, éclatements, doublons : redressement sur les poids de tirage Fréquentation : nombre de personnes ayant fréquenté le service le jour de la visite Données service exploitables : fréquentation renseignée nombre de contacts nombre de femmes francophones nombre d hommes francophones nombre de femmes non francophones nombre d hommes non francophones

1. Apurement des données : QIL (1) BON REMPLISSAGE B2 Où avez-vous mangé les 7 derniers jours? code restauration p. 10-11 et carte 4 Pour les distributions de repas à l extérieur, coder le service et indiquer le nom de l organisme et l adresse la plus précise possible du lieu de distribution (ex : Restos du Cœur derrière la gare de Perrache, LYON, 69) Jour semaine Repas du matin Repas du midi J-1 (hier) Lun Mar Mer Jeu Ven Sam Dim Type de repas _0_ _1_ RMA1T Type de repas _0_ _1_ RM1T Si type 01 Code service 3 4 1 4 E P Si type 01 Code service 7 8 6 5 E M RMA1S RM1S nom :..Petits déjeuners du Cœur... nom : Restos du Cœur......RMA1N adresse :.13 rue du Palais......RMA1A commune :..Bordeaux...RMA1C dép _3_ _3_...RMA1D......RM1N adresse : 13 rue du Palais......RM1A commune :...Bordeaux......RM1C dép _3_ _3_.....RM1D J-2 Lun Mar Mer Jeu Ven Sam Dim J-3 Lun Mar Mer Jeu Ven Sam Type de repas _0_ _1_ RMA2T Type de repas _0_ _1_ RM2T Si type 01 Code service 3 4 1 4 E P Si type 01 Code service 7 8 6 5 E M RMA2S RM2S nom :...IDEM......RMA2N adresse :......RMA2A commune :...RMA2C dép.........rma2d nom :...IDEM......RM2N adresse :......RM2A commune :...RM2C dép........rm2d Type de repas _0_ _1_ RMA3T Type de repas _0_ _1_ RM3T Si type 01 Code service 3 4 1 4 E P Si type 01 Code service 7 8 6 5 E M RMA3S RM3S nom :...IDEM......RMA3N adresse :......RMA3A nom :...IDEM......RM3N adresse :......RM3A

1. Apurement des données : QIL (2) Semainier très important pour la pondération La vérification des codes services était réalisée lors de la saisie Traitement des prestations dans le champ avec une adresse renseignée et un code service à blanc ou noté inconnu Pour un code service : vérification des adresses du semainier et de la base Vérification des extensions des codes services : doivent correspondre à la bonne prestation Vérification des prestations codées hors champ avec un code service Déterminer si le semainier est exploitable ou non Pour les exploitables : Imputations Calcul du nombre de liens

1. Apurement des données : QIL (3) QIL exploitable si : Semainier exploitable On peut déterminer la situation d hébergement de la personne la veille de l enquête (ce qui définit sans-domicile ou non) : Sans-domicile : hébergé (logement / hôtel / hébergement regroupé) ou sans-abri Locataire ou propriétaire Sans logement personnel (personnes hébergées par un tiers, squatt)

1. Apurement des données : QAA non francophones Apurement des variables nécessaires au calage : âge, sexe, pays de naissance et diplôme si la personne est née en France Semainier agrégé renseigné Déterminer la situation d hébergement de la personne la veille de l enquête

2. Le calage de l'enquête : Introduction But du calage : améliorer la précision des estimateurs et assurer la cohérence entre sources différentes de données (et éventuellement corriger de la non réponse) en utilisant de l'information auxiliaire disponible sur la population complète. Idée : estimateur par la régression généralisée Problèmes : Pas de «vraie» information auxiliaire sur la population cible. Qualité de la base de sondage pour le calage.

2. Le calage de l'enquête : prestations Les poids service x jours et la fréquentation observée donnent l'estimation du nombre de prestations. Les données obtenues au niveau service x jour (i.e. la fiche contacts) sont considérés pour estimer deux variables : Sexe Francophone On effectue ensuite une post-stratification des poids contacts sur ces deux variables au niveau agglomération x type de service.

2. Le calage de l'enquête : auto-calage des questionnaires A ce stade, nous avons un poids prestation utilisable pour le calcul des poids individuels. Cet ensemble de poids représente séparément les populations francophones et non francophones. L'échantillon des utilisateurs francophones est l'ensemble des QIL. Nous pouvons tirer parti de l'information disponible dans les QAAF. On fait un calage des QIL sur l'information disponible dans l'ensemble QIL + QAAF.

3. Poids individuels : le partage des poids Problématique du sondage indirect : la population d'inférence est celle des sans domicile, mais la population (statistique) observable est celle des prestations offertes dans les services d'aide. La solution est la méthode du partage des poids : pour chaque questionnaire de l'échantillon, compter le nombre de liens avec la population. Intuitivement : Il faut diviser le poids prestation par le nombre de fois où l'individu était atteignable par le plan d'échantillonnage. Le nombre de liens est observé dans le semainier.

3. Poids individuels : semainiers et liens Les liens sont observés grâce au «semainier.» On note sur les sept derniers jours : Dans les QIL : questions détaillées sur les sept derniers jours. 4 prestations enregistrées par jour : petit-déjeuner, déjeuner, dîner, nuit. Dans les QAA : quatre questions résument la fréquentation des services au cours de la semaine précédente. La qualité des semainiers observés est cruciale pour le calcul des poids. Les rapports de poids extrêmes possibles varient de 1 à 22. Les problèmes de mémoire ont un effet direct sur la variance des estimations.

3. Poids individuels : imputation des semainiers Le nombre de liens est indispensable pour avoir un poids individuel. Il faut absolument utiliser l'information des semainiers Dans le cas de non réponse partielle, on doit imputer les semainiers. Pour les QIL, on utilise une méthode d'imputation par donneur, en tirant les liens d'un individu ayant les mêmes fréquentations que celles observées dans les données du receveur. Pour les QAA, un fort effet questionnaire est observable.

Conclusion - Les difficultés de l'estimation proviennent de plusieurs facteurs : L'échantillonnage complexe, prenant en compte des contraintes diverses (base de sondage, collecte, files) L'absence de données de cadrage Une population difficile à atteindre Une population difficile à interroger Les résultats sont de deux ordres L'estimation de la taille de la population est la plus fragile, mais semble raisonnable (études de sensibilité) Les études de comportement dépendent avant tout de la qualité de l'apurement.