Collecte de données. Laurent Dorey



Documents pareils
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Chapitre 11 METHODOLOGIE D ENQUÊTES

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

Chapitre 3 : INFERENCE

Théorie des sondages : cours 5

MODÈLE CROP DE CALIBRATION DES PANELS WEB

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

1. Les types d enquêtes

POINTS DE VUE DES CANADIENS SUR LA COUVERTURE DES MÉDICAMENTS D ORDONNANCE

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

INITIATION AUX METHODES DE SONDAGE

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

ANNEXE 4. Réaliser un diagnostic de sécurité Principales méthodes de collecte d information. (Module 3, partie I, section 2.5)

Introduction aux sondages

SONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ

Probabilités conditionnelles Loi binomiale

23. Interprétation clinique des mesures de l effet traitement

Principe d un test statistique

Formation PME Etude de marché

La définition La méthode. Les échelles de mesure L ENQUETE PAR SONDAGE : LA METHODE

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Évaluations aléatoires : Comment tirer au sort?

Études épidémiologiques analytiques et biais

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

La nouvelle planification de l échantillonnage

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Enquête auprès du grand public sur le projet de réforme du système ferroviaire Vague 2 Juin 2014

Guide méthodologique : Enquêtes en ligne

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

DÉCISIONS À PRENDRE AVANT DE COMMENCER

Benny Creppy Claudia Senardière

Les Français et les complémentaires santé

Estimation et tests statistiques, TD 5. Solutions

SONDAGE OMNIBUS TÉLÉPHONIQUE - OPINION AU SUJET DU PROJET ÉNERGIE EST -

L OBSERVATOIRE LCL EN VILLE - RÉALISÉ PAR BVA L ÉCONOMIE DU PARTAGE, ZOOM SUR LES JEUNES URBAINS. Juin 2014

BD/MSPS. Guide de création de la base de données

Étude auprès de la génération X. Le paiement virtuel et la gestion des finances personnelles

Sondage sur le travail de conseiller d arrondissement et de conseiller municipal

Les groupes de médecine familiale (GMF) Sondage Omniweb. Dossier septembre 2012

Chapitre 3 - L'enquête descriptive simple

Structure typique d un protocole de recherche. Préparé par Johanne Desrosiers dans le cadre d une formation au réseau FORMSAV

Les débats sur l évolution des

REF01 Référentiel de labellisation des laboratoires de recherche_v3

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Les Français et les nuisances sonores. Ifop pour Ministère de l Ecologie, du Développement Durable et de l Energie

Echantillonnage INTRODUCTION. Module 1

Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france

Raisonnement probabiliste

À retenir Ce qu en disent les acteurs communautaires

Les Français et l assurance Prévoyance

PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT CE QU IL FAUT SAVOIR

Date de diffusion publique : lundi 15 décembre 2008, 6h00 heure normale de l Est

Article. Peut-on établir des statistiques officielles à partir d enquêtes en ligne reposant sur le principe de l autosélection? par Jelke Bethlehem

LES MODES D ADAPTATION ET DE COMPENSATION DU HANDICAP : Les personnes handicapées motrices à domicile (enquête HID 1999)

Statistiques Descriptives à une dimension

MARCHE PUBLIC EN PROCEDURE ADAPTEE POUR LA REALISATION D UN SONDAGE TELEPHONIQUE AUPRES DES HABITANTS DE L AGGLOMERATIONGRENOBLOISE

MINISTERE DE L'ECONOMIE ET DU DEVELOPPEMENT SECRETARIAT GENERAL INSTITUT NATIONAL DE LA STATISTIQUE ET DE LA DEMOGRAPHIE

Annexe commune aux séries ES, L et S : boîtes et quantiles

CECOP. Centre d études et de connaissances sur l opinion publique. Les Français, leur épargne et leur retraite

L ANALYSE COUT-EFFICACITE

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA

Probabilités Loi binomiale Exercices corrigés

Développement itératif, évolutif et agile

LES FRANÇAIS ET LA COMPLEMENTAIRE SANTE

I. Définition des objectifs :

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Intérêt des membres de la GMMQ, l APASQ, l ARRQ et la SPACQ à adhérer aux projets de régime de retraite et d assurance collective

Evaluation de la variabilité d'un système de mesure

La collecte des informations

L évolution des modes de communication, comment adapter les enquêtes en population générale? L expérience de l enquête KABP VIH/sida 2010

Les Français et l économie Les journées de l économie Patrick Haas 13 novembre 2014

Sondage auprès des employés du réseau de la santé et des services sociaux du Québec - Rapport sommaire -

Lignes directrices de 2004 pour des sondages sur la satisfaction des demandeurs dans le cadre de l assurance-automobile

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

RECHERCHE MARKETING. Ecole des Hautes Etudes Commerciales. Manuel de cours. destiné aux étudiants de la première année master à EHEC

Sondage sur le phénomène de la cyberintimidation en milieu scolaire. Rapport présenté à la

Cinzia Grassi, Loredana Ceccacci, Anna Elisa D Agostino Observatoire pour le contraste de la pédophilie et de la pornographie enfantine

Probabilités sur un univers fini

Enquête sur les indicateurs du paludisme

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Etude de marché. Idée de depart. Etude de l environnement et des offres existantes. Clients. actuels. Choix de la cible précise

CHAPITRE I : PRESENTATION DES INSTRUMENTS DE LA SAISIE

MATHÉMATIQUES. Mat-4104

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Peut-on croire un sondage?

BAROMÈTRE DE LA PROTECTION SOCIALE DES AGENTS TERRITORIAUX

Analyse et interprétation des données

Projet de mise en place de l Enquête Emploi du temps en Algérie

Exercices sur le chapitre «Probabilités»

Les intentions de vote pour les élections régionales en Midi-Pyrénées- Languedoc-Roussillon

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

FM/BS N Contact Ifop: Frédéric Micheau / Bénédicte Simon Département Opinion et Stratégies d'entreprise

HARCÈLEMENT CRIMINEL. Poursuivre quelqu un, ce n est pas l aimer!

Transcription:

Laurent Dorey Mercredi 16 Décembre 2014

Programme : Recensement & Echantillonnage Étapes pour sélectionner un échantillon La population observée La base de sondage Les unités d enquête La taille de l échantillon Approches pour construire un échantillon Menu Les méthodes aléatoires Méthodes non aléatoires Les erreurs

Recensement & Echantillonnage : Recensement : Tous les sujets de la population sont «examinés» Echantillonnage : Une partie des sujets de la population sont «examinés» Plusieurs échantillons peuvent être constitués L échantillon en lui-même n est pas intéressant, ce sont les conclusions sur la population que l on peut tirer de son observation qui en font l intérêt : Inférence

Étapes pour sélectionner un échantillon : 1. Établir les objectifs de l enquête Évaluer les avantages et les inconvénients d un recensement par rapport à un échantillon ou l utilisation de dossiers administratifs 2. Définir la population cible Population totale pour laquelle on a besoin de l information Définir unités qui composent la population sous forme de caractéristiques les identifiant : Nature des données dont on a besoin : sur des personnes, des hôpitaux Emplacement géographique : périmètre géographique (région, canton ) Période de référence : Date Autres caractéristiques dont on veut pouvoir tenir compte : caractéristiques sociodémographiques par exemple

Étapes pour sélectionner un échantillon : 3. Déterminer les données à recueillir Définition des termes Libellé des questions Définitions des méthodes de mesures S assurer que les exigences de l enquête seront respectées sur le plan opérationnel 4. Fixer le degré de précision Il y a un degré d incertitude associé aux estimations établies à partir d un échantillon qui dépend notamment de la méthode d échantillonnage et de la taille de l échantillon Quel degré peut-on accepter? Il faut établir un compromis entre le degré d incertitude et le budget disponible pour l enquête

La population observée : La population cible est définie à partir des éléments précédant L enquête prend en compte une population différente : la population observée Certains membres de la population cible ne sont pas observés par exemple du fait du coût de la collecte des données Les conclusions ne s appliqueront qu à la population réellement observée

La base de sondage : Permet d avoir accès à la population 2 types Les nomenclatures Liste noms et adresses donnant directement accès à des unités e. g. : Liste hôpitaux Liste étudiants en médecine Registre des entrées Les bases aléatoires Liste de «régions» donnant accès indirectement à des unités e. g. : Quartier d une ville Service d un hôpital

La base de sondage : Doit être complète et à jour Aucun membre population observée ne devrait en être exclu ni y être représenté plusieurs fois Aucune unité ne faisant pas partie de la population ne doit y figurer (décédé )

Les unités d enquête : L unité d échantillonnage Fait partie de la base de sondage Peut être ou non sélectionnée L unité déclarante Fournit l information qu exige l enquête L unité d analyse ou de référence C est l unité au sujet de laquelle l information est fournie

Exemple : Enquête sur les nouveau-nés Unité d échantillonnage : Ménage Unité déclarante L un des deux parents ou le tuteur Unité d analyse Le nouveau-né

La taille de l échantillon : Est souvent un compromis entre le degré de précision à atteindre et le budget de l enquête mais aussi d autre contraintes opérationnelle comme le temps disponible Repose notamment sur : La variabilité des caractéristiques que l on mesure La taille de la population Les méthodes d échantillonnage et d estimation

Approches pour construire un échantillon : Méthodes aléatoires (probabiliste) Méthodes non aléatoires (non probabiliste) Chaque unité a une chance que l on peut quantifier d être sélectionnée

Les méthodes aléatoires : 1. Echantillon aléatoire simple 2. Echantillonnage systématique 3. Echantillonnage avec une probabilité proportionnelle à la taille 4. Echantillonnage stratifié 5. Echantillonnage en grappes 6. Echantillonnage à plusieurs degrés 7. Echantillonnage à plusieurs phases

Les méthodes aléatoires : 1. Echantillon aléatoire simple Consiste à choisir des individus de telle sorte que chaque membre de la population a une chance égale de figurer dans l échantillon. Ce choix peut se faire avec remise ou sans remise : Avec remise, un individu peut être choisi plusieurs fois Sans remise, un individu déjà choisi ne peut l être de nouveau. C est le cas habituel.

Les méthodes aléatoires : 1. Echantillon aléatoire simple Avantage : On peut espérer un échantillon «représentatif» puisque la méthode donne à chaque individu de la population une chance égale. Difficultés : méthode applicable que lorsqu il existe liste exhaustive de toute la population.

Les méthodes aléatoires : 1. Echantillon aléatoire simple Procédure générale 1. On numérote tous les individus de la liste correspondant aux individus de la population avec des nombres comportant un même nombre de chiffres. 2. En utilisant une table de nombres aléatoires, une calculatrice ou un programme informatique, on obtient des nombres aléatoires comportant le nombre de chiffres désiré. 3. On sélectionne les nombres qui coïncident avec la liste. On rejette les nombres qui ne coïncident pas avec la liste ou qui se répètent, on s arrête après avoir sélectionné n individus (n représentant le nombre d individus souhaités dans l échantillon).

Les méthodes aléatoires : 2. Echantillonnage systématique L échantillonnage systématique est une méthode qui exige aussi l existence d une liste de la population où chaque individu est numéroté de 1 jusqu à N. Notons n, le nombre d individus que doit comporter l échantillon (la taille de l échantillon). L entier voisin de N/n sera noté r et appelé raison de sondage ou pas de sondage.

Les méthodes aléatoires : 2. Echantillonnage systématique Pour constituer l échantillon il faut : Choisir au hasard un entier naturel d entre 1 et r (cet entier sera le point de départ), L individu dont le numéro correspond à d est le premier individu, Pour sélectionner les autres, il suffit d ajouter à d la raison de sondage : les individus choisis seront alors ceux dont les numéros correspondent à d + r d + 2r d + 3r etc.

Les méthodes aléatoires : 2. Echantillonnage systématique Avantages : facile à sélectionner parce qu un seul individu est choisi au hasard. On peut obtenir une bonne précision parce que la méthode permet de répartir l échantillon dans l ensemble de la liste. Désavantages : Les données peuvent être biaisées à cause de la périodicité.

Les méthodes aléatoires : 2. Echantillonnage systématique On a une population de 400 individus, on veut un échantillon de 100 individus R = 4 On a donc que 4 échantillons possibles 1, 5, 9,. 397 2, 6, 10, 398 3, 7, 11,.399 4, 8, 12, 400 Si la population est distribuée au hasard dans la base de sondage, un échantillonnage systématique donnera des résultats similaire à ceux d un échantillonnage aléatoire simple Cette méthode est très utilisée dans les contrôles de qualité

Les méthodes aléatoires : 3. Echantillonnage avec une probabilité proportionnelle à la taille Si la base de sondage renferme de l information sur la taille de chaque unité (comme le nombre de médecins d un hôpital) et si la taille des ces unité varie, on peut utiliser cette information pour accroître l efficacité de l échantillonnage. Plus la taille de l unité est grande, plus sa chance d être incluse dans l échantillon est élevée

Les méthodes aléatoires : 4. Echantillonnage stratifié Démarche de sélection : a. On subdivise la population en strates (groupes homogènes) qui sont mutuellement exclusives b. Proportionnellement à son importance dans la population, on calcule combien il faut d individus au sein de l échantillon pour représenter chaque strate. c. Dans chacune des strates, on choisit au hasard le nombre nécessaire d individus

Les méthodes aléatoires : 4. Echantillonnage stratifié Les variables de starification doivent être : Simple à utiliser Facile à observer Étroitement reliées au thème de l enquête

Les méthodes aléatoires : 4. Echantillonnage stratifié Avantages : Il est peu probable de choisir un échantillon absurde puisqu on s assure de la présence proportionnelle de tous les divers sous-groupes composant la population. Désavantages : La méthode suppose l existence d une liste de la population. Il faut aussi connaître comment cette population se répartit selon certaines strates. La variance totale est la somme de la variance intrastrate et de la variance interstrate. On cherche a avoir la plus petite variance intrastrate et une grande variance interstrate.

Les méthodes aléatoires : 5. Echantillonnage par grappes Dans les méthodes précédentes, l unité statistique était choisie individuellement. La technique de l échantillonnage en grappes entraîne la division de la population en groupes ou grappes. On sélectionne au hasard un certain nombre de grappes (unités primaires) pour représenter la population. On sélectionne tous les individus des grappes choisies

Les méthodes aléatoires : 5. Echantillonnage par grappes Avantages : la méthode ne nécessite pas une liste globale de la population puisque seules les individus inclus dans les grappes comptent. Elle permet de limiter l échantillon à des groupes compacts ce qui permet de réduire les coûts de déplacement, de suivi et de supervision. Désavantage : la méthode peut entraîner des résultats imprécis (moins précis que les méthodes précédentes) puisque les unités voisines ont tendance se rassembler. Elle ne permet pas de contrôler la taille finale de l échantillon.

Les méthodes aléatoires : 6. Echantillonnage à plusieurs degrés Ressemble à l échantillonnage en grappes, sauf que dans ce cas on prélève un échantillon à l intérieur de chaque grappe On a au moins 2 degrés : 1. On identifie au premier les grandes grappes (unités primaires). Ces grappes renferment plus d unités qu il n en faut dans l échantillon 2. Au second degré, à l intérieur de chaque grappes, on sélectionne les unités (unités secondaires) qui vont faire partie de l échantillon On peut utiliser plus de 2 degrés : Niveau 1 : Ville Niveau 1 : Établissement de santé Niveau 3 : Médecins

Les méthodes aléatoires : 6. Echantillonnage à plusieurs degrés Avantage : Échantillon plus concentré ce qui réduit les coûts, pas besoin de disposer de la liste de toutes les unités. Permet de contrôler la taille de l échantillon notamment par stratification. Désavantage : précision des résultats

Les méthodes aléatoires : 7. Echantillonnage à plusieurs phases Les données de base sont collectées auprès d un échantillon d unité de grande taille, ensuite pour un sous-échantillon de ces unités, la collecte des données est plus détaillée. Le plus couramment on utilise 2 phases ou échantillonnage double

Méthodes empirique ou non aléatoires : On oppose aux méthodes aléatoires les méthodes non aléatoires. Les méthodes non aléatoires sont des méthodes où le concept de «chance égale» est absent. Ce sont des méthodes généralement peu fiables. Elles ne nécessite pas de base de sondage Elles sont souvent utilisées : pour des études exploratoires pour réduire les coûts quand il est impossible ou non envisageable d utiliser la méthode aléatoire.

Méthodes non aléatoires : On distingue : Echantillonnage à l aveuglette ou de commodité : e.g. Déguster un échantillon de vin. Echantillonnage de volontaires : e.g. Expériences médicales ou psychologiques. Echantillonnage au jugé : implique la sélection d individus en fonction de l idée qu on se fait de la composition de la population. e.g. essais auprès des groupes cibles. Echantillonnage par quotas (dirigé ou par choix raisonné) : largement utilisé dans enquêtes opinion et études de marché car il ne suppose pas de liste des individus de la population. On effectue un nombre d entrevues dans divers groupes, fonction du secteur géographique, âge, sexe ou autres caractéristiques L enquêteur doit respecter son quota.

Méthodes non aléatoires : Avantages : Moins coûteuse et plus facile à réaliser. Désavantages: Beaucoup de non-réponses; difficulté de trancher lorsqu il s agit de sélectionner des individus d un groupe d âge ouvert (e.g. : 65 ans et plus : faut-il prendre 66 ans, 70 ans ).

Les erreurs : Les méthodes d échantillonnage peuvent être sources d erreurs. Un certain nombre d erreurs pourront être éliminées, certaines pourront être réduites, mais d autres persisteront Erreurs dues aux instruments de mesure Un instrument est fidèle s il répond exactement de la même façon quand il est placé dans deux situations identiques. e. g. thermomètre. Une question claire est dite fidèle quand tout le monde la comprend de la même façon. Un instrument est valide lorsqu il mesure vraiment ce qu il est censé mesurer.

Erreurs dues à l organisation : Ce sont les erreurs qui se glissent lors de la collecte des données. Est-ce que les consignes ont été respectées? Les enquêteurs ont-ils agi de la même façon? Pour éviter ces erreurs il faut utiliser les mêmes instruments, les mêmes conditions Erreurs dues à la méthode d échantillonnage Il faut toujours vérifier, à la lumière des objectifs de l étude statistique, que la méthode d échantillonnage est adaptée. En particulier éviter la surreprésentation de certaines parties de la population.

Erreurs dues au phénomène de non-réponse : Même avec la meilleure méthode d échantillonnage, il se présente toujours un certain nombre de non-répondants, ce qui peut entacher la représentativité de l échantillon et amener des conclusions erronées. Erreur d échantillonnage Le fait d étudier un échantillon plutôt qu un autre engendre forcément une erreur. Cette erreur appelée erreur d échantillonnage est inévitable.

The end