Techniques d échantillonnage en épidémiologie

Documents pareils
Théorie des sondages : cours 5

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Chapitre 3 : INFERENCE

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Études épidémiologiques analytiques et biais

Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france

Docteur José LABARERE

Évaluations aléatoires : Comment tirer au sort?

Probabilités conditionnelles Loi binomiale

INITIATION AUX METHODES DE SONDAGE

Analyse de la variance Comparaison de plusieurs moyennes

Introduction à l approche bootstrap

Chapitre 3 - L'enquête descriptive simple

Analyse et interprétation des données

Statistiques Descriptives à une dimension

L axe 5 du Cancéropole Nord Ouest

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

RNV3P Recherche de pathologies émergentes

myflex. La ligne de produits qui s adapte à vos besoins spécifiques et vous offre des possibilités flexibles de choix et de changement.

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

PARTIE I - Données de cadrage. Sous-indicateur n 9-1 : Nombre de consultations de médecins par habitant, perspective internationale

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

DEMANDE DE VISA TOURISME/ (VISITE FAMILIALE/OU AMICALE)

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Lois de probabilité. Anita Burgun

Exposé n 5: Bases IMS, Thalès Quel apport pour la sécurité d emploi des médicaments?

Chapitre 6 : Consolidation par paliers et consolidation directe

note d Temps de travail des enseignants du second degré public : pour une heure de cours, une heure de travail en dehors 13.13

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

Les Français et les nuisances sonores. Ifop pour Ministère de l Ecologie, du Développement Durable et de l Energie

Un outil pour l étude des dépenses de santé et des «restes à charge» des ménages : le modèle Omar

A PROPOS DES CRITERES D ATTRIBUTION DES EQUIVALENCES

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Non-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011

Guide de rédaction d un protocole de recherche clinique à. l intention des chercheurs évoluant en recherche fondamentale

DÉCISIONS À PRENDRE AVANT DE COMMENCER

La nouvelle planification de l échantillonnage

L ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN 2003 : UNE ANALYSE TERRITORIALISÉE DES PROFILS D OCCUPATION DES PARCS ET DES QUARTIERS

Gestion du traitement personnel des patients : Enquête et audit régional

Théorie des Jeux Et ses Applications

CONSTRUIRE UNE QUESTION ET ELABORER UN QUESTIONNAIRE?

PROBABILITES ET STATISTIQUE I&II

La classification automatique de données quantitatives

Cinzia Grassi, Loredana Ceccacci, Anna Elisa D Agostino Observatoire pour le contraste de la pédophilie et de la pornographie enfantine

Car Insurance Survey. L assurance automobile RC chez les jeunes. Statistics Belgium. Rapport final

Santé environnement. Description du budget espace-temps et estimation de l exposition de la population française dans son logement

Audit du CESP Etude ONE 2011 (Echantillon principal)

LES DIFFERENTS TYPES DE MESURE

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Observatoire Economique et Statistique d Afrique Subsaharienne

Guide méthodologique : Enquêtes en ligne

DOSSIER DE PRESSE. Les dates clés de la Coddem

À retenir Ce qu en disent les acteurs communautaires

Réseau sur. Médicaments. l Innocuité et l Efficacité des. Document d orientation pour la présentation de requêtes au RIEM

LE DOSSIER PHARMACEUTIQUE

DEMANDE D AUTORISATION DE DEPART. à adresser en 2 exemplaires à l Inspecteur de circonscription.

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Masters OBSER VATOIRE. Sciences / Technologies / Santé OBSERVATOIRE CARREFOUR DES ÉTUDIANTS. Université de Limoges

Lecture critique et pratique de la médecine

TRANSPORT ET LOGISTIQUE :

Programme d assurance-invalidité de courte durée

CMI ECONOMIE, FINANCE QUANTITATIVE ET STATISTIQUES - PARCOURS FORMATION EN APPRENTISSAGE

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Organisation du suivi dans le cadre d un réseau

LE MALI L HÔPITAL GABRIEL TOURE L HÔPITAL DU POINT G INTRODUCTION 2 INTRODUCTION 1 DISPENSATION DES ARV DANS LES HÔPITAUX DU POINT G ET GABRIEL TOURE

Les domaines et les thèmes du SIG Grand Sud

Séance 4. Gestion de la capacité. Gestion des opérations et de la logistique

TP N 57. Déploiement et renouvellement d une constellation de satellites

1 ère partie Amont de l'hôpital : organiser la permanence des soins une obligation médicale!

Rappel sur les bases de données

OUVERTURE ET MISE EN PLACE

Transports sanitaires

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

«Politique des ARS pour les seniors»

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

CONTEXTE... 3 PROFIL DES POSTES DE NOUNOUS... 5 AGE DU PLUS JEUNE ENFANT GARDE... 5 TYPE DE GARDE... 5 HORAIRES... 5

Assurances et prestations Les solutions en bref

Probabilités III Introduction à l évaluation d options

DEMANDE D AUTORISATION DE DEPART EN SORTIE SCOLAIRE AVEC NUITEE(S) *

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

BAROMETRE DE CONJONCTURE DE L HEBERGEMENT D ENTREPRISES

Sommaire. 2. Utiliser la télécommande Télécommande Administrateur Télécommande Utilisateur Échanger une télécommande...

LE PETIT RELATION CLIENT. Les pratiques clés en 15 fiches. Nathalie Houver

APRES LE BAC S

Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles

Audit du CESP Etude ONE Juillet juin 2014

MASTER (LMD) INGENIERIE DE LA SANTE

Chapitre 2/ La fonction de consommation et la fonction d épargne

Etude Elfe, Le de de e v nir de en a f n a t n s

Synthèse du rapport d activité 2007 du CCAS

La couverture complémentaire santé des jeunes

Guide d établissement des budgets des propositions soumises aux appels à projets de

Evaluation de la variabilité d'un système de mesure

SECTION II RELATIVE AU PRÉLEVEUR

Transcription:

Master Sciences et Technologies Santé Mention Biologie Santé Spécialité Génie physiologique, Biotechnologies et informatique, Développement du médicament UE EPIDEMIOLOGIE Techniques d échantillonnage en épidémiologie Marion ALBOUY-LLATY 14 octobre 2009 1

Plan Echantillonnage et épidémiologie Pré-requis Sondages empiriques Sondages aléatoires Estimation 2

Plan Echantillonnage et épidémiologie Pré-requis Sondages empiriques Sondages aléatoires Estimation 3

Échantillonnage opération qui consiste à identifier un sous-groupe d individus dans une population afin d y recueillir des données statistiques Population Sondage: méthode utilisée pour échantillonner N Échantillon: groupe d individus qui a été sélectionné n1 n2 n3 4

Epidémiologie Epidémiologie descriptive Décrire d état de santé d une population Epidémiologie évaluative Evaluer l impact des interventions Epidémiologie analytique Analyser les déterminants des problèmes de santé Proposer les interventions les plus efficaces 5

Objectifs En épidémiologie descriptive estimer avec la meilleure précision possible (IC ou σ) et le moins de moyens possibles des paramètres concernant une population bien définie L idéal: utiliser base de données exhaustive (registre, recensement) sinon: sondages En épidémiologie analytique Établir la relation entre une exposition et un état de santé pour tirer des lois générales, applicables à toute la population L échantillon doit inclure des individus exposés et non-exposés, à risque de développer la maladie 6

Objectifs Analytique Descriptif Non malades Malades N témoins cas Non exposés NE Exposés E n1 n2 n3 Comparabilité des groupes Représentativité 7

Représentativité=bon sondage Un échantillon est représentatif s il permet : d estimer les paramètres étudiés sans biais (équivalents à ceux que l on aurait obtenu en étudiant la population totale) avec une précision acceptable Conditions: Inclusion des sujets aléatoire=tas Probabilité d inclusion déterminée à l avance et non nulle Formules d estimateurs adaptés au plan de sondage 8

Paramètre: valeur vraie de la population Ex: Effectif; Moyenne; %; variance Estimation: valeur attribuée à un paramètre étudié à partir de données observées sur un échantillon s 2 σ - N 2 1 = N i= 1-1 = n 1 n ( x i µ ) ( x i m ) i= 1 2 2 Population de taille N avec moyenne µ Estimateur: formule mathématique permettant de calculer cette valeur Échantillon de taille n1 et de moyenne m1 Échantillon de taille n2 et de moyenne m2 9

Avantages du sondage Réduction de la durée d étude Résultats obtenus plus rapidement Économie de moyens Effectif plus faible donc moins d enquêteurs Qualité des données recueillies Plus de détails: plus de précision 10

Erreurs liées aux sondages Biais de sélection Erreur systématique qui conduit à un manque de validité des données Processus de sélection influe sur le résultat Sources principales: défaut de couverture et nonréponses Ex: passants dans la rue (invalides; quartier; travail) ou Téléphone (portable, défavorisés) Ne peut être corrigé par l analyse stat Fluctuation d échantillonnage Erreur non systématique qui conduit à un manque de précision des données 11

Validité et précision Biais: manque de validité Fluctuation d échantillonnage: manque de précision Biais + Fluctuation d échantillonnage 12

Plan Echantillonnage et épidémiologie Pré-requis Sondages empiriques Sondages aléatoires Estimation 13

Avant d échantillonner 1. Établir les objectifs de l'enquête 2. Définir la population d intérêt et les unités d enquête 3. Déterminer les données à recueillir 4. Fixer la taille de l échantillon 5. Sélectionner une base de sondage 6. Fixer une méthode d échantillonnage Avoir en tête les contraintes logistiques (base de sondage adaptée à la cible, mode de recueil des données ) 14

Population d intérêt Ensemble des individus (unités statistiques) que l on voudrait étudier et auxquels s appliquent les résultats d une enquête Dépend de l objectif de l enquête Définition limites géographiques période de référence caractéristiques sociodémographiques 15

Les unités d'enquête Pas forcément des personnes Services hospitaliers ou lieux de travail Plusieurs niveaux de réponse Unité d échantillonnage Unité déclarante Unité de référence Ex: enquête sur les nouveau-nés UE=le ménage UD=l'un des parents ou le tuteur légal UR=le bébé 16

Base de sondage Définition liste d unités (individus ou groupe d individus) qui couvre toute la population avec une identification de chaque unité Qualités obligatoires Liste exhaustive (sinon défaut de couverture) Liste sans doublon : identifiant unique (sinon Πk inégales) Qualités supplémentaires Information auxiliaire individuelle : autres informations que l identifiant pour chaque unité (sexe, âge si les unités sont des personnes par exemple...) Exemples population générale (liste téléphonique) population hospitalière (liste des patients ayant eu une cs) pop. Salariés (liste personnel) 17

Exemple 1 Étude de l incidence du VIH en France Population N=60 000 000 Population française Étude de recensement Échantillon n=1600 Cas de VIH Taux d incidence= 1600/60 000 000=2.6/100 000 PA 18

Exemple 2 Étude du taux de CD4 chez les patients VIH hospitalisés dans 4 hôpitaux parisiens Population Patients atteints du VIH en France Sondage Population cible Patients suivis dans 4 hôpitaux parisiens BASE DE SONDAGE : N Liste des cs Échantillon n Échantillons de malades 19

Méthodes d échantillonnage Sondages empiriques : Probabilité de sélection définie sur le terrain = sélection par choix raisonné Sondages aléatoires : Probabilité de sélection définie dès la constitution du plan de sondage = sélection par TAS 20

Plan Echantillonnage et épidémiologie Pré-requis Sondages empiriques Méthode des quotas Méthode des itinéraires Méthode des unités-types Méthode des transects Sondages aléatoires Estimation 21

Sondages par quotas L enquêteur sélectionne librement le sujets La consigne: obtenir une structure de l échantillon similaire à celle de la population Pas de probabilités d inclusion - pas de TAS Pas de base de sondage MAIS Imprécision des résultats Difficultés d organisation Non représentativité possible de l échantillon Exemples: Élections, Étude Sélénium 22

Autres sondages empiriques Méthode des itinéraires =quotas avec respect d un trajet réduit liberté enquêteur Méthode des unités-types Individus moyens Méthode des transects Écologie animale 23

Plan Définitions Sondages empiriques Sondages aléatoires Estimation 24

Sondages aléatoires Sondages élémentaires Sondage aléatoire simple (SAS) Sondage systématique (SYS) Sondages non élémentaires Sondages stratifiés Sondages en 2 phases avec post-stratification Sondages à plusieurs degrés Sondages en grappe Sondages stratifiés à plusieurs degrés 25

Sondages élémentaires (1) Sélection de l échantillon : en une seule étape sans manipulation de la base de sondage BASE DE SONDAGE : N Fraction de sondage: proportion d individus sélectionnés f =n/n Échantillon : n Probabilité d inclusion: probabilité pour un individu de faire partie de l échantillon. 0<Πk 1 26

Sondages élémentaires (2) Tirages : Probabilités égales Πk = f =n/n = cste Probabilités inégales Πk = cste * Xk f Σ Πk = n Souvent proportionnelles à une valeur quantitative X connue pour chaque unité k Πk = n (Xk /Tx) avec Tx =Σ Xk 27

Exemple: Échantillon de 3 hôpitaux parmi 10 hôpitaux Base de sondage Proba égales Proba inégales Hôpital Nb services (Xk) Πk = n/n=3/10 Πk =n (Xk/Tx) A 7 0,3 0.20= 3*(7/107) B 9 0,3 0,25 C 6 0,3 0,17 D 5 0,3 0,14 E 24 0,3 0,67 F 14 0,3 0,39 G 12 0,3 0,34 H 19 0,3 0,53 I 5 0,3 0,14 J 6 0,3 0,17 Tx=107 Σ Πk =10*0.3=3=n Σ Πk = 3=n 28

SAS (1) m tirages avec remise : n m (indépendants) 1 3 1 3 1 3 2 2 4 2 4 4 3 2 3 Πk =1/4 Πk = 1/4 Πk = 1/4 m tirages sans remise : n=m (non indépendants) 1 3 1 1 2 2 4 4 4 3 2 1 Πk = 1/4 Πk = 1/3 Πk = 1/2 29

SAS (2) sondage de référence tirage à probabilités égales (Πk= f) simple à réaliser analyse statistique classique MAIS efficacité non optimale seulement si base de sondage disponible 30

Exemple de SAS Tri aléatoire du fichier (EXCEL) TAS de 3 hôpitaux parmi 10 : 1. Générer un nombre aléatoire pour chaque unité de la population 2. Trier par ordre croissant (ou non) selon ce nombre les unités 3. Inclure dans l échantillon les n=3 premières unités A B C D E F G H I J ALEA 0,0182649 0,92378547 0,70844104 0,81075558 0,64186973 0,01395947 0,30724938 0,70746604 0,23531711 0,26064087 F A I J G E H C D B ALEA trié croissant 0,013959467 0,018264902 0,235317108 0,260640868 0,307249378 0,641869731 0,707466041 0,708441037 0,810755579 0,923785471 31 F A I

SYS à proba égales (1) TAS 1er individu puis Pas de sondage (N/n = 1/f) Cas 1: N et n connus N=9 A B C D E F G H I n=3 B E H 9/3 = 3 9/3 = 3 32

SYS à proba égales (2) Cas 2: N et n inconnus Estimer le pourcentage des visites à domicile parmi les actes effectués au cours d une année en colligeant 5% des feuilles de maladie reçues par la CNAM Fraction de sondage = 5% donc Pas de sondage = 20 N=? 1 2 3 4 5 6 7 8 9 1011121314151617181920212223 n=? 2 22 33

SYS à proba égales (3) simple à réaliser analyse statistique classique à probabilités égales base de sondage non disponible à l avance taille de l échantillon aléatoire MAIS tirages non indépendants pas de formule rigoureuse pour la variance risque de périodicité néfaste 34

SYS à proba égales (4) Condition : US classées selon ordre quelconque sinon biais! N=9 A femme B homme C femme D femme E homme F femme G femme H homme I femme n=3 B homme E homme H homme 35

SYS à proba inégales Base de sondage disponible à l avance ou non et information auxillaire quantitative disponible Probabilités proportionnelles à la taille 36

Exemple de SYS à proba inégales 1. Calculer la répartition des services sur l ensemble des hôpitaux (Xk /Tx) et le cumul des Xk 2. Calculer le pas de sondage : Tx /n=107/3=36 3. Générer 1 nombre aléatoire 4. Choisir le premier élément=(1+entier (alea*pas)) 3. Sélectionner les échantillons avec alea juste <cumul A B C D E F G H I J nb services 7 9 6 5 24 14 12 19 5 6 Tx =107 TAS de 3 hôpitaux parmi 10 : Cumul taille 7 16 22 27 51 65 77 96 101 107 Pas 36 alea 0.191 Premier elt 1+(0.191*36)=8 choix 8 43 79 37

Sondages élémentaires: résumé Taille n Tirages indépendants estimations Proba égales SAS fixe Oui ou non simples SYS 1 fixe ou aléatoire Non simples, biais! Proba inégales SYS 2 fixe Non complexes Poisson* aléatoire Oui simples Remise* aléatoire Oui simples * Non abordé dans ce cours 38

Sondages aléatoires Sondages élémentaires Sondage aléatoire simple (SAS) Sondage systématique (SYS) Sondages non élémentaires Sondages stratifiés Sondages en 2 phases avec post-stratification Sondages à plusieurs degrés Sondages en grappe Sondages stratifiés à plusieurs degrés 39

Sondages stratifiés Base de sondage et information auxiliaire qualitative disponibles Manipulation de la base de sondage Variance du paramètre plus faible que dans pop totale Sélections indépendantes dans chaque strate Sondage élémentaire Probabilités égales ou inégales 40

Sondages stratifiés Gain de précision (= réduction de la fluctuation d échantillonnage) si critère de stratification corrélé au paramètre étudié Permet de sur-représenter un sous-groupe minoritaire attention, les paramètres observés dans l échantillon sont des estimateurs biaisés Peu d inconvénient hormis l analyse statistique un peu plus complexe 41

Exemple de sondages stratifiés on veut estimer le pourcentage des élèves consommateurs de tabac du lycée Victor Hugo par un échantillon de 200 élèves NF F NF F NF NF F F F F F NF NF F NF F NF NF NF F NF NF NF F NF NF NF NF F NF NF N=800 lycéens f =1/4 n=200 SAS Fluctuation d échantillonnage!!! On sait que la consommation est différente selon les âges des lycéens 42

Exemple de sondages stratifiés on veut estimer le pourcentage des élèves consommateurs de tabac du lycée Victor Hugo par un échantillon de 200 élèves 360 seconde 240 première 200 Term N=800 lycéens n=200 n1=90 f1=25% n2=60 f2=25% n3=50 f3=25% Πk = f =1/4 43

Exemple de sondages stratifiés on veut estimer le pourcentage des élèves consommateurs de tabac du lycée Victor Hugo par un échantillon de 200 élèves 360 seconde 240 première 200 Term N=800 lycéens n=200 n1=90 f1=25% n2=60 f2=25% n3=50 f3=25% Πk = f =1/4 On sait qu il y a plus de fumeurs en Term: sur-représenter les Term. n1=30 f1=8% n2=50 f2=21% n3=120 f3=60% Πk f =1/4 44

Sondages en deux phases avec poststratification base de sondage disponible mais information auxiliaire qualitative absente stratification en 2ème phase probabilités inégales sur-représentation d une sous-population minoritaire MAIS plus complexe à réaliser et analyser moins efficace qu une stratification a priori si elle est possible 45

Exemple de Sondages en deux phases avec post-stratification N=800 lycéens 1ere phase ni=500 Stratification sur la consommation de tabac 86 Fumeurs 414 NF 2ème phase poststratification n1=86 n2=114 nii=200 46

Sondages à plusieurs degrés (ex à 2 degrés) Population N grappes 1er échantillon m UP 2ème échantillon n US On TAS des individus au sein de chaque UP 47

Sondages en grappe Population N grappes On prend tous les individus des grappes 48

! L effet grappe Traduit la ressemblance des unités d une même grappe vis-à-vis du phénomène étudié Variance intra-groupe faible :Individus du même groupe ont les mêmes caractéristiques Variance inter-groupe forte : Individus de groupes différents ont des caractéristiques différentes Nuit à la qualité du sondage : analyses stat complexes (modèles mixtes) Exemple: famille et alimentation 49

Exemple (1) On souhaite réaliser une étude départementale pour connaître la consommation d ATB des enfants de maternelle Écoles On décide de demander aux parents de remplir un questionnaire, après recrutement dans les écoles 50

Exemple (2) Pour avoir une meilleure représentativité, on souhaite avoir des enfants d âge varié Écoles On décide de stratifier sur la classe pour avoir des groupes d âge Il y a 3 échantillons par école 51

Exemple (3) On suppose que la CSP des parents peut influer sur le type de consommation Écoles On décide de stratifier sur la localisation de l école (ZEP ou non) pour avoir une meilleure représentativité sociale 52

Sondages à plusieurs degrés Solution alternative en l absence de base de sondage des unités d intérêt Diminue le coût lié à la dispersion géographique MAIS Moins précis qu un SAS car 2 étapes et possible effet grappe Échantillonnage complexe Analyse statistique complexe Nécessite l existence d un découpage de la population ciblée sous forme d unités locales identifiables 53

Cas particulier : sondage aréolaire 1. Base de sondage initiale : découpage du territoire en aires (UP) 2. 1er degré: tirage de k aires (UP) 3. Recensement de tous les logements par aire 4. 2ème degré: tirage de m logements (US) par aires 5. 3ème degré: tirage de n sujets (UT) par logements 54

Différence strate-grappe Dans les 2 cas: découpage de la population cible en groupes d unités d intérêt strates Individus sélectionnés à partir de toute la population Les strates ne font pas l objet d un TAS Strates homogènes pour la variable étudiée Strates contrastées entre elles grappes Individus sélectionnés dans une partie de la population Les UP font l objet d un TAS Grappes hétérogènes pour la variable étudiée Grappes semblables entre elles 55

Sondages stratifiés à plusieurs degrés 56

Sondage élémentaire Sondage stratifié Sondage en 2 phases avec post-stratification Sondage à 2 degrés UP US 57

Choix du sondage Base de sondage disponible Oui Info auxiliaire disponible Non Base intermédiaire Oui Non Oui Non quanti quali Proba. inégales Sondage stratifié SAS SYS Sondage à plusieurs degrés (grappe) Sondage empirique 58

Plan Echantillonnage et épidémiologie Pré-requis Sondages empiriques Sondages aléatoires Estimation 59

Estimations Population cible θ? BASE DE SONDAGE : N estimations θ ± 1.96 V(θ) Échantillon 60

Estimations Le recours à un sondage a pour but d'estimer sans biais et avec la plus petite variance possible des paramètres qui concernent une population bien déterminée Les Πk qui dépendent du plan de sondage choisi, devront obligatoirement être incorporées dans les formules d'estimateurs. Les estimateurs de sondages complexes permettent de corriger la sur-représentation Redressements Pondérations: tenir compte du poids de la strate Imputations: corriger les non-réponses 61

Conclusion (1) Avant tirage PLAN DE SONDAGE Échantillonnage + estimateur adapté Limiter les biais de sélection Correction de la non-réponse Minimiser la variance REDRESSEMENT Pondérations et/ou imputations Après tirage 62

Objectifs de l enquête Champs de l étude Paramètre d intérêt Information à recueillir Mode de recueil des informations Echantillonnage Bases de sondage disponibles adaptées aux objectifs Informations auxiliaires utiles disponibles Coût unitaire Budget disponible Analyse statistique Choix de l estimateur le plus adapté au plan de sondage Redressement pour améliorer la variance et traiter les non-réponses 63

Bibliographie http://www.statcan.ca WARSZAWSKI Josiane. Épidémiologie descriptive. Cours de master 2 recherche épidémiologie. BOUYER et al. Épidémiologie: principes et méthodes quantitatives. Ed INSERM http://ifr69.vjf.inserm.fr/~u88/site/cours%20son dages%202005.pdf 64