Sondage en épidémiologie Dr Julien Mancini julien.mancini@univmed.fr Laboratoire d Enseignement et de Recherche sur le Traitement de l Information Médicale Faculté de Médecine de Marseille, Université de la Méditerranée
Exercice Pour déterminer la proportion d accouchements par césarienne de la ville de Marseille, vous avez accès aux dossiers médicaux de 3 des plus grandes maternités de la ville : Hôpital Nord, Conception et St Joseph. Quelle est la population cible? Quelles données utilisez-vous? Votre échantillon peut-il être considéré comme biaisé?
Exercice (suite) Un recueil de données élargi dans la ville trouve une proportion d accouchements par césarienne de 10%, alors que vous trouviez 20%. Qu en concluez-vous?
Population = Ensemble des individus (unités statistiques) Population cible Celle à laquelle on voudrait généraliser les résultats Pop. pour laquelle on veut recueillir des infos Population source Celle qu on va réellement étudier Pop. pour laquelle on peut recueillir des infos
Base de sondage Liste des unités statistiques Recensement (exhaustivité +++) Liste téléphonique Propriétés recherchées : Exhaustivité Absence de doublons (tel. fixe) (tel. fixe + portables)
Schéma Population cible Patients atteints d une maladie en France Population source Patients suivis dans un hôpital Base de Sondage Liste des consultations Échantillon Échantillon
Taille de l échantillon Fonction de : Taille de la pop. Précision souhaitée des estimations Variabilité Méthode de sélection Non-réponses, perdus de vue Contraintes «logistiques» : budget, calendrier
Sondages +/- (+) Moins cher Plus rapide Infos + riches (-) Représentativité? Erreurs d échantillonnage
Fluctuation d échantillonnage Biais
Sondages : types Non aléatoires : (- cher + rapide) Convenance Volontaires Quotas Aléatoires : (+ représentatif extrapolation) Simples / stratifiés / en grappe 1 ou plusieurs degrés
Sondages Non aléatoires Convenance Biais +++ Volontaires Biais +++ Quotas «Représentativité» définie à priori pour certaines caractéristiques Attention aux biais car sélection dans les catégories de volontaires ou par convenance risque de mauvaise représentativité
Sondage aléatoire simple Objectif Même proba. d appartenir à l échantillon Base Liste complète des sujets Tirage Numérotation des sujets Tirage au sort de numéros (avec ou sans remise) informatique +++ (ex: EpiTable/EpiInfo) Fraction de sondage (f=n/n)
Sondage stratifié Objectif Proba. identique ou différente d appartenir à l échantillons selon la strate i On peut sur-représenter des strates avec petits échantillons N i Base Liste complète des sujets dans chaque strate Tirage Numérotation des sujets Tirage au sort dans les strates Fractions de sondage (f i =n i /N i )
Sondage stratifié +/- (+) Simple Sur-représentation gain en précision (-) Liste disponible / strates? Si facteur (strate) liée au paramètre étudié
Sondage en grappes Objectif Pratique+++ Base Liste complète des grappes Tirage Numérotation des grappes Tirage au sort des grappes
Sondage en grappes +/- (+) Pas besoin de base de sondage détaillée Pratique (limite dispersion géographique) (-) Effet grappe (ressemblances à l intérieur) Complexe pour échantillonnage et analyse
Sondage à 2 degrés + Complexe Exemple : Tirage au sort de grappe Puis tirage aléatoire simple d individus dans les grappes Complexifications possibles à volonté Représentativité? Analyse + complexe
Sondage à x degrés Exemple : 2 strates d école maternelle (ZEP ou non) Tirage au sort d écoles (grappe) Puis tirage stratifié (sections) d enfants
Sources Czernichow P, Chaperon J, Le Coutour X. Epidémiologie. Paris : Masson; 2001. 464 pages. ISBN 2294003772 Remerciements / diaporama : JB Meynard (IMTSSA)