Echantillonnage. Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine

Documents pareils
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Item 169 : Évaluation thérapeutique et niveau de preuve

Chapitre 3 - L'enquête descriptive simple

Études épidémiologiques analytiques et biais

Évaluations aléatoires : Comment tirer au sort?

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Probabilités (méthodes et objectifs)

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Chapitre 3 : INFERENCE

PROGRAMME (Susceptible de modifications)

INTRODUCTION AU MARKETING

Soutenance de stage Laboratoire des Signaux et Systèmes

POINTS DE VUE DES CANADIENS SUR LA COUVERTURE DES MÉDICAMENTS D ORDONNANCE

Théorie des sondages : cours 5

Les entrepreneuriales - soirée Tools 1

Webinaire ICCA/RBC : Tendances conjoncturelles Les opérations de change : un risque ou une occasion d affaires?

Les probabilités. Chapitre 18. Tester ses connaissances

MINISTERE DE L'ECONOMIE ET DU DEVELOPPEMENT SECRETARIAT GENERAL INSTITUT NATIONAL DE LA STATISTIQUE ET DE LA DEMOGRAPHIE

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

La nouvelle planification de l échantillonnage

Interne Forces Faiblesses Externe Opportunités Menaces

POKER ET PROBABILITÉ

CE QU IL FAUT SAVOIR PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

«Petites assurances (assurances moyens de paiement/fuites d eau) : grosses dépenses» Questions/Réponses

Panel MBAweb MBA Recherche

23. Interprétation clinique des mesures de l effet traitement

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

La simulation probabiliste avec Excel

un environnement économique et politique

SOMMAIRE I. INTRODUCTION 4 II. SOURCES D INFORMATION 5

Les mathématiques du XXe siècle

Qu est-ce qu une probabilité?

MATHÉMATIQUES. Mat-4104

TSTI 2D CH X : Exemples de lois à densité 1

Analyse Combinatoire

PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT CE QU IL FAUT SAVOIR

Le meilleur moyen de communication au Canada?

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Comment évaluer des initiatives web 2.0 visant le changement des normes sociales? JASP, Hôtel Fairmont Le Reine Elizabeth, 27 novembre 2012

Probabilités conditionnelles Loi binomiale

Probabilités sur un univers fini

Chapitre 1 : Notions. Partie 9 - Rente viagère. Qu est-ce q u u n e «r e n t e v i a g è r e»?

INITIATION AUX METHODES DE SONDAGE

Lutter contre la flambée des coûts des régimes d assurance-médicaments

Étude auprès de la génération X. Le paiement virtuel et la gestion des finances personnelles

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

Lignes directrices de 2004 pour des sondages sur la satisfaction des demandeurs dans le cadre de l assurance-automobile

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Economie de l Incertain et des Incitations

Les stratégies marketing

!-.!#- $'( 1&) &) (,' &*- %,!

INFORM OBLIGATIONS DE PREMIÈRE QUALITÉ ET OBLIGATIONS À HAUT RENDEMENT: AUGMENTER LE RENDEMENT ET DIMINUER LE RISQUE GRÂCE À UNE JUSTE COMBINAISON

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Liste des auteurs et remerciements

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Rotary et réseaux sociaux. Séminaire Image Publique du Rotary oct Rotary et réseaux sociaux Jacqueline Fétis

9.11 Les jeux de hasard et d argent

Classe de première L

Comparaison des coûts de gestion des Assureurs Santé et de l Assurance Maladie. Annexe méthodologique

CREER UNE ENTREPRISE A JERSEY

Bienvenue à notre sondage en ligne pour l examen du Code canadien de déontologie professionnelle des psychologues

Echantillonnage INTRODUCTION. Module 1

Lois de probabilité. Anita Burgun

Le bilan comparatif des médicaments (BCM): où en sommes-nous?

Cours de Probabilités et de Statistique

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

ACCRÉDITATION DES CENTRES PRIVÉS ET DES PROGRAMMES DE FORMATION PROFESSIONNELLE EN HAÏTI. Formulaire de demande d une autorisation de fonctionnement

Les pratiques de consommation de jeux vidéo des Français

Le rendez-vous de l innovation La Fintech Juillet 2015

L analyse de la gestion de la clientèle

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

1 les caractères des êtres humains.

«Evaluation de l activité physique chez les enfants et adolescents à l aide d une méthode objective» SOPHYA

RÉGION CENTRE, PLUS QU UNE RÉGION, UNE CHANCE POUR LA MOBILITÉ! FLASH TRAFIC

Observatoire Orange Terrafemina vague 14. La ville connectée. Sondage de l institut CSA

GUIDE PRATIQUE DU CHAI GUIDE D AUDIT DE LA FONCTION ACHAT

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

ELABORATION DU PLAN DE MONITORING ADAPTE POUR UNE RECHERCHE BIOMEDICALE A PROMOTION INSTITUTIONNELLE

Le référentiel RIFVEH La sécurité des personnes ayant des incapacités : un enjeu de concertation. Septembre 2008

Observatoire Economique et Statistique d Afrique Subsaharienne

Bulletin de service Bureaux d agents, de courtiers en immeubles et d évaluateurs de biens immobiliersetdes autres activités liées à l immobilier

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Introduction au Data-Mining

Le processus du développement économique

Chapitre 11 METHODOLOGIE D ENQUÊTES

Gestion intégrée des risques technologiques émergents

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

La statistique et la probabilité. Durée suggérée: 2 semaines

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

N.-B. 18 à 34 24,3 28,1 20,1 24,4. 35 à 54 36,7 23,0 31,6 49,3 55 à 64 18,7 18,7 21,3 16,9 65 et plus 20,3 30,2 26,9 9,4

Analyse et interprétation des données

Transcription:

Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine

Plan Terminologie Méthodes de sondage Qualité des estimateurs

Comment dénombrer? Question : combien y a-t-il de personnes atteintes de troubles de la vue parmi les conducteurs automobiles en France? Réponse : 10%? 40 %? 75 %? Il est impossible de les compter toutes en examinant toute la population des conducteurs français Il va être nécessaire d utiliser une procédure particulière (l échantillonnage) et des méthodes statistiques pour estimer la précision du résultat (incertitude)

Un peu de terminologie Population : Toutes les personnes à qui les résultats doivent s appliquer Echantillon : Dans la plupart des cas, la taille de la population est trop importante pour que l on puisse étudier tous les individus qui la compose. On étudie un sous-groupe appelé échantillon. Unités : il peut s agir d unité individuelle (sujet) ou collective (foyer, hôpitaux)

Un peu de terminologie Phénomène d intérêt : c est la caractéristique de santé qui fait l objet de l étude Sondage : toute forme d échantillonnage qui permet de constituer un échantillon à partir de la population Estimateur : résultat estimé à partir des données observées dans l échantillon qui représente la valeur vraie du phénomène dans la population, avec un certain degré d incertitude

Différentes méthodes Sondage empirique Sondage aléatoire simple Sondage stratifié Sondage en grappe Sondage pseudo-aléatoire

Sondage empirique Constituer un échantillon de telle façon qu un nombre fixe de personnes à enquêter soit atteint. On utilisera volontiers la méthode des quotas, indiquant à l enquêteur de s arrêter lorsqu il a atteint le quota voulu dans chaque catégorie: X hommes, Y femmes Z 1 [18 25 ans[, Z 2 [25 60 ans[, Z 3 [60 ans et +] etc

Sondages probabilistes Ensemble de méthodes appelées sondages probabilistes, parce que chaque unité échantillonnée a une probabilité connue à l avance de figurer dans l échantillon Ceci permet de généraliser l estimation du phénomène à la population dont est issu l échantillon d apprécier la marge d erreur, le degré d incertitude de l estimateur

Sondage aléatoire simple Chaque sujet de la population a la même probabilité d être inclus dans l échantillon Maximise la possibilité de conclure pour toute la population Base de sondage : liste pré-établie des sujets Liste des conducteurs Liste des foyers Liste des abonnés au téléphone

Sondage aléatoire simple Procéder à un tirage au sort des sujets dans la base : Programme informatique Tables de nombre au hasard TAS Population Échantillon

Sondage aléatoire simple Le sondage permet de limiter la taille de l investigation Avantages : Réduction des coûts d investigation Meilleure qualité de l observation chez chaque sujet (enquête, questionnaire, investigation clinique) Délai d obtention des résultats plus rapide Limite : il est nécessaire d avoir une base de sondage fiable

Sondage stratifié Dans certains cas, on peut craindre d obtenir trop peu de sujets d un sous-groupe particulier (p.ex. les conducteurs occasionnels), alors qu on peut supposer une fréquence particulière du phénomène dans ce sousgroupe. On risque que l échantillon de ce sous-groupe de la population ne permette pas de calculer un estimateur suffisamment précis Par le simple fait du hasard, on peut sous-estimer ou sur-estimer la fréquence du phénomène dans ce sousgroupe

Sondage stratifié La méthode consiste à identifier les niveaux / catégories de la variable qui caractérise cet aspect de la population exemple 1 : fréquence de la conduite Quotidienne longs trajets Quotidienne courts trajets Occasionnelle Chaque catégorie définit une strate de la population

Sondage stratifié La méthode consiste à identifier les niveaux / catégories de la variable qui caractérise cet aspect de la population exemple 2 : on peut supposer que les personnes d un même groupe partagent des caractéristiques qui déterminent plus particulièrement le phénomène Les troubles de la vue peuvent comporter une composante d origine génétique : daltonisme, myopie Les personnes d une même famille ont donc une probabilité différente d une autre famille Chaque famille définit une strate de la population

Sondage stratifié L échantillon est constitué par un sondage aléatoire simple par strate : Tirage au sort des unités dans chaque strate Population TAS Échantillon

Sondage stratifié Ainsi, connaissant le poids (la proportion) de chaque strate dans la population, on peut en tenir compte au moment du calcul des estimateurs Avantage : cette méthode permet d améliorer la précision du sondage Inconvénient : le calcul de l estimateur est plus complexe

Sondage en grappe Dans certains cas, il est difficile d obtenir un échantillon d individus indépendants les uns des autres. Il peut être plus facile d enquêter dans un lieu où ils sont rassemblés Exemple : les sujets d un même foyer (résidence) Le sous-groupe de la population définit une grappe

Sondage en grappe Ce sont les grappes qui sont tirées au sort dans la population L ensemble des sujets d une grappe tirée au sort sera enquêté Population TAS Échantillon

Sondage en grappe Avantages : il n est pas nécessaire de disposer d une base de sondage des individus, une liste des grappes suffit Inconvénients : le sondage est moins précis que le sondage aléatoire simple L analyse doit prendre en compte l effet grappe, ce qui est plus complexe

Sondage pseudo-aléatoire En l absence de base de sondage, on peut prendre des méthodes d allure organisée, sur un caractère supposé indépendant du phénomène étudié, mais qui ne garantissent pas un vrai tirage au sort Ces méthodes ne garantissent pas la représentativité comme le ferait un véritable tirage au sort

Sondage pseudo-aléatoire Méthode systématique : les conducteurs qui franchissent un carrefour, qui se garent sur un parking Méthode dite «des itinéraires» : les conducteurs de telle maison, puis telle autre plus loin.

La qualité de l estimation La qualité d'une estimation repose sur sa précision et sur l'absence de biais. La représentativité de l échantillon est la qualité garantie par une estimation sans biais. La précision n est jamais parfaite et se traduit par une incertitude sur la valeur de l estimateur

La qualité de l estimation une estimation sans biais est obtenue au mieux par les méthodes de sondage aléatoire estimation non biaisée estimation biaisée

La qualité de l estimation La précision d une estimation dépend du degré d erreur de la méthode de mesure L incertitude sur la valeur de l estimateur est exprimée par son intervalle de confiance L incertitude diminue lorsque la taille de l échantillon augmente

La qualité de l estimation Elle dépend donc de la méthode d échantillonnage choisie et de la taille de l échantillon