UE4 Évaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé. Échantillonnage. Frédéric Mauny 04 et 10 octobre 2013

Documents pareils
STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

ZOOM ETUDES Les études paramédicales. Auditorium de l Institut Français du Bénin 9 novembre 2013

Le processus de professionnalisation du cadre de santé : Cadre de santé ou Cadre de soins?

A PROPOS DES CRITERES D ATTRIBUTION DES EQUIVALENCES

Chapitre 3 - L'enquête descriptive simple

Théorie des sondages : cours 5

Code emploi statutaire de la fonction publique hospitalière (NEH) Emplois non-médicaux

TIERS PAYANT. des professionnels de santé GÉNÉRALISATION DU TIERS PAYANT : LA FRANCE A UN NET RETARD!

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Chapitre 3 : INFERENCE

REUNION D INFORMATION LES ETUDES DE SANTE ET LES METIERS AUXQUELS ELLES MENENT

CECOP. Centre d études et de connaissances sur l opinion publique. Les Français, leur épargne et leur retraite

Analyse et interprétation des données

CAHIER DES CHARGES Bourse «Avenir Recherche & Soins»

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

INAUGURATION DU CESU Centre d Enseignement des Soins d Urgence

POKER ET PROBABILITÉ

Dispenses et allègements pour les diplômes du secteur SANITAIRE et SOCIAL

ANNEXE 1 DEFINITIONS DES NIVEAUX DE QUALIFICATION DES EMPLOIS

Observatoire Economique et Statistique d Afrique Subsaharienne

Octobre Médecine Paramédical social

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

La classification automatique de données quantitatives

Baromètre des professions Février 2015

BAROMÈTRE DE LA PROTECTION SOCIALE DES AGENTS TERRITORIAUX

PARAMEDICAL. Métiers et formations. Centre d information et d orientation de NOUMEA

Les professions. de santé. à mayotte et à la réunion. au 1er janvier N 6 Juillet 2012

COMMENT DEVENIR KINÉSITHÉRAPEUTE

Sommaire La méthodologie Les résultats de l'étude... 4

L axe 5 du Cancéropole Nord Ouest

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Publicité Une nouvelle vision de la complémentaire santé

Probabilités conditionnelles Loi binomiale

1. Les types d enquêtes

Fluctuation d une fréquence selon les échantillons - Probabilités

LES FRANÇAIS, LEUR BANQUE ET LEUR MOBILE Novembre BVA Opinion Céline BRACQ Directrice adjointe Pierre ALBERT Chargé d études

Audit et Inspection Les contraintes extérieures B.Malivoir

La nouvelle planification de l échantillonnage

Principe d un test statistique

Publication des liens

Les Français et la liberté de la presse. Ifop pour Metronews et Reporters sans frontières

APRES LE BAC S

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Equipe de Direction : -Docteur Christine BOURDEAU Responsable médical. - Annie PAPON Cadre responsable

Exercices supplémentaires sur l introduction générale à la notion de probabilité

CAPTEURS - CHAINES DE MESURES

POINTS DE VUE DES CANADIENS SUR LA COUVERTURE DES MÉDICAMENTS D ORDONNANCE

L analyse de la gestion de la clientèle

INITIATION AUX METHODES DE SONDAGE

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Garantie Senior Régime général ou local Sécurité Sociale

SONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ

La formation comme levier de changement des pratiques

Résumé du projet (french) Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Les métiers porteurs Perspectives 2015

Réseau de Santé du Pays des Vals de Saintonge Pôle de santé du Canton d Aulnay de Saintonge MSP Aulnay et Néré PROJET D AULNAY PSP

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Les intentions de vote pour les élections régionales en Midi-Pyrénées- Languedoc-Roussillon

Un projet multi-établissements de territoire en Franche-Comté

REGLEMENT D INTERVENTION BOURSES D ETUDES POUR LES FORMATIONS SANITAIRES ET SOCIALES

Prise de conscience. Niveau élevé de prise de conscience de la controverse du Sénat MÉTHODOLOGIE. Pas entendu. Indécis 1% parler. Entendu.

2009 et DUBAR C., TRIPIER P., Sociologie des professions, Collection U, Armand Colin,, 2 éd., 2009

Schéma des études post-bac

Les Français et les complémentaires santé

FMC GMBS -02 MARS 2010 PROJET D EDUCATION THÉRAPEUTIQUE DE PROXIMITÉ DU PATIENT DIABÉTIQUE DIAPASON 36

Le regard des Français sur le secret des échanges entre un avocat et son client. IFOP pour Ordre des avocats de Paris

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

CARTE BLANCHE, Le meilleur pour votre santé ASSURES1

C est votre santé Impliquez-vous

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Atlas de la formation initiale en France Version publipostage et ing 2015

livret d accueil Frais de santé

Lois de probabilité. Anita Burgun

Comité Santé en français de Fredericton. Évaluation de l offre active des services de santé de première ligne. Rapport de sondage-final

Télécharger directement le Petit Guide Métiers des Industries des Papiers et Cartons

Parkdale Community Health Centre 2015 Client Experience Survey

L éducation au Québec : L état de la situation

Etude de marché. Idée de depart. Etude de l environnement et des offres existantes. Clients. actuels. Choix de la cible précise

LE FINANCEMENT DES HOPITAUX EN BELGIQUE. Prof. G. DURANT

Ce document a été mis en ligne par le Canopé de l académie de Montpellier pour la Base Nationale des Sujets d Examens de l enseignement professionnel.

Guide pour remplir la fiche de règlement d emprunt

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

ENSEIGNEMENTS D EXPLORATION CLASSE DE SECONDE GT MARS 2011 SANTÉ ET SOCIAL. Ressources documentaires pour la découverte des métiers et des formations

Introduction aux sondages

Equivalences et dispenses de diplômes pour l accès à un concours

Les femmes restent plus souvent au foyer, travaillent davantage à temps partiel, gagnent moins et sont plus exposées à la pauvreté

Le parcours en greffe de cellules hématopoïétiques : greffe allogénique

TIC pour la santé et l'autonomie : évaluation des services rendus et modèles économiques, une approche nécessairement pluridisciplinaire

Tableau de bord des communautés de l Estrie DEUXIÈME ÉDITION INDICATEURS DÉMOGRAPHIQUES ET SOCIOÉCONOMIQUES

Les Français et l assurance santé

Startup Santé. Les avantages pour vous :

Organiser une permanence d accès aux soins de santé PASS

N.-B. 18 à 34 24,3 28,1 20,1 24,4. 35 à 54 36,7 23,0 31,6 49,3 55 à 64 18,7 18,7 21,3 16,9 65 et plus 20,3 30,2 26,9 9,4

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

La mobilité professionnelle revêt

I. Cas de l équiprobabilité

Sommaire La méthodologie Les principaux enseignements de l étude... 4

Ool O p t i c i e n s L u n e t i e r s U n i s 6 r u e d e l é g l i s e S t G e o r g e s d E s p e r a n c h e.

Transcription:

UE4 Évaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé Échantillonnage Frédéric Mauny 04 et 10 octobre 2013 1 Plan du cours 1. Définitions 2. Base de sondage et tirage au sort 3. Principaux types de sondages aléatoires 4. Choix du mode de sondage 2 1

1. Définitions Populations & échantillons Biais et dispersion Différentes méthodes de sondage 3 Populations & échantillons Population = ensemble des individus (unités statistiques) Population cible : pour laquelle on veut recueillir des informations, à laquelle on voudrait généraliser les résultats. Population source : pour laquelle on peut recueillir des informations. de laquelle on extrait le(s) échantillon(s). 4 2

Populations & échantillons Recensement : exhaustif : tous les sujets de la population sont considérés. Échantillonnage (ou sondage) : procédé qui consiste à n observer qu une partie (échantillon) de la population étudiée, plusieurs échantillons peuvent être constitués. 5 Populations & échantillons Population cible Patients atteints d'une maladie Population source Patients suivis dans un hôpital Base de sondage Liste des consultations Échantillon Série de patients 6 3

Sondage L échantillon en lui-même n est pas intéressant, ce sont les conclusions sur la population d'origine que l on peut tirer de son observation qui en font l intérêt : inférence statistique. Avantages : plus rapide et moins cher qu'un recensement, informations recueillies plus détaillées. Inconvénient : incertitude quant à la possibilité d extrapoler à la population entière. 7 Populations & échantillons La principale qualité d'un échantillon est d'être «représentatif» : tout individu de la population peut figurer avec une probabilité connue dans l échantillon, condition assurée uniquement par le tirage au sort, conduit à des estimations non biaisées. C est le mode de constitution d un échantillon (et non les résultats obtenus) qui permet de le qualifier de représentatif. 8 4

1. Définitions Populations & échantillons Biais et dispersion Différentes méthodes de sondage 9 Biais et dispersion Biais = erreur systématique (1) Dispersion = erreur aléatoire (2) ou fluctuation d'échantillonnage a b c d 10 5

1. Définitions Populations & échantillons Biais et dispersion Différentes méthodes de sondage Sondage empirique ou méthode des "quotas" Sondage aléatoire Sondage pseudo-aléatoire 11 Sondage empirique (quotas) Largement utilisée dans les enquêtes d opinion et les études de marché. On construit un échantillon à l'image de la population en respectant les proportions de chaque catégorie dans la population d'origine On subdivise la population en catégories : sexe, âge, catégorie socioprofessionnelle On suppose que la variable étudiée est liée à la distribution des variables de contrôle. 12 6

Sondage empirique (ex.) Variable Modalités % visé % échantillon Sexe Masculin Féminin 47,8 52,2 49,2 50,8 Age 18 à 24 ans 25 à 34 ans 12,3 19,3 12,6 19,6 CSP chef de famille Agriculteur Ouvrier 2,3 22,8 2,5 19,9 13 Sondage empirique Avantages : ne nécessite pas une base de sondage, économique et rapide à mettre en œuvre, adaptée aux échantillons de faible effectif (<1000) et aux enquêtes avec un fort risque de refus de répondre. Inconvénients : ne permet pas d évaluer la précision des estimations, de calculer une marge d erreur, laisse beaucoup d initiative à l enquêteur. 14 7

Sondage empirique Très peu utilisé en recherche médicale et biologique. Quelques applications en sociologie médicale: attitudes de la population par rapport au test de dépistage d'un cancer, perception du risque,... 15 1. Définitions Populations & échantillons Biais et dispersion Différentes méthodes de sondage Sondage empirique ou méthode des "quotas" Sondage aléatoire Sondage pseudo-aléatoire 16 8

Sondage aléatoire On tire au sort les individus parmi tous ceux de la population. Cela suppose qu'on dispose d'une liste où est répertoriée toute la population : une base de sondage 17 1. Définitions Populations & échantillons Biais et dispersion Différentes méthodes de sondage Sondage empirique ou méthode des "quotas" Sondage aléatoire Sondage pseudo-aléatoire 18 9

Sondage pseudo-aléatoire En cas d'absence de base de sondage. On sélectionne les personnes selon un critère non aléatoire, mais supposé indépendant du phénomène à étudier : tous les gens nés un 30 septembre, "méthodes des itinéraires". Permet d'échapper en partie à la subjectivité de l'enquêteur. Parfois compliqué à mettre à œuvre. 19 Plan du cours 1. Définitions 2. Base de sondage et tirage au sort 3. Principaux types de sondages aléatoires 4. Choix du mode de sondage 20 10

2. Base de sondage et tirage au sort Listes Causes d erreur Principe du tirage au sort 21 Base de sondage : listes Listes de sujets : listes électorales, abonnés au téléphone, listes professionnelles... 22 11

Fichier ADELI = Automatisation DEs LIstes Listes de professionnels de santé : état civil situation professionnelle activités exercées Inscription obligatoire du diplôme Détails des professionnels concernés : médecin, pharmacien, chirurgien-dentiste, sage-femme femme, infirmier, infirmier de secteur psychiatrique, masseurkinésithérapeute, orthoptiste, orthophoniste, audioprothésiste, pédicure-podologue, opticien-lunetier, ergothérapeute, manipulateur d électroradiologie médicale, diététicien, psychomotricien, orthoprothésiste, podo-orthésiste, orthopédiste-orthésiste, oculariste, épithésiste, assistant de service social, psychologue 23 Base de sondage : listes Listes de sujets : listes électorales, abonnés au téléphone, listes professionnelles... Listes de logements (cadastre). Listes administratives : hôpitaux, écoles, entreprises, etc. Carte géographique : sondage aréolaires. 24 12

2. Base de sondage et tirage au sort Listes Causes d erreur Principe du tirage au sort 25 Causes d erreur Base incomplète : défaut le plus fréquent et le plus grave. Répétitions : repérées assez facilement dans l'échantillon, mais on oublie parfois de les rechercher dans la base. Données manquantes : ex: adresse (pour enquête postale ). 26 13

2. Base de sondage et tirage au sort Listes Causes d erreur Principe du tirage au sort JF Viel - UFR SMP Université de Franche-Comté 27 Tirage au sort (1) Informatique (fonction RANDOM des tableurs) Table de nombres au hasard 14

Tirage au sort (2) Mode d utilisation d une table de nombres au hasard Ex : tirer 100 sujets dans une base de 1000 individus, numérotés de 000 à 999. Dans une table, on prend les 100 premiers nombres de 3 chiffres en éliminant les répétitions. n 265, 364, 774, 836, 718, 574, 733, 144, 407, 422 Plan du cours 1. Définitions 2. Base de sondage et tirage au sort 3. Principaux types de sondages aléatoires 4. Choix du mode de sondage 30 15

3. Principaux types de sondages aléatoires Sondage élémentaire Sondage aléatoire simple Sondage aléatoire systématique Sondage stratifié Sondage en grappes Sondage à plusieurs degrés 31 Sondage aléatoire simple Tous les individus ont la même probabilité d être tiré au sort. Fraction ou taux de sondage : f=n/n Deux possibilités : avec remise : un individu peut être choisi plusieurs fois. sans remise : un individu déjà choisi ne peut l être de nouveau, différence importante si f est grand. 32 16

Sondage aléatoire simple Estimation sur l'échantillon d un pourcentage ou d une moyenne, et de leur variance. Précision : intervalle de confiance d un pourcentage : p + ε α p ( 1 p) / n intervalle de confiance d une moyenne : m + ε α s ² / n Intervalle de confiance (IC) : ε α = écart réduit pour un risque α prédéfini ε α = écart réduit pour un risque α prédéfini plus n augmente, plus l IC est réduit, donc plus l estimation est précise. 33 Exemple de calcul d IC n=50 personnes, p=20%, α=5% IC 95% = 0,20 + 1,96x = 0,09 à 0,31 0,20 (1 0,20) / 50 Le pourcentage réel dans la population d'origine (P) est compris entre 9 et 31%, (avec un risque d erreur consenti de 5%). Pour améliorer la précision, on peut : accepter un risque d erreur plus élevé, augmenter la taille de l échantillon. 17

Sondage aléatoire simple On peut calculer à partir de ces formules, le nombre de sujets nécessaire pour estimer le pourcentage ou la moyenne avec une précision et un risque d'erreur donnés. Pourcentage : imprécision : écart e = ε α d'où n = ε α ² p(1-p)/e² Moyenne : imprécision : écart e = ε α d'où n = s² (ε α /e)² p ( 1 p) / n s ² / n JF Viel - UFR SMP Université de Franche-Comté 35 Sondage aléatoire simple n = ε α ² p(1-p)/e² Pour calculer le nombre de sujets nécessaire il faut connaître au préalable le pourcentage (ou la moyenne) qu'on se propose d'estimer! étude pilote, bibliographie, avis d'expert. JF Viel - UFR SMP Université de Franche-Comté 36 18

Nombre de sujets nécessaire : ex. - Estimation d un % dans une population - ordre de grandeur connu = 10% - écart /imprécision souhaitée = 2% - risque d erreur accepté = 10% ε α = 1,64 - Taille de l'échantillon: - n = 1,64 2 (0,10 x 0,90)/(0,02) 2 = 605 personnes Sondage aléatoire simple Toutes ces formules supposent que les distributions suivent une loi normale : n 30, tirage avec remise. En cas de tirage sans remise : la variance est moindre, terme correctif : (N-n)/n = 1-f la taille de l'échantillon est moins grande : n* = n / [1+(n/N)] peu utilisé en pratique car N >> n 38 19

3. Principaux types de sondages aléatoires Sondage élémentaire Sondage aléatoire simple Sondage aléatoire systématique Sondage stratifié Sondage en grappes Sondage à plusieurs degrés 39 Sondage aléatoire systématique Unités de la population rangées de 1 à N Soit n la taille de l échantillon k = N/n = 1 / f, "pas" de sondage Principe : on tire au sort un entier d entre 1 et k, le d ième individu est le premier inclus, pour les autres, il suffit d ajouter le pas de sondage à d : d + k, d + 2k, d + 3k 40 20

Sondage aléatoire systématique Ex: tirer 10 sujets parmi 1000, N = 1000, n = 10, f = 0,01, k = 100 Tirage au sort d'un numéro entre 1 et 100 : 78 78 178 278 378 478 578 678 778 878 978 1 1000 41 Sondage aléatoire systématique Avantages : simplicité. Inconvénients : aucun moyen de connaître la variance des estimateurs, suppose l'absence de périodicité (ou de cycle) de la base de sondage : hommes : numéro pairs, femmes : numéros impairs 42 21

3. Principaux types de sondages aléatoires Sondage élémentaire Sondage aléatoire simple Sondage aléatoire systématique Sondage stratifié Sondage en grappes Sondage à plusieurs degrés 43 Sondage stratifié On divise la population étudiée en sous-populations (ou strates) plus homogènes. Les strates sont définies selon un critère simple (âge, sexe) lié à la variable à estimer. A l'intérieur de chaque strate, on effectue un sondage aléatoire. La variance à l'intérieur des strates est inférieure à la variance totale de la population : chacun des sondages partiels est précis. 44 22

Représentation graphique Sondage stratifié X X X S5 µ S4 S3 m µ m µ S2 S1 45 Sondage stratifié Efficacité d'une stratification X X 46 23

Sondage stratifié Avantages : la stratification réduit la variance des estimateurs, le gain de précision est d'autant plus grand qu'il existe une liaison forte entre le critère de stratification et la variable à étudier, on peut répartir l'échantillon entre différentes sous-populations présentant chacune un intérêt propre, de manière à obtenir pour chacune une estimation satisfaisante, les fractions de sondage peuvent différer entre strates. 47 3. Principaux types de sondages aléatoires Sondage élémentaire Sondage aléatoire simple Sondage aléatoire systématique Sondage stratifié Sondage en grappes Sondage à plusieurs degrés 48 24

Sondage en grappes On ne dispose pas toujours, comme base de sondage, d'une liste d'unités. Mais on peut disposer d'une liste de groupes d'unités (ou grappes) : logements, écoles, hôpitaux, cabinets médicaux Un sondage en grappes consiste à : choisir au hasard un échantillon de grappes, mener l'étude sur tous les individus que contiennent les grappes tirées, l'unité de sondage et l'unité statistique sont distinctes. 49 Sondage en grappes X Dans ce type d'échantillonnage, ou bien une grappe échappe en totalité à l'échantillon, ou bien elle est retenue tout entière. 50 25

Sondage en grappes Avantages : le tirage se fait dans une base de sondage moins étendue, dont il est facile de disposer, la concentration de plusieurs enquêtes au même endroit se traduit par un gain de temps et une économie. Inconvénient potentiel : en termes de précision, ce type de sondage peut selon les cas, se révéler avantageux ou comporter des inconvénients graves. 51 Sondage en grappes Variance totale = var. inter-g. + var. intra-grappes La précision est d'autant meilleure que : var. inter-grappes est petite (meilleurs estimateurs), var. intra-grappes est grande, des grappes très hétérogènes (var. intra-grappes grande) sont dites efficaces, des grappes très homogènes (va. intra-grappes petite) conduisent à un sondage de mauvaise qualité. 52 26

Sondage en grappes des grappes très hétérogènes (var. intra-grappes grande) sont dites efficaces des grappes très homogènes (var. intra-grappes petite) conduisent à un sondage de mauvaise qualité. 53 Sondage en grappes Par rapport à un sondage élémentaire les estimations sont : aussi précises si les grappes sont constituées au hasard, plus précises si les grappes sont plus hétérogènes que ne le voudrait le hasard et semblables entre elles, moins précises si les grappes sont plus homogènes que ne le voudrait le hasard et différentes les unes des autres. 54 27

Sondage en grappes Un sondage en grappes est généralement stratifié : ex: CHU, hôpitaux > 500 lits, hôpitaux < 500 lits. En pratique : préférer plus de grappes mais moins volumineuses, que moins de grappes mais plus volumineuses. Au moins 30 grappes. 55 3. Principaux types de sondages aléatoires Sondage élémentaire Sondage aléatoire simple Sondage aléatoire systématique Sondage stratifié Sondage en grappes Sondage à plusieurs degrés 56 28

Sondage à deux degrés Principe : un premier sondage désigne un échantillon d'unités collectives, ou unités «primaires» (comme pour un sondage en grappes), puis dans chacune des unités collectives, un second sondage ne retient que certaines unités statistiques, ou unités «secondaires» à étudier. deux degrés, car deux tirages au sort. 57 Sondage à deux degrés Avantages : d'abord ceux du sondage en grappes (concentration des enquêtes, économies ). ensuite, ceux d'un sondage à plusieurs degrés : un éventuel effet de grappe défavorable est atténué par le deuxième degré, bon compromis coût / précision. 58 29

Sondage à plusieurs degrés Autant de degrés que de tirages au sort. Ils sont généralement stratifiés. Le calcul des estimations (moyenne, pourcentage) et de leurs variances devient complexe. 59 Plan du cours 1. Définitions 2. Base de sondage et tirage au sort 3. Principaux types de sondages aléatoires 4. Choix du mode de sondage 60 30

4. Choix du mode de sondage oui Base de sondage "élémentaire" non Tirage au sort direct des unités statistiques Tirage au sort de groupes d unités - sondage en grappes Sondage élémentaire Sondage stratifié Un degré Plusieurs degrés 61 Conclusion Toujours exercer un regard critique! population cible? population source? qualité de la liste de sondage? tirage(s) au sort? méthode de sondage? calcul d'un nombre de sujets nécessaire? taille de l'échantillon? variance des estimateurs?... 31