Séminaire Environnement

Documents pareils
STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

LES PROBABILITÉS DE GAINS

Chapitre 3 : INFERENCE

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Théorie des sondages : cours 5

Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france

Exercices supplémentaires sur l introduction générale à la notion de probabilité

La nouvelle planification de l échantillonnage

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Echantillonnage INTRODUCTION. Module 1

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

Évaluations aléatoires : Comment tirer au sort?

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

L évolution des modes de communication, comment adapter les enquêtes en population générale? L expérience de l enquête KABP VIH/sida 2010

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Observatoire Economique et Statistique d Afrique Subsaharienne

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS

Guide méthodologique : Enquêtes en ligne

2.4 Représentation graphique, tableau de Karnaugh

SONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ

Panel MBAweb MBA Recherche

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Chapitre 3. Les distributions à deux variables

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

CHEQUE DOMICILE. PAIEMENT EN LIGNE d un intervenant ou d un prestataire

A-QU EST-CE QUE L ORIE? Intervention ADI

Intervenant : Séverin Poutrel, BURGEAP

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Organisation Gestion du temps. Participation Notes et résumés Etudes et examens

L image du statut d auto-entrepreneur Principaux résultats du sondage. Sondage TNS Sofres pour la Fondapol Juin 2010

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Le recensement, c est quoi? campagne 2011

Probabilités conditionnelles Loi binomiale

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

main-d oeuvr mploi Profil économique opulation active construction résidentielle logement

ilottery 2.0 DÉVELOPPER LE JEU En collaboration avec

Document d orientation sur les allégations issues d essais de non-infériorité

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Rendez-vous de Insee. «Des projections de ménages aux besoins. en logement» Mardi 11 décembre Annaïg LE MEUR, SIAL/DPH

un environnement économique et politique

Consolidation de fondamentaux

Etude de marché. Idée de depart. Etude de l environnement et des offres existantes. Clients. actuels. Choix de la cible précise

PROBABILITES ET STATISTIQUE I&II

Le modèle conceptuel des traitements

THÈME 1. Ménages et consommation

Séminaire Association des médecins-dentiste de Genève Système suisse de prévoyance Fisca finance SA

Les SCPI. François Longin 1

Sondage d opinion auprès des Canadiens Perception à l égard des couples de même sexe PROJET

Quelques rappels concernant la méthode expérimentale

Santé environnement. Description du budget espace-temps et estimation de l exposition de la population française dans son logement

Les stratégies marketing

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Chapitre 2/ La fonction de consommation et la fonction d épargne

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Statistiques Descriptives à une dimension

Début des travaux à Sihlcity

23. Interprétation clinique des mesures de l effet traitement

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

FORMULAIRE DE STATISTIQUES

4. Exercices et corrigés

Benny Creppy Claudia Senardière

Intervention au Colloque de Bruxelles du jeudi 31 octobre 2013 (Mallorie Trannois)

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Mobilité bancaire : des mythes à la réalité 2 milliards d euros de pouvoir d achat économisables. UFC-Que Choisir, 9 décembre 2014

Non-réponse et données manquantes. Sylvie Rousseau & Gilbert Saporta décembre 2011

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Marketing 1 to 1. Gilles Enguehard. DG société Atenys - Conseil & Management. Le marketing one to one. 1. Bref historique

Optimiser la Gestion des réserves ou des excédents de trésorerie des Entreprises et des Associations

Le taux d'actualisation en assurance

!-.!#- $'( 1&) &) (,' &*- %,!

Article 1 : Société organisatrice Article 2 : Acceptation Article 3 : Nature de l opération Article 4 : Modalités de participation

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

POLITIQUE DE LOCATION DE SALLES

Baloise Fund Invest: donnez des ailes à vos placements

Communauté. Découverte. Collaboration. Plan stratégique de la Bibliothèque publique de Winnipeg

La classification automatique de données quantitatives

Température corporelle d un castor (une petite introduction aux séries temporelles)

LE RÔLE DU POKER EN LIGNE DANS LES TRAJECTOIRES DE JEU DE HASARD ET D ARGENT

POKER ET PROBABILITÉ

MRK A : Méthodes d Analyse de Données en Marketing Automne 2010

Les principales méthodes d évaluation

TESTS D'HYPOTHESES Etude d'un exemple

L ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN 2003 : UNE ANALYSE TERRITORIALISÉE DES PROFILS D OCCUPATION DES PARCS ET DES QUARTIERS

Plan d action sur le changement climatique de [nom de la collectivité]

B.A.-BA de la garde d enfants

Observation et Conjoncture Économique. Économie Nationale approche par les revenus

Chapitre 3 - L'enquête descriptive simple

Solution de jeu concours «Scratch2Win»

Soutenance de stage Laboratoire des Signaux et Systèmes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Cours de Tests paramétriques

Étude nationale sur les besoins des clients

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Calcul élémentaire des probabilités

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Prestations de soins et d assistance dispensées par les proches : temps investi et évaluation monétaire

Transcription:

Séminaire Environnement Constitution d échantillons pour études quantitatives Myriam Campardon Unité Mixte de Recherche Cemagref-ENGEES en Gestion des Services Publics Séminaire environnement - Ateliers enquête - 10 octobre 2006 1

Plan Une introduction à la théorie des sondages Les méthodes de sondage probabilistes Les méthodes de sondage empiriques Séminaire environnement - Ateliers enquête - 10 octobre 2006 2

Une introduction à la théorie des sondages Séminaire environnement - Ateliers enquête - 10 octobre 2006 3

Une introduction à la théorie des sondages Exemples de problèmes Population : ensemble des individus auxquels on s intéresse dans le cadre d une étude donnée Population Réservoir d eau Lycéens de la classe de T ale Électorat français Information recherchée Concentration en certaines bactéries Poids moyen Proportion de «oui» au référendum Séminaire environnement - Ateliers enquête - 10 octobre 2006 4

Une introduction à la théorie des sondages Pourquoi échantillonner? Recherche d information sur une population concrète et définie x x x x x x Recensement : Recueil des données sur la population entière (population de faible effectif) x x x x x x Sondage : Mesurer une partie seulement de la population pour économiser temps et argent (tirage d un échantillon) x x Séminaire environnement - Ateliers enquête - 10 octobre 2006 5

Une introduction à la théorie des sondages Estimation Les données obtenues par sondage fournissent une estimation des caractéristiques de la population. Selon l échantillon tiré les résultats varient. Séminaire environnement - Ateliers enquête - 10 octobre 2006 6

Une introduction à la théorie des sondages Un exemple simple Population N=6 a b c d e f total 1 2 4 6 7 16 36 Tirer un échantillon de n=3 individus pour estimer le total (T=36) Séminaire environnement - Ateliers enquête - 10 octobre 2006 7

Une introduction à la théorie des sondages une méthode de tirage simple tirage aléatoire simple (ou tirage exhaustif ou encore tirage sans remise). Chaque lettre a la même chance d être tirée Chaque combinaison de 3 lettres a la même chance de constituer l échantillon 20 échantillons possibles Cette méthode donne-t-elle une bonne estimation de la population totale?? Mesurer la précision et le biais Séminaire environnement - Ateliers enquête - 10 octobre 2006 8

Une introduction à la théorie des sondages Les 20 échantillons possibles Echantillon Total de l'échantillon Estimation du total de la population Erreur de l'estimation abc 7 14-22 abd 9 18-18 abe 10 20-16 abf 19 38 2 acd 11 22-14 ace 12 24-12 acf 21 42 6 ade 14 28-8 adf 23 46 10 aef 24 48 12 bcd 12 24-12 bce 13 26-10 bcf 22 44 8 bde 15 30-6 bdf 24 48 12 bef 25 50 14 cde 17 34-2 cdf 26 52 16 cef 27 54 18 def 29 58 22 Moyenne 18 36 0 Séminaire environnement - Ateliers enquête - 10 octobre 2006 9

Une introduction à la théorie des sondages Le biais Biais = moyenne des erreurs = 0 (espérance de l estimateur) Le tirage aléatoire simple est un plan de sondage donnant des estimations sans biais (valable pour toute population et tout effectif d échantillon) Prendre un grand échantillon ne réduit pas le biais!! Séminaire environnement - Ateliers enquête - 10 octobre 2006 10

Une introduction à la théorie des sondages La précision précision = carré moyen des erreurs = 175.2 (variance de l estimateur) Écart-type = 13.2, soit 37% du vrai total de la population Le tirage aléatoire simple n est pas très précis dans le cas de petites populations Séminaire environnement - Ateliers enquête - 10 octobre 2006 11

Une introduction à la théorie des sondages Illustration Estimations de la vraie valeur selon 2 plans de sondage (tous les échantillons possibles sont représentés) Vraie valeur Quel que soit l échantillon tiré selon le plan 1, l estimation de la vraie valeur sera précise mais «biaisée» (décalé et non centré, par rapport à la vraie valeur) Le plan 2 peut illustrer le plan se sondage aléatoire simple Séminaire environnement - Ateliers enquête - 10 octobre 2006 12

Les méthodes de sondage probabilistes Séminaire environnement - Ateliers enquête - 10 octobre 2006 13

Les méthodes de sondage probabilistes Sondages probabilistes Méthodes de sondage où : Chaque individu de la population a une probabilité connue et non nulle de figurer dans l échantillon Ces probabilités sont prises en compte pour le choix de la méthode de tirage et pour les estimations Possibilité de calculer, à partir de l échantillon, la précision de l estimation obtenue (IC) Les résultats sont généralisables à la population Séminaire environnement - Ateliers enquête - 10 octobre 2006 14

Les méthodes de sondage probabilistes Quelques méthodes Méthode/plan Caractéristiques Dans quel cas l utiliser? Exemple Sondage aléatoire simple (sans remise) Choix de l échantillon laissé au hasard Satisfaisante lorsque la population n est pas très variable (en particulier lorsque les proportions à estimer sont entre 20% et 80%) Stratification - Population divisée en strates (partition) - Échantillon tiré de façon indépendante dans chaque strate - On peut choisir la taille de l échantillon de chaque strate Gain de précision par rapport au sondage aléatoire simple dans la cas d une population hétérogène divisée en strates assez bien homogènes - Sondage sur la population d une ville hôtels et grandes maisons placés à part dans une strate - Estimer la récolte de blé à partir d un échantillon de fermes stratifier en fonction de la taille des fermes Sondage à 2 degrés L unité statistique peut être sous-échantillonnée : - Choix d un échantillon d unités primaires (UP) - Choix d un sous-échantillon d unités secondaires (US) dans chaque UP Quelques fois la seule méthode possible Liste des UP souvent facile à obtenir. Permet d éviter de lister toutes la population (US) Étude de la teneur en vitamine A du beurre produit par les laiteries on ne prendra pas tout le beurre de la laiterie Séminaire environnement - Ateliers enquête - 10 octobre 2006 15

Les méthodes de sondage probabilistes Taille d échantillon? Elle est déterminée en fonction du plan de sondage. Décider d abord de la valeur de l erreur que l on peut tolérer pour l estimation recherchée L expression de l erreur au risque 5% (avoir au + 5 chances sur 100 que l erreur dépasse la valeur fixée) donne n. Séminaire environnement - Ateliers enquête - 10 octobre 2006 16

Les méthodes de sondage empiriques Séminaire environnement - Ateliers enquête - 10 octobre 2006 17

Les méthodes de sondage empiriques Méthode des quotas Échantillon = Modèle réduit de la population Reproduction en proportions de certaines caractéristiques socio-démographiques de la population (âge, sexe, CSP) Hypothèse : «effet de halo» Représentativité de l échantillon (condition permettant d étendre les résultats et conclusions de l enquête à l ensemble de la population) Séminaire environnement - Ateliers enquête - 10 octobre 2006 18

Les méthodes de sondage empiriques Avantages / Inconvénients + rapide (et - coûteux) Individus interchangeables Préférable pour petits échantillons Précision pas calculable rigoureusement Postulat (difficulté de déterminer les caractéristiques pertinentes!) Séminaire environnement - Ateliers enquête - 10 octobre 2006 19

Les méthodes de sondage empiriques Quels quotas? Quotas simples : x% de femmes et y% de 20-25 ans Quotas croisés : z% de femmes de 20-25 ans Plutôt simples que croisés 2 à 3 quotas max. Fins de quotas Ne pas tricher Séminaire environnement - Ateliers enquête - 10 octobre 2006 20

Les méthodes de sondage empiriques Taille d échantillon Veut-on une certaine précision? Homogénéité de la population Ressources Séminaire environnement - Ateliers enquête - 10 octobre 2006 21

Documentation Théorie des sondages : Snedecor & Cochran, «Méthodes statistiques», 6 ème édition (bibliothèque) Les sondages, en général : articles sur Wikipédia Tuyaux sur les tailles d échantillon : http://www.surveystore.info/nsarticle/enqu ete-par-questionnaire.asp Séminaire environnement - Ateliers enquête - 10 octobre 2006 22

Qui interroger? Base de sondage disponible : Échantillon probabiliste (tirage aléatoire) Base de sondage non disponible : Échantillon empirique Séminaire environnement - Ateliers enquête - 10 octobre 2006 23

Et nous?? Absence d information sur la population étudiée Réduction des biais et contrôle de l échantillon : Éviter les enquêtes sur base volontaire! Quotas, unité géographique (région, département, ville, quartier), taille (ville, ménage, ) Temporalité (période, jour, plage horaire) Trouver une répartition qui assure une VARIETE max. Effectifs suffisants dans les «cases» Échantillons non représentatifs mais : Cohérence avec l objet de l étude Rigueur dans la réalisation et l analyse Séminaire environnement - Ateliers enquête - 10 octobre 2006 24