1 Échantillonnage aléatoire simple



Documents pareils
STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Théorie des sondages : cours 5

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Que faire lorsqu on considère plusieurs variables en même temps?

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Plan. 5 Actualisation. 7 Investissement. 2 Calcul du taux d intérêt 3 Taux équivalent 4 Placement à versements fixes.

Probabilités conditionnelles Loi binomiale

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

Annexe commune aux séries ES, L et S : boîtes et quantiles

TSTI 2D CH X : Exemples de lois à densité 1

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

MATHÉMATIQUES FINANCIÈRES

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Introduction à la Statistique Inférentielle

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

Probabilités sur un univers fini

Suites numériques 3. 1 Convergence et limite d une suite

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Variables Aléatoires. Chapitre 2

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles

Document d accompagnement. de la 1 re à la 8 e année. Exemples de tâches et corrigés. 1 re année Tâche Corrigé... 7 Tâche Corrigé...

La classification automatique de données quantitatives

I. Cas de l équiprobabilité

Observatoire Economique et Statistique d Afrique Subsaharienne

La représentativité d un échantillon et son test par le Khi-deux Testing the representativeness of a sample

ACTUALITÉS LANDPARK. Nouvelle version. Landpark Helpdesk. Landpark Helpdesk. Les avantages de la nouvelle version

Principe d un test statistique

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

PROBABILITES ET STATISTIQUE I&II

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Note:... Q1 :... Q2 :... Q3 :... Q4 :... Bonus :... Total :...

Statistiques Descriptives à une dimension

Probabilités (méthodes et objectifs)

INITIATION AUX METHODES DE SONDAGE

Coefficients binomiaux

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de :

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

1. Déterminer l ensemble U ( univers des possibles) et l ensemble E ( événement) pour les situations suivantes.

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

Règlement du concours «Alaska à l'abordage»

Comparaison de fonctions Développements limités. Chapitre 10

Mathématiques appliquées à l'économie et à la Gestion

COMBIEN UN MÉDECIN A-T-IL BESOIN D ARGENT POUR SA RETRAITE?

LES PROBLEMES D ASYMETRIE D INFORMATION AU SEIN DE L ENTREPRISE

Apprentissage par renforcement (1a/3)

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Cryptographie Quantique

Christophe SANNIER

où «p» représente le nombre de paramètres estimés de la loi de distribution testée sous H 0.

Guide de jumelage d emploi

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Estimation et tests statistiques, TD 5. Solutions

Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Dérivés Financiers Contrats à terme

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

Exercices sur le chapitre «Probabilités»

Créé le : Approuvé le :

La persistance des nombres

Direction de l'urbanisme. Foire Aux Questions. Service Urbanisme

S initier aux probabilités simples «Un jeu de cartes inédit»

ilottery 2.0 DÉVELOPPER LE JEU En collaboration avec

Simulation de variables aléatoires

S initier aux probabilités simples «Question de chance!»

Etude des possibilités de passerelles entre les CQP des Entreprises de l industrie pharmaceutique et les CQP des industries chimiques

Classification non supervisée

CONCEPTION ET TIRAGE DE L ÉCHANTILLON

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Partie 1 - Séquence 3 Original d une fonction

S initier aux probabilités simples «Question de chance!»

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

Feuille d exercices 2 : Espaces probabilisés

Compétences essentielles numériques dans les petites entreprises rurales QUESTIONNAIRE DU SONDAGE PRÉ- FORMATION DES EMPLOYEURS

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

4. Exercices et corrigés

Éléments de calcul actuariel

Qu est-ce qu une probabilité?

Renseignements fiscaux de NexGen :

TPE et PME : comment me situer et justifier de mon statut?

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

DEVREZ VOUS RÉAPPRENDRE À TRAVAILLER AVEC VOTRE SUITE PRIMMO?

Gestion de Portefeuille. Mesures de Performance Ajustées du Risque

Modèle de phases FlexWork: Sondage des entreprises et administrations suisses sur la flexibilité géographique et temporelle du travail

Introduction à la théorie des files d'attente. Claude Chaudet

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Guide REER. Guide REER. Repères pour vos REER. Présenté par :

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Les Canadiens continuent de négliger des moyens simples de régler leurs dettes personnelles plus rapidement

Transcription:

Semaine 13 : Compléments sur l échantillonnage aléatoire simple et stratifié 1 Échantillonnage aléatoire simple 1.1 Population infinie Population infinie Trois cas où la population est considérée infinie, et où les formules habituelles d inférence sont valides (car les observations sont considérées comme des tirages indépendants) : 1. 2. 3. 1.2 Population finie Population finie Situation très fréquente : On détient une liste des individus composant la population parmi laquelle on sélectionne des unités. La population est nécessairement finie, et on en tire un échantillon sans remise. Conséquence pour l inférence sur la moyenne µ : L estimation de la moyenne par X reste valide et sans biais, mais la variance de X devra être corrigée pour la dépendance entre les tirages. Fraction de sondage f = fraction de sondage taux d échantillonnage prop. d unités échantillonnées = Plus la fraction de sondage est élevée,plus la variance de X est... On a besoin de la variance de X pour... 1

Estimation de la variance de X V ar(x) = Si la population est finie : V ar(x) = Si la population est infinie : V ar(x) = Intervalle de confiance approximatif sur µ Les formules usuelles d IC ne sont plus valides car la population est finie et l échantillonnage se fait sans remise. La forme générale d un IC sur la moyenne µ reste la même, soit : X ± z α/2 erreur-type estimée(x) Si les données proviennent d une loi normale ou si n est grand, alors un IC approximatif de niveau 1 α pour µ est X± (Source : Alalouf, S., Introduction à la statistique appliquée, 2 e éd., 1990, p. 282.) D une population de 8 427 comptes à recevoir, on prélève un échantillon de taille 30 afin d estimer la valeur moyenne d un compte. Voici les résultats : x = 165, 62 $ s 2 = 35 930, 59 $ 2 Construire un intervalle de confiance à 95% pour le véritable montant moyen d un compte. 2

2 Échantillonnage aléatoire stratifié Échantillonnage aléatoire stratifié Définitions Poids de la strate h : W h = Moyenne de la population : µ = Fraction de sondage de la strate h : f h = 3

Estimateur de la moyenne et variance associée ˆµ = V ar(ˆµ) = V ar(ˆµ) = Comment déterminer n 1, n 2,..., n k? On veut (ou on peut) sélectionner un échantillon de taille n au total. Quelle est la meilleure façon de déterminer le nombre d individus à piger dans chaque strate? Nous aborderons la question sous trois angles différents : 1. Allocation arbitraire 2. Allocation proportionnelle 3. Allocation optimale 2.1 Allocation arbitraire Allocation arbitraire : définition Le nombre d unités échantillonnées dans chaque strate est déterminé par l enquêteur, pour des raisons d économie, de facilité d accès, ou autre. Si on considère que la variance est constante dans toutes les strates, on obtiendra une précision similaire dans toutes les strates en prenant des tailles égales. 4

(Source : Alalouf, S., Introduction à la statistique appliquée, 2 e éd., 1990, p. 285.) On veut estimer la superficie moyenne (m 2 ) des habitations dans une ville en stratifiant selon trois catégories : maisons récentes, maisons anciennes et appartements/condos. Pour des raisons de commodité, on choisit de prendre 10, 20 et 30 observations respectivement dans ces strates. (suite) Voici un résumé des résultats obtenus. Strate h N h n h x h s 2 h 1 : Maisons récentes 80 10 422,6 1 933, 4 2 : Maisons anciennes 200 20 254,4 1 931, 3 3 : Appartements 500 30 176,83 559, 0 Calculer une estimation de la superficie moyenne des habitations et de l erreur-type qui lui est associée. (calculs) 5

2.2 Allocation proportionnelle Allocation proportionnelle : définition Le nombre d unités échantillonnées dans chaque strate est proportionnel au poids de la strate dans la population. Dans l exemple sur la superficie des habitations, combien aurait-on échantillonné de résidences dans chaque catégorie avec une allocation proportionnelle si on avait conservé la taille totale de l échantillon? 2.3 Allocation optimale Allocation optimale : définition But : On veut réduire le plus possible la variance de l estimateur de la moyenne globale. Les strates ayant des valeurs très différentes les unes des autres devront avoir de plus grandes tailles d échantillons. Le nombre d unités échantillonnées dans chaque strate est proportionnel à l écart-type pondéré de cette strate par rapport à l écart-type pondéré global : 6

On veut planifier un sondage pour estimer une moyenne en stratifiant de façon optimale dans trois strates. Voici ce que nous savons de la population. Strate h N h σ h 1 50 000 5 2 100 000 10 3 200 000 5 Quelles sont les tailles d échantillon à collecter dans chaque strate si on souhaite une taille totale de n = 600? 7

3 Stratification a posteriori Stratification a posteriori Il arrive qu un échantillon ne soit pas représentatif de la population, du moins du point de vue d une certaine variable influente sur notre mesure d intérêt. On peut apporter une correction au calcul de la moyenne et de son erreur-type, en donnant un poids à chaque individu de l échantillon en fonction de sa catégorie (de sa strate). Supposons qu on procède à un échantillonnage aléatoire simple sans remise de 100 individus dans une population comprenant 40% de femmes. Par hasard, on obtient la répartition et les résultats suivants : Strate N n Moyenne Variance Hommes 60 000 45 20 4 Femmes 40 000 55 30 9 Total 100 000 100 Quelle serait l estimation de la moyenne et de son erreur-type avec l échantillonnage aléatoire simple? Quelle serait l estimation de la moyenne et de son erreur-type avec une stratification a posteriori? 8