Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.



Documents pareils
Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

Terminale S. Terminale S 1 F. Laroche

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

4 Approximation des fonctions

Séries réelles ou complexes

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Limites des Suites numériques

Petit recueil d'énigmes

Pour l inclusion : Appuyer les comportements positifs dans les classes du Manitoba

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Résolution numérique des équations aux dérivées partielles (PDE)

Guide du suivi et de l évaluation axés sur les résultats P ROGRAMME DES NATIONS UNIES POUR LE DÉVELOPPEMENT B U R E AU DE L É VA L UATION

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Suites et séries de fonctions

Chapitre 3 : Fonctions d une variable réelle (1)

mômes en santé la santé en collectivité pour les enfants de 3 à 18 ans édition 2012 avec le soutien de la Fédération Wallonie-Bruxelles

Comportement d'une suite

SÉRIES STATISTIQUES À DEUX VARIABLES

Les polymères. I) Historique

Classification non supervisée

comment faire face? définition du responsable

Modèles et Méthodes de Réservation

Les devoirs en Première STMG

La population jeune en Afrique sera le moteur

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Apprentissage non paramétrique en régression

IV. La ressemblance entre apparentés

Programmes des classes préparatoires aux Grandes Ecoles

Peut-on croire un sondage?

Transcription:

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES PLAN DU CHAPITRE 2 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.1 Pla de sodage 2.2.2 Probabilités d iclusio 2.3 SONDAGE ALEATOIRE SIMPLE AVEC REMISE (PEAR) 2.3.1 Pla de sodage 2.3.2 Probabilités d iclusio 2.4 VARIABLES INDICATRICES 2.5 ESTIMATEUR 2.6 ESTIMATION D UNE MOYENNE 2.6.1 Sodage aléatoire PESR 2.6.2 Sodage aléatoire PEAR 2.7 ESTIMATION D UN TOTAL 2.7.1 Estimateur de τ 2.7.2 Espérace de ˆτ 2.7.3 Précisio de ˆτ 1

2.8 ESTIMATION D UNE PROPORTION 2.8.1 Estimateur de π 2.8.2 Espérace de ˆπ 2.8.3 Précisio de ˆπ 2.9 EFFET DE (PLAN DE) SONDAGE 2.9.1 Défiitio 2.9.2 Exemple 2.10 INTERVALLES DE CONFIANCE 2.10.1 Distributio d échatilloage de ˆµ 2.10.2 Itervalles de cofiace 2.10.3 Icertitude absolue et relative 2.10.4 Détermiatio de la taille d u échatillo 2.10.5 Exemples 2.11 ALGORITHMES POUR LES PLANS SIMPLES SANS REMISE 2.11.1 Méthode du tri aléatoire 2.11.2 D autres méthodes fourissat u pla de sodage de type PESR avec échatillos de taille fixée a priori 2.11.3 Tirage de Beroulli 2

2.1 DEFINITIONS Le ombre de tirages à effectuer das la populatio est fixé a priori 2 procédures possibles de tirage aléatoire : a) tirages au hasard avec remise : tirages au hasard successifs et e replaçat l uité selectioée das la populatio avat le tirage suivat b) tirages au hasard sas remise : tirages au hasard successifs et sas replacer l uité sélectioée das la populatio avat le tirage suivat Ω = {s 1, s 2,..., s M } : esemble des échatillos que l o peut obteir par la procédure de tirage aléatoire choisie Caractéristiques du pla de sodage : Tous les idividus de U ot la même probabilité de faire partie de l échatillo S qui sera sélectioé : ils ot tous la même probabilité d iclusio Tous les échatillos apparteat à Ω se voiet associer ue (même) probabilité coue o ulle de sélectio 3

Déomiatios : sodage PEAR : sodage aléatoire simple ou à probabilités égales, avec remise sodage PESR : sodage aléatoire simple ou à probabilités égales, sas remise 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.1 Pla de sodage Les échatillos sot de la forme s = {i 1, i 2,..., i }, avec i 1 i 2... i U et s = Nombre M d échatillos possibles : ( ) N N! M = =!(N )! Pour tout s Ω : p(s) = 1 ( N ) 4

Exemple 2.1 : Populatio : U = {1, 2, 3, 4} = N = 4 Taille de l échatillo à prélever : = 2 Taux de sodage : f = /N = 50% Esemble des échatillos pouvat être obteus par tirage aléatoire PESR : Ω = {{1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4}} = M = 6 O vérifie que ( ) ( ) N 4 4! = = 2 2!(4 2)! = 4! 2!2! = 4 3 2 = 6 = M 2 2 Probabilité de sélectio d u échatillo s particulier : p ({2, 4}) = P ((le 1er sélectioé est 2 et le 2ème sélectioé est 4) ou (le 1er sélectioé est 4 et le 2ème sélectioé est 2)) = P(le 1er sélectioé est 2 et le 2ème sélectioé est 4) +P(le 1er sélectioé est 4 et le 2ème sélectioé est 2) = P(le 1er sélectioé est 2) P(le 2ème sélectioé est 4 le 1er sélectioé est 2) +P(le 1er sélectioé est 4) P(le 2ème sélectioé est 2 le 1er sélectioé est 4) = 1 4 1 3 + 1 4 1 3 = 2 12 = 1 6 = tous les échatillos s de Ω ot la même probabilité de sélectio : p(s) = 1/6 pour tout s Ω 5

2.2.2 Probabilités d iclusio La probabilité d iclusio p i de l idividu i est la probabilité que cet idividu i fasse partie de l échatillo (aléatoire) S qui sera prélevé ; e d autres termes, p i est la probabilité de prélever u échatillo qui cotiee l idividu i : p i = P(i S) = p(s) s Ω i s Das le cas du sodage PESR, pour tout i U : p i = 1 ( ) N s Ω i s ombre d échatillos possibles coteat i = ( ) N ( ) N 1 = 1 ( ) = N N = taux de sodage 6

Exemple 2.1 (suite) : Probabilité d iclusio de l idividu 2 : 3 échatillos sur les 6 échatillos possibles cotieet l idividu 2 = p 2 = 3 6 = 1 2 = N O vérifie que tous les idividus de U ot bie la même probabilité d iclusio : p i = 1 2 pour tout i U 7

2.3 SONDAGE ALEATOIRE SIMPLE AVEC REMISE (PEAR) 2.3.1 Pla de sodage Les échatillos possibles sot de la forme s = {i 1, i 2,..., i } avec i 1, i 2,..., i U. U même idividu peut être sélectioé à plusieurs reprises ( s ). Nombre M d échatillos possibles : M =... (expressio très complexe) M = ombre d échatillos dot les idividus sot disticts + ombre d échatillos das lesquels u idividu est sélectioé 2 fois et les ( 2) autres idividus sot disticts + ombre d échatillos das lesquels 2 idividus sot chacu sélectioés 2 fois et les ( 4) autres idividus sot disticts +... 8

Exemple 2.2 : Populatio : U = {1, 2, 3, 4} = N = 4 Nombre de tirages à effectuer : = 2 Esemble des échatillos pouvat être obteus par tirage aléatoire PEAR : Ω = {{1, 1}, {1, 2}, {1, 3}, {1, 4}, {2, 2}, {2, 3}, {2, 4}, {3, 3}, {3, 4}, {4, 4}} = M = 10 Probabilité de sélectio d u échatillo s particulier : même raisoemet que das l exemple 2.1 p ({2, 4}) = 1 4 1 4 + 1 4 1 4 = 2 16 = 1 8 p ({1, 1}) = 1 4 1 4 = 1 16 = o vérifie que p ({1, 1}) = p ({2, 2}) = p ({3, 3}) = p ({4, 4}) = 1 16 p ({1, 2}) = p ({1, 3}) =... = p ({3, 4}) = 2 16 = 1 8 9

O peut associer à tout échatillo s Ω ue probabilité de sélectio p(s) telle que p(s) > 0 et p(s) = 1 s Ω MAIS, cotrairemet au sodage aléatoire PESR, les échatillos de Ω e sot pas tous équiprobables. Remarque : Par cotre, si o tiet compte de l ordre de tirage das la défiitio des échatillos, ces deriers redevieet équiprobables : Les échatillos possibles sot de la forme s o = (i 1, i 2,..., i ) avec i 1, i 2,..., i U et i k = idividu sélectioé lors du kème tirage (k = 1,..., ) Nombre M o d échatillos possibles : Pour tout s o Ω o : M o = N p(s o ) = 1 N 10

Exemple 2.2 (suite) : Ω o = {(1, 1), (1, 2), (1, 3), (1, 4) (2, 1), (2, 2), (2, 3), (2, 4) (3, 1), (3, 2), (3, 3), (3, 4) (4, 1), (4, 2), (4, 3), (4, 4)} = M o = 16 = 4 2 p ((2, 4)) = P (le 1er sélectioé est 2 et le 2ème sélectioé est 4) = 1 4 1 4 = 1 16 O vérifie que p(s o ) = 1/16 pour tout s o Ω o 11

2.3.2 Probabilités d iclusio Pour tout i U : p i = P(i S) = 1 P(i / S) = 1 P(i est sélectioé à aucu des tirages) ( ) N 1 = 1 N ( = 1 1 1 ) N = tous les idividus de U ot bie la même probabilité d iclusio Exemple 2.2 (suite) : Probabilité d iclusio de l idividu 2 : ( p 2 = 1 1 4) 1 2 = 1 ( 3 4 ) 2 = 7 16 12

Remarque : Si << N, alors p i = /N = les probabilités d iclusio pour le sodage PEAR sot pratiquemet idetiques à celles pour le sodage PESR Exemple : N = 1 000 = 10 } = f = N = 1% PESR : p i = f = 1% ) 10 PEAR : p i = 1 ( 1 1 1 000 = 0.00995 = 0.01 = 1% 13

2.4 VARIABLES INDICATRICES S = échatillo (aléatoire) qui sera prélevé par tirages aléatoires das la populatio = ombre d idividus disticts das S S = sodage aléatoire PESR : S = PEAR : S (PEAR : u même idividu peut être sélectioé à plusieurs reprises = S est aléatoire) Variables idicatrices d iclusio : pour tout i U, { 1 si i S I i = 0 sio { P(Ii = 1) = P(i S) = p i P(I i = 0) = P(i / S) = 1 p i = I i Bi(1, p i ) = { E(Ii ) = p i Var(I i ) = p i (1 p i ) i U I i = ombre d idividus de U qui fot partie de l éch. S = S 14

i U p i = i U E(I i) = E ( i U I i) = E(S ) Exemple : Pour le sodage PESR : p i = N = N N = i U i U 15

2.5 ESTIMATEUR Objectif Estimer u paramètre-populatio θ : θ = θ(y 1, y 2,..., y N ) Θ (cf. Sectio 1.2.3 : θ = τ, µ, σ 2, π,...) Estimateur ˆθ de θ U estimateur ˆθ de θ est ue foctio des valeurs observées pour Y das l échatillo prélevé, qui pred ses valeurs das l esemble Θ des valeurs possibles de θ : ˆθ = h(y i ; i S) Θ ˆθ est ue variable aléatoire :o e peut pas prédire à l avace quels idividus ferot partie de l échatillo particulier s qui sera effectivemet prélevé = o e peut pas prédire à l avace quelles valeurs de Y serot observées das l échatillo particulier s qui sera effectivemet prélevé = o e peut pas prédire à l avace quelle valeur predra ˆθ das l échatillo particulier s qui sera effectivemet prélevé 16

La valeur prise par ˆθ das l échatillo particulier s est otée ˆθ s : ˆθ s = h(y i ; i s); cette valeur ˆθ s fourit ue estimatio de θ. Comme toute variable aléatoire, l estimateur ˆθ possède ue certaie distributio de probabilité, appelée distributio d échatilloage, étroitemet liée au pla de sodage : {(ˆθs, p(s)) = E(ˆθ) = s Ω p(s)ˆθ s } ; s Ω Var(ˆθ) = s Ω p(s) (ˆθs E(ˆθ) ) 2 17

Exemple 2.3 Populatio : U = {1, 2, 3} Variable d itérêt : Y = âge avec y 1 = 28, y 2 = 32, y 3 = 40 Paramètres-populatio : µ = 28 + 32 + 40 3 = 33.33 σ 2 = (28 33.33)2 + (32 33.33) 2 + (40 33.33) 2 3 = 24.89 π = proportio d idividus das la populatio âgés de mois de 30 as = 1/3 Pla de sodage (PESR) : = 2 Ω = {s 1 = {1, 2}, s 2 = {1, 3}, s 3 = {2, 3}} p(s 1 ) = p(s 2 ) = p(s 3 ) = 1/3 18

Estimateurs : ˆµ = 1 y i = y (moyee-échatillo) i S ˆσ 2 = 1 (y i y) 2 = s 2 (variace-échatillo) i S ˆπ = proportio d idividus das l échatillo S âgés de mois de 30 as Distributios d échatilloage : = s p(s) ˆµ s ˆσ 2 s ˆπ s {1,2} 1/3 30 4 0.5 {1,3} 1/3 34 36 0.5 {2,3} 1/3 36 16 0 1 E(ˆµ) = 1 3 30 + 1 3 34 + 1 3 36 = 33.33 = µ Var(ˆµ) = 1 3 (30 33.33)2 + 1 (34 33.33)2 3 + 1 3 (36 33.33)2 = 6.45 E(ˆσ 2 ) = 1 3 4 + 1 3 36 + 1 3 16 = 18.67 σ 2 19

E(ˆπ) = 1 3 (0.5) + 1 3 (0.5) + 1 3 0 = 1 3 = π ( ) 2 1 + 1 ( 1 3 2 1 ) 2 + 1 3 3 Var(ˆπ) = 1 3 2 1 3 = 0.05 Erreur d échatilloage ( 0 1 3 E gééral, la valeur prise par u estimateur das u échatillo est différete de la valeur du paramètre qu il cherche à estimer. Ex. : E gééral, la moyee-échatillo est disticte de la moyee-populatio. La valeur ˆθ s prise par l estimateur ˆθ das l échatillo s est qu ue estimatio de la valeur exacte du paramètre-populatio θ. L erreur que l o commet e remplaçat θ par ˆθ s est pas imputable à ue icompétece das des mesures ou des calculs : elle résulte du fait qu ue partie de la populatio a été omise. Cette erreur est appelée erreur d échatilloage. O peut évaluer l importace de l erreur d échatilloage associée à u estimateur e calculat le biais et la variace ou l erreur quadratique moyee de cet estimateur. 20 ) 2

Deux propriétés sot gééralemet recherchées pour u estimateur : être sas biais avoir ue boe précisio 21

Biais d u estimateur U estimateur ˆθ du paramètre-populatio θ est sas biais (o biaisé) si et seulemet si E(ˆθ) = θ Ex. : ˆµ est u estimateur sas biais de µ ; ˆπ est u estimateur sas biais de π ; ˆσ 2 est u estimateur biaisé de σ 2 Le biais de l estimateur ˆθ est B(ˆθ) = E(ˆθ) θ 22

Précisio d u estimateur La précisio d u estimateur est mesurée par so erreur quadratique moyee EQM(ˆθ) (mea squared error MSE(ˆθ)) : ] EQM(ˆθ) = E [(ˆθ θ) 2 = p(s)(ˆθ s θ) 2 s Ω ( ) 2 = Var(ˆθ) + B(ˆθ) Si ˆθ est u estimateur sas biais de θ, alors EQM(ˆθ) = Var(ˆθ) Distributios d échatilloage de ˆθ 1 et ˆθ 2 : E(ˆθ 1 ) = E(ˆθ 2 ) = θ ; Var(ˆθ 1 ) < Var(ˆθ 2 ) P ( θ ɛ ˆθ ) 1 θ + ɛ > P ( θ ɛ ˆθ ) 2 θ + ɛ La probabilité de predre ue valeur fort proche de θ est plus grade pour ˆθ 1 que pour ˆθ 2. 23

2.6 ESTIMATION D UNE MOYENNE 2.6.1 Sodage aléatoire PESR Echatillo de taille a) Estimateur de µ : ˆµ PESR = 1 y i = y i S b) ˆµ PESR est sas biais : E(ˆµ PESR ) = µ Dém. : E(ˆµ PESR ) = E ( 1 (moyee-échatillo) ) y i = E i S = 1 y i E(I i ) i U = 1 y i p i i U = 1 y i N i U = 1 y i = µ N i U ( 1 ) y i I i i U car E(I i ) = p i car p i = N (PESR) 24

c) Précisio de ˆµ PESR : ( 1 Var(ˆµ PESR ) = 1 ) σcorr 2 = (1 f) σ2 corr N où f = et σcorr 2 = 1 (y i µ) 2 N N 1 i U La variace et doc la précisio de ˆµ PESR dépedet de trois élémets : la taille de l échatillo : plus l échatillo est grad, plus l estimatio de µ est précise le taux de sodage f : plus f est proche de 1, c està-dire plus la taille de l échatillo est proche de celle de la populatio, plus l estimatio de µ est précise. A la limite, pour f = 1 (échatillo égal à la populatio tout etière), Var(ˆµ PESR ) = 0 : il y a plus d erreur d échatilloage la variace σ 2 corr de la variable d itérêt Y das la populatio U : plus la populatio est homogèe (σ 2 corr petite), plus le sodage y est efficace. Par cotre, soder ue populatio très hétérogèe (σ 2 corr grade) écessite, pour s assurer que Var(ˆµ PESR ) e soit pas trop élevée, de prélever u échatillo de taille importate ou de réaliser u découpage préalable e sous-populatios homogèes (cf. sodage stratifié) 25

d) Estimatio de Var(ˆµ PESR ) O peut motrer que la variace-échatillo corrigée s 2 corr = 1 (y i y) 2 1 i S est u estimateur sas biais de σ 2 corr. Dès lors, Var(ˆµ PESR ) = (1 f) s2 corr est u estimateur sas biais de Var(ˆµ PESR ). La valeur prise par Var(ˆµ PESR ) das l échatillo s particulier effectivemet prélevé ous fourit ue estimatio de la variace, et doc de la précisio, de l estimateur ˆµ PESR de µ. 26

e) Exemple 2.4 Ue populatio U est composée des ciq ombres 2, 3, 6, 8 et 11. O veut estimer la moyee-populatio µ à partir d u échatillo d effectif 2 prélevé das U selo ue procédure PESR. Estimateur de µ : y. Propriétés de y? Paramètres de la populatio : µ = 2 + 3 + 6 + 8 + 11 5 = 6 σ 2 = (2 6)2 +... + (11 6) 2 5 = 10.8 Taux de sodage : σcorr 2 = 5 (10.8) = 13.5 4 f = N = 2 5 = 0.4 = 40% Nombre d échatillos possibles : ( ) ( ) N 5 5! = = 2 2!(5 2)! = 5! 2!3! = 5 4 3 2 1 2 1 3 2 1 = 10 27

Pla de sodage et distributio d échatilloage de y : Echatillos possibles : s p(s) y s {2, 3} 1/10 2.5 {2, 6} 1/10 4 {2, 8} 1/10 5 {2, 11} 1/10 6.5 {3, 6} 1/10 4.5 {3, 8} 1/10 5.5 {3, 11} 1/10 7 {6, 8} 1/10 7 {6, 11} 1/10 8.5 {8, 11} 1/10 9.5 1 E(y) = 1 10 (2.5) + 1 10 (4) +... + 1 10 (9.5) = 6 = µ Var(y) = 1 10 (2.5 6)2 + 1 10 (4 6)2 +... + 1 10 (9.5 6)2 = 4.05 O vérifie bie que Var(y) = (1 f) σ2 corr = (1 0.4) 13.5 2 = 4.05. Supposos que le hasard ous fasse sélectioer l échatillo {2, 3}. Das ce cas, y = 2.5 (estimatio de µ) et s 2 corr = 1 [ (2 2.5) 2 + (3 2.5) 2] = 0.5. 2 1 O estime alors Var(y) par (1 f) s2 corr = (1 0.4)0.5 2 = 0.15. 28

2.6.2 Sodage aléatoire PEAR tirages aléatoires avec remise das la populatio S = ombre (aléatoire) d idividus disticts das l échatillo S qui sera prélevé (i) Lie avec l iférece statistique classique Das la populatio U : Les valeurs prises par la variable d itérêt Y chez les N idividus de U sot = y 1, y 2,..., y N { µ = 1 N i U y i σ 2 = 1 N i U (y i µ) 2 Tirage au hasard (à probabilités égales) d u idividu das la populatio : Il s agit d ue expériece aléatoire dot l esemble des résultats possibles est U. O peut associer à cette expériece aléatoire la variable aléatoire Z qui pred la valeur y i si l idividu sélectioé est l idividu i. 29

Cette v.a. Z possède ue distributio de probabilité qui coïcide avec la distributio (de fréqueces) de Y das U : pour i = 1,..., N, P(Z = y i ) = P(l idividu sélectioé est l idividu i) = 1/N { E(Z) = µ Var(Z) = σ 2 tirages à probabilités égales et avec remise (PEAR) das la populatio : O associe au kème tirage (k = 1,..., ) la variable aléatoire Z k qui pred la valeur y i si l idividu sélectioé au kème tirage est l idividu i : Z k = y i si i k = i; P(Z k = y i ) = P (l idividu sélectioé au kème tirage est l idividu i) = 1/N { E(Zk ) = µ = Var(Z k ) = σ 2 (k = 1,..., ) Les Z k (k = 1,..., ) sot des v.a. idépedates et idetiquemet distribuées (i.i.d.) 30

(ii) Tirage de idividus disticts : S = a) Estimateur de µ : ˆµ PEAR = 1 y i = y i S (moyee-échatillo) Autre écriture possible : ˆµ PEAR = 1 k=1 Z k b) ˆµ PEAR est sas biais : E(ˆµ PEAR ) = µ Dém. : E(ˆµ PEAR ) = 1 E(Z k ) = 1 k=1 µ = µ k=1 c) Précisio de ˆµ PEAR : Dém. : Var(ˆµ PEAR ) = Var Var(ˆµ PEAR ) = σ2 ( 1 = 1 2 k=1 ) Z k = 1 Var(Z 2 k ) k=1 σ 2 = σ2 2 = σ2 k=1 31

Pour le sodage aléatoire PEAR, comme das le cas du sodage aléatoire PESR, la variace et doc la précisio de ˆµ PEAR déped de la taille de l échatillo la variace σ 2 de la variable d itérêt Y das la populatio U = plus l échatillo est grad et la populatio est homogèe, plus l estimatio de µ est précise MAIS, cotrairemet au cas du sodage aléatoire PESR, la variace de ˆµ PEAR e déped pas de la taille N de la populatio (et doc du taux de sodage f), ce qui est pas écessairemet très ituitif!!! d) Estimatio de Var(ˆµ PEAR ) : La variace-échatillo corrigée s 2 corr = 1 (y i y) 2 1 i S est u estimateur sas biais de σ 2 (cf. cours de statistique de base). Dès lors, Var(ˆµ P EAR ) = s2 corr est u estimateur sas biais de Var(ˆµ PEAR ) 32

e) Exemple 2.4 (suite) Nombre d échatillos possibles das le cas PEAR (si l o tiet compte de l ordre du tirage) : N 2 = 25. Echatillos Echatillos possibles : s p(s) y s possibles : s p(s) y s 2, 2 1/25 2 8, 2 1/25 5 2, 3 1/25 2.5 8, 3 1/25 5.5 2, 6 1/25 4 8, 6 1/25 7 2, 8 1/25 5 8, 8 1/25 8 2, 11 1/25 6.5 8, 11 1/25 9.5 3, 2 1/25 2.5 11, 2 1/25 6.5 3, 3 1/25 3 11, 3 1/25 7 3, 6 1/25 4.5 11, 6 1/25 8.5 3, 8 1/25 5.5 11, 8 1/25 9.5 3, 11 1/25 7 11, 11 1/25 11 6, 2 1/25 4 6, 3 1/25 4.5 6, 6 1/25 6 6, 8 1/25 7 6, 11 1/25 8.5 33

Distributio d échatilloage de y : Valeurs possibles de y Probas 2 1/25 2.5 2/25 3 1/25 4 2/25 4.5 2/25 5 2/25 5.5 2/25 6 1/25 6.5 2/25 7 4/25 8 1/25 8.5 2/25 9.5 2/25 11 1/25 1 E(y) = 1 25 (2) + 2 25 (2.5) +... + 1 25 (11) = 6 = µ Var(y) = 1 25 (2 6)2 + 2 25 (2.5 6)2 +... + 1 25 (11 6)2 = 5.4 O vérifie bie que Var(y) = σ2 = 10.8 2 = 5.4. Supposos que le hasard ous fasse sélectioer l échatillo {2, 3}. Das ce cas, y = 2.5 (estimatio de µ) et s 2 corr = 0.5. O estime alors Var(y) par s 2 corr = 0.5 2 = 0.25. 34

(iii) Tirage de m idividus disticts : S = m < 1) Utilisatio des observatios Mêmes résultats qu e (ii) ( ˆµ PEAR ) 2) Prise e compte seulemet des m idividus disticts a) Estimateur de µ : ˆµ diff = 1 S i S diff y i où S = échatillo aléatoire costitué des idividus prélevés S diff = esemble des idividus disticts sélectioés S = #S diff = ombre d idividus disticts das S Remarque : S est aléatoire S diff et S sot aléatoires le ombre d observatios à predre e cosidératio pour calculer ˆµ diff est aléatoire : difficulté supplémetaire!!! b) ˆµ diff est sas biais : E(ˆµ diff ) = µ 35

c) Précisio de ˆµ diff : Var(ˆµ diff ) = ( 1 1 2N + 1 12N 2 ) σ 2 corr Var(ˆµ diff ) Var(ˆµ PEAR ) : das le cas du prélèvemet de idividus par sodage PEAR, il est toujours plus itéressat de e coserver que les uités statistiques distictes. 36

2.7 ESTIMATION D UN TOTAL Das la populatio U : τ = i U y i = Nµ 2.7.1 Estimateur de τ Das le cas du sodage PESR comme das celui du sodage PEAR où l o utilise les observatios de l échatillo, o estime µ par y, que ous désigeros simplemet par ˆµ = Estimateur de τ : ˆτ = N ˆµ N.B.) N est supposé cou 2.7.2 Espérace de ˆτ Das le cas des sodages PESR et PEAR où l o utilise les observatios de l échatillo : E(ˆµ) = µ = E(ˆτ) = NE(ˆµ) = Nµ = τ = ˆτ est u estimateur sas biais de τ 37

2.7.3 Précisio de ˆτ Var(ˆτ) = Var(N ˆµ) = N 2 Var(ˆµ) a) Sodage aléatoire PESR Var(ˆτ) = N 2 (1 f)σcorr/ 2 Var(ˆτ) = N 2 (1 f)s 2 corr/ b) Sodage aléatoire PEAR (utilisatio des observatios de l échatillo) Var(ˆτ) = N 2 σ 2 / Var(ˆτ) = N 2 s 2 corr/ 38

2.8 ESTIMATION D UNE PROPORTION U est partagé e deux sous-esembles : K 1 et K 2 Ex. : K 1 = esemble des idividus de la populatio U qui possèdet ue certaie caractéristique π = proportio d idividus de U qui appartieet à K 1 π peut être vu comme ue moyee-populatio : Soit { 1 si i K1 y i = (i = 1,..., N) 0 si i K 2 µ = 1 N i U y i = π σ 2 = 1 N i U (y i µ) 2 = 1 N i U y2 i µ2 i U y i µ 2 = π π 2 = π(1 π) = 1 N 2.8.1 Estimateur de π Das le cas des sodages PESR et PEAR où l o utilise les observatios de l échatillo : ˆπ = ˆµ = y = 1 i S y i = proportio d idividus das l échatillo qui appartieet à K 1 39

2.8.2 Espérace de ˆπ Das le cas des sodages PESR et PEAR où l o utilise les observatios de l échatillo : = ˆπ est sas biais 2.8.3 Précisio de ˆπ a) Sodage aléatoire PESR E(ˆπ) = π Var(ˆπ) = (1 f) σ2 corr = (1 f) 1 = (1 f) = N N 1 N N 1 σ2 Nπ(1 π) (N 1) = (1 π) )Nπ(1 N (N 1) π(1 π) = (1 f) π(1 π) si N N 1 = 1 40

U estimateur sas biais de σcorr 2 est s 2 1 corr = (y i y) 2 1 = 1 = 1 = 1 = 1 = 1 i S ( 1 ( 1 ( 1 ) (y i y) 2 i S ) yi 2 y 2 i S ) y i y 2 i S (ˆπ ˆπ 2 ) ˆπ(1 ˆπ) = U estimateur sas biais de Var(ˆπ) = (1 f) σ2 corr est ˆπ) Var(ˆπ) = (1 f)ˆπ(1 1 41

b) Sodage aléatoire PEAR (utilisatio des observatios de l échatillo) Var(ˆπ) = σ2 = π(1 π) U estimateur sas biais de σ 2 est s 2 corr = = u estimateur sas biais de Var(ˆπ) = σ2 Var(ˆπ) = ˆπ(1 ˆπ) 1 1ˆπ(1 ˆπ) est E coclusio : facteurs jouat sur Var(ˆπ) (ou Var(ˆπ)) PEAR : Var(ˆπ) = PESR : Var(ˆπ) π(1 π) (1 f) π(1 π) π(1 π) si f fort petit 42

π(1 π) Valeurs de e foctio de π et de (Valeurs e multiples de.01) p.05.10.15.20.25.30.35.40.45.50 100 2.2 3.0 3.6 4.0 4.3 4.6 4.8 4.9 5.0 5.0 150 1.8 2.4 2.9 3.2 3.5 3.7 3.8 3.9 4.1 4.1 200 1.5 2.1 2.5 2.8 3.1 3.2 3.4 3.5 3.5 3.5 250 1.4 1.9 2.3 2.5 2.7 2.9 3.0 3.1 3.1 3.2 300 1.3 1.7 2.1 2.3 2.5 2.6 2.8 2.8 2.9 2.9 350 1.2 1.6 1.9 2.1 2.3 2.4 2.5 2.6 2.7 2.7 400 1.1 1.5 1.8 2.0 2.2 2.3 2.4 2.4 2.5 2.5 450 1.0 1.4 1.7 1.9 2.0 2.2 2.2 2.3 2.3 2.4 500 1.0 1.3 1.6 1.8 1.9 2.0 2.1 2.2 2.2 2.2 600.9 1.2 1.5 1.6 1.8 1.9 1.9 2.0 2.0 2.0 700.8 1.1 1.3 1.5 1.6 1.7 1.8 1.9 1.9 1.9 800.8 1.1 1.3 1.4 1.5 1.6 1.7 1.7 1.8 1.8 900.7 1.0 1.2 1.3 1.4 1.5 1.6 1.6 1.7 1.7 1 000.7.9 1.1 1.3 1.4 1.4 1.5 1.5 1.6 1.6 1 500.6.8.9 1.0 1.1 1.2 1.2 1.3 1.3 1.3 2 000.5.7.8.9 1.0 1.0 1.1 1.1 1.1 1.1 2 500.4.6.7.8.9.9 1.0 1.0 1.0 1.0 3 000.4.5.7.7.8.8.9.9.9.9 4 000.3.5.6.6.7.7.8.8.8.8 5 000.3.4.5.6.6.6.7.7.7.7 10 000.2.3.4.4.4.5.5.5.5.5 20 000.2.2.3.3.3.3.4.4.4.4 43

2.9 EFFET DE (PLAN DE) SONDAGE Questio : Lorsqu o désire estimer u paramètre-populatio par sodage et qu o a le choix etre plusieurs plas de sodage possibles, lequel doit-o utiliser? Répose : L idéal est de pouvoir appliquer le pla de sodage doat lieu à l estimateur le plus précis du paramètrepopulatio. L effet de sodage est ue mesure permettat de comparer deux plas de sodage e termes de précisio des estimateurs qu ils fourisset. 2.9.1 Défiitio θ : paramètre à estimer O dispose de deux plas de sodage différets (pour la même taille d échatillo ) : P 1 = {(s, p 1 (s)); s Ω 1 } P 2 = {(s, p 2 (s )); s Ω 2 } ˆθ 1 : estimateur de θ si l o suit le pla de sodage P 1 ˆθ 2 : estimateur de θ si l o suit le pla de sodage P 2 44

Si ˆθ 1 et ˆθ 2 sot deux estimateurs sas biais de θ, alors l effet de sodage de P 1 par rapport à P 2 est défii par Iterprétatio : D(P 1 P 2 ) < 1 D(P 1 P 2 ) = Var P 1 (ˆθ 1 ) Var P2 (ˆθ 2 ) Var P1 (ˆθ 1 ) < Var P2 (ˆθ 2 ) pour ue même taille d échatillo, l estimateur ˆθ 1 est plus précis que l estimateur ˆθ 2 le pla de sodage P 1 permet ue estimatio plus précise de θ que le pla de sodage P 2 2.9.2 Exemple Preos θ = µ. La taille de l échatillo est fixée a priori. P 1 : sodage aléatoire PESR : ˆθ 1 = ˆµ PESR = y et ( 1 Var PESR (y) = 1 ) σcorr 2 = N N N 1 σ2 P 2 : sodage aléatoire PEAR : ˆθ 2 = ˆµ PEAR = y et Var PEAR (y) = σ2 45

= D(PESR PEAR) = N N 1 = 1 f < 1 = PESR doit être préféré à PEAR Exemple 2.4 (suite) L effet de sodage est doé par D(PESR PEAR) = Var PESR(y) Var PEAR (y) = 4.05 5.4 = 0.75 < 1. y est u estimateur de µ plus précis das le cas PESR ; les valeurs possibles de y sot mois dispersées autour de µ = 6 das le cas PESR que das le cas PEAR. Remarques : O peut motrer que, pour u même ombre de tirages, Var(ˆµ PESR ) Var(ˆµ diff ) Var(ˆµ PEAR ); le pla aléatoire simple sas remise est toujours préférable et, si le pla est avec remise, il est toujours plus itéressat de e coserver que les uités statistiques distictes. 46

Si est petit par rapport à N (càd le taux de sodage f est très petit), alors le gai e précisio de PESR par rapport à PEAR est très faible. Valeurs de N N 1 N 100 10 000 1 000 000 10 0.909 0.999 0.99999 100 0 0.990 0.99990 1 000 0.900 0.99900 10 000 0 0.99000 E pratique, le choix du pla de sodage e se fode pas sur le seul critère de la précisio de l estimateur. Ce choix doit se faire e teat compte aussi du coût de l opératio des possibilités d applicatio des facilités d applicatio Ces différets critères sot parfois cotradictoires! 47

2.10 INTERVALLES DE CONFIANCE 2.10.1 Distributio d échatilloage de ˆµ (i) Sodage aléatoire PEAR Rappels : tirages au hasard successifs avec remise O associe au kème tirage (k = 1,..., ) la variable aléatoire Z k qui pred la valeur y i si l idividu sélectioé au kème tirage est l idividu i Z 1, Z 2,..., Z sot des v.a. s i.i.d. telles que E(Z k ) = µ et Var(Z k ) = σ 2 pour tout k = 1,..., ; Z k a ue distributio de probabilité qui coïcide avec la distributio de fréqueces de la variable d itérêt Y das la populatio U Si Y a ue distributio de fréqueces que l o peut approcher (ajuster) par la loi N(µ, σ 2 ), alors o peut cosidérer que Z 1, Z 2,..., Z sot i.i.d. N(µ, σ 2 ) et ˆµ = 1 ) Z k N (µ, σ2 k=1 ˆµ µ σ/ N(0, 1) 48

Si, de plus, σ 2 est icou, o peut l estimer par so estimateur sas biais s 2 corr et o a ˆµ µ s corr / t 1 Das le cas où l o e coaît pas la distributio de Y das U, le théorème cetral limite (TCL) ous idique que, si 30, ˆµ µ σ/ N(0, 1) Si, de plus, σ 2 est icou, o peut l estimer par so estimateur sas biais s 2 corr et o a ˆµ µ s corr / N(0, 1) (ii) Sodage aléatoire PESR Si o défiissait des v.a. s Z k (k = 1,..., ) comme pour le sodage aléatoire PEAR, elles e seraiet i idépedates, i équidistribuées = impossibilité de faire appel au TCL classique = utilisatio d u théorème cetral pour populatio fiie 49

Si U (N) est ue populatio de taille N, de moyee µ (N) et de variace (σ (N) ) 2 et si y () est la variable aléatoire correspodat à la moyee arithmétique des observatios d u échatillo aléatoire S () de taille : y () = 1 i S () y i, alors y () µ (N) Var(y () ) N(0, 1) quad et N, et sous des coditios géérales liées à la part de (σ (N) ) 2 due à chaque élémet de U (N) Sous des coditios idetiques : y () µ (N) Var(y () ) N(0, 1) 50

2.10.2 Itervalles de cofiace De maière géérale, si ˆθ est u estimateur o biaisé de θ et si o peut supposer que ˆθ θ N(0, 1), Var(ˆθ) l itervalle de cofiace pour θ au iveau de cofiace 1 α (0 < α < 1) est doé par ] [ˆθ ± z 1 α/2 Var(ˆθ), où z 1 α/2 est le quatile d ordre 1 α/2 de la loi N(0, 1) (si X N(0, 1), alors P[X z 1 α/2 ] = 1 α/2) Dém. : Si X N(0, 1), alors P( z 1 α/2 X z 1 α/2 ) = 1 α. 51

Puisque ˆθ θ Var(ˆθ) N(0, 1), o a doc ( ) P z 1 α/2 Var(ˆθ) ˆθ θ z 1 α/2 = 1 α = P (ˆθ z 1 α/2 Var(ˆθ) θ ˆθ + z 1 α/2 = 1 α ) Var(ˆθ) N.B.) si 1 α = 95%, alors z 1 α/2 = z 0.975 = 1.96 si 1 α = 90%, alors z 1 α/2 = z 0.95 = 1.645 (i) I.C. pour µ au iveau de cofiace 1 α : ] [ˆµ ± z 1 α/2 Var(ˆµ) PESR : PEAR : ] [ˆµ ± z 1 α/2 (1 f) s2 corr ] [ˆµ ± z 1 α/2 s 2 corr 52

(ii) I.C. pour τ au iveau de cofiace 1 α : ] [ˆτ ± z 1 α/2 Var(ˆτ) PESR : PEAR : ] [ˆτ ± z 1 α/2 N 2 (1 f) s2 corr ] [ˆτ ± z 1 α/2 N 2 s 2 corr (iii) I.C. pour π au iveau de cofiace 1 α : ] [ˆπ ± z 1 α/2 Var(ˆπ) PESR : PEAR : ] [ˆπ ± z 1 α/2 (1 f) ˆπ(1 ˆπ) 1 [ˆπ ± z 1 α/2 ] ˆπ(1 ˆπ) 1 Remarque : L I.C. pour θ est u itervalle aléatoire : les valeurs de ses bores variet d u échatillo à l autre. 53

Exemple 2.5 U échatillo de 400 automobilistes d u pays compred 40 propriétaires d ue voiture de marque A. Costruisez u itervalle de cofiace, au iveau de cofiace de 95%, pour la proportio réelle d automobilistes de ce pays qui possèdet ue voiture de marque A, e cosidérat que l échatillo a été prélevé selo u tirage PESR das ue populatio de taille a) N = 5 000 ; b) N = 100 000. Solutio = 400 π = proportio d automobilistes possédat ue voiture de marque A das le pays ˆπ = 40/400 = 0.1 L I.C. pour π au iveau de cofiace de 95% est ] [ˆπ ± z 0.975 Var(ˆπ) = Puisque le tirage est PESR, ous avos ˆπ(1 ˆπ) Var(ˆπ) = (1 f) 1 = (1 f)(0.00023) [ ˆπ ± (1.96) ] Var(ˆπ). = (1 f) (0.1)(0.9) 399 a) Si N = 5 000, le taux de sodage est égal à f = 400 5 000 = 0.08 = 8%. O a alors Var(ˆπ) = (0.92)(0.00023) = 0.00021 Var(ˆπ) = 0.01441 54

L I.C. pour π au iveau de cofiace de 95% est alors [0.1 ± (1.96)(0.01441)] = [0.1 ± 0.02823] = [0.07177 ; 0.12823] = [7.177% ; 12.823%] b) Si N = 100 000, le taux de sodage est égal à f = 400 100 000 = 0.004. O a alors Var(ˆπ) = (0.996)(0.00023) = 0.00022 Var(ˆπ) = 0.01499 L I.C. pour π au iveau de cofiace de 95% est alors [0.1 ± (1.96)(0.01499)] = [0.1 ± 0.02938] = [0.07062 ; 0.12938] = [7.062% ; 12.938%] O voit doc sur cet exemple que, lorsque le taux de sodage dimiue (à taille d échatillo fixée), la précisio (estimée) de l estimateur ˆπ de π dimiue et, par coséquet, l I.C. s élargit quelque peu. Exemple 2.6 145 méages de touristes séjourat e Frace das ue régio doée ot dépesé, e moyee jouralière, 35.5 Euros ; l écart-type de ces 145 dépeses jouralières s élève à 8.4 Euros. Sachat que das la régio où a été effectuée l equête il est veu 50 000 méages de touristes, que peut-o dire de la dépese globale jouralière de l esemble de ces méages (o suppose que l échatillo est du type PESR)? 55

Solutio Paramètre à estimer : τ = dépese jouralière globale des 50 000 méages de touristes. ˆτ = Ny = (50 000)(35.5) = 1 775 000 Euros Le tirage état PESR, o a Var(ˆτ) = N 2 (1 f) s2 corr f = 145 = 0.0029 = 0.29% 50 000 s 2 corr = 145 144 (8.4)2 = 71.05 = (50 000) 2 (1 0.0029) 71.05 = 1 221 447 500 145 L I.C. pour τ au iveau de cofiace de 95% est dès lors égal à ] [ˆτ ± z 0.975 Var(ˆτ) = [1 775 000 ± (1.96)(34 949.21)] = [1 775 000 ± 68 500.46] = [1 706 499.54 ; 1 843 500.46] Il y a doc 95 chaces sur 100 que la dépese jouralière globale des 50 000 méages de touristes soit comprise etre (approximativemet) 1 706 500 Euros et 1 843 500 Euros. 56

2.10.3 Icertitude absolue et relative Si l I.C. pour θ est de la forme [ˆθ d, ˆθ + d], d est appelé icertitude absolue (= demi-logueur de l I.C.) De maière géérale, d = z 1 α/2 Var(ˆθ) L icertitude relative est défiie par d/ˆθ (e %) (i) Icertitude absolue pour µ / PESR z 1 α/2 (1 f) s2 corr (ii) Icertitude absolue pour τ / PESR z 1 α/2 N 2 (1 f) s2 corr (iii) Icertitude absolue pour π / PESR ˆπ) z 1 α/2 (1 f)ˆπ(1 1 Tout comme l I.C., l icertitude absolue d est aléatoire : sa valeur varie d u échatillo à l autre. 57

d déped de α et de Var(ˆθ) (et doc aussi, de faço idirecte, de Var(ˆθ) et de ) : 1) 1 α = z 1 α/2 = d 2) = d Pour ue proportio π, l icertitude absolue d déped de π (ou ˆπ). Pour u iveau de cofiace de 95% : ˆπ) d = 1.96 (1 f)ˆπ(1 1 ˆπ) = 2 (1 f)ˆπ(1 ˆπ(1 ˆπ) 1 < 2 2 4 = 1 Valeur de 1/ (icertitude absolue maximale pour 1 α = 95%) 1/ 100 10% 400 5% 1 000 3% 1 600 2.5% 10 000 1% 58

Icertitude relative d/ˆπ (e %) pour l estimateur ˆπ d ue proportio (1 α = 0.95 ; f = 0 ; d ˆπ(1 ˆπ) = 2 ) ˆπ.10.20.30.40.50 100 60 40 31 24 20 200 42 28 21 18 14 300 34 23 17 14 12 500 26 19 15 12 10 1 000 18 13 9 8 6 2 000 14 9 7 6 4 5 000 8 6 4 4 3 10 000 6 4 3 3 2 59