B2 - Itervalle de cofiace d ue moyee avec écart-type icou das le cas d ue populatio Gaussiee Das le cas précédet, o a costruit l IdC à partir de la var X m σ{?. Mais, maiteat σ état icou, il coviet de le remplacer par so estimateur sas biais qui sera la racie carrée de la variace d échatillo : ÿ px i X q 2 C est-à-dire : S 2 S i 1 1 g fÿ e px i X q 2 i 1? 1. O cosidère alors la var Z X m S {?. La var X suivat ue loi Gpm, σq, Z suit ue loi de Studet 1 à 1 degrés de libertés (ddl e abrégé). Rappelos la desité de cette loi : @t P R, où, @m P N, Γpmq ż `8 0 x m 1 e x dx. f Z ptq? 1 Γp `1 2 q 1 π Γp 2 q, `1 ` t 2 `1 L expressio, assez rébarbative, de la desité de cette loi e doit pas vous iquiéter car elle figure das tous les logiciels qui permettet d effectuer des calculs statistiques (sur les tableurs otammet). Doos u exemple d utilisatio de cette loi pour détermier u itervalle de cofiace. Supposos que X Gpm, σq et qu u échatillo (iid) de cette loi doe : 5.134; 6.582; 4.269; 6.425; 4.465; 4.400; 5.507; 5.212; 5.134; 4.852; 5.231; 3.933; 4.925 5.901; 3.166; 3.184; 3.915; 6.315; 4.678; 4.997 Détermier u itervalle de cofiace pour m, au seuil 0.99. O commece par détermier, grâce à u logiciel adapté (tableur par exemple) fourissat les valeurs iverses de la loi de Studet à 20 1 19 ddl, la valeur t 0.99 telle : P r t 0.99 ď X 20 m S 20 {? 20 ď t 0.99s 0.99. Puis, o détermie l itervalle de cofiace aléatoire de m au seuil 0.99 : ȷ P m P rx 20 t0.99? S 20 ; X 20 ` t0.99? S 20 s 0.99. 20 20. 2 1. Studet est le pseudoyme d u statisticie aglais, de so vrai om William GOSSET (1876-1937). 1
Efi, à partir de l échatillo, o calcule l écart-type d échatillo s 20 et x 20, pour trouver ue réalisatio de cet itervalle alétoire qui sera l itervalle de cofiace particulier de m au seuil 0.99, associé à l échatillo de taille 20 doé par l éocé. O trouve r5.08; 5.39s. B3 - Itervalle de cofiace d ue moyee pour ue populatio quelcoque avec écart-type cou La différece essetielle avec les deux cas précédets est que la costructio de l itervalle va s appuyer sur ue loi limite et o plus sur ue loi exacte. Pour que l itervalle de cofiace soit assez précis, il faudra doc que la taille de l échatillo soit! grade ". E pratique, ě 50 garatit ue boe précisio. Si X suit ue loi (quelcoque) d espérace mathématique m, alors le théorème cetral-limite affirme que : Z X m σ{? coverge e loi vers Gp0; 1q, lorsque ted vers ` 8. Rappelos que la covergece e loi de Z vers la loi ormale cetrée réduite sigifie que : @x P R, lim P rz ď xs 1 ż? e Ñ`8 2π x 8 t2 2 dt. À partir de ce résultat o costruit u itervalle de cofiace aléatoire au seuil α comme précédemmet : O détermie t α à partir de la loi ormale cetrée réduite et l itervalle est de la forme : rx tα? σ; X ` tα? σs. Pour grad, la probabilité que m appartiee à cet itervalle (aléatoire) est approximativemet égale à α. À partir d u échatillo de taille, o détermie u itervalle de cofiace particulier e calculat x à partir de l échatillo, l idc est rx? tα σ; x `? tα σs. B4 - Itervalle de cofiace d ue moyee pour ue populatio quelcoque avec écart-type icou Si X est ue var de moyee m et d écart-type σ, alors ue gééralisatio du théorème cetrallimite, justifie que la var Z X m S {?, ted ecore e loi vers Gp0; 1q (avec les otatios itroduites précédemmet). À partir de ce résultat, la costructio de l itervalle de cofiace aléatoire au seuil α de m se costruit exactemet comme das le cas B3. Pour u échatillo de taille doé, o obtiet u IdC particulier e remplaçat X par x et S par l écart-type d échatillo s. U cas particulier importat Il s agit du cas où la var parete est u var de Berouilli. C est ce qui se produit lorsqu o s itéresse à la présece (ou l absece) d u caractère das ue populatio. Par exemple, avat ue électio, o observe sur la populatio d u certai esemble géographique, le caractère! être favorable au cadidat Utel ". Ue var de Berouilli, X, est caractérisée par u paramètre, oté ici p P r0; 1s et EpXq p, V pxq pp1 pq. Comme vous le compreez, le but du travail statistique est l estimatio de p (estimatio potuelle ou par IdC). Comme p est la moyee de la var parete, si px i q 1ďiď est u échatillo iid de X, o est 2
rameé au cas B4 : var o écesairemet gaussiee, mais - grâce au théorème cetral-limite, loi de la moyee de l échatillo suivat ue loi limite gaussiee. De plus, i m EpXq p, i σ pp1 pq e sot cous. Examios u exemple. O suppose que sur u échatillo de taille 100, le ombre de persoes favorables à Utel est égal à 62 (et le ombre de persoes o favorables alors égal à 100-62=38). Estimatio poctuelle de p : o estime par l estimateur habituel sas biais (et coverget) d ue moyee X 100. D où l estimatio poctuelle 62 100 0.62. Estimatio par IdC de p : la valeur de état suffisamet grade, o s appuie sur la loi limite de X p S {? qui est la loi Gp0; 1q. D où, pour u seuil α, comme o l a déjà vu l IdC aléatoire et l IdC particulier associé à l échatillo observé : rx 100 tα 10 S 100; X 100 tα 10 S 100s. rx 100 tα 10 s 100; x 100 tα 10 s 100s. Das ce cas particulier, les expressios de x et de s s obtieet e codat les valeurs des var de Berouilli par 1 (succès=! être favorable à Utel ") et 0 (échec =! e pas être favorable à ř utel "). Aisi, x est la fréquece observée des succès, cad ici, x 100 0.62. Le calcul de s doe : s 2 i 1 px i x q 2, 1 où x i vaut 1 u ombre de fois égal à x et 0 u ombre de fois égal à x p1 x q. O obtiet : s 2 p1 x q 2 x ` p0 x q 2 p1 x q 1 p1 x q x ˆ 1. p1 x q 2 x ` p0 x q 2 p1 x q D où, s a c p1 x q x 1. L expressio de l IdC particulier au seuil α est alors ȷ x? tα a p1 x q x ; x ` tα a? p1 x q x 1 1 Das le cas particulier de l exemple, si α 0.95 : 0.62 1.96 ȷ? 1.96? 0.2356; 0.62 ` 0.2356 r0.573; 0.667s. 99 99 Les chaces de Utel d être élu sot doc sérieuses. ˆ 1 La situatio se complique si la fréquece observée des opiios favorables est voisie de 0.5. Imagios que x? 0.51. L amplitude de l IdC associé à u échatillo (toujours au seuil 0.95) est alors 0.51 ˆ 0.49 1.96 égale à 2 ˆ 1.96 ˆ?, soit ecore?. 1 1 3
Si l o veut que cette amplitude reste iférieure à 0.01 - ce qui fourira u IdC particulier! à droite " de 0.5 - il faut iterroger u ombre d électeurs potetiels tel que 196 2 ` 1 ď, c est-à-dire au miimum 38417 persoes - ce qui est u éorme échatillo! Avec les réserves d usage : c est seulemet pour 95% des échatillos, e moyee, que l IdC cotiedra la vraie valeur de p. Pour termier ce paragraphe, il est itéressat d examier l itroductio à l estimatio d ue moyee qui est proposée das les programmes de Secode. Le détail des PO est le suivat. CONTENUS Échatilloage Notio d échatillo. Itervalle de fluctuatio d ue fréquece au seuil 0,95. Réalisatio d ue simulatio. CAPACITÉS ATTENDUES COMMENTAIRES Cocevoir, mettre e œuvre et U échatillo de taille est costitué exploiter des simulatiosde situatios de répétitios idépedates de la cocrètes à l aide d u même expériece. tableur ou d ue calculatrice. Exploiter et faire ue aalyse critique d u résultat d échatilloage. À l occasio de la mise e place d ue simulatio o peut : utiliser les foctios logiques d u tableur ou d ue calculatrice mettre e place des istructios coditioelles das u algorithme. L objectif est d ameer les élèves à u questioemet lors des activités suivates. L estimatio d ue proportio icoue à partir d u échatillo, la prise de décisio à patir d u échatillo. Le commetaire suivat est ajouté.! L itervalle de fluctuatio au seuil 0,95, relatif aux échatillos de taille, est l itervalle cetré autour de p, où se situe - avec ue probabilité égale à 0,95%, la fréquece observée das l échatillo de taille. Cet itervalle peut être obteu de faço approchée par simulatio. Le professeur peut idiquer aux élèves le résultat suivat, utilisable das la pratique pour des échatillos de taille ě 25 et des proportios p comprises etre 0,2 et 0,8 : si f désige la fréquece du caractère das l échatillo, f appartiet à l itervalle p? 1 ; p ` 1 ȷ? avec ue probabilité d au mois 0,95. Le professeur peut faire percevoir expérimetalemet la validité de cette propriété, mais elle est pas exigible. ". Vous remarquerez que c est l expressio! itervalle de fluctuatio " qui est reteue. Elle correspod au cas où p est coue et où o cherche à cofirmer (ou à ifirmer) la valeur de p par celle d ue fréquece observée et d u itervalle costruit autour de cette fréquece. U itervalle de cofiace est u itervalle qui a ue probabilité doée de coteir la valeur exacte de p qui est pas supposée coue. La uace etre les deux otios est faite das certais mauels, mais elle est pas metioée das le 4
PO. Iterrogez-vous sur la légitimité de l approximatio (de l itervalle) qui est proposée par le PO das l ecadré ci-dessus. 5
Exercices d etraiemet Ce sot des exercices types des classes de STS - sectio TPIL (Techiques Physiques pour l Idustrie et le Laboratoire) du groupemet A (à l exceptio du premier exercice). Exercice 1 : O cosidère u stock très importat de boulos. O ote Y la var qui, à chaque boulo tiré au hasard das le stock, associe le diamètre, e mm, de so pied. La var Y suit la loi ormale de moyee icoue m et d écart-type σ 0, 1. O désige Y la va qui, à chaque échatillo aléatoire de 100 boulos prélevé das le stock, associe la moyee des diamètres des pieds de ces 100 boulos (le stock est assez importat pour qu o puisse assimiler ces prélèvemets à des tirages sas remise). 1) Justifier que Y suit ue loi Gpm; 0, 01q. 2) Détermier h 1 ą 0 tel que P rm h 1 ď Y ď m ` h 1 s 0, 9. 3) Détermier h 2 ą 0 tel que P rm h 2 ď Y ď m ` h 2 s 0, 95. 4) Détermier h 3 ą 0 tel que P rm h 3 ď Y ď m ` h 3 s 0, 99. Exercice 2 : O se propose d étudier, das ue populatio de grad effectif, la taille d adolescets de 13 à 14 as. O suppose que la va X doat la taille d u adolescet est ue va gaussiee de moyee m et d écart type σ. U échatillo de 36 adolescets, choisis au hasard das la populatio étudiée, doe les résultats suivats. Taille [130 ;135[ [135 ;140[ [140 :145[ [145 ;150[ [150 ;155[ [155 ;160[ [160 ;165[ Effectif 1 4 7 10 8 4 2 1) a) Calculer la moyee, otée x et l écart-type σ e de cet échatillo. b) E déduire ue estimatio poctuelle de m et de σ. c) Doer u itervalle de cofiace de m au seuil de 95%. 2) Afi d améliorer la coaisssace de m, o décide d augmeter la taille de l échatillo. À partir de quel etier 0 obtiedra-t-o u itervalle de cofiace d amplitude iférieure à 1 cm avec u seuil de 98%? 6
Solutios : Exercice 1 : 1) Y état ue moyee d u échatillo de var idépedates d ue loi ormale, suit aussi ue loi (exacte) ormale, de même moyee que la loi parete et d écart-type égal à σ{? si σ est l écarttype de la loi parete et la taille de l échatillo. 2) Z Y m 0.01 suit ue loi Gp0; 1q, d où P h1 0, 01 ď Z ď h ȷ 1 0, 9 ô 2F p h 1 0, 01 0, 01 q 1 0, 9 ô F p h 1 q 0, 95 0, 01 L utilisatio de la loi iverse d ue loi gausiee stadard doe h 1 0, 0164. 3) h 2 0, 0196. 4) h 3 0, 0258. Exercice 2 : 1) a) Le type de calcul demadé ici pose u problème. O e coait pas pour chaque idividu de la populatio, la valeur de la taille. Il est doc pas possible d effectuer les calculs demadés sas faire ue hypothèse supplémetaire cocerat la répartitio des idividus das chaque classe. L hypothèse la plus élémetaire cosiste à assimiler chaque classe à so cetre. Tout se passe alors comme si : 1 idividu mesurait 132,5 cm ; 4 idividus mesuraiet 137,5 cm, etc. D autres hypothèse sot possibles - qui coduiset à d autres valeurs de la moyee et de l écarttype - comme, par exemple, supposer que les idividus sot équirépartis das les classes. Alors, les 4 idividus de la deuxième classe sot iterprétés comme : 1 idividu de taille 136 cm ; 1 idividu de taille 137 cm, 1 idividu de taille 138 cm et 1 idividu de taille 139 cm. Avec l hypothèse simplificatrice, o trouve (e cm) x 1 ˆ 132.5 ` 4 ˆ 137.5 ` 7 ˆ 1452.5 ` 10 ˆ 147.5 ` 8 ˆ 152.5 ` 4 ˆ 157.5 ` 2 ˆ 162.5 36 148.1 Et, pour l écart-type d échatillo σ e 7.25. b) Les valeurs précédemmet calculées fourisset des estimatios poctuelles des deux paramètres. Les estimateurs utilisés sot sas biais et covergets. c) Pour détermier u itervalle de cofiace de m au seuil 95%, o utilise le fait que X m σ suivat ue loi gaussiee cetrée réduite, X X 36 suit ue loi de Studet à 35 ddl. O a vu S 36 {6 das le cours que l IdC était de la forme rx 36 t 0.95 s 36 6 ; x 36 ` t 0.95 s 36 6 s où, t 0.95 est détermié à partir de la loi de Studet. soit, r148.1 2.03 ˆ 7.25. 7.25 ; 148.1 ` 2.03 ˆ s r145.6; 150.6s. 6 6 2) L amplitude de l itervalle est 2 ˆ t 0.98 ˆ 7.25?, où t 0.98 2.438. Ce ombre est iférieur ou égal à 1 (e cm) dès que 2 ˆ 2.438 ˆ 7.25 ď? ô ě 1250 Taille d échatillo très supérieure à la taille de l échatillo iitial, mais fourissat u IdC particulier très étroit. 7