Lesprogronmes: StEtistique Secon ' intervslle f luctusfion îerminaf es Premiàres échantitrlonnoge. intervalle. intervolle a f luctustion binotn[al f IucTustion asyrnptotique prise drâcision prise da décision prise dédsion a a nrise décision 'parfir intervalf d' un inferval/e e ' bartird'un flucfwfion f luctuation asyt'npfofique égalité ux prûpnrfions binomiale astirnution ' intervalle confiance e On utilise I'intervalle fluctuation lorsque: Population Echantillon La proportionp est connueou supposée (on a une valeur Tailleruconnue Fréquencefiinconnue Lintervalle fluctuation estutilisé pour une prise décision On utilise l'intervalle confiancelorsque : Population Échantillon On ne connaît pas la proportion p Taille n connue Fréquencp/,connue Lintervalle confianceestutilisé pour une estimation
ffic*"ae&'?**!!onna$6r msâ*matiæn l- hlrod*çtign" f#i Onconnaîtla proportionp sboulesbleues On ne connaîtpasla proportionsboulesbleues IffI âtr$ On procè à stiragessuccessifs avecremise n boules. Onobserve la fréquence d,apparition d,uneboulebleue. Cettefréquence observée appartient (engénératlà un < intervalle fluctuation> d e c e n t r ep d o n t l a l o n g u e u d r i m i n u ea v e cn. Quandutilise-t-onun a intervatle fluctuation>? i:r*.-.. il*- t..-'- :, - - "--*"',.'' i tu, " i$i â#i * * }; On procè à stiragessuccessifs avecremise n boules. Onvaessayer d'estimerla proportion p sboulesbleues. Cetteestimation sefait au moyend,un < intervalle confiance > associé à un coefficient, appeléniveau confiance, attribuéà l,estimation ;ffi ffff Ë$l Quandutilise-t-onun a intervalle confianced? iffr rgr on connaîtla proportion p du caractère ou on fait unehypothèse surla valeur cetté on, on parle prise décision i#i f$i On ignorela valeur la proportion p présence du caractère On neformulepasd $ff1 saufmentioncontraire,la taille l'échantillonn et la proportionp du caractèreétudiédansla populationvérifient: n)30, npà5 et n(l-p)à5 Il,Fç.ha,ntlJlqnnaæ lll Intervnlle flurtuation asymptotique Dansce paragraphe, on supposeque la proportionp du caractèreest connue Exemple: On disposed'uneurnecontenantun grandnombre boules bleueset rouges. La proportion boulesbleuescontenues dansi'urneestp = 0.6. voici lesfréquences obtenues par simulation: 20 échantillons taille 100 on constate quecesfréquences fluctuent.c'est la fluctuationd,échantillonnage. En utilisantle programme secon,on obtienti'intervalle fluctuation à 95 % 1r I - 1 LP.,lnt,*,nl= 10,5;0,71 Il y en a 19échantillons sur20 soit95%. p.1
Pour la terminale, on va utiliser un intervalle plus précis : Définition : L'intervalle est a intervalle fluctuation asymptotique au seuil 95 Yo. Pour I'exemple, on a : Loo - [0,504;0,696] N"t"6 F, la variable aléatoire qui à tout échantillon taille n associe la fréquence d'un caractère. F, prend ses valeurs dans 1, avec une ilité qui s'approche 0,95 quand n vient It"2 Frise déeisiçn Dans ce paragraphe, la proportion du caractère étudié n'est pas connue mais on la suppose égale à p. La prise décision consiste à valir ou invalir I'hy'pothèse faite sur la proportion p prise décision : On note / la fréquence du caractère érudié dans un échantillon taille n. Hypothèse: < La proportion ce caractère dans lapopulation est égale à p > Soit 1, l'intervalle fluctuation asymptotique au seuil 95 o/o f el" on accepte l'hypothèse on w rejette l'hypothèse Exemple : Deux-entreprises A et B recrutent dans un bassin d'emploi où il y a autant femmes que d'hommes, avec la contrainte du respect la parité. Dans I'entreprise A, il y a iog employés dont 43 femmes; dans l'entreprise B, il y a 2500 employés dont 1150 femmes. Ces entreprises respectent-elles laparité? Les entreprises peuvent donc être assimilées à s échantillons taille n prélevés dans une population où la fréquence ét:udiée p est égale à 0,5. Les intervalles fluctuation au niveau 0,95 sont : L,entreprise A est un échantillon taille 100 dont l'intervalle fluctuation est [0,402 ; 0,598]. L'entreprise B est un échantillon taille 2500 dont l'intervalle fluctuation est [0,48 ;0,52]. La valeur 43Yo estdans l'intervalle fluctuation pour un échantillon taille 100 alors que 460Â n'est pas dans l'intervalle fluctuation pour un échantillon taille 2500. D pour I'entreprise B, la proportion 460lo s'observe dans moins 50Â s échantillons taille 2500 prélevés au hasard dans une population où il y a autant d'hommes que femmes. On peut alors rejeter l'hypothèse que cette entreprise respecte la parité. Mais en prenant cette décision, on prend le risque se tromper, ce risque étant égal à 50Â. DPour l'entreprise A, on considère que le résultat observé est compatible avec le modèle. De ce fait, on peut accepter l'hypothèse que cette entreprise respecte la parité. Mais là aussi en prenant cette décision, on a un risque se tromper, risque inconnu dans ce cas.
lll", Es}inafisn Dans ce paragraphe, ra proportion du caractère p étudié n,est pas.onnu". ï:*::ffî",ffi,'l;ï::'x";',*l3,..';"îjljîtffâî,:*jflîff fréquence / observée sur un :1 échantilon taire n, onva lll.l fnt r"uâlle c*nfiance Définition, t'tnr.* Le risque est 5%. T"'i:5jj" fréquence " contlent p avec une lll.2 Ëxernpfe ilité d'au ryoins V-#',.#l 0,95. La plupart s sondages en France sont effectués auprès On obtient alors 1000 personnes. I'intervalle,- "onfiun"" V_ 0,03 iti O,ôii."" résultats s rniersondages n:tl];ffi:iî;îîtf,îâf"rtï effedués er les résutrars du premier tour l,étection I ê I - CSA - 11 avri, tfop - tz avril SOFRËS_t3avril CSA * 18 avril tpsos - 18 avril BVA- 19 avril Sondage confintiel _21 avril Résultat final Jacques CHIRAC Jean Marie LE PEN LionelJOSplN 27% t2% 79% t9% 11.,5% t7% 2A% 1,3% t8a/o 19.15% 14% 18Yo 20% t4o/o 78To t9% 1.4% 78% 78s/o 14,5% 17% x9,ggyo!6,88yo L6,78y" On va s'intéresser au sondage BVA du 19 avrjl2002. sondage BVA 19 avril Chirac Le Pen Jospin 0,19 4,14 0,18 Intervalles confiance : borne inf : 0,75937722 0,10837722 0,14837722 rre sup : o,22t62278 0,t7!62278 o,2t!62278 Résultat final : p.3
Si les résultats du rnier sondage avaient été annoncés avec une marge d'erreur 30Â, voici le graphique qui aurait été donné : Intervalles confiance au risque 5% d'apràs l'échantillon BVA 0,23 a,21 0,19 a,17 0,15 0,13 0,11 0,09 0,07 Il apparaît que toutes les configurations l'ordre s trois premiers candidats étaient possibles. p.4