S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio Uiversité de Picardie Jules Vere 2015-2016 IAE Amies Licece metio Gestio parcours Maagemet et Marketig Vete - Semestre 5 Statistiques appliquées Echatilloage, estimatio, itervalle de cofiace, test statistique Cas d ue ou de deux proportios 1. Simulatios 1.1. Loi de Beroulli et simulatio Soit,P u espace probabilisé. Ue variable aléatoire X suit la loi de Beroulli de paramètre p 0,1, que l o ote Bp, si et seulemet si X est à valeurs das0; 1, et PX 1 p et PX 0 p. Ue telle variable aléatoire permet d idiquer si u évéemet A est réalisé (X 1) ou pas (X 0). Comme exemples d applicatio o peut citer : - lacer d ue pièce meat à Pile ou Face, A "obteir Pile" ; - tirer ue boule das ue ure coteat des boules blaches et oires, A "obteir ue blache" ; - choisir d u idividu das la populatio, A "l idividu est malade". Aisi, ue telle variable permet de représeter u caractère qualitatif à deux modalités. Simulatio 1 p état doé das 0,1, o cosidère ue ure coteat ue proportio p de boules blaches. Plus précisémet, o cosidère l etier N plus petit multiple de 10 tel que Np soit etier, et aisi ue ure coteat N boules, dot Np boules blaches et N1p boules oires. Par exemple, pour p 0,42, o a N 100, Np 42 et N1p 58. O suppose que les N boules sot umérotées de 1 à N, de 1 à Np pour les boules blaches, de Np1à pour les oires. A l expériece aléatoire " tirer ue boule au hasard das l ure ", o peut associer l uivers 1,..., N et le muir de l équiprobabilité P. Das ce cotexte, l évéemet A "obteir ue boule blache" est A 1,...,Np, sa probabilité état alors PA card carda Np N p. Cosidérat la variable aléatoire X qui à chaque tirage d ue boule associe 1 si elle est blache et 0 sio, o a X 1 A et X 0 A, et doc PX 1 PA p et PX 0 PA 1PA 1p. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 1) Le tirage d ue boule de l ure est simulé par l istructio ALEA.ENTRE.BORNES(1;N) à etrer das la cellule B8 (par exemple). La valeur correspodate de X est alors obteue par l istructiosi(b8np;1;0). Simulatio 2 A l expériece aléatoire "choisir u ombre au hasard das l itervalle 0; 1" o peut associer ue variable aléatoire Y suit la loi Uiforme sur l itervalle 0; 1 (loi à desité) ; Y idique le ombre obteu. O sait que pour tout y 0; 1, PY y y. p état doé das 0, 1, o a alors PY p p. Cosidérat la variable aléatoire X défiie par X 1 Y p et X 0 Y p Y p, X suit la loi de BeroulliBp. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 2) Ue valeur de Y est simulée par l istructioalea() à etrer das la cellule B7 (par exemple). La valeur correspodate de X est alors obteue par l istructiosi(b7p;1;0). Stéphae Ducay 1
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 1.2. Loi biomiale et simulatio Repreos l exemple d ue ure coteat ue proportio p 0,42 de boules blaches. O tire ue boule au hasard das l ure : le ombre de "boule blache" obteu e u tirage est ue variable aléatoire X de loi de Beroulli Bp : PX 1 p 0.42 et PX 0 1p 0,58. O a EX p 0,42 et VarX 0,2436. Si o effectue 50 tirages avec remise d ue boule, o observe la réalisatio de X 1, X 2,..., X 50, variables aléatoires idépedates de même loi que X. O dit que l o a u échatillo aléatoire simple de taille 50 de loi de Beroulli de paramètre p 0,42. La proportio de "boules blaches" obteue est ue variable aléatoire : où F X X i 1 X 2 X 50 50 X i représete le ombre de "boules blaches" obteues e 50 tirages. Ayat procédé par répétitios d expérieces idépedates, F X i est ue variable aléatoire de la loi Biomiale B50; 0, 42 B, p. O a doc EF EF p et 2 VarF VarF, d où EF p 0,42 et VarF 0,2436. O costate doc que lorsqu o augmete la taille de l échatillo, l espérace de F reste costate, égale à 0,42, alors que la variace dimiue. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 1 et 2) O repred les simulatios 1 et 2 e répétat 50 les istructios précédetes sur 50 liges. Il suffit esuite de "sommer" les valeurs de X obteues pour avoir le ombre de boules blaches obteues, puis de diviser par 50 pour avoir la fréquece. 2. Echatilloage : cas d ue proportio 2.0. Quel cadre mathématique? Statistique et probabilités : Descriptio des observatios et modèle théorique. La Statistique cosiste à étudier u esemble d objets (o parle de populatio, composée d idividus ou uités statistiques) sur lesquels o observe des caractéristiques, appelées variables statistiques. Le calcul des Probabilités permet de proposer u modèle théorique d ue situatio cocrète afi de quatifier la fiabilité des affirmatios. Populatio et échatillo : Das certais cas o peut obteir les valeurs de ces variables sur l esemble de la populatio ; e appliquat les méthodes de la statistique descriptive il est possible, au moye de tableaux, graphiques, paramètres, d aalyser ces résultats. Exemples : Recesemet de la populatio fraçaise, otes obteues par tous les cadidats à u exame, salaires de tous les employés d ue etreprise, etc... Mais la populatio peut être trop vaste pour être étudiée das sa totalité, par maque de moyes, ou de temps. (C est le cas si o s itéresse aux itetios de vote des Fraçais pour ue électio). Elle peut même être cosidérée comme ifiie. C est le cas si l o ote la qualité (défectueuse ou o) des pièces produites par u certai procédé : le ombre de ces pièces est a priori illimité, et o e peut toutes les tester. De même, si l o s itéresse aux fréqueces d obtetios de "pile" et "face" avec ue pièce de moaie, le ombre de lacers de pièce à étudier est a priori ifii : o a ici ue populatio latete ifiie. Il arrive aussi que la mesure d ue variable soit destructrice pour l idividu : si o étudie la durée de vie de certais appareils, il serait absurde de les faire tous foctioer jusqu à la pae, les redat iutilisables. Das tous ces cas, o est ameé à étudier qu ue partie de la populatio, u échatillo, obteu par sodage, das le but d extrapoler à la populatio etière des observatios faites sur l échatillo. Stéphae Ducay 2
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio Fluctuatio d échatilloage Lorsqu o étudie u caractère sur plusieurs échatillos d ue même populatio, o peut observer que les résultats e sot pas idetiques selo les échatillos. Plus la taille de l échatillo étudié est grade, plus les résultats obteus serot fiables. Cela s explique par la dimiutio de la variace, et aussi par la loi des grads ombres. La fluctuatio d échatilloage représete la fluctuatio etre les différets résultats obteus d ue même equête sur différets échatillos d ue même populatio. Ces différets résultats présetet ue certaie régularité, ce qui se traduit par la otio d itervalle de cofiace. 2.1. Caractère statistique et variable aléatoire Cosidéros ue populatio sur laquelle o défiit u caractère qualitatif à deux modalités A et B. O coviet de représeter la modalité A par 1 et la modalité B par 0. Le caractère est aisi représeté par ue applicatio X de das qui, à tout idividu, associe u réel x X X X 0,1 esemble des "valeurs" du caractère. Cette applicatio modélise le caractère de faço détermiiste : si o coaît l idividu, o coaît aussitôt la valeur x. So étude relève de la statistique descriptive qui coduit, par exemple, au tableau des couplesx i,f i où x i est ue valeur observée et f i sa fréquece. Supposos maiteat que l o tire au hasard u idividu das cette populatio pour cosiger la valeur x du caractère. Ne pouvat pas prévoir quel idividu précis sera tiré, o e peut pas prévoir o plus la valeur précise de x qui sera cosiger. O aimerait doc disposer d u moye d attribuer ue probabilité aux élémets de X. Ici, X est ue variable aléatoire de loi de Beroulli Bp où p est la proportio d idividus ayat la modalité A das la populatio : PX 1 p et PX 0 1p. 2.2. Echatilloage Lorsqu o a pas accès à l esemble de la populatio, la proportio p est icoue. O procède à u échatilloage, i.e. au choix de idividus das la populatio, sur lesquels o observe la valeur x du caractère X. Lorsque les tirages ot lieu avec (respectivemet sas) remise, l échatilloage est dit o-exhaustif (resp. exhaustif). Lorsque la taille de l échatillo est faible par rapport à celle N de la populatio (N 10), alors tout échatilloage est assimilable au cas o-exhaustif. Pour u premier échatilloage, o observera des valeurs x 1, x 2,..., x du caractère. Pour u deuxième échatilloage de même taille, o observera des valeurs x 1, x 2,..., x du caractère. Et aisi de suite. O peut alors cosidérer la suite x 1, x 1,... comme les valeurs observées d ue même variable aléatoire X 1, la suite x 2, x 2,... comme les valeurs observées d ue même variable aléatoire X 2,... Aisi, pour tout i 1,...,, la variable aléatoire X i correspod aux valeurs du caractère du i-ème idividu obteu par échatilloage, et aura doc la même loi de probabilité que X. De plus, l échatilloage état o-exhaustif (tirages avec remise), les variables aléatoires X i sot idépedates. Plus précisémet, les variables aléatoires X i sot des applicatios de das, qui à tout échatilloage 1, 2,..., associe x i X i 1, 2,..., X i O dira que X 1,X 2,...,X est u échatillo (aléatoire simple) de taille de X, et que x 1,x 2,...,x est ue observatio de l échatillo. Le terme d échatillo désige à la fois les idividus choisis et le -uple de variables aléatoires X 1,X 2,...,X. 2.3. Estimateur et estimatio d ue proportio Objectif : détermier p à l aide d iformatios obteues à partir d u échatilloage de taille extrait de la populatio. Impossible tat que N, mais la théorie de l échatilloage coduit à des estimatios p de p, d autat meilleures que est grad. Estimateur du paramètre p : proportio (ou fréquece) d échatillo F X i, où X i représete le ombre d idividus de l échatilloage ayat la modalité A. Stéphae Ducay 3
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio Pour ue observatio x 1,x 2,...,x de l échatillo (e pratique o observe souvet directemet x i ), ue estimatio poctuelle de p est f 2.4. Proportio d échatillo x i p. U exemple sur la proportio U groupe de 4 efats, Alexis, Bejami, Cyril et David, d âges respectifs 12, 13, 14 et 15 as. O choisit u efat au hasard das le groupe, o peut cosidérer : - X, idicatrice du fait que l efat plus 14,5 as, variable aléatoire de loi de BeroulliB 1 : 4 PX 1 1 4 p et PX 0 3 4 1p. Cherchos à retrouver ou à approcher ces résultats à partir d échatillos o-exhaustifs (avec remise) de taille 3. Il y e a 4 3 64, ils formet u uivers, esemble des résultats possibles de l expériece aléatoire "choisir u échatillo". O peut muir de la tribu des évéemets A P et de l équiprobabilité P sur,a. A chacu des résultats (échatillos), o peut associer la proportio F f d efats ayat plus de 14,5 as. O obtiet les résultats suivats : f A,A,A 0 A,A,B 0 A,A,C 0 A,A,D 1/3 A,B,A 0 A,B,B 0 A,B,C 0 A,B,D 1/3 A,C,A 0 A,C,B 0 A,C,C 0 A,C,D 1/3 A,D,A 1/3 A,D,B 1/3 A,D,C 1/3 A,D,D 2/3 f B,A,A 0 B,A,B 0 B,A,C 0 B,A,D 1/3 B,B,A 0 B,B,B 0 B,B,C 0 B,B,D 1/3 B,C,A 0 B,C,B 0 B,C,C 0 B,C,D 1/3 B,D,A 1/3 B,D,B 1/3 B,D,C 1/3 B,D,D 2/3 f C,A,A 0 C,A,B 0 C,A,C 0 C,A,D 1/3 C,B,A 0 C,B,B 0 C,B,C 0 C,B,D 1/3 C,C,A 0 C,C,B 0 C,C,C 0 C,C,D 1/3 C,D,A 1/3 C,D,B 1/3 C,D,C 1/3 C,D,D 2/3 f D,A,A 1/3 D,A,B 1/3 D,A,C 1/3 D,A,D 2/3 D,B,A 1/3 D,B,B 1/3 D,B,C 1/3 D,B,D 2/3 D,C,A 1/3 D,C,B 1/3 D,C,C 1/3 D,C,D 2/3 D,D,A 2/3 D,D,B 2/3 D,D,C 2/3 D,D,D 1 O défiit aisi ue variable aléatoire F, dot o peut obteir la loi de probabilité : x i 0 1/3 2/3 1 PF x i 27/64 27/64 9/64 1/64 O peut alors calculer : - EF 1 4 : o remarque que EF p EX. - VarF 1 16 : o remarque que VarF VarX. Stéphae Ducay 4
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio X i Propriétés géérales de F. F X i suit la loi Biomiale B,p. O a alors EF EF p et 2 VarF VarF, d où EF p et VarF. O a aisi EF p et o dit que F est u estimateur sas biais de p. O a de plus lim VarF 0 et o dit que F est u estimateur coverget de p. Théorème. Loi faible des grads ombres Si les X i sot idépedates et admettet la même espérace p et la même variace 2, alors pour tout 0, lim P F p 0 ; cette covergece état uiforme e p. Cela sigifie que F coverge e probabilité vers p. Théorème cetral limite Si les X i sot idépedates, de même espérace mathématique et de même écart-type, et si X X i, alors Z X suit approximativemet la loi ormalen0; 1 ; autremet dit que X suit approximativemet la loi ormalen ; De plus, si p 10 et 1p 10, o peut approcher la loi Biomiale B,p par la loi ormale N p ;. O e déduit que F suit approximativemet la loi ormalen p ;, et doc F suit approximativemet la loi ormale N p ; approximativemet la loi ormalen0; 1... Aisi, U F p Commetaires de ces résultats F a toujours pour espérace p : la proportio das l échatillo est, "e moyee", celle de la populatio. La variace de F est d autat plus faible que est grad : la proportio das l échatillo varie d autat mois d u échatillo à l autre que la taille de cet échatillo est grade. A la limite, si ted vers l ifii, VarF ted vers 0 et doc F ted vers la costate p. Das la pratique, l approximatio de la loi de F par ue loi ormale est correcte dès que p 10 et 1p 10, ou dès que 18, ou sous d autres coditios proches, d autat plus que est grad et p proche de 0.5. Lorsque p est pas cou, o vérifie ces coditios sur la fréquece f observée. suit 3. Itervalle de fluctuatio et itervalle de cofiace pour ue proportio Cosidéros ue variable aléatoire X de loi de Beroulli Bp, où p est la proportio d idividus de la populatio ayat ue propriété doée, u échatillo X 1,X 2,...,X de taille de X et la proportio (ou fréquece) d échatillo F X i, où X i représete le ombre d idividus de l échatilloage ayat la propriété. F O sait que si p 10 et 1p 10, alors U p suit approximativemet la loi ormale N0; 1. O détermie comme le réel u tel que Pu U u 1 grâce à la table 2. Pour 5%, o a u 1.96. Remarque. Lorsque est petit, o doit utiliser la loi exacte de F, à savoir la loi BiomialeB,p. Stéphae Ducay 5
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 3.1. Itervalle de fluctuatio de la fréquece F O suppose que l o coait p. O e déduit que P p u F p PF IF p 1, avec IF p p de F au iveau 1 0.95. u ; p u 1, et doc u itervalle de fluctuatio IF p 3.2. Itervalle de cofiace de la proportio p O suppose que l o e coait pas p mais que l o a ue observatio f de F à partir d u échatillo. O a P F u p F u 1, et doc Pp IC p 1, avec IC p F u ; F u itervalle de cofiace IC p de p au iveau 1 0.95. F Comme 1F est u estimateur sas biais de 1, o e déduit, si f 10 et 1f 10, u itervalle de cofiace de la proportio p au iveau 1: ic p f f 1f 1 u, f f 1f 1 u. Exemple d itervalle de cofiace Das ue certaie espèce de rogeur, o a compté 206 mâles sur 400 aissaces. O peut cosidérer la situatio suivate. Populatio : les rogeurs d ue certaie espèce. Variable : le sexe, à deux modalités (mâle et femelle), représeté par ue variable aléatoire de loi de Beroulli Bp, où p est la proportio de mâles das la populatio ; o a aisi PX 1 p et PX 0 1p. EchatilloX 1,X 2,...,X de taille 400 de X. Observatio de l échatillo : x 1,x 2,...,x 1,1,0,1,...,0. X i Estimateur de la proportio p : F, proportio (ou fréquece) de mâles das l échatillo, où X i représete le ombre de mâles de l échatillo. Estimatio poctuelle de la proportio p : mâles das l observatio de l échatillo. Itervalle de cofiace de la proportio p : f 206 10 et 1f 194 10 Pour 0,05 (i.e. 5%, o a u 1,96. ic p f f 1f 1 u ; f f f 1f 1 x i 206 400 u 0,466 ; 0,564. 0.515, fréquece (ou proportio) de Exemple d applicatio de l itervalle de fluctuatio Repreos l exemple précédet et supposos savoir qu il y a équiprobabilité male/femelle à chaque aissace, autremet dit que p 0,5. Pour u échatillo de 400 aissaces, l itervalle de fluctuatio de F est 0.510.5 0.510.5 p u ; p u 0.5 1.96 ; 0.5 1.96 400 400 Aisi, 95 % des échatillos de 400 aissaces doerot ue fréquece d échatillo comprise etre 0.451 et 0.551. L échatillo étudié doe ue fréquece observée f 0.515 qui appartiet à l itervalle de fluctuatio : il est doc représetatif d ue populatio pour laquelle p 0,5. Stéphae Ducay 6
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 3.3. Itervalle de fluctuatio de la fréquece F et loi biomiale O cosidère ue populatio das laquelle o suppose que la proportio d u certai caractère est p. Pour juger de cette hypothèse, o y prélève, au hasard et avec remise, u échatillo de taille sur lequel o observe ue fréquece f du caractère. O rejette l hypothèse selo laquelle la proportio das la populatio est p lorsque la fréquece f observée est trop éloigée de p, das u ses ou das l autre. O choisit de fixer le seuil de décisio de sorte que la probabilité de rejeter l hypothèse, alors qu elle est vraie, soit iférieure à 5 %. Lorsque la proportio das la populatio vaut p, la variable aléatoire X correspodat au ombre de fois où le caractère est observé das u échatillo aléatoire de taille, suit la loi biomiale de paramètres et p. O cherche à partager l itervalle 0,, où X pred ses valeurs, e trois itervalles 0,a1, a,b et b1, de sorte que X pree ses valeurs das chacu des itervalles extrêmes avec ue probabilité proche de 0,025, sas dépasser cette valeur. E tabulat les probabilités cumulées PX k, pour k allat de 0 à, il suffit de détermier le plus petit etier a tel que PX a 0, 025 et le plus petit etier b tel que PX b 0, 975, c est-à-dire PX b 0,025. Autremet dit, a est le plus grad etier tel que PX a 0.25. O observe aussi que a b. O a aisi PX a X b PX a PX b 0.05 et doc Pa X b P X a X b 0.95, e état "assez proche" de 0.95. Comme F X, o a aisi P a F b 0.95, e état "assez proche" de 0.95. La règle de décisio est la suivate : si la fréquece observée f appartiet à l itervalle de fluctuatio à 95 % a, b, o cosidère que l hypothèse selo laquelle la proportio est p das la populatio est pas remise e questio et o l accepte ; sio, o rejette l hypothèse selo laquelle cette proportio vaut p. Pour 30, p 5 et 1p 5, o observe que l itervalle de fluctuatio a, b est sesiblemet le même que l itervalle p 1, p 1 proposé das le programme de secode. Exemple d exercice Mosieur Z, chef du gouveremet d u pays loitai, affirme que 52 % des électeurs lui fot cofiace. O iterroge 100 électeurs au hasard (la populatio est suffisammet grade pour cosidérer qu il s agit de tirages avec remise) et o souhaite savoir à partir de quelles fréqueces, au seuil de 5 %, o peut mettre e doute le pourcetage aocé par Mosieur Z, das u ses, ou das l autre. 1. O fait l hypothèse que Mosieur Z dit vrai et que la proportio des électeurs qui lui fot cofiace das la populatio est p 0, 52. Motrer que la variable aléatoire X, correspodat au ombre d électeurs lui faisat cofiace das u échatillo de 100 électeurs, suit la loi biomiale de paramètres 100 et p 0,52. 2. O doe ci-cotre u extrait de la table des probabilités cumulées PX k où X suit la loi biomiale de paramètres 100 et p 0,52. Détermier a et b tels que défiis précédemmet et comparer les itervalles de fluctuatio à 95 % a, b et p 1, p 1 3. Éocer la règle décisio permettat de rejeter ou o l hypothèse p 0,52, selo la valeur de la fréquece f des électeurs favorables à Mosieur Z obteue sur l échatillo. 4. Sur les 100 électeurs iterrogés au hasard, 43 déclaret avoir cofiace e Mosieur Z. Peut-o cosidérer, au seuil de 5 %, l affirmatio de Mosieur Z comme exacte?. k PX k 40 0,0106 41 0,0177 42 0,0286 43 0,0444... 61 0,9719 62 0,9827 63 0,9897 64 0,9941 Remarque : la recherche de l itervalle de fluctuatio peut-être illustrée par le diagramme e bâto de la loi biomiale de paramètres 100 et p 0,52. Utilisatio du tableur Excel Costruire la table des probabilités et des probabilités cumulées de la loi Biomiale de paramètres 100 et p 0,52. Costruire le diagramme e bâto de cette loi. Stéphae Ducay 7
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 4. Test de coformité pour ue proportio p O s itéresse à la questio suivate : état doée ue populatio das laquelle ue proportio p d idividu ot ue certaie propriéte, peut-o raisoablemet supposer que p est égal à ue certaie valeur p 0 doée a priori? Par exemple, des tests e laboratoire permettet d affirmer qu u certai médicamet est efficace sur ue proportio p 0 d idividus atteits d ue certaie maladie. Mais après sa mise sur le marché, le médicamet a-t-il la même efficacité sur l esemble des idividus malades? Commet savoir si la proportio p de malades guéris par le médicamet est bie égale à p 0? La répose à la questio est doée par la mise e place d u test de coformité. De faço géérale, u test statistique est ue procédure permettat de calculer la valeur d ue certaie foctio des observatios d u ou de plusieurs échatillo, qui coduit à rejeter ou o, avec u certai risque d erreur, ue hypothèse gééralemet appelée hypothèse ulle et otée H 0. Celle-ci porte sur la (ou les) populatio(s) d où est (sot) issu(s) le(s) échatillo(s). Elle s oppose à ue hypothèse dite alterative et otée H 1. Cosidéros ue variable aléatoire X de loi de Beroulli Bp, où p est la proportio d idividus de la populatio ayat ue propriété doée, u échatillo X 1,X 2,...,X de taille de X et la proportio (ou fréquece) d échatillo F propriété. X i O sait que si p 10 et 1p 10, alors U, où X i représete le ombre d idividus de l échatilloage ayat la F p N0; 1. O détermie le réel u tel que Pu U u 1, i.e. u 1 1 2 suit approximativemet la loi ormale (table 2). Test (bilatéral) de H 0 : p p 0 cotre H 1 : p p 0. f p O calcule u 0. O détermie u tel que Pu U u 1, et o décide que : p 0 1p 0 - si u u,u, alors o e peut rejeter H 0 ; - si u u,u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p p 0 cotre H 1 : p p 0. O détermie u tel que PU u 1, i.e. u 1 1 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p p 0 cotre H 1 : p p 0. O détermie u tel que PU u 1, i.e. u 1 u 22 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Exemple Repreos l exemple précédets sur les rogeurs. Sur u échatillo de 400 aissaces, o a observé 206 mâles, soit ue fréquece de mâles de f 206 400 0.515. O se demade s il y a autat de mâles que de femelles das la populatio ; autremet dit si la proportio de mâles das la populatio est p 0.5. O peut effectuer le test statistique de H 0 : p p 0 cotre H 1 : p p 0, avec p 0 0.5. O calcule u f p 0 p 0 1p 0 0.5150.5 0.510.5 400 0.6. Pour 0,05 (i.e. 5%, o a u 1,96. Comme u u,u, alors o e peut rejeter H 0 : il est doc possible que p 0.5. Stéphae Ducay 8
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 5. Comparaiso de deux proportios Das deux populatios P 1 et P 2 o étudie le même caractère avoir ou o ue propriété doée. Soiet X 1 et X 2 des variables aléatoires de loi de Beroulli Bp 1 et Bp 2 représetat le caractère das chaque populatio, où p 1 (respectivemet p 2 ) est la proportio d idividus ayat la propriété das P 1 (respectivemet das P 2 ). De P 1 et P 2 o extrait u échatillo E 1 X 1,1,X 1,2,...,X 1,1 de taille 1 de X 1 et u échatillo E 2 X 2,1,X 2,2,...,X 2,2 de taille 2 de X 2. Les fréqueces d échatillo sot alors F 1 1 X1,i 1 5.1. Cas d échatillos idépedats Les échatillos E 1 et E 2 sot supposés idépedats. et F 2 2 X2,i 2. Test (bilatéral) de H 0 : p 1 p 2 p cotre H 1 : p 1 p 2. Supposos que 1 f 1 5, 1 1f 1 5, 2 f 2 5, 2 1f 2 5. Sous l hypothèse H 0, U F 1 F 2 suit approximativemet la loi ormale N0; 1, et e regroupat les deux 1 1 1 2 échatillos, o peut estimer p par f 1,2 1f 1 2 f 2 f 1. O calcule u 1 f 2 2 1 2 f 1,2 1f 1,2. O détermie u tel que Pu U u 1, i.e. u 1 1 (table 2) et o décide que : 2 - si u u,u, alors o e peut rejeter H 0 ; - si u u,u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p 1 p 2 cotre H 1 : p 1 p 2. O détermie u tel que PU u 1, i.e. u 1 1 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p 1 p 2 cotre H 1 : p 1 p 2. O détermie u tel que PU u 1, i.e. u 1 u 22 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. 5.2. Cas d échatillos appariés : test de McNemar Deux échatillos E 1 et E 2 sot dits appariés lorsque chaque observatio x 1,i de E 1 est associée à ue valeur x 2,i de E 2 (appariés associés par paires). C est par exemple le cas lorsque E 1 et E 2 provieet d u même groupe de malades avat et après traitemet. Deux échatillos appariés ot doc la même taille 1 2. O utilise le tableau suivat des effectifs de présece ou absece de la propriété étudiée : P 1 \ P 2 préset abset totaux 1 1 préset abset a c b d ab c d totaux ac bd Le test de McNemar s appuie sur le calcul de u bc, et se poursuit de faço aalogue au cas bc d échatillos idépedats (paragraphe 2.3.1). O peut l utiliser dès que bc 10. Stéphae Ducay 9
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 5.3. Exemple Das ue même catégorie sociale, u échatillo de 40 hommes a fouri 8 fumeurs et u échatillo de 60 femmes a fouri 18 fumeuses. O se demade si la proportio de fumeurs est la même pour les deux sexes. O peut cosidérer la situatio suivate. Populatio 1 : hommes. Variable X 1 : être fumeur, représeté par ue variable aléatoire X 1 de loi de BeroulliBp 1, où p 1 est la proportio d hommes fumeurs. Echatillo de taille 1 40. Estimateur de p 1 : fréquece d échatillo F 1. Estimatio de p 1 : f 1 8 40 0,2. Populatio 2 : femmes. Variable X 2 : être fumeuse, représeté par ue variable aléatoire X 2 de loi de BeroulliBp 2, où p 2 est la proportio de femmes fumeuses Echatillo de taille 2 60. Estimateur de p 2 : fréquece d échatillo F 2. Estimatio de p 2 : f 2 18 60 0,3. Les échatillos E 1 et E 2 sot idépedats. Test (bilatéral) de H 0 : p 1 p 2 p cotre H 1 : p 1 p 2. Supposos que 1 f 1 8 5, 1 1f 1 32 5, 2 f 2 18 5, 2 1f 2 42 5. Sous l hypothèse H 0, U F 1 F 2 suit approximativemet la loi ormale N0; 1, et e 1 2 1 1 regroupat les deux échatillos, o peut estimer p par f 1,2 1f 1 2 f 2 1 818 0,26. E 2 4060 remplaçat p par f 1,2, o e modifie pas la loi approchée de U. f O calcule u 1 f 2 0,20,3 1,12. 1 1 1 1 2 f 1,2 1f 1,2 1 0,2610,26 40 60 O détermie u tel que Pu U u 1(table 2) : pour 0,05, o trouve u 1,96. Comme u u,u, o e peut rejeter H 0 : la proportio de fumeurs e diffère pas sigificativemet etre les deux sexes. Pour cette décisio de o-rejet, o e coait pas la probabilité de se tromper (erreur de deuxième espèce). 6. Exercices Exercice 1. O admet que das la populatio d efats de 11 à 14 as d u départemet fraçais, le pourcetage d efats ayat déjà eu ue crise d asthme das leur vie est de 13%. U médeci d ue ville de ce départemet est surpris par le ombre importat d efats le cosultat pour des crises d asthmes. Il décide de meer ue étude statistique e choisissat de maière aléatoire 100 efats de 11 à 14 as de la ville. Il observe que 19 d etre eux ot déjà eu ue crise d asthmes. 1) Utiliser u itervalle de fluctuatio pour aider le médeci à décider s il y a plus d efats ayat des crises d asthmes das la ville que das le départemet. 2) Le médeci est pas covaicu par la décisio obteue et pese que le ombre d efats iterrogés était isuffisat. Combie d efats faudrait-il iterroger pour qu ue fréquece observée de 0,19 amèe à coclure qu il y a plus d efats ayat des crises d asthmes das la ville que das le départemet. Exercice 2. E mai 2006, le miistre de l Ecoomie des Fiaces et de l Idustrie a mis e place la déclaratio de reveus préremplie par l admiistratio. Les premiers cotrôles effectués sur u échatillo de 780 déclaratios d impositio préremplies motret que 12% des ces déclaratios présetet au mois ue erreur. Doer u itervalle de cofiace au iveau 95% pour la proportio p de déclaratios erroées. Exercice 3. Ue société mutuelle d assurace effectue tous les as ue equête pour évaluer le pourcetage d accidets domestiques parmi ses adhérets au cours de l aée atérieure. 1) Le résultat de l equête e 2005 (pourcetage d accidets domestiques e 2004) est égal à 5%. L equête a été effectuée auprès de 2000 persoes. E déduire l itervalle de cofiace pour u iveau de cofiace égal à 0.95. 2) Quelle est, pour le même iveau de cofiace, le pourcetage miimum? Le pourcetage maximum? Stéphae Ducay 10
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 3) O demade que l equête que l o effectuera e 2006 pour estimer ce pourcetage e 2005 doe ue fourchette limitée à 2%. Quelle est la taille de l échatillo qu il faudra choisir? Exercice 4. Ue etreprise automobile se préoccupe du ombre de cliets reouvelat leur voiture e achetat u modèle d u cocurret. Ue equête auprès de 1 000 cliets fait apparaître u pourcetage atioal égal à 35%. 1) Doer l itervalle de cofiace de ce pourcetage pour u iveau de cofiace égal à 0.99. 2) Quelle est la valeur maximale de ce pourcetage, pour le même iveau de cofiace? 3) Ce pourcetage, chez certais cocessioaires de la marque, atteit 40%. Cela sigifie-t-il que leurs performaces commerciales sot isuffisates? Exercice 5. U sodage effectué sur u échatillo de 400 électeurs doe 212 itetios de vote e faveur d u cadidat C. 1) Détermier u itervalle de cofiace au iveau 95% pour la proportio d électeurs, das l esemble de la populatio électorale, ayat l itetio de voter e faveur de C. 2) Quelle taille miimale de l échatillo faudrait-il predre pour que l itervalle (au même iveau 95%) e cotiee pas la valeur 0,50? Exercice 6. Lors d ue précédete cosultatio électorale, le cadidat A avait obteu 51% des suffrages exprimés. A l approche de ouvelles électios, il réalise u sodage sur u échatillo de 400 électeurs choisis au hasard das sa circoscriptio. Il obtiet 196 itetios de votes. Peut-il coclure que sa cote de popularité est restée stable? Exercice 7. Ue agece de publicité affirme qu u produit d etretie est efficace à 90% pour déboucher éviers et lavabos e deux heures, quelle que soit la ature de l obstructio. Ue associatio de défese du cosommateur a fait ue equête qui relève que sur 100 lavabos bouchés, 80 seulemet sot débouchés e deux heures e utilisat le produit d etretie. Doit-o faire u procès à l agece de publicité? Faire u test au risque 5%, puis 1%. Exercice 8. O compare les effets d u même traitemet das deux hopitaux différets. Das le premier hopital, 70 des 100 malades traités motret des siges de guériso. Das le deuxième hopital, c est le cas pour 100 des 150 malades traités. Quelle coclusio peut-o e tirer? Exercice 9. E 2009, ue etreprise a egagé 21 idividus pour ue foctio de cadre et 63 idividus pour ue foctio d employé. Sur les 21 idividus egagés pour u poste de cadre, 6 étaiet de sexe fémii. Sur les 63 idividus egagés pour u poste d employé, 31 étaiet de sexe fémii. Tester, au risque 5%, l hypothèse selo laquelle la proportio de postes de cadre attribués à ue femme est iférieure à la proportio de postes d employé attribués à ue femme. Exercice 10. Afi d évaluer l impact d ue campage média ati-tabac, o s est itéressé à la proportio de fumeurs meat des actios pour essayer d arrêter de fumer (dimiutio de la cosommatio, achat de patchs ati-tabac, cosultatios médicales,...), c est-à-dire à la proportio de fumeurs "actifs" pour arrêter. U sodage "avat campage" a été effectué auprès de 3000 fumeurs, et u sodage "après campage" a été effectué auprès d u autre échatillo de 3000 fumeurs ; les deux échatillos sot doc idépedats. Le premier sodage doe ue proportio de 0,15 de fumeurs "actifs", alors que le deuxième sodage doe ue proportio de 0,17 de fumeurs "actifs". O veut savoir si la campage a été efficace ; autremet dit si la proportio de fumeurs "actifs" a augmeté après la campage. Stéphae Ducay 11
S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 1) a) Détermier u itervalle de cofiace au iveau 95% de la proportio de fumeurs "actifs" avat la campage. Préciser la populatio et le caractère étudié, la taille d échatillo, le(s) estimateur(s) mis e jeu. b) De faço aalogue, doer (sas détailler les calculs) u itervalle de cofiace au iveau 95% de la proportio de fumeurs "actifs" après la campage. c) Peut-o déduire de ces deux itervalles que la campage a été efficace? 2) a) Expliquer brièvemet ce que représetet les erreurs de première et deuxième espèce d u test statistique. b) Effectuer u test statistique au risque 5%, puis 10%, pour savoir si la campage a été efficace. E cas de décisios cotradictoires avec les deux risques 5% et 10%, préciser et justifier la décisio à reteir. Stéphae Ducay 12