CORRIGE DES EXERCICES DE LA SEANCE DE TD 3 Exercice 1 1. Pour trouver les probabilités demadées, il faut lire la table de Studet à la lige ddl=25. t α = 1,3 y figurat pas, o pred la valeur la plus proche, ce qui doe P(X > 1,3) 0,10. E utilisat la symétrie de la loi de Studet, comme o l a fait pour la loi ormale cetrée réduite, o a : P( X > 2,5) = 2 P(X > 2,5) 2 0,01 = 0,02 Pour trouver P(X > -1,3), o se sert de l égalité P(X > -1,3) = 1 - P(X < -1,3). Par symétrie, de la loi de Studet, o a P(X < -1,3) = P (X > 1,3). O e déduit fialemet : P(X > -1,3) = 1 - P(X > 1,3) 1-0,10 = 0,90 2. Pour trouver les valeurs de a demadées, il faut lire la table das l autre ses (toujours à la lige ddl=25. O obtiet aisi : P(X > 1,708) = 0,05 De même qu o l a fait pour la loi ormale cetrée réduite, o a P( X > a) = 2 P(X > a) d où : P( X > 2,060) = 0,05 Exercice 2 1. Le pourcetage observé de sujets déclarat avoir des lombalgies est p 0 = 12 30 = 0,40. Pour trouver l itervalle de cofiace du pourcetage vrai P das la populatio, o utilise la formule p o p o qui fait appel à l approximatio de la loi biomiale par la loi ormale (rappelos que la vérificatio de la validité de l utilisatio de cette approximatio e peut être faite qu après le calcul de l itervalle de cofiace). O obtiet ici : 0,40 ±1,96 0,40 0,60 30 = 0,40 ± 0,18 soit : [0,22 ; 0,58] Les coditios d applicatio sot satisfaites : p i, p s, q i et q s sot supérieurs ou égaux à 5. O peut aussi se servir de la table 5 qui doe, pour = 30 et 12 évéemets observés, l itervalle [22,66% ; 59,40%]. C est certaiemet la méthode la plus rapide! Elle est possible que parce que les valeurs de et du ombre d évéemets correspodat à otre échatillo figuret das la table (et parce que vous avez la table à votre dispositio...). Le résultat obteu est proche du précédet. E dehors des arrodis de calculs, l écart viet de ce que le premier résultat est ue approximatio, c est l itervalle de la table qui est exact. 2. Le pourcetage observé de sujets déclarat avoir des lombalgies est cette fois p 0 = 0,25 (avec = 20). L itervalle de cofiace du pourcetage vrai das la populatio est doé par : Master de Saté Publique - 2017-2018 1
0,25 ± 1,96 0,25 ±1,96 0,25 0,75 20 = 0,25 ± 0,19 = [0,06 ; 0,44] Ici, les coditios d applicatio e sot pas satisfaites puisque p i = 1,2 < 5. L itervalle trouvé e doit doc pas être reteu. Il faut recourir à la table 5 qui doe : [8,66% ; 49,10%]. O voit qu ici le résultat obteu est ettemet différet de celui doé par l approximatio (o légitime) précédete. 3. Si o veut coaître le pourcetage de lombalgies das la populatio avec ue précisio de p ±5%, il faut que z o α/2 = 0,05, c est-à-dire = z 2 p α/2 o. 0,05 2 Das cette formule p 0 et q 0 sot icous, ce sot les valeurs que l o observera sur le ouvel échatillo dot o cherche à détermier l effectif. E première approximatio, o pred des valeurs trouvées sur u échatillo précédet. Das cet exercice, le premier échatillo doe p 0 = 0,40 et q 0 = 0,60 et doc = 1,962 0,40 0,60 0,05 2 = 368,8. Le secod échatillo doe p 0 = 0,25 et q 0 = 0,75 et doc = 1,962 0,25 0,75 0,05 2 = 288,12. Comme prévu, le résultat déped de p 0, ce qui motre la part d icertitude das le calcul du ombre de sujets. Pour être plus sûr d avoir la précisio voulue, o predra ici la valeur la plus grade, soit au mois 369 sujets. Exercice 3 1. Puisque l obésité est défiie par u BMI supérieur à 30, le pourcetage d obèses das la populatio est P = P(BMI > 30). Comme la distributio du BMI est ormale, o a, e se rameat à 30 25,33 la loi ormale cetrée réduite : P = P Z > 14,61 = 1,22. La table 1 doe : P = 0,11. Remarques : le pourcetage qu o viet de calculer est le pourcetage vrai das la populatio, puisqu il est calculé à partir de la moyee et de la variace vraies. le calcul précédet est valable que parce que la distributio du BMI est ormale. le résultat serait le même si l obésité était défiie par u BMI supérieur ou égal à 30. 2. L itervalle (de fluctuatio) das lequel se situe le BMI de 95% de la populatio est doé par µ σ 2 puisque la distributio du BMI est ormale, avec α = 5% et doc z α/2 = 1,96. O obtiet doc : 25,33 ±1,96 14,61 = 17,84 ; 32,82. Remarque : comme o a déjà eu l occasio de le dire, l itervalle doé ci-dessus est celui qui est symétrique par rapport à µ. C est ce qu il est habituel de faire, mais il y a d autres solutios : ce sot tous les itervalles [a ; b] qui vérifiet P(a < BMI < b) = 0,95. Master de Saté Publique - 2017-2018 2
3. Il s agit de calculer trois itervalles de fluctuatio pour u échatillo de 41 sujets. L itervalle de fluctuatio de la moyee est doé par : µ σ 2 d applicatio particulière puisque la distributio du BMI est ormale. O obtiet : 25,33 ±1,96 14,61 41 = 24,16 ; 26,50.. Il y a pas de coditio Pour la variace, o peut utiliser l approximatio par la loi ormale puisque la distributio du BMI est ormale et que l effectif de l échatillo est supérieur à 30. O obtiet : σ 2 2σ 4 1 = 14,61±1,96 2 14,612 40 = 8,21; 21,01. O peut aussi utiliser la formule exacte (qui écessite que la distributio soit ormale, mais e b a requiert aucue coditio d effectif) : 1 σ2 ; 1 σ2 où a et b sot les limites de la loi de χ2 à 40 ddl pour α = 0,975 et α = 0,025. 24,43 O obtiet : 40 14,61;59,34 40 14,61 = 8,92 ; 21,67. O costate sur cet exemple que la formule approchée doe u résultat peu éloigé de la formule exacte. L itervalle de fluctuatio du pourcetage d obèses est doé par : P PQ. Les coditios d applicatio (P et Q 5) e sot cepedat pas vérifiées puisque P = 4,51. O e peut doc pas utiliser la formule précédete. Il est pas o plus possible d utiliser la table 5 qui est faite pour l itervalle de cofiace et o pour l itervalle de fluctuatio. O e peut doc pas calculer l itervalle de fluctuatio demadé avec les méthodes que vous coaissez. 4. Les valeurs observées permettet de calculer x = 268 et x 2 = 7 378. a) O e déduit : m=26,80 et s 2 =21,73. L itervalle de cofiace de la moyee est doc (puisque la distributio du BMI est ormale) : m ± t 1;α/2 s 2 = 26,80 ± 2,262 21,73 10, soit : [23,47 ; 30,13] b) Comme l effectif de l échatillo est iférieur à 30 (et que la distributio du BMI est ormale), 1 l itervalle de cofiace de la variace doit être calculé par : b s2 ; 1 a s2 ce qui doe : 9 19,02 21,73 ; 9 2,70 21,73 = [10,28 ; 72,43]. c) La proportio observée d obèses est p 0 = 3 = 0,30. So itervalle de cofiace est doé par 10 la table 5 : [6,67% ; 65,25%]. Master de Saté Publique - 2017-2018 3
Exercice 4 L itervalle de cofiace du pourcetage de malades est p o p o est p o. So itervalle de cofiace est doc doé par : p o p o. Le ombre de malades O coaît ici p 0 qui est égal à 17. O e coaît pas q 0, mais le pourcetage de malades état petit (maladie très rare), o a q 0 1. O obtiet doc, pour l itervalle de cofiace : p o p o = 17 ±1,96 17 soit : [8,9 ; 25,1]. Les coditios d applicatio de la formule de l itervalle de cofiace sot les mêmes que pour u pourcetage. Elles sot satisfaites : p i, q i, p s et q s sot supérieurs à 5. Exercice 5 1. E faisat le chagemet de variable X = X/100 (ce qui reviet à supprimer les deux deriers 0 de chaque ombre), o obtiet : x ' = 3 939 et x ' 2 = 314 909. D où o déduit : m' = 3939 314909 1 50 = 78,78 et s'2 = 50 39392 = 93,7669. 49 E reveat à la variable iitiale, o trouve : m = 100 m' = 7878 et s 2 = 100 2 s' 2 = 937 669. Remarque : si o fait le chagemet de variable X = X/100-61, o obtiet (après des calculs u peu mois lourds) : x " = 889 et x " 2 = 20 401. D où : m = 17,78 et s 2 = 93,7669. O reviet esuite à la variable iitiale par : m = 100 m +61 = 7878 et s 2 = 100 2 s 2 = 937 669. O voit doc qu u chagemet de variable peut alléger les calculs, mais qu il e faut pas le payer par des erreurs pour reveir à la variable iitiale (ou même e exécutat le chagemet de variable lui-même). C est à chacu de trouver l équilibre qui lui coviet le mieux. 2. La médiae est la valeur qui sépare l échatillo e deux sous échatillos de même effectif. C est ici 7900 car 24 umératios sot iférieures à 7900 et 24 lui sot supérieures. Le mode est la valeur la plus souvet observée (elle est pas toujours uique). Il y a ici 4 modes : 7700, 8300, 8500 et 8600 qui sot toutes des valeurs observées trois fois (le mode a pas grad itérêt sur ces doées o groupées). 3. La variabilité des mesures, quatifiée par la variace de la questio 1, soit s 2 = 937 669, compred à la fois la variabilité due à l erreur de mesure et la variabilité due à la différece etre sujets. La variabilité due à la seule erreur de mesure est bie sûr iférieure à la variabilité totale, elle e est qu ue part, et souvet la plus petite (mais o égligeable das le cas préset). C est la variabilité totale qui iterviet das la très grade majorité des problèmes. 4. Après regroupemet, les doées se présetet sous la forme suivate : Master de Saté Publique - 2017-2018 4
Numératio 6000-6500 6500-7000 7000-7500 7500-8000 Nombre de sujets 4 5 8 9 Numératio 8000-8500 8500-9000 9000-9500 9500-10000 Nombre de sujets 8 10 4 2 E preat comme cetre des classes 6250, 6750,, 9750 et e utilisat les formules pour doées groupées, o trouve : x = 396 500 et x 2 = 3 187 625 000. D où : m = 7930 et s 2 = 885 306,12. L écart avec les valeurs (exactes) trouvées à la questio 1 est dû à l approximatio résultat du regroupemet e classes. 5. Il est plus difficile de détermier la médiae sur des doées groupées que sur les doées idividuelles. Le regroupemet réalisé ici permet cepedat de costater qu il y a 26 valeurs iférieures à 8000 et 24 supérieures. De sorte qu o peut doer 8000 comme valeur approchée de la médiae. Quat au mode, so estimatio est foctio de la faço de grouper les doées. Pour celle que ous avos adoptée avec des classes d amplitude 500, le mode (valeur la plus probable) est la classe 8500-9000. Master de Saté Publique - 2017-2018 5