Statistiques L5.1. APA et ES TD 5 (V. Bougault) Exercice 3 Pour déterminer l âge moyen de ses clients, une entreprise de distribution d articles de sport prélève aléatoirement un échantillon de 50 clients et trouve une moyenne de 36 ans avec un écart-type de 9 ans. Déterminez l intervalle interquartile de la moyenne, puis l'intervalle de confiance à 95% puis à 99%. Une proportion de 75% nous donne un score Z de 0,675 Une proportion de 25% nous donne un score Z de -0,675 75%: x= 0,675*9+36 = 42 25%: x= -0,675*9+36 = 30 L'intervalle de confiance est de [30;42] L'intervalle de confiance à 95% signifie que 2,5% des clients sont au-dessus et 2,5% au-dessous de celui-ci (donc 5% sont en dehors de cette zone). Une proportion de 2,5% au-dessus de la valeur x nous indique que 97,5% de la population est comprise en-dessous donc 97,5% nous donne un score Z de 1,96. 97,5% de la population a moins de : x=1,96*9 + 36 = 53,6 ans 97,5% de la population a plus de x= -1,96*9 + 36 = 18,4 ans L'intervalle de confiance à 95% est de [18;54] Pour l'intervalle de confiance de 99% Z score supérieur: 2,575 x= 2,575*9+36 = 59 x= -2,575*9+36 = 12,8 L'intervalle de confiance à 95% est de [13;59] Exercice 4 Un fabriquant a voulu étudier l efficacité d un nouveau prototype de chaussures de course. Pour cela, on a mesuré la consommation d oxygène pendant les deux dernières minutes d une course de 8 km à allure modérée sur 9 sujets dans 2 conditions : course avec des chaussures conventionnelles et course avec les nouvelles chaussures. Les résultats obtenus sont les suivants : sujets VO2 avec chaussures conventionnelles 1 53,0 52,1 2 44,5 43,6 3 40,7 39,9 4 50,6 48,7 5 50,7 50,3 6 40,7 40,5 7 44,5 43,6 8 37,2 37,2 9 37,9 38,9 VO2 avec nouvelles chaussures Peut-on dire que la consommation d oxygène est significativement influencée par le type de chaussure?
H0: Les deux consommations d'o 2 sont identiques H1: la consommation d'o 2 est réduite avec les nouvelles chaussures Faire test de Student sur Open Office Calc. Mode: 1 = unilatéral 2= bilatéral (CECI INDIQUE LA FORME DE LA COURBE EN CLOCHE). Dans notre cas nous ne verrons que des courbes en cloche symétriques donc de MODE 2 car le MODE 1 indique une courbe étirée vers la droite ou la gauche uniquement. Type: 1=réunion (1 population) 2= 2 échantillons avec même variance, 3= 2 échantillons avec une variance différente Ici choisir Mode 2, Type 1. P= 0,07 Il y a donc 7% de chance pour que H0 soit vraie. On accepte H1 si la probabilité de H0 est inférieure à 5% seulement donc H0 vraie. La consommation d'o 2 n'est pas significativement influencée par le type de chaussure. Exercice 5 Vingt élèves provenant de 2 universités différentes A et B ont répondu à un même quizz. Les notes qu'ont obtenu ces élèves figurent dans le tableau ci-dessous:
Numéro Etudiant Université Note 15 A 6 6 A 16 5 A 25 4 A 35 19 A 40 3 A 43 8 A 46 10 A 50 9 A 56 2 A 60 12 A 61 17 A 63 18 A 61 11 A 67 1 A 80 13 A 86 7 A 87 16 A 70 20 A 91 14 A 93 30 B 23 40 B 25 21 B 21 39 B 32 29 B 34 22 B 42 38 B 43 37 B 44 25 B 45 36 B 50 35 B 51 28 B 61 26 B 67 27 B 77 23 B 78 34 B 83 33 B 86 32 B 87 31 B 90 24 B 97 a- Quelles sont les moyennes et les écart-types des notes obtenues par les élèves des universités A et B. Moyenne± ET : Université A: 57± 24; Université B: 57± 24 b- Sur un même graphique, représentez l'histogramme des fréquences relatives de ces deux distributions. c- Sur un même graphique, représentez les polygones des fréquences cumulées. d- Quel est l'élève le plus méritant dans chacune des classes? Quel est le plus méritant des 40 élèves? Quel est le moins méritant des deux classes? Les élèves les plus méritants sont ceux qui ont le score Z le plus élevé, donc l'élève 14 ( Z=1,51) pour l'université A et le 24 (Z=1,63) pour l'université B. Le plus méritant est celui qui a le score Z le plus élevé et le moins méritant celui qui a le score Z le
plus bas, donc respectivement les élèves 24 (Z=1,63) et le 15 (Z=-2,12). e- Peut-on dire que l'une des universités est significativement meilleure que l'autre? H0: les deux universités ont le même niveau H1: l'une des universités est meilleurs Test de Student: p= 1,00 Il y a 100% de chances que l'université A et B aient le même niveau. Donc on ne peut pas dire que l'une des universités est significativement meilleure que l'autre. f- Les étudiants de l'université A ont refait le même test en fin d'année et ont obtenu les résultats suivants: Numéro Etudiant Université Note 15 A 35 6 A 42 5 A 45 4 A 52 19 A 43 3 A 65 8 A 56 10 A 68 9 A 47 2 A 69 12 A 40 17 A 91 18 A 93 11 A 71 1 A 82 13 A 70 7 A 87 16 A 59 20 A 98 14 A 99 g- Peut-on dire que les notes obtenues sont significativement meilleures que lors du premier test? Quelle est l'importance de préciser le seuil de significativité? H0: les notes sont identiques. H1: les notes sont différentes. La moyenne des notes est supérieure lors du deuxième test. Le test de Student nous donne un p de 0,0189 qui est plus petit que le seuil de significativité de 5%. Donc H0 est réfutée et H1 est vraie. Les élèves se sont donc significativement améliorés lors du deuxième test. La précision du seuil de significativité est importante car il est souvent de 5% et 1% en médecine. Si nous étions en médecine, et que le seuil était de 1% alors les notes des deux tests auraient été considérées comme non significativement différentes.
Exercice 6: L'indice de masse corporelle (IMC), qui équivaut au calcul du poids (en kilos) sur la taille (en mètres) au carré a été calculé dans une population d'adolescents et de jeunes adultes (Graphique 1). La distribution observée suit une courbe normale. La moyenne de la population est de 25 kg/m² et l'écart-type est de 5. Fréquence (%) 25 Indice de Masse Corporelle (IMC) (kg/m²) Graphique 1: Distribution des IMC dans une population d'adolescents et de jeunes adultes. 1) A partir de votre propre poids et taille, calculez votre IMC. Calculez la probabilité d'avoir un IMC supérieur au vôtre, selon cette distribution. 2) Quelle est la probabilité d'avoir un IMC compris entre 30 et 40? Score Z de 30: (30-25)/5 = 1 Score Z de 40: (40-25)/5 = 3 Selon la table de la loi normale centrée réduite, P (Z<1) = 0,8413 et P(Z<3) = 0,99865 P (1<Z<3) = 0,99865-0,8413 = 0,1574 La probabilité d'avoir un IMC entre 30 et 40 est de 15,7%. 3) Les normes actuelles sont définies comme tel: - IMC < 18,5: personne en sous-poids - 18,5 IMC < 30 : personne ayant un poids normal - 30 IMC < 40 : personne ayant une obésité massive - IMC 40: personne atteinte d'obésité morbide Quelle est la probabilité d'être atteint d'obésité morbide selon cette distribution? Cf question précédente, 1-0,99865 = 0,001350 La probabilité d'être atteint d'obésité morbide, est la probabilité d'avoir un IMC supérieur ou égal à 40, donc 0,14%, soit environ 1,4 personne sur 1000 personnes. 4) La table 1 représente les tailles et poids des médaillés d'or français aux Jeux
Olympiques de Sydney, en 2000. Calculez l'imc pour chaque judoka, et la moyenne et l'écart-type de cet échantillon. Table 1: Tailles et poids des médaillés olympiques français aux Jeux Olympiques de Sydney en 2000 Judokas Taille (cm) Poids (kg) 1 192 97 2 165 63 3 186 70 4 196 125 5 171 64 6 182 75 7 187 83 8 176 79 9 164 50 10 182 85 5) Regroupez en classes les données des judokas, selon leur poids. Faîtes des classes de 10 poids. Le premier intervalle est [45-54]. Un individu ne peut-être que dans un seul intervalle. 6) Réalisez l'histogramme relatif de cette distribution et le polygone cumulé. 7) Calculez la moyenne de cette nouvelle distribution de classes, la variance, l'écarttype, la classe médiane et la classe modale. Quel est l'intervalle interquartile? moyenne 79,5 variance 480 Ecart-type 21,91 classe médiane 75-84 classe modale 75-84 intervalle interquartile 55-94