STATISTIQUES INFÉRENTIELLES MYUB Travaux dirigés

Université de Franche-comté Année Universitaire / Licence de psychologie 2 e Année STATISTIQUES INFÉRENTIELLES MYUB 7344 - Travaux dirigés

TD1 Loi Normale, Loi Binomiale, Distribution d'échantillonnage 1) Loi normale Les basketteurs appartiennent à une population dont la taille est normalement distribuée. (moyenne = 1.95 m ; écart-type = 6 cm). (1) Quel pourcentage de cette population est dépassé par un basketteur qui mesure 1.87 m? (2) Quelle est la taille d un basketteur dépassé par 35 % de cette population? (3) Les sumos appartiennent à une population dont le poids est normalement distribué (moyenne = 172 kg). Un sumo de 186 kg dépasse 92% des sumos, quel pourcentage de cette population est dépassé par un sumo de 169 kg? (4) Par quel pourcentage de sumos un sumo de 170 kg est-il dépassé? Pour rappel, un score z centré réduit est calculé comme suit : z = x µ σ 2) Loi binomiale (1) Question de dénombrement. Combien y a-t-il de manières possibles de commettre 2 erreurs à 4 questions? Utiliser la formule de combinaisons : n! C n k = k!(n k)!. (2) Quelle est la probabilité de commettre 2 erreurs parmi 4 questions en répondant au hasard? Utiliser la loi Binomiale : P(X = k) = C n k p k (1 p) n k, avec X la variable correspondant à un nombre donné d'erreurs, k le nombre spécifié d'erreurs (ici, k = 2), et p la probabilité de commettre une erreur (ici, p =.50) (3) Quelle est la probabilité de commettre 3 erreurs parmi 6 questions en répondant au hasard? (4) Quelle est la probabilité de commettre 4 erreurs parmi 8 questions en répondant au hasard? (5) Pourquoi la probabilité de répondre correctement à la moitié des questions diminue à mesure que le nombre de questions augmente? (6) Quelle est la probabilité pour quelqu'un maîtrisant presque parfaitement son sujet (p =.1) de commettre 0, 1, 2 erreurs pour 2 questions? Représenter la distribution de probabilité obtenue. 3) Distribution d'échantillonnage de la moyenne. Aller sur http://onlinestatbook.com/stat_sim/sampling_dist/index.html et cliquer sur le bouton Begin. L'objectif est de vérifier le théorème de la limite centrale stipulant que lorsqu on prélève des échantillons aléatoires de taille N dans une population X de moyenne µ X et d écart-type σ X, quelle que soit la forme de la distribution de X, la distribution X des moyennes d échantillon x i tend à se rapprocher d une loi normale d espérance µ X = µ X et d écart-type σ X = σ X N, d autant plus que N est grand. 1

Dans cette simulation, la population parente présente une moyenne de 16 et un écart-type de 5 (par défaut). En tirant au sort des échantillons de 10 scores, la distribution des moyennes d'échantillons devrait présenter théoriquement une moyenne de 16 et un écart type de σ X = 5 = 1.58. C'est ce que nous proposons de 10 vérifier. La fenêtre est divisée en quatre parties horizontales. Seules les 3 premières parties nous intéressent. La première partie montre la population parente X. La seconde montre les scores (les x) tirés au sort, lorsqu'on clique sur le bouton "Animated". La troisième partie montre la moyenne de chaque échantillon. Au niveau de la troisième partie, choisir "Mean" et "N = 10" dans les boutons déroulants. Cliquez ensuite sur "Animated". (1) Pour chaque échantillon, relever la moyenne x. Procéder au tirage de 10 échantillons, puis calculer les valeurs observées de µ X et σ X. Pour rappel, un écarttype est égal à s X = (x i x) 2 N 1 ; ici σ X (x i µ X ) 2 N 1. Exemple de simulation Votre simulation 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 12 2 2 etc. 13 2 15 16 6 15 17 10 16 17 14 16 18 15 17 19 18 17 20 20 20 21 21 25 22 23 30 x i 17.5 13.1 17.3 14.9 20.1 17.2 16.4 10.6 17.4 14.1 µ X 15.9 σ X 2.7 σ X (2) Avec 10 échantillons de 25 scores, quel est le σ X théorique? Quel est le σ X observé? (3) Vérifier la convergence de σ X observé avec σ X théorique pour 1000 échantillons de 25 scores. (4) Quelle est la probabilité d'observer une moyenne d'au moins 18 pour un échantillon de 25 scores sur la base d'une telle population? 2

TD2 ESTIMATION D UNE MOYENNE Une population obéit à une loi normale de variance 81. On prélève au hasard dans cette population un échantillon de taille 36 dont la moyenne est 250. a) Quelle est l estimation ponctuelle de µ? b) Déterminer les limites de l intervalle qui a 95 chances sur 100 d encadrer la vraie valeur de µ. c) Quelle est la marge d erreur associée à l estimation de µ au niveau de confiance de 95%? Une étude sur a créativité a été conduite selon le niveau scolaire. Le test utilisé est le test de pensée créative de Torrance. Le tableau suivant indique les résultats de fluidité et de flexibilité aux épreuves d expression figurée. Moyenne Ecart-type Niveau N Fluidité Flexibilité Fluidité Flexibilité Maternel 75 13.7 10.6 6.2 3.9 Elémentaire 160 20.2 14.8 5.8 4.8 Secondaire 121 19.3 15.7 6.5 5.3 Universitaire 36 18.2 14.5 5.0 4.7 Pour chacun des niveaux scolaires : a) Faire une estimation ponctuelle du résultat moyen de flexibilité. b) Calculer la marge d erreur dans l estimation par intervalle de confiance (au niveau de confiance 90%) du résultat moyen de flexibilité. c) Estimer par intervalle de confiance au niveau de confiance 90% le résultat moyen de flexibilité. Exercice 3 Les résultats à un test de dextérité manuelle de 16 personnes choisies au hasard présentant un handicap mental léger apparaissent dans le tableau ci-dessous : Résultats au test de dextérité 72 73 73 74 74 75 76 66 66 67 65 73 71 70 71 70 a) En supposant que les résultats au test sont distribués normalement, estimer avec un niveau de confiance de 99% le résultat moyen pour la population correspondante. b) On devrait connaître les résultats de combien de personnes présentant un handicap mental léger pour que la marge d erreur au niveau de confiance 99% n excède pas 1? 3

Exercice 4 On soumet 15 femmes et 18 hommes de 20 à 30 ans au test B101 de la batterie standard Bonnardel (test similaire aux cubes de Kohs). Pour chacun, on mesure le temps nécessaire pour reproduire les 16 modèles. On supposera que le temps est distribué normalement. Les scores individuels sont présentés dans le tableau suivant : Temps F 190 505 550 468 366 374 451 239 356 528 450 420 269 430 418 - - - H 489 561 383 336 437 555 339 444 383 557 362 458 351 348 555 441 464 469 a) Effectuer une estimation ponctuelle du temps moyen nécessaire aux femmes pour reproduire les 16 modèles. b) Effectuer une estimation ponctuelle du temps moyen nécessaire aux hommes pour reproduire les 16 modèles. c) Quelle est la marge d erreur dans l estimation du temps moyen nécessaire aux femmes au niveau 90%? 95%? 99%? d) Pour quel niveau de confiance la marge d erreur est-elle la plus élevée? e) Estimer le temps moyen nécessaire aux femmes par intervalle de confiance au niveau 90%, 95% et 99%. f) Pour quel niveau de confiance l amplitude de l intervalle est-elle la plus élevée? g) Combien de femmes devrait-on interroger pour que la marge d erreur dans l estimation par intervalle de confiance au niveau 95% ne dépasse pas 30 secondes? h) Calculer la marge d erreur dans l estimation du temps moyen nécessaire aux hommes au niveau 99%. i) Entre quelles limites peut se situer le temps moyen nécessaire aux hommes au niveau de confiance 99%? j) Combien d hommes devrait-on interroger pour que la marge d erreur dans l estimation par intervalle de confiance au niveau 99% ne dépasse pas 25 secondes? k) Combien d hommes devrait-on interroger pour que la marge d erreur dans l estimation par intervalle de confiance au niveau 95% ne dépasse pas 20 secondes? Exercice 5 Le dépouillement des scores des 30 hommes de 20 à 25 ans soumis au test d estime de soi de Janis et Field apparaît dans le tableau ci-dessous. Faire une estimation ponctuelle du niveau moyen d estime de soi pour les hommes de 20 à 25 ans. Scores Effectif 35 x 40 4 40 x 45 3 45 x 50 10 50 x 55 4 55 x 60 6 60 x 65 2 65 x 70 1 4

TD3 - ESTIMATION D UNE PROPORTION On applique le test de Rorschach à 160 sujets normaux choisis au hasard. Pour les 10 planches, on note que 30 sujets donnent 55 interprétations ou plus et que 64 sujets produisent moins de 5 réponses banales. a) Estimer ponctuellement la proportion des sujets donnant 55 interprétations ou plus. b) Effectuer une estimation ponctuelle de la proportion des sujets fournissant moins de 5 réponses banales. c) Calculer la marge d erreur associée à l estimation de la proportion des sujets donnant 55 interprétations ou plus en utilisant un niveau de confiance de 95%. d) Estimer par intervalle de confiance au niveau 95% la proportion des sujets donnant 55 interprétations ou plus. e) Pour un échantillon de taille 160, entre quelles limites de confiance peut se situer le nombre de sujets donnant 55 interprétations ou plus au niveau 95%? f) Entre quelles limites peut se situer la proportion des sujets produisant moins de 5 réponses banales en utilisant un niveau de confiance de 99%? g) Pour un échantillon de taille 160, entre quelles limites peut se situer le nombre de sujets produisant moins de 5 réponses banales, au niveau 99%? h) Combien de sujets devra-t-on ajouter à l échantillon pour que la marge d erreur dans l estimation de la proportion des sujets fournissant 55 interprétations ou plus au niveau de confiance 95% soit d au plus 0.03? i) On veut en plus que la marge d erreur dans l estimation de la proportion des sujets donnant moins de 5 réponses banales soit aussi d au plus 0.03 avec un niveau de confiance de 95%. Le nombre de sujets trouvé en h) sera-t-il suffisant? On demande à 500 personnes choisies au hasard dans tout le Québec ce à quoi elles aspirent (voyager, acheter une nouvelle voiture, etc.) : 275 disent rêver de voyage. a) Estimer par intervalle de confiance la proportion de gens qui rêvent de voyage en utilisant un niveau de confiance de 95%. b) Pour un échantillon de taille 500, entre quelles limites peut se situer le nombre de gens qui disent rêver de voyage si le niveau de confiance est de 95%? Exercice 3 On veut faire une étude sur l utilisation de drogues chez les adolescents de 14 à 18 ans. a) Combien de sujets devrait-on choisir pour que la marge d erreur dans l estimation par intervalle de confiance au niveau 95% de la proportion des jeunes qui font usage de drogues soit d au plus 0.05? b) On choisit au hasard 1860 sujets et on relève que 372 font usage de drogues. Calculer la marge d erreur au niveau de confiance 95%. c) Estimer par intervalle de confiance la proportion de jeunes de 14 à 18 ans qui font usage de drogues en utilisant un niveau de confiance de 95% 5

TD4 TESTS DE COMPARAISON D UNE MOYENNE À UN STANDARD En 1980, le temps de réaction moyen à des stimuli visuels simples pour des étudiant en psychologie (M = 20 ans) était de 200 millisecondes. On choisit cette année au hasard un échantillon de 36 étudiants de 20 ans qu'on soumet à la même expérimentation, afin de tester l'effet de Flynn. Le temps de réaction moyen observé pour l échantillon est de 180 millisecondes avec un écart-type de 10 millisecondes. a) Tester au seuil de signification 5% l hypothèse selon laquelle la norme évaluée les années précédentes pour le temps de réaction moyen est toujours plausible (test bilatéral). b) Le temps de réaction moyen a t-il significativement diminué (test unilatéral, seuil de signification de 5%)? Une étude porte sur le temps de latence de sujets asthmatiques à un test de barrage de symboles (le patient doit marquer d'un trait un symbole parmi d'autres). On applique ce test à 64 sujets asthmatiques et on obtient un temps de latence moyen de 15.18 secondes avec un écart-type de 12.51 secondes. Au seuil de signification 1%, ce temps de latence moyen est-il supérieur au temps de latence moyen de 13 secondes qui a été observé sur une population de sujets non asthmatiques. Exercice 3 Le résultat moyen de 25 jeunes adultes soumis au test d Estime de soi de Janis et Field est 46.13, avec un écart-type de 15.44. Ce résultat observé est-il significativement différent du niveau moyen de référence au test d Estime de soi (égal à 50 en théorie pour cette tranche d'âge)? Exercice 4 Le dépouillement en classes d amplitude 5 des scores de 27 hommes inactifs soumis au test d estime de soi de Janis et Field apparaît dans le tableau ci-dessous. Peut-on affirmer au seuil de signification 1% que le niveau moyen d estime de soi est inférieur à 50? Scores Effectif 35 x 40 7 40 x 45 6 45 x 50 9 50 x 55 3 55 x 60 1 60 x 65 0 65 x 70 1 6

TD5 TESTS DE COMPARAISON DE DEUX MOYENNES Le tableau ci-dessous indique les scores de 9 hommes et de 15 femmes au test Oméga de la batterie Standard Bonnardel. Hommes Femmes 24 69 23 95 43 48 60 35 86 79 64 40 82 39 25 33 53 41 93 54 44 31 15 62 x = 450, x 2 = 26678 x = 788, x 2 = 49504 On suppose que les deux populations correspondantes sont régies par des lois normales de même variance. Les résultats des hommes sont-ils en moyenne plus faibles que ceux des femmes? (Choisir un risque α =.01) On souhaite comparer les effets de deux neuroleptiques sur des patients psychotiques, en considérant le temps nécessaire pour calmer leur crise d'angoisse. On applique à 11 patients le neuroleptique A et aux 14 autres le neuroleptique B. Les résultats résumés apparaissent ci-dessous : Groupe A Groupe B n A = 11, x = 14.6, x 2 = 23.34 n B = 14, x = 39.9, x 2 = 198.91 On souhaite savoir s il existe une différence significative de temps nécessaire pour calmer les crises entre les deux neuroleptiques. 1) Quels tests statistiques devrait-on effectuer avant de choisir le test du t de Student adéquat? 2) Comparez le rapport des variances à la valeur critique F.05 (13,10) = 2.89 et concluez quant à l égalité des variances de population. 3) Appliquez un test de Student approprié à la situation, en admettant que les populations sont normalement distribuées. Exercice 3 On souhaite comparer les temps de réaction lors de comparaisons de paires de stimuli. Les sujets ont pour consigne de répondre le plus rapidement possible à l aide d un clavier. On présente au sujet sur un écran deux traits côte à côte. Le sujet doit appuyer sur la flèche qui se trouve du côté du trait le plus long. On procède à 12 mesures par sujet : 6 conditions traits de longueur différente, et 6 conditions traits sont de longueur semblable. L alternance des deux types de condition est choisie aléatoirement pour chaque sujet. On moyenne chacune des conditions afin d'avoir deux scores par sujet. Les mesures de temps apparaissent dans le tableau ci-dessous (cf. page suivante). 1) La durée des comparaisons est-elle significativement plus longue lorsque les stimuli sont semblables? (Choisir un risque α =.05 ) 2) La différence est-elle significativement supérieure à une demi-seconde? (Choisir un risque α =.01) 7

Temps de réaction moyen (en sec.) Sujets Longueur différentes Longueurs semblables 1 1.82 2.75 2 3.23 4.02 3 4.18 4.73 4 2.57 3.11 5 2.95 3.63 6 3.54 4.48 7 3.82 4.44 8 2.97 3.82 9 2.18 3.16 10 3.45 4.57 11 3.62 4.71 12 3.04 3.87 TD6 TESTS D AJUSTEMENT On donne à 50 étudiants 9 dés. On demande à chacun des étudiants de les lancer une fois et d enregistrer le nombre de fois que chaque face apparaît. Le tableau ci-dessous présente les résultats. Peut-on considérer que la probabilité d obtenir chacune des faces est égale? (choisir un seuil de risque α =.05) Face du dé Effectif 1 62 2 50 3 76 4 68 5 111 6 83 La répartition des 65 sujets soumis au test de créativité de Torrance apparaît dans le tableau ci-dessous. La troisième colonne indique les probabilités théoriques pour chacune des classes. Peut-on considérer le modèle théorique comme vraisemblable pour cet échantillon? (α =.05) Résultats Effectif p Moins de 100 2.07 100 X < 150 7.11 150 X < 200 14.20 200 X < 250 18.31 250 X < 300 16.21 300 ou plus 8.10 8

Exercice 3 Le tempo spontané pour les enfants de 12 ans est-il soumis à une loi normale d espérance 80 et de variance 400? Pour répondre à cette question, on choisit au hasard 150 enfants de 12 ans et pour chacun d eux, on mesure leur tempo spontané. Les résultats apparaissent dans le tableau ci-dessous. Avant d effectuer le test, il est nécessaire de calculer les fréquences théoriques de chaque classe et subséquemment les effectifs théoriques. Classes Effectif X < 45 5 45 X < 55 16 55 X < 65 28 65 X < 75 18 75 X < 85 19 85 X < 95 30 95 X < 105 17 105 X < 115 10 115 X 7 N = 150 Exercice 4 Le tableau ci-dessous fournit la répartition de 100 sujets selon le temps nécessaire pour parcourir un labyrinthe. On souhaiterait savoir si l hypothèse selon laquelle le temps nécessaire pour parcourir le labyrinthe est régi par une loi normale est vraisemblable. 1) Indiquez la méthode à utiliser pour procéder au calcul des effectifs théoriques (sans effectuer les calculs concrètement). 2) Quels seront les degrés de liberté associés au test du χ 2? Temps Effectif 2 X < 4 9 4 X < 6 14 6 X < 8 15 8 X < 10 29 10 X < 12 13 12 X < 14 15 14 X < 16 5 9

TD7 TESTS D INDEPENDANCE On se demande s il y a un lien entre l âge et l opinion face à l avortement. On choisit au hasard 154 sujets : pour chacun, on note l âge et l opinion sur l avortement. Les résultats apparaissent dans le tableau ci-dessous. Effectuez un test d indépendance au seuil de signification 1%. Age 20-29 30-49 50 et plus Total Fortement opposé 7 10 15 32 Opposé 9 10 20 39 En faveur 20 11 8 39 Fortement en faveur 26 13 5 44 Total 62 44 48 154 Note. Les deux variables étant ordinales, certains tests statistiques plus complexes sont plus appropriés que le simple chi-carré d'indépendance. Dans un hôpital psychiatrique, on se demande s il y a un lien entre la saison et la présence ou l absence de réaction à un certain médicament administré selon un dosage standard. On choisit au hasard 490 patients. Pour chacun, on note la période pendant laquelle le médicament a été administré et l existence ou l absence de réaction. Les résultats apparaissent dans le tableau ci-dessous. Effectuez un test d indépendance avec un seuil critique de 5%. Réaction Saison Absence Présence Total Printemps 55 64 119 Eté 59 60 119 Automne 52 63 115 Hiver 60 77 137 Total 226 264 490 Exercice 3 On se demande s il y a un lien entre la réussite ou l échec à un examen et le fait que l étudiant assiste ou non au cours de révision. Les résultats pour 225 étudiants choisis au hasard sont indiqués ci-dessous. Choisir un seuil critique de 1%. Peut-on dire que ceux qui assistent au cours de révision sont plus nombreux à réussir l examen? Examen Révision Réussi Echoué Total Oui 79 21 100 Non 76 49 125 Total 155 70 225 10