STAT-I301 Chapitre VI: Méthodes non paramétriques Caroline Verhoeven
Table des matières 1 Test de Mann-Whitney 2 Test de rangs de Wilcoxon pour 2 échantillons appariés 3 Coefficient de corrélation de rangs de Spearman Calcul du coefficient de corrélation Test de significativité pour r s Caroline Verhoeven STAT-I301 2 / 39
1. Test de Mann-Whitney Test de Mann-Whitney : Exemple I Exemple 1 Chez le grillon des sauges (Cyphoderris strepitans), durant l accouplement, la femelle grignote les extrémités des ailes du mâle. En 1999, Johnson et al. se sont demandé si une femelle affamée aura plus facilement tendance à s accoupler. Ils ont pris 24 grillons et ont choisi un groupe de N 1 = 11 au hasard qu ils ont affamé, l autre groupe de N 2 = 13 a été nourri. Apres quoi chaque femelle a été mise dans une cage avec 1 mâle, et on a enregistré le temps d attente pour l accouplement Les mesures se trouvent sur le slide suivant Caroline Verhoeven STAT-I301 3 / 39
1. Test de Mann-Whitney Test de Mann-Whitney : Exemple II Exemple 1 faim nourri 1,9 1,5 2,1 1,7 3,8 2,4 9,0 3,6 9,6 5,7 13,0 22,6 14,7 22,8 17,9 39,0 21,7 54,4 29,0 72,1 72,3 73,6 79,5 88,9 Caroline Verhoeven STAT-I301 4 / 39
1. Test de Mann-Whitney Mann-Whitney : Exemple III nombre 8 6 4 2 Femelles affamées 0 0 20 40 60 80 100 temps nombre 8 6 4 2 Femelles nouries 0 0 20 40 60 80 100 temps Clairement non normal Caroline Verhoeven STAT-I301 5 / 39
1. Test de Mann-Whitney Test de Mann-Whitney : Principes Egalement appelé test de rangs de Wilcoxon pour 2 échantillons indépendants équivalent non-paramétrique du test t pour 2 échantillons indépendants Formulation des hypothèses H 0 : µ 1 = µ 2 médianes! H a : µ 1 µ 2 Caroline Verhoeven STAT-I301 6 / 39
1. Test de Mann-Whitney Mann-Whitney : Calcul et résolution de l exemple I 1 Classer les mesures de la plus petite à la plus grande, tous groupes confondus Exemple 1 groupe temps classement groupe temps classement 2 1,5 1 1 17,9 13 2 1,7 2 1 21,7 14 1 1,9 3 2 22,6 15 1 2,1 4 2 22,8 16 2 2,4 5 1 29,0 17 2 3,6 6 2 39,0 18 1 3,8 7 2 54,4 19 2 5,7 8 2 72,1 20 1 9,0 9 1 72,3 21 1 9,6 10 2 73,6 22 1 13,0 11 2 79,5 23 1 14,7 12 2 88,9 24 Caroline Verhoeven STAT-I301 7 / 39
1. Test de Mann-Whitney Mann-Whitney : Calcul et résolution de l exemple II 2 Calculer la somme des classements du plus petit groupe : Exemple 1 r 1 = 3+4+7+9+10+11+12+13+14+17+21 = 121. 3 Calcul de la statistique : r 1 Caroline Verhoeven STAT-I301 8 / 39
1. Test de Mann-Whitney Mann-Whitney : Calcul et résolution de l exemple III 4 Comparer la statistique avec la table de Wilcoxon Exemple 1 Ici on regarde un test bilatéral et on veut savoir si il y a une différence à α = 0, 05. On regarde dans la table pour α = 0, 05 et N 1 = 11, N 2 = 13 et on voit 2 nombres : w 0,025 = 103 w 0,975 = 172 Si r 1 w 0,025 ou r 1 w 0,975 On rejette H 0 Si w 0,025 < r 1 < w 0,975 On ne rejette pas H 0 Ici : w 0,025 = 103 < r 1 = 121 < w 0,975 = 172 On ne rejette pas H 0 Caroline Verhoeven STAT-I301 9 / 39
1. Test de Mann-Whitney Valeur attendue pour R 1 I On sait que n i=1 i = 1+2+ +n = n(n+1) 2 Si on additionne tous le classements, on a 1+2+ +(N 1 + N 2 ) = (N 1 + N 2 )(N 1 + N 2 + 1) 2 La moyenne des classements est donnée par 1 (1+2+ +(N 1 + N 2 )) = N 1 + N 2 + 1 N 1 + N 2 2 Caroline Verhoeven STAT-I301 10 / 39
1. Test de Mann-Whitney Valeur attendue pour R 1 II La valeur attendue E(R 1 ), si H 0 est vraie, est proportionnelle : au nombre de sujets dans le groupe 1 : N 1 à la moyenne des classements N 1 + N 2 + 1 2 Et donc : E(R 1 ) = N 1 N 1 + N 2 + 1 2 Caroline Verhoeven STAT-I301 11 / 39
1. Test de Mann-Whitney Si les échantillons sont grands? Si N 1 et N 2 sont trop grands, ils ne sont plus dans les tables. Alors, on calcule z = r 1 E(R 1 ) N1 N 2 (N 1 + N 2 + 1), s(r 1 ) = s(r 1 ) 12 Z N(0, 1) Si on regarde un test bilatéral à un taux α = 0, 05 : On rejette H 0 si z < 1, 96 ou z > 1, 96 On ne rejette pas H 0 si 1, 96 < z < 1, 96 Caroline Verhoeven STAT-I301 12 / 39
1. Test de Mann-Whitney Classement avec mesures égales Comment classe-t-on si on a plusieurs fois la même mesure? Exemple 2 Considérons les mesures fictives groupe x i classement 2 12 1 2 14 2 1 17 3 1 19 4,5 2 19 4,5 1 24 6 2 27 7 1 28 8 Classement des mesures égales : moyenne des places qu elles prennent Caroline Verhoeven STAT-I301 13 / 39
1. Test de Mann-Whitney Test de Mann-Whitney : conditions Il n y a pas de conditions sur la distribution de la population Les distributions de 2 populations doivent avoir la même forme Les 2 échantillons sont aléatoires simples Les 2 échantillons sont indépendants Caroline Verhoeven STAT-I301 14 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Exemple I Exemple 3 En 2002, Haguenauer a étudié le pas de base de la danse sur glace. Il a étudié l impact de la position de la jambe d appui en phase de repositionnement après une poussée. La jambe peut être en flexion ou en extension. La différence des position a-t-elle un impact sur la vitesse du patineur? On a demandé de faire le même pas, 1 fois avec la jambe en extension et 1 fois avec la jambe en flexion à N = 7 patineurs. La vélocité de poussée a été enregistrée. Caroline Verhoeven STAT-I301 15 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Exemple II Exemple 3 patineur E F 1 2,13 1,90 2 1,77 1,55 3 1,68 1,62 4 2,04 1,89 5 2,12 2,01 6 1,92 1,91 7 2,08 2,10 Caroline Verhoeven STAT-I301 16 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Principes Egalement appelé test de Wilcoxon des rangs signés Equivalent non-paramétrique du test t pour 2 échantillons appariés Hypothèse sur la médiane δ des différence entre les 2 mesures d 1 paire Formulation des hypothèses H 0 : δ = 0 H a : δ 0 Caroline Verhoeven STAT-I301 17 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Calcul et résolution de l exemple I 1 Calcul des différences d i = x i1 x i2 entre les 2 mesures 2 Calcul des valeurs absolues d i Exemple 3 i x i1 x i2 d i d i 1 2,13 1,90 0,23 0,23 2 1,77 1,55 0,22 0,22 3 1,68 1,62 0,06 0,06 4 2,04 1,89 0,15 0,15 5 2,12 2,01 0,11 0,11 6 1,92 1,91 0,01 0,01 7 2,08 2,10-0,02 0,02 Caroline Verhoeven STAT-I301 18 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Calcul et résolution de l exemple II 3 Classement des d i de la plus petite à la plus grande. Si d i = 0, on élimine la donnée de l analyse. (Il nous reste n données) Si 2 différences sont identiques, on prend la moyenne de leur place Exemple 3 i x i1 x i2 d i d i classement 1 2,13 1,90 0,23 0,23 7 2 1,77 1,55 0,22 0,22 6 3 1,68 1,62 0,06 0,06 3 4 2,04 1,89 0,15 0,15 5 5 2,12 2,01 0,11 0,11 4 6 1,92 1,91 0,01 0,01 1 7 2,08 2,10-0,02 0,02 2 Caroline Verhoeven STAT-I301 19 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Calcul et résolution de l exemple II 4 On regarde les classement des différences positives et négatives 5 On prend la somme des c+ et la somme des c- Exemple 3 i x i1 x i2 d i d i classement c+ c- 1 2,13 1,90 0,23 0,23 7 7 2 1,77 1,55 0,22 0,22 6 6 3 1,68 1,62 0,06 0,06 3 3 4 2,04 1,89 0,15 0,15 5 5 5 2,12 2,01 0,11 0,11 4 4 6 1,92 1,91 0,01 0,01 1 1 7 2,08 2,10-0,02 0,02 2 2 t + = 26 t = 2 Caroline Verhoeven STAT-I301 20 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Calcul et résolution de l exemple II 6 Prendre le plus petit entre les t + et t, on le nomme t Exemple 3 Dans notre example, on a t = t = 2 Caroline Verhoeven STAT-I301 21 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Calcul et résolution de l exemple III 6 On compare t avec la table de Wilcoxon pour 2 échantillons appariés Exemple 3 Ici on regarde un test bilatéral et on veut savoir si il y a une différence à α = 0, 05. On regarde dans la table pour α = 0, 05 et n = 7 et on voit le nombres : t 0,025 = 3 Caroline Verhoeven STAT-I301 22 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Wilcoxon pour 2 échantillons appariés : Calcul et résolution de l exemple IV Exemple 3 Si t t 0,025 ou t t 0,975 On rejette H 0 Ici : Si t 0,025 < t < t 0,975 On ne rejette pas H 0 t = 2 < t 0,025 = 3 On rejette H 0 Caroline Verhoeven STAT-I301 23 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Valeur attendue pour T Si H 0 est vrai, on s attend à ce que la somme des classements de différence négative soit la même que celle des classements des différences positives : E(T ) = E(T + ) On sait que la somme totale des classements est : t + + t = 1+2+ +n = n(n+1) 2 En combinant les 2 infos, on obtient : E(T ) = E(T + ) = 1 n(n+1) = n(n+1) 2 2 4 La distribution T de Wilcoxon est symétrique autour de n(n + 1)/4 Caroline Verhoeven STAT-I301 24 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Si les échantillons sont grands Si n est trop grand pour le trouver dans les tables, on calcule z = t E(T) s(t) s(t) = n(n+1)(2n+1) 24 Z N(0, 1) Si on regarde un test bilatéral à un taux α = 0, 05 : On rejette H 0 si z < 1, 96 ou z > 1, 96 On ne rejette pas H 0 si 1, 96 < z < 1, 96 Caroline Verhoeven STAT-I301 25 / 39
2. Test de rangs de Wilcoxon pour 2 échantillons appariés Test de rangs de Wilcoxon pour 2 échantillons appariés : conditions La distribution ne doit pas être trop asymétrique Les données ne peuvent pas être biaisées Les sujets doivent être indépendants Caroline Verhoeven STAT-I301 26 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Coefficient de corrélation de Spearman : Exemple I Exemple 4 En 1986, Woloschuk a étudié le lien entre la performance d une équipe de basket-ball et sa volonté de gagner. Durant un tournoi, il a donné un questionnaire mesurant la volonté de gagner aux joueuses de 18 équipes, On a enregistré le score moyen pour la volonté de vaincre par équipe et le nombre de points moyen de cette équipe pour le tournoi? Le score pour la volonté de vaincre est-il relié au nombre de points moyen obtenus par l équipe? Les données se trouvent sur le slide suivant Caroline Verhoeven STAT-I301 27 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Coefficient de corrélation de Spearman : Exemple II Exemple 4 équipe vaincre points équipe vaincre points 1 9,50 46,25 10 7,71 30,33 2 9,46 40,50 11 7,64 22,00 3 9,00 41,20 12 7,56 40,75 4 8,90 48,75 13 7,17 39,50 5 8,55 45,00 14 7,00 42,75 6 8,22 43,00 15 7,00 28,50 7 8,18 28,50 16 6,50 42,50 8 8,09 46,20 17 6,29 25,33 9 7,80 27,66 18 5,75 41,00 Caroline Verhoeven STAT-I301 28 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Coefficient de corrélation de Spearman : Exemple II Exemple 4 Nuage de points pour cet exemple points 50 45 40 35 30 25 20 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 volonté de vaincre Caroline Verhoeven STAT-I301 29 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Coefficient de corrélation de Spearman : Calcul et résolution de l exemple I 1 Déterminer le classement des mesures x et des mesures y. Si 2 mesures sont identiques, on prend la moyenne de leur place. Exemple 4 i x i y i c x,i c y,i 1 9,50 46,25 18 17 2 9,46 40,50 17 8 3 9,00 41,20 16 11 4 8,90 48,75 15 18 5 8,55 45,00 14 15 6 8,22 43,00 13 14 7 8,18 28,50 12 4 8 8,09 46,20 11 16..... 18 5,75 41,00 1 10 Caroline Verhoeven STAT-I301 30 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Coefficient de corrélation de Spearman : Calcul et résolution de l exemple II 2 Prendre la différence entre les 2 classements d i = c x,i c yi 3 Calculer d 2 i Exemple 4 i x i y i c x,i c y,i d i di 2 1 9,50 46,25 18 17 1 1 2 9,46 40,50 17 8 9 81 3 9,00 41,20 16 11 5 25 4 8,90 48,75 15 18-3 9 5 8,55 45,00 14 15-1 1 6 8,22 43,00 13 14-1 1 7 8,18 28,50 12 4 8 64 8 8,09 46,20 11 16-5 25..... 18 5,75 41,00 1 10-9 81 Caroline Verhoeven STAT-I301 31 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Coefficient de corrélation de Spearman : Calcul et résolution de l exemple II 4 Calculer le total des d 2 i Exemple 4 i x i y i c x,i c y,i d i di 2 1 9,50 46,25 18 17 1 1 2 9,46 40,50 17 8 9 81 3 9,00 41,20 16 11 5 25 4 8,90 48,75 15 18-3 9 5 8,55 45,00 14 15-1 1 6 8,22 43,00 13 14-1 1 7 8,18 28,50 12 4 8 64 8 8,09 46,20 11 16-5 25..... 18 5,75 41,00 1 10-9 81 663,5 Caroline Verhoeven STAT-I301 32 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Coefficient de corrélation de Spearman : Calcul et résolution de l exemple III 5 Calculer le coefficient de corrélation de Spearman r s r s = 1 6 N i=1 d i 2 N(N 2 1) Exemple 4 Dans notre exemple : Remarque 5 1 r s 1 r s = 1 6 663, 5 18(18 2 = 0, 315 1) Caroline Verhoeven STAT-I301 33 / 39
3. Coefficient de corrélation de rangs de Spearman 1. Calcul du coefficient de corrélation Formule et ex aequo La formule r s = 1 6 N i=1 d i 2 N(N 2 1) n est exacte que si il n y a pas d ex aequos dans les mesures! Si il y a des ex aequos, on utilise la formule r s = N i=1 (c x,i c x )(c y,i c y ) N i=1 (c N x,i c x ) 2 i=1 (c y,i c y ) 2 c x et c y : moyenne des classements pour x et y : c x = c y = N + 1 2 Caroline Verhoeven STAT-I301 34 / 39
3. Coefficient de corrélation de rangs de Spearman 2. Test de significativité pour r s Test de significativité pour r s : Exemple Exemple 4 Dans l exemple de basket, nous avons obtenu un coefficient de corrélation de rangs de Spearman r s = 0, 315. Peut-on conclure à partir de cet exemple, que la performance d une équipe est relié à sa volonté de vaincre, avec un taux α = 0, 05? Caroline Verhoeven STAT-I301 35 / 39
3. Coefficient de corrélation de rangs de Spearman 2. Test de significativité pour r s Test de significativité pour r s : Principe ρ s : Coefficient de corrélation de Spearman pour la population Formulation d hypothèses H 0 : ρ s = 0 H a : ρ s 0 Calcul de la statistique : r s On regarde dans la table de distribution du coefficient de corrélation du Spearman le nombre r N,1 α/2 r s r N;1 α/2 ou r s r N;1 α/2 on rejette H 0 r N;1 α/2 < r s < r N;1 α/2 on ne rejette pas H 0 Caroline Verhoeven STAT-I301 36 / 39
3. Coefficient de corrélation de rangs de Spearman 2. Test de significativité pour r s Test de significativité pour r s : Résolution de l exemple Exemple 4 Formulation d hypothèses H 0 : ρ s = 0 H a : ρ s 0 Calcul de la statistique : r s = 0, 315 On regarde dans la table de distribution du coefficient de corrélation du Spearman : r 18;0,975 = 0, 472 r s = 0, 315 < r 18;0,975 = 0, 472 On ne rejette pas H 0 Caroline Verhoeven STAT-I301 37 / 39
3. Coefficient de corrélation de rangs de Spearman 2. Test de significativité pour r s Si les échantillons sont grands Si N est trop grand pour le trouver dans les tables, on calcule t = r s 1 rs 2, s rs = s rs N 2 T t(df = N 2) Caroline Verhoeven STAT-I301 38 / 39
3. Coefficient de corrélation de rangs de Spearman 2. Test de significativité pour r s Corrélation de Spearman : Conditions Les échantillons sont aléatoires simples La relation entre les 2 classements doit être linéaire Caroline Verhoeven STAT-I301 39 / 39