Corrélation entre deux classements Cas: échelle ordinale On peut utilisé le Rhô ρ Le coefficient de rang de Spearman Cours réalisé par Benjamin Putois Novembre 2008 bputois@gmail.com Indice statistique compris entre - 1 et +1 qui exprime l'intensité et le sens (positif ou négatif) de la relation monotone (d'ordre) entre deux variables ordinales. Un cas particulièrement fréquent concerne les situations où un ensemble d'individus (d'objets) sont classés par deux juges (évaluateurs, observateurs) différents, ou par un même juge selon deux critères différents (niveau de réussite et niveau de motivation d'un groupe d'élèves par exemple). La procédure consiste à attribuer à chaque individu(à chaque objet) un rang allant de 1 à n, n étant le nombre d'éléments à classer. On dispose alors de deux classements des mêmes éléments, dont il s'agit de vérifier quel est le degré de concordance. De ce point de vue, le coefficient rhô de Spearman est parfois utilisé pour évaluer le degré d' accord entre juges, évaluateurs ou observateurs. http://www.irdp.ch/edumetrie/lexique/coef_rho_spearmann.htm 1
Exemple 1: Corrélation entre deux classements Exercice: Deux psychologues d une clinique ont classé dix patients par ordre d agressivité. Leur opinion sont-elles corrélées? Le patient B a été décrit comme le moins agressif par le psy 1. patient A B C D E F G H I J psychologue 1 4 10 2 1 6 3 8 5 7 9 psychologue 2 5 3 4 6 2 7 9 1 10 8 Le patient D a été décrit comme le plus agressif par le psy 1. Le patient H a été décrit comme le plus agressif par le psy 2. Le patient I a été décrit comme le moins agressif par le psy 2. 2
Etape 1: hyp. H0: pas de fidélité inter-juge H1: fidélité inter-juge Etape 1: hyp. H0: pas de fidélité inter-juge H1: fidélité inter-juge Etape 2: calcul rhô J applique la formule suivante: 1. Différence entre les rangs 2. Carré des différences 3. Somme 4. Multiplication par 6 5. Division par n(n²-1) n est le nombre d éléments à classer 6. Je soustrait le tout à 1. 3
Etape 2: Je calcule le Rhô de Spearman patient A B C D E F G H I J psychologue 1 4 10 2 1 6 3 8 5 7 9 psychologue 2 5 3 4 6 2 7 9 1 10 8 9-8= D -1 7-2 -5 4-4 -1 4-3 1 D² 1 49 4 25 16 16 1 16 9 1*1= 1 138 * Etape 3: Table Je cherche le Rhô théorique dans la table: Si α=.05, Rhô théorique = 0,6483 4
Etape 4: Comparaison Je compare Rhô calculé et Rhô théorique Rhô calculé =0,1636 Rhô théorique = 0,6483 Rhô calculé < Rhô théorique On ne peut rejeter H0 Attention valeur absolue! Etape 5: Conclusion A une confiance de.05, il n y a pas de fidélité inter-juge. Exemple 2: Rhô de Spearman entre des variables non rangées 5
Un neuropsychologue a testé 9 enfants autistes par deux épreuves. Nous aimerions savoir si l épreuve de est corrélée à l épreuve de en employant le coefficient de rang de Spearman. Etape 1: hypothèses H0: pas de fidélité inter-épreuve H1: fidélité inter-épreuve Voici les données (fictives): A B C D E F G H I 18 29 32 25 16 21 22 28 24 5 13 13 13 3 7 10 9 9 Ici les données ne sont pas ordonnées, mais nous pouvons leur attribuer un rang 6
Etape 2: Attribution de rang A B C D E F G H I 18 29 32 25 16 21 22 28 24 5 13 13 13 3 7 10 9 9 2 8 9 6 1 3 4 7 5 A B C D E F G H I 18 29 32 25 16 21 22 28 24 5 13 13 13 3 7 10 9 9 9+8+7/3=8 Que faire en cas d égalité? 4+5/2=4,5 Rang Rang 2 8 9 6 1 3 4 7 5 2 8 8 8 1 3 6 4,5 4,5 Attention ce n est pas 5! 7
Rang Rang A B C D E F G H I 18 29 32 25 16 21 22 28 24 5 13 13 13 3 7 10 9 9 2 8 9 6 1 3 4 7 5 2 8 8 8 1 3 6 4,5 4,5 Etape 3.1: Je calcul D D 0 0 1-2 0 0-2 2,5 0,5 Etape 3.2: Je calcul D² D² 0 0 1 4 0 0 4 6,25 0,25 = 15,5 Etape 3.3: * 8
Etape 3.3: * Etape 4: Rhô α=.01 =0,8332 Etape 3.3: * Etape 4: Rhô α=.01 =0,8332 Etape 5: Rhô calculé >Rhô α=.01 9
Etape 3.3: * Etape 4: Rhô α=.01 =0,8332 Etape 5: Rhô calculé >Rhô α=.01 Etape 6: Rejet de H0, fidélité inter-épreuve Utilisation du coefficient de rang de Spearman (rhô): Si je souhaite connaître le lien (la corrélation) entre deux variables ordinales (i.e. entre deux classements) ou si je souhaite utiliser une méthode de rang sur d autres formes de variables (rare). Formule: Différence entre les rangs Nombre d éléments à classer ρvarie en -1 et 1. Plus ρest proche de ces valeurs, plus grande est la corrélation. Plus ρest proche de 0, moins grande est la corrélation 10
Lors de la 2eme manche de l élection de miss France, nous cherchons à savoir si les classements d un membre du jury sont fidèles dans le temps! Voici les deux classements: Classement avant l apéro Classement après l apéro alsace 5 10 anjou 7 3 artois 10 7 auvergne 13 2 bourgogne 9 13 bretagne 8 11 champagne 12 6 charentes 14 1 corse 11 5 guyane 6 12 mayotte 3 9 paris 2 8 pyrénées 4 4 tahiti 1 14 Lors du festival d Angoulême de 1954, deux critères (noté sur 10) étaient retenus pour le classement des BD enfant moins de 10 ans. Ces deux critères sont-ils valides? Moyenne des notes attribuées par 1000 lecteurs asterix spirou donjon stroumph pif toupet mickey phylactères trop compliqués 8 3 1 2 4 1 1 personnages trop intellectuels 10 2 4 8 6 2 1 (données fictives) Appliquer un coefficient de rang de Spearman! N. De Crécy. Le bibendum céleste 11