Le test du χ 2
Test du χ 2 Objectif Mesurer l écart entre des fréquences observées et attendues d'un tableau de contingence (ou de corrélation) et tester si ces écarts sont suffisamment faibles pour n être imputables qu aux fluctuations de l échantillonnage. Principe L analyse se fait à l aide d un tableau de corrélation (variables quantitatives regroupées en classes) ou (plus souvent) de contingence (variables qualitatives). On calcule les fréquences attendues de chacune des cases puis les écarts entre celles-ci et les fréquences observées. On calcule une statistique χ 2 calc et on détermine la probabilité de cette valeur sous H 0 à l aide de la distribution du χ 2 à υ = (l 1) (c 1) degrés de liberté. Cette distribution nous permettra de savoir si la probabilité de trouver notre valeur de χ 2 sous H 0 est plus grande ou plus petite que notre seuil α.
Tableau de contingence: les Smarties transgéniques
Les tableaux de corrélation: le territoire et la masse des marsupiaux
Calcul de la statistique χ 2 Pour calculer la statistique χ 2, on a besoin des: - fréquences absolues observées - fréquences absolues attendues Remarque importante: les fréquences du tableau sont des fréquences absolues observées, jamais des fréquences relatives!
Il nous faut maintenant les fréquences attendues (théoriques). Ce sont les fréquences qu'on aurait dans chaque case du tableau s'il n'y avait pas de lien entre les lignes et les colonnes (entre les deux variables multiclasses). 1. Si on connaît déjà (grâce à une théorie) les fréquences attendues théoriques, on les utilise directement. Exemple: l'hérédité des pois de Mendel: 2. Si on ne dispose pas d'une théorie qui nous prédit les fréquences absolues théoriques, on peut les calculer à partir des données brutes: Dans chaque case du tableau, on calcule la somme des éléments de la ligne fois la somme des éléments de la colonne, divisé par N, soit
Calcul de la statistique du χ 2 Test du χ 2 H 0 : Il n y a pas de relation entre les variables χ 2 = 0 H 1 : Il y a une relation entre les variables χ 2 > 0 Ce test nous permet de trouver une relation entre les lignes et les colonnes du tableau mais pas le sens de la relation.
Conditions d'application données sous forme de fréquences indépendance des observations fréquences distribuées normalement règles de Cochran respectées
Distribution de la variable auxiliaire Si H 0 est vraie, la statistique χ 2 calc suit une distribution de χ2 à υ = (l 1) (c 1) d.d.l. Règle de décision On rejette H 0 si χ 2 calc χ2 (α, ν)
Exemple : Vive le hockey! Tableau de contingence du nombre de joueurs de hockey de différentes nationalités utilisant différentes marques de bâtons de hockey. Étape 1 : Question biologique Le choix de la marque du bâton de hockey que les joueurs utilisent est-il influencé par l origine du joueur?
Étape 2: Déclaration des hypothèses H 0 : il n y a pas de préférence de marque de bâton de hockey chez les joueurs de différentes nationalités (donc: la variable "marque de bâton" et la variable "nationalité" sont indépendantes) : χ 2 = 0 H 1 : les joueurs de différentes nationalités ont des préférences différentes au niveau de la marque de bâton de hockey qu ils utilisent : χ 2 > 0 Étape 3 : Test statistique utilisé Étape 4: Conditions d application données sous forme de fréquences indépendance des observations fréquences distribuées normalement les règles de Cochran sont-elles respectées?
Calcul des fréquences théoriques: f th(i,j) = (n i n j )/N exemple, la première cellule :
a) Il n y a aucune fréquence théorique < 1 b) N / (l c) = 287 / (5 6) = 9,57 > 6 pour un seuil α = 0,05 Les règles de Cochran respectées: on ne fusionne pas de classe. Étape 5 : Distribution de la variable auxiliaire Si H 0 est vraie, la statistique χ 2 calc suit une distribution de χ2 à υ = (l 1) (c 1) = (5 1) (6 1) = 20 d.d.l. Étape 6 : Règle de décision On rejette H 0 si χ 2 calc χ2 (0,05, 20) = 31,41 Étape 7: Calcul du test Étape 8: Décision statistique On ne rejette pas H 0 au seuil α = 0,05 car si χ 2 calc < χ2 (0,05, 20) Étape 9: Interprétation biologique Les joueurs de différentes nationalités n utilisent pas des bâtons de hockey de marques différentes car les compagnies font la promotion de leurs bâtons avec la même intensité dans les pays étudiés.