L analyse de variance à deux critère de classification Objectif : comparer l influence de chaque facteur sur la moyenne de plusieurs (k) groupes indépendants d observations La méthode détaillée ci-dessous s applique uniquement quand les deux critères (variables qualitatives)sont indépendants, et s il y a une seule unité d expérimentation pour chaque groupe. -La première variable qualitative a r catégories et - la deuxième a s catégories - r x s observations Cette analyse correspond grosso modo à une double ANOVA à un critère de classification
Cette méthode nous permet uniquement de tester l effet de chaque critère uniquement, mais PAS l interaction H 0 : Les moyennes de la variable x ne sont pas affectées par le critère A. µ 1 = µ 2 = = µ r H 0 : Les moyennes de la variable x ne sont pas affectées par le critère B. µ 1 = µ 2 = = µ s Puisqu on a deux séries d hypothèses, on a deux statistiques F :
T = ( x) 2
Exemple : Robert!!! Robert s intéresse à l effet des strates d un lac et du type de nutriments présents dans 4 différentes zones du lac sur la quantité de bactéries présentes dans l eau. Robert veut être certain d avoir de la bonne eau à son chalet.
Étape 1 : Question biologique Est-ce que le nombre de bactéries par ml d eau varie selon la strate à laquelle l échantillon a été pris? Est-ce que le nombre de bactéries par ml d eau varie selon le traitement? Étape 2 : Hypothèses H 0 : La profondeur n affecte pas le nombre de bactéries par ml (hypothèse A) H1 : La profondeur affecte le nombre de bactéries par ml (hypothèse A) H 0 : La présence de nutriments n affecte pas le nombre de bactéries par ml (hypothèse B) H1 : La présence de nutriments affecte le nombre de bactéries par ml (hypothèse B)
Étape 3 :Choix du test Le test statistique utilisé est une ANOVA à deux critères de classification où : Étape 4 : Conditions d application Normalité des données dans tous les groupes et ce, pour chaque combinaison des critères Indépendance des observations Équivariance de ces groupes Étape 5 : Distribution de la variable auxiliaire Sous H 0, la variable F A se distribue selon la loi de Fisher à υ1 = (r-1) = 2 et υ2 = (r-1)(s-1) = 8 degrés de liberté et la variable F B se distribue selon la loi de Fisher à υ1 = (s-1) = 4 et υ2 = (r-1)(s-1) = 8 d.d.l.
Étape 6 : Règles de décision Pour un seuil α = 0.05 On rejette H 0 (il y a un effet des strates) si F A > 4,46. On rejette H 0 (il y a un effet des traitements) si F B > 3,84 Étape 7 : Calcul du test
Étape 8 : Décision statistique Puisque F A = 9,71 > 4,46, on rejette H 0 : Les strates ont un effet des sur le nombre de bactéries. Puisque F B = 1,91 < 3,84, on ne rejette pas H 0 : pas d effet des traitements sur le nombre de bactéries.
Étape 9 : Interprétation biologique Les bactéries sont sensibles à la concentration d oxygène, qui varie passablement entre les différentes strates d un lac, mais pas aux types de nutriments qui ont été utilisés lors de l expérience.
ANOVA factorielle à deux critères de classification n égaux = orthogonal experimental design Ce type d ANOVA permet de tester, en plus de l effet isolé de chacun des facteurs, l effet de l interaction des deux. Pour cela il faut disposer de plusieurs mesures pour chaque combinaison de niveaux, c est-à-dire dans chaque cellule. Les résultats permettent de tester trois séries d hypothèses :
H 0 : Les moyennes de la variable x ne sont pas affectées par le critère A. µ 1 = µ 2 = = µ r H 0 : Les moyennes de la variable x ne sont pas affectées par le critère B. µ 1 = µ 2 = = µ s H 0 : Les critères A et B n interagissent pas sur les moyennes.
SC = Somme des carrés des écarts Dispersion totale = SCT Dispersion intragroupe ( due aux erreurs ) = SCE Dispersion due aux facteur A ou B = SCEA ou SCEB Dispersion des cellules = SCcells Mesure de la dispersion (variation) totale SCT a b n SCT = X C 2 d.d.l. = N-1 C = a b n N X 2
Mesure de la dispersion (variation) du facteur A SCA a b n X = bn 2 C d.d.l. = a-1 Mesure de la dispersion (variation) du facteur B SCB b a n 2 X d.d.l. = b-1 = C an
Mesure de la dispersion (variation) des cellules SCcells SCcells a b n X = n 2 C d.d.l. = ab-1 Mesure de la dispersion (variation) de l interaction AxB SCAB SCAB = SCcells (SCA + SCB) d.d.l. = (a-1)(b-1)
Mesure de la dispersion (variation) intragroupe (dûe aux erreurs) SCE SCE= SCT SCcells d.d.l. = ab(n-1)
Calculs : T = ( x) 2 Interaction
Exemple : Le régime miracle! On désire quantifier l efficacité de trois types de régimes, de quatre intensités d activité physique ainsi que l interaction de ces deux critères sur la perte de poids.
Étape 1 : Question biologique Quel est l effet du régime, de l exercice physique ainsi que de leur interaction sur la perte de poids? Étape 2 : Déclaration des hypothèses H 0 : Le régime n affecte pas la perte de poids (hypothèse A) µ reg1 = µ reg2 = µ reg3 H 1 : Le régime affecte la perte de poids (hypothèse A) µi µj pour au moins un i j H 0 : L activité physique n affecte pas la perte de poids (hypothèse B) µ ex1 = µ ex2 = µ ex3 H 1 : L activité physique affecte la perte de poids (hypothèse B) µi µj pour au moins un i j H 0 : L activité physique et le régime n interagissent pas sur la perte de poids H 1 : L activité physique et le régime interagissent sur la perte de poids.
Étape 3 : Choix du test Le test statistique utilisé est une ANOVA factorielle à deux critères de classification où : Étape 4 : Conditions d application Normalité des données dans tous les groupes et ce, pour chaque combinaison des critères Équivariance de ces groupes Indépendance des observations Étape 5 : Distribution de la variable auxiliaire Sous H 0, la variable F A se distribue selon la loi de Fisher à υ1 = (r-1) = 2 et υ2 = rs(k-1) = 60 d.d.l. la variable F B se distribue selon la loi de Fisher à υ1 = (s-1) = 3 et υ2 = rs(k-1) = 60 d.d.l. la variable F AB se distribue selon la loi de Fisher à υ1 = (r-1)(s-1) = 6 et υ2 = rs(k-1) = 60 d.d.l.
Étape 6 : Règles de décision Pour un seuil α = 0,05 : On rejette H 0 (donc il y a un effet des régimes) si F A > 3,15. On rejette H 0 (donc il y a un effet des exercices) si F B > 2,76 On rejette H 0 (donc il y a une interaction) si F AB > 2,25. Étape 7 : Calcul du test
Étape 8 : Décision statistique Puisque F A = 3,435 > 3,15, on rejette H 0 : il y a un effet des régimes. Puisque F B = 26,743 > 2,76, on rejette H 0 : il y a un effet des exercices. Puisque F AB = 3,954 > 2,25, on rejette H 0 : il y a une interaction. Étape 9 : Interprétation biologique Le régime et l exercice physique permettent de perdre du poids car ils permettent de contrôler le taux de gras. De plus, l effet du régime sur la perte de poids variera en fonction de l activité physique et vice-versa.
Modèle I : les 2 facteurs ont des effets fixes Modèle II : les niveaux des facteurs sont aléatoires Modèle III : modèle mixte entre I et II effet Modèle I Modèle II Modèle III A & B fixes A &B aléatoires A fixe & B aléatoire Facteur A CM A/CM e CM A/CM AB CM A/CM AB Facteur B CM B/CM e CM B/CM AB CM B/CM e Interaction A x B CM AB/CM e CM AB/CM e CM AB/CMe
ANOVA factorielle à deux critères de classification n inégaux et non proportionnels S il manque une mesure ou qqes, on peut l estimer selon la formule : Xˆ = aa + bb + cc +... ( k 1) X i j l N + k 1 a b c... Somme de toutes les données dans le niveau i du facteur A Somme de toutes les autres données Ou plus simple on remplace par les cellules manquantes par la valeur moyenne des données, puis on fait l anova MAIS avec le ddl total et le ddl des cellules calculés sur le vrai nombre de mesures
S il en manque plus Voir les modèles GLM (General Linear Model) ou on recommence tout