Chapitre 8 ANOVA Aalyse de la Variace. Obectif de la méthode Chap 8.. Obectif de la méthode. Approche ituitive 3. Décompositio de la variace 4. ANOVA: le test et le modèle statistique sous-acet O s itéresse ici ecore aux différeces de moyee etre populatios. Par exemple, trois échatillos ot-elles la même moyee? ou autremet dit, les différeces de moyee etre les trois échatillos sot-elles sigificatives? O utilisera ici la mesure de variace afi de détermier le caractère sigificatif, ou o, des différeces de moyee mesurées sur les populatios. Exemple: Calcul de la répose d orgaismes tests à 7 substaces polluates, e utilisat par exemple leur durée de vie. O aura doc 7 groupes, avec u certai ombre d observatios par groupe. O calculera ue durée de vie moyee pour chaque groupe et o cherchera à savoir si les différeces etre les moyees obteues sot sigificatives ou pas. O pourrait le faire grâce à u test paramétrique, mais cela impliquerait de comparer à chacu des groupes à tous les autres, soit réaliser C 7 = tests. Ça reste faisable mais si o réalise le test avec u seuil α=5%, o aura test sur 0 qui apparaîtra sigificatif alors qu il e l est pas. O choisit doc de comparer globalemet les 7 moyees etre elles. == c est l obectif de l ANOVA.
. Approche Ituitive de l ANOVA Chap 8.. Obectif de la méthode. Approche ituitive 3. Décompositio de la variace 4. ANOVA: le test et le modèle statistique sous-acet O peut touours dire: Variabilité totale = variabilité aturelle (ou itrisèque) + variabilité due au facteur étudié O va chercher à détermier si la variabilité des moyees est plus forte que la variabilité aturelle (fluctuatios d échatilloage). groupes ou iveaux de facteurs ou échatillos: Les populatios d où provieet ces groupes otelles la même moyee? Pour cela, o va chercher à quatifier la dispersio de ces moyees et étudier ses variatios. Dispersio trop grade e peut être attribuée aux fluctuatios d échatilloage échatillos sot de moyees sigificativemet différetes issus de populatios
Exemple: 3 groupes issus des populatios A, B, C O cosidère ue var quatitative X qui suit ue loi ormale N(µ,σ ). O cosidère de plus la même variace: σ A =σ B =σ C H 0 : µ A =µ B =µ C H : au mois ue moyee différete Pour quatifier la dispersio, o calcul la variace itergroupe. Variace résiduelle= variace itragroupe e = estimatio de σ. O va doc comparer la variace itergroupe F = à la variace résiduelle. O peut utiliser la statistique e Faible dispersio des moyees e, F ou F < Fseuil α et o e peut pas reeter H0. Forte dispersio >> e, F >> ou F > Fseuil α et o pourra reeter H0 au seuil α.
3. Décompositio de la variace Chap 8.. Obectif de la méthode. Approche ituitive 3. Décompositio de la variace 4. ANOVA: le test et le modèle statistique sous-acet ANOVA == aalyse de la variabilité, grâce à ue décompositio de la variabilité e deux facteurs: Variabilité totale = var due au facteur étudié + var aturelle (ou itrisèque) ou ici var. due au facteur étudié + var. restate ou résiduelle Questio: la variabilité etre observatios pour des groupes différets est-elle plus importate (ou pas) que celle etre observatios à l itérieur de chacu des groupes?? La variabilité est quatifiée par la variace (== somme des carrés de l écart à la moyee / ddl) Cas de N obs réparties e groupes, avec obs pour chaque iveau ; variace proportioelle à: = i= ( ) ( ) xi X g = xi X + ( X X g ) = i= = Itragroupe i.e. dispersio des moy. das chacu des groupes Itergroupe i.e. dispersio des moy. de chaque groupe où X g = Tg / N avec Tg = i= omme de ttes les obs. = xi et X = T / somme des obs. groupe avec T = i= x i
O peut motrer que: = i= ( x X ) i g = = i= Tg xi N = = i= xi T + = T = Tg N Itragroupe Itergroupe i variabilité iter-groupe statistiquemet > var itragroupe è moy. des groupes sot è groupes o issus d ue même populatio. ANOVA va doc cosister à comparer les deux composates de la variace e utilisat u test statistique.
4. ANOVA: le test et le modèle statistique sous-acet Chap 8.. Obectif de la méthode. Approche ituitive 3. Décompositio de la variace 4. ANOVA: le test et le modèle statistique sous-acet O va orgaiser les observatios sous la forme d u tableau: L ANOVA va cosister à comparer les moyees pour vérifier si elles sot statistiquemet diff. ou o. O peut poser le modèle de l aalyse suivat: x = µ + α + e i Déviatio associée au iveau du facteur i i Note: o se limite ici au cas d ue expériece à u facteur, i.e. u seul aget susceptible d ifluecer la distributio des variables (e.g. variable=qté récoltée, facteur= fertilisat). i Erreur: petites var associées à tous les autres facteurs.
Les hypothèses posées pour le test sot: H0: égalité des moyees, groupes homogèe ou αi=0 i H: au mois ue des moyees est différetes, les groupes e sot pas homogèes et au mois u αi 0. Coditios d applicatio: x i suivet des lois Normales de même variace σ (estimée par e ) e i «ormaux», idépedats et de même variace σ (estimée par e ). tatistique du test: F = e uit ue loi de Fisher-edecor si H 0 est vraie. H 0 reetée au seuil α si F = e > F N, α Var de F-: Rapport de deux variables suivat ue loi de Chi. Voir démo chap. +4; Comp. variaces.
Pour réaliser ce test, o va costruire le tableau d aalyse de variace: (Note: variace=dce/ddl) i i =, les calculs se simplifiet e: F = = e X e Variace des moyees
() O a vu que les coditios d applicatio de l ANOVA sot: x i suivet des lois Normales de même variace σ (estimée par e ) e i «ormaux», idépedats et de même variace σ (estimée par e ). Il faut doc examier l hypothèse de variace costate: H 0 : σ A =σ B =σ C Pour cela, il existe des tests statistiques adaptés comme le test de Bartlett. E ere approche rapide, o peut comparer simplemet la variace dot la valeur est la + grade à celle dot la valeur est la plus petite avec u test classique de comparaiso de variaces. i o reette H0, o a solutios de remplacemet: trasformer les observatios avec, par exemple, log, sqrt, arcsi, utiliser u test o paramétrique comme le test de ruskal-wallis. () i e réalisat l ANOVA, l hypothèse H0 est reetée, il peut être itéressat de détermier quel sot les groupes ou les iveaux du facteur étudié dot les moyees sot sigificativemet différetes. (3) Pour le choix de α, l idée est de réduire sa valeur e foctio du ombre de moyees comparées. E.g.: Boferroi propose d utiliser: α =α*j*(j-)/, avec J le ombre de moyees à comparer.