Analyse des données - Méthodes explicatives (STA102) Analyse de la variance à deux facteurs : dispositif équilibré Giorgio Russolillo Departement IMATH CNAM giorgio.russolillo@cnam.fr
Introduction Giorgio Russolillo STA102 2
Le problème On dispose d un échantillon de n individus sur lesquels on a observé 2 variables qualitatives (facteurs, x 1 et x 2 ) et une variable quantitative y. On veut étudier si les 2 facteurs ont un effet sur la variabilité de y facteurs var. quantitative Où : 2 ème facteur à J niveaux 1 er facteur à I niveaux Giorgio Russolillo STA102 3
Les notations i c est un des possibles niveaux du 1 er facteur, avec i = 1 I (n x 2) j c est un des possibles niveaux du 2 ème facteur, avec j = 1 J Chaque combinaison (i,j) définit un traitement et définit un «groupe»; en total on a I x J traitements n ij = nombre de répétions pour le traitement (i,j) dans chaque traitement k est l indice de répétition, k = 1 n ij Giorgio Russolillo STA102 4
Tableau des fréquences Niveaux du 2ème facteur 1 j J Tot. Niveaux di 1er facteur 1 n 11 n 1j n 1J n 1. i n i1 n ij n ij n i.... I n I1 n Ij n IJ n I. Tot. n. 1 n. j n. J n n i = J j=1 n ij i, j : n ij K Chaque traitement à été reçu pour le même nombre de répétitions K (constant) n j = i=1 n ij Giorgio Russolillo STA102 I Dispositif équilibré : Les effets des deux facteurs seront complètement distinguables, i.e. c est un dispositif orthogonal nombre total d observations J n = n j = n i = n ij j=1 i, j : n ij = n i n j n I i=1 i, j 5
Les notations Y ijk = valeur de la variable Y pour l individu k qui a reçu le traitement (i,j) Moyenne de la variable Y pour le traitement (i,j) Y j = 1 n j I n ij Y ijk i=1 k=1 Moyenne de la variable Y pour le niveau j du 2 ème facteur (n x 1) n ij k=1 Y ij = 1 n ij Y ijk Y = 1 n J j =1 Moyenne de la variable Y pour le niveau i du 1 er facteur I i=1 n ij k=1 Y ijk Y i = 1 n i Moyenne générale de la variable Y J n ij Y ijk j=1 k=1 Giorgio Russolillo STA102 6
Tableau des moyennes Niveaux du 2éme facteur 1 j J Tot. Niveaux du 1er facteur 1 Y 11 Y 1j Y 1J Y 1 i Y i1 Y ij Y ij Y i... I Y I1 Y Ij Y IJ Y I Tot. Y 1 Y j Y J Y Moyenne générale de Y pour le niveau i du 1 er facteur Moyenne générale de Y pour le niveau j du 2 ème facteur Moyenne générale de Y Moyenne de Y pour le traitement (i,j) Giorgio Russolillo STA102 7
Le modèle d analyse de la variance à deux facteur Giorgio Russolillo STA102 8
Le modèle d analyse de la variance à deux facteurs (1) Y ijk = µ ij + ε ijk { ε ijk } i.i.d. N ( 0,σ 2 ) à C est une généralisation du modèle de l analyse de la variance à 1 facteur où on fait apparaitre l effet du aux traitements Dans ce modèle on a : - Une espérance μ ij spécifique à chaque traitement - Une variance intra-traitement commune à tous les traitements Ce modèle ne fait pas apparaître explicitement les effets des différents facteurs Giorgio Russolillo STA102 9
Le modèle d analyse de la variance à deux facteurs (2) 1 + I + J + I*J paramètres à estimer facteurs var. quantitative Terme constant Effet principal du 1 er facteur Effet principal du 2 ème facteur Variable aléatoire Y ijk = µ +α i + β j + γ ij +ε ijk Terme d interaction, i.e. effet spécifique du traitement Terme résiduel aléatoire ( ) { ε ijk } i.i.d. N 0,σ 2 Giorgio Russolillo STA102 10
Le modèle d analyse de la variance à deux facteurs Y ijk = µ +α i + β j + γ ij +ε ijk µ ij { ε ijk } i.i.d. N ( 0,σ 2 ) Les valeurs de Y sont influencée par les deux effets principaux α i et β j des facteurs et par la présence du terme d interaction γ ij Giorgio Russolillo STA102 11
Ecriture matricielle du modèle Y = XΘ n I +1 +εn 1 [ n 1] [ ( )( J +1) ] [( I +1) ( J +1) 1] [ ] (Exemple avec I=2 et J=3) Partie relative à l effet principale du 2 ème Partie relative à facteur l interaction ε = n 1 ε 111! ε 11K ε 121! ε 12K ε 131! ε 13K ε 211! ε 21K ε 221! ε 22K ε 231! ε 23K Giorgio Russolillo STA102 12
Exemple : Les données On dispose d un échantillon de n = 24 effectifs Pour chaque observation, on a la variable quantitative y le facteur «a» (2 niveaux) le le facteur «b» (3 niveaux) 1 2 1 2 3 Giorgio Russolillo STA102 13
Exemple : Les données 2 ème facteur àfact_b, avec J= 3 niveaux 1 er facteur à fact_a, avec I=2 niveaux i = indice du niveau du factor «a», i = 1, 2 j = indice du niveau du factor «b», j = 1, 2, 3 3 x 2 = 6 Traitements k = indice de répétition dans chaque traitement, k = 1 n ij Giorgio Russolillo STA102 14
Exemple : Tableau des fréquences Facteur b 1 2 3 Tot. Facteur a 1 4 4 4 12 2 4 4 4 12 Tot. 8 8 8 24 n i = 3 j=1 n 1 j n j = 2 i=1 n i1 nombre total d observations 3 n = n j = n i = n ij j=1 2 i=1 6 i, j i, j : n ij 4 Dispositif équilibré, donc orthogonal : Les effets des deux facteurs seront complètement distinguables! Giorgio Russolillo STA102 15
Exemple : Tableau des données Y ijk = k ème obs pour le i ème niveau de a et le j ème niveau de b (n x 1) y 111 = 1 y 114 = 6 y 234 = 17 Giorgio Russolillo STA102 16
Exemple : Tableau des moyennes Tableau des moyennes de y conditionnées aux différents traitements 2ème facteur 1 2 3 Tot. 1er facteur 1 2 Y 11 = 3.5 Y 21 = 8.5 Y 12 = 9.75 Y 22 = 12.5 Y 13 = 17.75 Y 23 =15.25 Y 1 =10.333 Y 2 = 12.083 Moyenne de y pour le niveau 1 du factor «a» Tot. Y 1 = 6 Y 2 = 11.125 Y 3 = 16.5 Y = 11.208 Moyenne de y pour le niveau 2 du facteur «b» Moyenne générale de y Giorgio Russolillo STA102 17
Exemple : Statistiques élémentaires Moyennes et écarts types des y par traitement Trait 1 Trait 2 Trait 3 Trait 4 Trait 5 Trait 6 Moyenne pour le traitement 3, i.e. la moyenne des y pour les effectives qui appartient au group 1 du facteur «a» et au group 3 du facteur «b» Les 6 traitements n 12 = 4 à La variabilité est la même dans les différents groups, mais on observe des différences des moyennes assez fortes Giorgio Russolillo STA102 18
Distributions de Y pour chaque traitement Giorgio Russolillo STA102 19
L interaction Giorgio Russolillo STA102 20
Graphe de l interaction Y ijk = µ +α i + β j + γ ij +ε ijk Avec interaction µ ij = µ + α i + β j + γ ij j µ 1 j µ 2 j = = ( µ + α 1 + β j + γ 1 j ) ( µ + α 2 + β j + γ 2 j ) = = α 1 α 2 + γ 1 j γ 2 j à l écart entre 2 modalités du 1 er facteur dépende de l interaction avec le 2ème facteur Sans interaction µ ij = µ + α i + β j j µ 1 j µ 2 j = = ( µ + α 1 + β j ) ( µ + α 2 + β j ) = = α 1 α 2 à l écart entre 2 modalités du 1 er facteur est le même quel que soit le 2ème facteur, donc il est CONSTANT Giorgio Russolillo STA102 21
Graphe de l interaction Ce graphe permet de voir s il faut prévoir un terme d interaction dans le modèle (mais attention il ne serve pas à dire si il est significatif!!) Avec interaction j j' : µ 1 j µ 2 j µ 1 j' µ 2 j' Sans interaction j j' µ 1 j µ 2 j = µ 1 j' µ 2 j' moyennes 16 18 20 22 24 26 28 A B C niveaux du facteur 2 Est-ce qu il y a interaction? Est-ce que l hypothèse de parallélité est rejetée? Giorgio Russolillo STA102 22
Exemple : Graphes de l interaction Giorgio Russolillo STA102 23
Exemple : Graphes de l interaction 0 A Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B B I Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B B Giorgio Russolillo STA102 24
Exemple : Graphes de l interaction AB AI Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B BI ABI Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B Giorgio Russolillo STA102 25
Exemple : Graphes de l interaction 0 0 Y 9.7 9.8 9.9 10.0 10.1 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B Giorgio Russolillo STA102 26
Décomposition de la variabilité totale Giorgio Russolillo STA102 27
Décomposition de la variabilité totale SCT = SCM + SCR ( Y ijk Y ) 2 = ( Y ij Y ) 2 n ij + Y ijk Y ij i j k i j i j k ( ) 2 SCT = SCR = ( Y ijk Y ) 2 i j k ( ) 2 SCM = Y ij Y n ij = Y ij Y i j ( Y ijk Y ) 2 i j k ij i j k ( ) 2 Giorgio Russolillo STA102 28
Décomposition de la variabilité totale Tableau d analyse de la variance (n ij = K pour tous les i et j) = n 1 Avec les résultats en cette table on ne peut pas décomposer l effet du traitement en effet respectifs des deux facteurs et de leur interaction On peut décomposer la SCM en somme des carrés due aux effets principaux et somme des carrés due à l interaction Giorgio Russolillo STA102 29
Décomposition de la somme des carrés expliqués Giorgio Russolillo STA102 30
Décomposition de la SCM Si le dispositif est orthogonal on peut décomposer la SCM de façon unique à «A» c est le 1 er facteur à «B» c est le 2 ème facteur à «I» c est l interaction SCM = SCA + SCB + SCI ( Y ij Y ) 2 n ij = i j ( Y i Y ) 2 n i + Y j Y + Y ij Y i Y j + Y i j ( ) 2 n j i j ( ) 2 n ij SCA = Somme des carrés due au facteur «a» SCB = Somme des carrés due au facteur «b» SCI = Somme des carrés due à l interaction Giorgio Russolillo STA102 31
Test de la signification du modèle Giorgio Russolillo STA102 32
Test de la signification du modèle On veux tester l hypothèse H 0 = {le traitement n a pas d effet sur le Y, i.e. les moyennes sont les mêmes pour les différents traitements } contre l hypothèse H 1 = {il existe un effet du traitement sur le Y} Dans un modèle de ANOVA à deux facteurs, ce test s écrit : H 0 = { Y ijk = µ +ε ikj } contre H 1 = { Y ijk = µ +α i + β j + γ ij +ε ijk } Cela est équivalent à : H 0 = { i :α i = 0, j : β j = 0, ( i, j) : γ ij = 0} contre H 1 = { ( i, j) :α i 0 ou β j 0 ou γ ij 0 } Giorgio Russolillo STA102 33
Lois des sommes des carrés sous H0 SCM ~ σ 2 χ H IJ 1 0 2 ( ) SCR ~ σ 2 2 χ H0 ( n IJ ) Giorgio Russolillo STA102 34
Test de la signification du modèle H 0 = { Y ijk = µ +ε ikj } contre H 1 = { Y ijk = µ +α i + β j + γ ij +ε ijk } Ce test se fait au moyen de la statistique de test de Fischer : ( ) ( ) F = SCM IJ 1 SCR n IJ Variance expliquée par les traitements Variance résiduelle La statistique de test F suit sous H 0 une loi de Fisher à IJ-1 et n- IJ degrés de liberté : F ~ F IJ 1,n IJ H 0 Ce test nous montre que l analyse de la variance à deux facteurs est équivalent à une analyse de la variance à un facteur avec IJ niveaux Giorgio Russolillo STA102 35
Test de la signification du modèle H 0 = { Y ijk = µ +ε ikj } contre H 1 = { Y ijk = µ +α i + β j + γ ij +ε ijk } Statistique de test ( ) ( ) F = SCM IJ 1 SCR n IJ Probabilité critique (p-value) Pr( F IJ-1,n-IJ > f ) observé Règle de décision On rejette l hypothèse H0 au niveau α si ( ) < α ou f observé > f IJ 1,n IJ,(1 α ) Pr F IJ-1,n-IJ > f observé Giorgio Russolillo STA102 36
Exemple : Tableau d analyse de la variance Nombre de traitements I x J = 6 : 6-1 = 5 Modèle ANOVA à 2 facteurs avec interaction (modèle «complète») n-1 = 24-1 = 23 n - IJ = 24 6 = 18 Probabilité critique < 0.05, on rejette l hypothèse H 0 : le facteur «a», le facteur «b» ou leur effet conjoint ont un effet significatif sur les y Giorgio Russolillo STA102 37
Réductions Giorgio Russolillo STA102 38
Sommes des carrés et réductions Dans un dispositif orthogonal la somme des carrés associé à chaque effet peut s exprimer en terme de réduction de la variabilité résiduelle, puisque elle mesure la diminution des résidus lorsqu on introduit l effet dans le modèle De façon générale, R(M 2 M 1 ) mesure la diminution de la SCR lorsque on passe du modèle plus simple (emboîté) au modèle plus complexe (avec plus de paramètres) Exemple : Modèle 1 à Y ijk = µ +α i +ε ijk Modèle 2 à Y ijk = µ +α i + β j +ε ijk à R(β μ,α) = SCR 1 -SCR 2 Modèles emboîtés : deux modèles sont dits emboîtés si l un peut être considéré comme un cas particulier de l autre. Cela revient à comparer un modèle de référence à un modèle réduit ou contraint Giorgio Russolillo STA102 39
Sommes des carrés et réductions On peut récrire les sommes des carrés dues aux facteurs ainsi que la somme des carrés due à l interaction en termes de réduction de la SCR en utilisant comme modèle de référence le modèle 0 : Y ijk = µ +ε ijk Somme des carrés de type I (Type I SS) : SCA = R( α µ ) SCB = R( β µ,α ) SCI = R( γ µ,α,β ) modèle 0 à Y ijk = µ +ε ijk modèle A à Y ijk = µ +α i +ε ijk modèle A à Y ijk = µ +α i +ε ijk modèle AB à Y ijk = µ +α i + β j +ε ijk Y ijk = µ +α i + β j +ε ijk modèle AB à Yijk = µ +α i + β j + γ ij +ε ijk modèle C à Modèle «complet» Giorgio Russolillo STA102 40
Sommes des carrés et réductions Type I SS : SCA = R( α µ ) modèle 0 à Y ijk = µ +ε ijk modèle A à Y ijk = µ +α i +ε ijk SCR M 0 = SCT SCA = R( α µ ) = SCT SCR M A Giorgio Russolillo STA102 41
Sommes des carrés et réductions Type I SS : SCB = R( β µ,α ) modèle A à Y ijk = µ +α i +ε ijk modèle AB à Y ijk = µ +α i + β j +ε ijk SCB = R( β µ,α ) = SCR M A SCR M AB Dans un dispositif équilibré : SCB = R( β µ,α ) = R( β µ ) Les séquences AB et BA donnent les mêmes sommes des carrés Giorgio Russolillo STA102 42
Sommes des carrés et réductions Type I SS : SCI = R( γ µ,α,β ) Y ijk = µ +α i + β j +ε ijk modèle AB à modèle C à Y ijk = µ +α i + β j + γ ij +ε ijk SCR M C = SCR SCI = R( γ µ,α,β ) = SCR M AB SCR Giorgio Russolillo STA102 44
Tests des effets des facteurs Giorgio Russolillo STA102 45
Loi des sommes des carrés des effets Cas d un dispositif orthogonal Sous l hypothèse α 1 = = α I = 0 (Pas d effet du facteur A) SCA~σ 2 2 χ ( I 1) Sous l hypothèse β 1 = = β J = 0 (Pas d effet du facteur B) SCB~σ 2 2 χ ( J 1) Sous l hypothèse γ 11 = = γ IJ = 0 (Pas d interaction) SCI ~σ 2 2 χ I 1 ( )( J 1) Giorgio Russolillo STA102 46
Test des effets de chaque facteur On veux tester de façon spécifique l effet de chacun des facteurs (n ij = K pour toutes les i et j) : 1 er facteur 2 ème facteur Interaction En moyenne sur l ensemble des niveaux du 2 ème facteur, le valeur moyenne de Y ne varie pas entre les différents niveaux du 1 er facteur, i.e. Y 1.. =Y 2.. = =Y I.. Il n existe pas d interaction entre les deux facteurs SCA = R( α µ ) Giorgio Russolillo STA102 47
Exemple : Test des effets de chaque facteur Effet des différents facteurs dans un modèle de ANOVA à 2 facteurs avec interaction (modèle «complèt») SCI C Effet de l interaction : la p-valeur est > 0.05 donc l effet de l interaction n est pas significatif au niveau 5% et on peut accepter un modèle sans interaction. Effet du facteur «b»: la p-value est < 0.001 donc l effet du facteur «b» est nettement significatif. Effet du facteur «a»: la p-value est > 0.05 donc l effet du facteur «a» n est pas significatif au niveau 5%, mais on ne peux pas le supprimer à ce stade. Giorgio Russolillo STA102 48
Exemple : Le modèle sans interaction Résultat pour le modèle : Y ijk = µ +α i + β j +ε ijk SCM AB = SCM C SCI C = = 518.70833-59.25 SCT AB =SCT C SCR AB = SCR C + SCI C = 209.25 + 59.25 Modèle complète : Giorgio Russolillo STA102 49
Ex : Le modèle sans interaction Résultat pour le modèle sans intération : Y ijk = µ + α i + β j + ε ijk SCA AB = SCA c mais: La SCR augmente Les DL augmentent Effet du facteur «a»: la P-value est >0.05 donc l effet du facteur «a» n est pas significatif au niveau 5% Modèle complète : Giorgio Russolillo STA102 50
Ex : Analyses séparées pour les deux facteurs Pour connaitre l effet de chacun deux facteurs sur y, on peux être tenté d effectuer une analyse de la variance séparée pour chacun des deux facteurs Effet facteur «a» : Modèle A à Y ijk = µ +α i +ε ijk Effet facteur «b» : Y ijk = µ + β j + ε ijk Modèle B à avec avec 2 { ε ijk } i.i.d. N ( 0,σ A ) 2 { ε ijk } i.i.d. N ( 0,σ B ) Cette hypothèse n a évidemment de sens que si dans chacun des ces deux modèle le facteur pas considéré à n a pas d effet, autrement les j*k répétitions du premier modèle et les les i*k répétitions du second modèle ne sont pas vraiment des répétitions! Giorgio Russolillo STA102 51
Ex : Le modèle A Résultat pour le modèle ANOVA à un facteur («a») : Y ijk = µ +α i +ε ijk SCM A = SCA AB, mais : - La SCR augmente - Les DL augmentent Probabilité critique >> 0.05, on ne rejette pas l hypothèse H 0 : le facteur «a» n as pas d effet significatif sur les y Modèle AB : Giorgio Russolillo STA102 52
Ex: Le modèle B Résultat pour le modèle ANOVA à un facteur («b») : Y ijk = µ + β j +ε ijk SCM B = SCB mais : - La SCR augmente - Les DL augmentent Modèle AB : Probabilité critique < 0.05, on rejette l hypothèse H 0 : le facteur «b» a un effet significatif sur y Giorgio Russolillo STA102 53
Comparaison des moyennes On peut vouloir tester l hypothèse H 0 = {deux moyennes sont les mêmes} contre l hypothèse H 1 = {les deux moyennes sont différentes} Ce test ce peut faire : à Au niveau facteur, on veut tester si deux moyennes sont les mêmes pour deux niveaux différents du même facteur, i.e. Y 1..=Y 2.. à Au niveau traitement, on veut tester si deux moyennes sont les mêmes pour deux traitements différents, i.e. Y ij.= Y i j. Dans tous les cas il faut considérer qu on fait des comparaisons multiples! Giorgio Russolillo STA102 54
Ex: Comparaison des moyennes pour le 1 er facteur Modèle A : Y ijk = µ +α i +ε ijk Rappel: Les d.d.l. sont égales à n-2 (où 2 est le nombre de paramètres à estimer: µ et α 1 ) La difference entre les deux niveaux du facteur «a» n est pas significative, ce qui est cohérent avec l absence d effet principal du facteur Giorgio Russolillo STA102 55
Ex : Comparaison des moyennes pour le 2 ème facteur Modèle B : Y ijk = µ + β j +ε ijk Rappel: Les d.d.l. sont égales à n-3 (où 3 est le nombre de paramètres à estimer: μ, β 1 et β 2 ) t critique : t ddl, α/2 où ddl=21, α/2 = (α * /2)/l = 0.025/3 et α * = 0.05 Le facteur «b» a un effet significative car toutes les différences entre les moyennes des trois niveaux sont significatives. Giorgio Russolillo STA102 56
Ex : Comparaison des traitements (Modèle complet) t critique : t ddl,α/2 =3.380362 où ddl = 18, α/2 = (α * /2)/l = 0.025/15 et α * =0.05 t obs Dans ce cas on rejet H 0 car t obs > t ddl,α/2, c.à.d. p * <α * p * = P(t 18 >5.910625) x 30 Giorgio Russolillo STA102 57
Ex : Comparaison des traitements (Modèle complet) Giorgio Russolillo STA102 58
Estimation des paramètres du modèle Giorgio Russolillo STA102 59
Estimation des paramètres du modèle Y ijk = µ + α i + β j + γ ij + ε ijk E( Y ) ijk = µ ij = µ + α i + β j + γ ij { ε ijk } i.i.d. N ( 0,σ 2 ) à Ce modèle n est pas identifiable donc on a besoin d introduire des contraintes sur les paramètres 1 + I + J + I*J paramètres à estimer I*J colonnes indépendants dans la matrice X à On doit introduire 1+I+J contraintes indépendantes sur les paramètres : (a) Contraintes naturelles (b) Contraintes de SAS Giorgio Russolillo STA102 60
Les différentes contraintes (a) Contraintes naturelles à Avec cette contrainte on impose à la somme des paramètres associes à chaque effet d être nul, i.e. : I α i = 0 i=1 1 contrainte 1 contrainte D où les estimateurs : J J β j = 0 i : γ ij j =1 j =1 = 0 j : γ ij = 0 I i=1 I+J-1 contraintes ˆ µ = Y ˆ α i = Y i Y ˆ β j = Y j Y ˆ γ ij = Y ij Y i Y j + Y Tous ces estimateurs s interprètent comme des écarts entre moyennes Giorgio Russolillo STA102 61
Les différentes contraintes (b) Contraintes de SAS à Avec cette contrainte tous les paramètres associes au dernier niveau de chaque facteur s annulent : α I = 0 β J = 0 i : γ ij = 0 j : γ Ij = 0 1 contrainte 1 contrainte I+J-1 contraintes D où les estimateurs : ˆ µ = Y IJ ˆ α i = Y ij Y IJ ˆ β j = Y Ij Y IJ ˆ γ ij = Y ij Y ij Y Ij + Y IJ Le traitement (I,J) joue le rôle de référence Giorgio Russolillo STA102 62
Prédiction La forme des estimateurs dépend des contraintes qu on applique à ATTENTION à L INTERPRETATION DES ESTIMATIONS DES PARAMETRES Toutefois la prédiction ne dépend pas des contraintes, elles est dans tous les cas : E ( Y ) ijk = Y ˆ ijk = ˆ µ + α ˆ i + ˆ β j + ˆ γ ij = Y ij Moyenne du traitement (i,j) à On a donc que I*J valeurs prédites possibles, une pour chaque traitement Giorgio Russolillo STA102 63
Ex: Estimation des paramètres Y IJ. C est la différence entre les moyennes des traitements a2b1 et a2b3 Giorgio Russolillo STA102 64
Estimateur de la variance des erreurs 2 S n IJ = SCR n IJ = i j k n IJ ( Y ijk Y ) 2 ij Nombre de paramètres à estimer une fois posé les contraintes Valeur prédite ˆ Y ijk = Y ij Giorgio Russolillo STA102 65
Test sur les paramètres Giorgio Russolillo STA102 66
Tests sur les paramètres On veut tester l hypothèse H 0 = {le paramètre est égal à 0} contre l hypothèse H 1 = {le paramètre est diffèrent de 0} On a IJ tests sur les paramètres : i I H 0 : { α i = 0} contre H 1 : { α i 0} j J H 0 : β j = 0 { } contre H 1 : { β j 0} ( ) H 0 : { γ ij = 0} contre H 1 : { γ ij 0} ( i, j) ( I,J) ( I, j) i,j Chacun de ces tests se effectue à travers un test de STUDENT Giorgio Russolillo STA102 67
Tests sur les paramètres Il faut interpréter le test associé à chacun des paramètres en fonction des contraintes choisies par SAS Dans le cas de la contrainte (b) les estimateurs étaient : ˆ µ = Y IJ ˆ α i = Y ij Y IJ ˆ β j = Y Ij Y IJ ˆ γ ij = Y ij Y ij Y Ij + Y IJ Le test H 0 = {β j =0} contre l hypothèse H 1 = {β j 0} s interprète comme : Est-ce que la moyenne obtenue pour le niveau j du 2 ème facteur est la même de celle obtenue pour le niveau J du 2 ème facteur lorsque le niveau I du 1 er facteur est fixé?, i.e. Y Ij.=Y IJ?. Giorgio Russolillo STA102 68
Ex :Test sur les paramètres (Modèle Complet) Rappel: Les d.d.l. de t sont égales à n-6 (le nombre de paramètres à estimer) La différence entre les moyennes des traitements a2b1 et a2b3 est significative N.B.: Les p-valeurs ne sont pas corrigées On retrouve les mêmes valeurs dans la table des comparaisons des traitements Giorgio Russolillo STA102 69
This presentation is made available through a Creative Commons Attribution- Noncommercial license. Details of the license and permitted uses are available at http://creativecommons.org/licenses/by-nc/3.0/ 2016 G. Russolillo Analyse de la variance à deux facteurs : Dispositif équilibré Title: Analyse de la variance à deux facteurs : Dispositif équilibré UE STA102 Attribution:. G. Russolillo, CNAM L. Trinchera, NEOMA Business School Giorgio Russolillo - STA102 70