ANOVA avec un facteur aléatoire

Chapitre 7 ANOVA avec u facteur aléatoire Jusqu à maiteat, o a supposé que les modalités du facteur étudié ot été choisies parce qu elles étaiet itrisèquemet itéressates. Le modèle à effets fixes porte sur des traitemets bie défiis que l ANOVA permet de comparer etre eux. Cosidéros l exemple suivat: Exemple 7. O s itéresse au iveau de mathématiques des étudiats des cégeps de la régio de Québec. O pred alors u échatillo de 20 fiissats de chaque cégep de la régio de Québec. O leur admiistre ue épreuve commue et o compare les résultats. C est ue expériece avec effets fixes. Les modalités du facteur étudié sot les cégeps de la régio de Québec. Ce facteur est fixe. Supposos maiteat qu o veuille répodre à la questio suivate: Est ce que le iveau de mathématiques est variable d u cégep à l autre das la provice de Québec. Si tel est le cas, o demade de mesurer cette variabilité. O sélectioe das u premier temps u échatillo parmi les cégeps de la provice; esuite o procède comme avat et o tire au hasard 20 étudiats de chaque cégep (il s agit d u échatilloage à deux degrés). O s itéresse autat aux cégeps échatilloés qu à ceux que e l ot pas été car o veut étudier la variabilité iter-cégeps des compéteces e mathématiques. Das ce cotexte le facteur cégep est aléatoire.

7. ANOVA à u facteur aléatoire Das ue ANOVA à u facteur fixe, o a supposé le modèle Y ij µ i + e ij (7.) pour i,, I et j,, i. Das ce modèle, {µ,, µ I } sot des costates alors e ij N(0, ). O peut aussi écrire (7.) sous la forme: où {µ, τ, τ 2,, τ I } sot des costates vérifiat I τ i 0. Y ij µ + τ i + e ij (7.2) Das le cas d u effet aléatoire, les modalités des facteurs sot elles-mêmes aléatoires. Le modèle s écrit alors sous la même forme que (7.2) où µ est ue costate, τ i N(0, τ) pour i,, I, e ij N(0, ) pour i,, I, j,, i et τ i et e ij idépedates. Avec ce modèle, Y ij N(µ, στ 2 + ). O dit alors que στ 2 et sot les composates de la variace. Ue partie de la variabilité de Y est expliquée par la variabilité etre les traitemets ( τ), l autre par la variabilité résiduelle ( ). Das l ANOVA à u facteur fixe, o cosidère l hypothèse H 0 : µ µ 2 µ I. Cette derière a plus de ses das le cotexte d ue ANOVA à u facteur aléatoire puisque les modalités sot elles-mêmes aléatoires. O veut tester si le facteur ifluece la variabilité de Y. L hypothèse ulle s écrit H 0 : σ τ 0. L hypothèse alterative postule que le facteur a ue effet sur la variabilité de Y. Elle s écrit H : σ τ > 0. Das l exemple précédet, l hypothèse alterative spécifie la présece d ue variabilité iter-cégeps des compéteces mathématiques, sas préciser exactemet la ature des différeces etre les cégeps. Bie que les deux scéarios soiet très différets l u de l autre, o utilise la même règle de décisio das les deux cas, c est à dire: O rejette H 0 si MSB MSE > F I,N I,α Supposos pour l istat que le pla est balacé. Soit la taille commue des échatillos. Das ce cadre, les moyees des échatillos Ȳi. s écrivet: Ȳ i. Y ij j µ + τ i + ē i. 2

où ē i. { j e ij }/ N(0, /). O a alors Ȳ i. N(0, στ 2 + σ2 ) i,,. Les variables Ȳi. état idépedates et idetiquemet distribuées, o a alors (I )MSB + τ χ 2 I. (7.3) Das ce cadre, le SSB s écrit SSB i (Ȳi. Ȳ..) 2 (Ȳi. Ȳ..) 2 ({τ i τ. } + {ē i. ē.. }) 2 (7.4) où τ. I τ i /I et ē.. I ē i. /I. D autre part, pour i,, I, o a : ( )S 2 i (Y ij Ȳi.) 2 j (e ij ē i. ) 2 j Doc ( )S 2 i χ 2 idépedammet les ues des autres, et par coséquet (N I)MSE ( )S 2 i χ 2 N I (7.5) D après 7.4, MSB e déped que de {τ, τ 2,, τ I } et {ē., ē 2.,, ē I. }. D après 7.5, MSE e déped que de {S 2, S 2 2,, S 2 I }. Parmi les hypothèses de ce modéle, figure l idépedace des e ij et τ i, l idépedace des esembles {τ, τ 2,, τ I } et {S 2, S 2 2,, S 2 I } s e suit. D autre 3

part, o sait, d après le chapitre, que les esembles {ē., ē 2.,, ē I. } et {S 2, S 2 2,, S 2 I } sot idépedats. O coclut alors que les statistiques M SB et M SE sot idépedates. L idépedace de MSB et MSE et les relatios 7.3 et 7.5 doet alors: F + τ MSB MSE F I,N I (7.6) Sous H 0, cette derière équatio deviet MSB/MSE F I,N I. D où la régio de rejet aocée plus haut. 7.2 Estimatio des variaces et τ D après 7.5, l estimatio de est idetique au cas d u facteur fixe. Aisi, u itervalle de cofiace pour au iveau α est doé par: [ (N I)MSE, χ 2 N I,α/2 (N I)MSE ] χ 2 N I, α/2 D après 7.3, o a : E[MSB] + τ. D après 7.5, o a E[MSE]. Doc o a: E[ MSB MSE ] τ. La statistique (MSB MSE)/ est u estimateur sas biais de τ. Cepedat, il arrive qu o ait MSB < MSE, et doc u estimateur égatif pour la variace, ce qui est pas souhaitable. O préfère doc l estimateur: MSB MSE ˆσ τ 2 si MSB MSE 0 si MSB < MSE. Noter que c est la méthode des momets qui a été utilisée pour estimer τ. C est à partir des espéraces de MSE et de MSB que l estimateur a été costruit. O peut motrer que cet estimateur est aussi u estimateur du maximum de vraisemblace (la vraisemblace du modèle avec effets aléatoires est compliquée à écrire car deux observatios proveat du même échatillo sot correlées puisque qu ellet partaget le même τ i ). L estimateur ˆ τ est ue combiaiso liéaire de deux khi-deux. Sa loi est complexe et ous empèche d avoir 4

des itervalles de cofiaces exacts pour τ. Cepedat, o peut cotruire des itervalles de cofiaces exacts pour τ/( τ + ) ou approximatifs pour τ. E effet, d après 7.3, o a α P {F I,N I, α/2 P { (MSB MSE P {g( (MSB MSE MSB MSE F I,N I,α/2} + στ 2 ) σ2 τ F I,N I,α/2 σ 2 (MSB MSE )) g( σ2 τ F I,N I,α/2 σ ) g( 2 (MSB MSE F I,N I, α/2 )} (7.7) F I,N I, α/2 ))} où g( ) est ue foctio croissate défiie par g(t) t/(t + ). O obtiet alors l itervalle de cofiace suivat pour τ/( τ + ) : MSB F I,N I,α/2 MSE [ MSB + ( )F I,N I,α/2 MSE, MSB F I,N I, α/2 MSE MSB + ( )F I,N I, α/2 MSE ] Le rapport τ/( τ+ ) doe la proportio de la variabilité totale expliquée par l hétérogééité etre les modalités du facteur aléatoire. Lorsque N I est grad, l estimatio de par MSE deviet plus précise et o peut alors écrire MSE. L équatio 7.7 s écrit alors α P { (MSB MSE P { ( MSB F I,N I,α/2 ) σ2 τ MSE (MSB MSE MSB F I,N I, α/2 )} MSE) στ 2 F I,N I,α/2 ( MSE)} F I,N I, α/2 O e déduit u itervalle de cofiace approximatif au iveau α pour τ. 5

7.3 Puissace de l ANOVA à u facteur aléatoire O rappelle que P uissace P (rejetter H 0 H est vrai) Das le cas d u test F de l aova avec u facteur aléatoire, de seuil α, cette puissace s écrit comme suit: où τ/. P ( ) P ( MSB MSW > F MSB I,N I,α + στ 2 MSW F I,N I) P (F I,N I > F + στ 2 I,N I,α ) P (F I,N I > + F I,N I,α) Voici, e R, le programme qui calcule cette puissace puissace.aova.radom<-fuctio(,i,delta,alpha) { N<-*I ff<-qf(palpha,dfi-,df2n-i,cp0,lower.tailf)/(delta+) ## ou ff<-qf(p-alpha,dfi-,df2n-i,cp0,lower.tailt)/(delta+) result<-pf(qff,dfi-,df2n-i,lower.tailf) ## ou result<-(-pd(qff,dfi-,df2n-i,lower.tailt)) retur(result) } Pour α 0.05, I 5 et 20, o obtiet le graphe suivat: 7.4 Le cas o balacé Si les tailles d échatillos sot iégales le résultat (7.3) e tiet plus. Sous H 0 : στ 2 0, MSB est toujours proportioelle à ue variable alétoire ayat ue distributio χ 2 I et le test F d homogéité peut-être utilisé pour tester H 0. 6

Puissace d ue ANOVA avec effet aleatoire, I5, 20, alpha0.05 puissace 0.2 0.4 0.6 0.8.0 0.0 0.5.0.5 2.0 alterative Pour estimer τ, o peut utiliser la méthode des momets. Pour calculer l espérace de SSB o ote que { } E(SSB) E i (Ȳi Ȳ ) 2 { } E i (Ȳi µ) 2 ( i )(Ȳ µ) 2 ( ) I i στ 2 + σ2 2 i στ 2 i i { (I ) + στ 2 (I ) (i ) 2 /(I ) }, où est la taille d échatillo moyee. Aisi l estimateur des momets de τ est [ ˆσ τ 2 MSB ˆ ] [ max ( i ) 2 /{ I(I )}, 0 MSB ˆ ] max ( CV 2 { i }/I), 0. Cet estimateur est pas u estimateur du maximum de vraisemblace. Das SAS, o peut estimer τ das ue aalyse de variace à u facteur aléatoire de deux faços différetes: par la méthode des momets avec l optio radom de la procédure glm ou par la méthode du maximum de vraisemblace avec la procédure mixed. La théorie sous jacete a cette derière procédure est vue das les cours de plaificatio d expérieces et de régressio gradué. 7