Analyse de la variance à un facteur A. Jebrane Université de Bourgogne, Master 1 psychologie 28 septembre 2016
Variable indépendante : VI( ou facteur)
Variable indépendante : VI( ou facteur) C est une variable dont les valeurs sont manipulables par l expérimentateur.
Variable indépendante : VI( ou facteur) C est une variable dont les valeurs sont manipulables par l expérimentateur. Elles peuvent être soit catégorielles avec un nombre fini de modalités permettant quelquefois de répartir les sujets en groupes indépendants, par exemple, la classe socio-professionnelle du sujet,
Variable indépendante : VI( ou facteur) C est une variable dont les valeurs sont manipulables par l expérimentateur. Elles peuvent être soit catégorielles avec un nombre fini de modalités permettant quelquefois de répartir les sujets en groupes indépendants, par exemple, la classe socio-professionnelle du sujet, ou alors elles sont quantitatives, par exemple, la durée d un traitement, l âge, etc...
Variable indépendante : VI( ou facteur) C est une variable dont les valeurs sont manipulables par l expérimentateur. Elles peuvent être soit catégorielles avec un nombre fini de modalités permettant quelquefois de répartir les sujets en groupes indépendants, par exemple, la classe socio-professionnelle du sujet, ou alors elles sont quantitatives, par exemple, la durée d un traitement, l âge, etc... Ces variables ont vocation à avoir une influence sur les réponses des sujets lors d une procédure expérimentale.
Variable indépendante : VI( ou facteur) C est une variable dont les valeurs sont manipulables par l expérimentateur. Elles peuvent être soit catégorielles avec un nombre fini de modalités permettant quelquefois de répartir les sujets en groupes indépendants, par exemple, la classe socio-professionnelle du sujet, ou alors elles sont quantitatives, par exemple, la durée d un traitement, l âge, etc... Ces variables ont vocation à avoir une influence sur les réponses des sujets lors d une procédure expérimentale.
Variable dépendante VD (réponse)
Variable dépendante VD (réponse) C est la variable réponse du sujet lors d une procédure expérimentale. Les valeurs ne sont pas manipulables par l expérimentateur.
Variable dépendante VD (réponse) C est la variable réponse du sujet lors d une procédure expérimentale. Les valeurs ne sont pas manipulables par l expérimentateur. Elles peuvent être qualitatives ou quantitative. par exemple, les temps de réaction d un sujet sous l effet d un stimuli ou alors l issue d une épreuve : succès ou échec.
Variable dépendante VD (réponse) C est la variable réponse du sujet lors d une procédure expérimentale. Les valeurs ne sont pas manipulables par l expérimentateur. Elles peuvent être qualitatives ou quantitative. par exemple, les temps de réaction d un sujet sous l effet d un stimuli ou alors l issue d une épreuve : succès ou échec. Ces variables ont vocation à dépendre de certains facteurs ou conditions expérimentales. On parle aussi de variable à expliquer par les VI.
Variable dépendante VD (réponse) C est la variable réponse du sujet lors d une procédure expérimentale. Les valeurs ne sont pas manipulables par l expérimentateur. Elles peuvent être qualitatives ou quantitative. par exemple, les temps de réaction d un sujet sous l effet d un stimuli ou alors l issue d une épreuve : succès ou échec. Ces variables ont vocation à dépendre de certains facteurs ou conditions expérimentales. On parle aussi de variable à expliquer par les VI.
Variable inter-sujet et variable intra-sujet :
Variable inter-sujet et variable intra-sujet : Une variable indépendante catégorielle est dite inter-sujet, si ses modalités permettent de répartir les sujets en groupes indépendants, chaque sujet se trouve dans un et seul groupe. On dit aussi variable d emboîtement. En fait les sujets ne sont observés qu une seule fois chacun dans une seule condition expérimentale qui définit son groupe d appartenance.
Une variable indépendante catégorielle est dite intra-sujet (ou variable de croisement) Si chaque sujet voit successivement toutes les modalités de la variable.
Une variable indépendante catégorielle est dite intra-sujet (ou variable de croisement) Si chaque sujet voit successivement toutes les modalités de la variable. Imaginons par exemple qu on veuille évaluer l évolution de la vigilence des sujets au cours d une journée, en utilisant un outil de simulation de conduite, le matin, l après midi et le soir. La variable dépendante est par exemple le nombre d erreurs commises pendant une durée de 10mn. Chaque sujet disposera alors de trois scores de vigilence. La variable moment de contrôle admet trois modalités. On l appelle souvent Variable à mesure répétées.
Une variable indépendante catégorielle est dite intra-sujet (ou variable de croisement) Si chaque sujet voit successivement toutes les modalités de la variable. Imaginons par exemple qu on veuille évaluer l évolution de la vigilence des sujets au cours d une journée, en utilisant un outil de simulation de conduite, le matin, l après midi et le soir. La variable dépendante est par exemple le nombre d erreurs commises pendant une durée de 10mn. Chaque sujet disposera alors de trois scores de vigilence. La variable moment de contrôle admet trois modalités. On l appelle souvent Variable à mesure répétées.
Plans Emboîtés : Toutes les VI sont inter-sujets.
Plans Emboîtés : Toutes les VI sont inter-sujets. Si N sujets sont répartis en k groupes selon les modalités d une VI notée A on écrit S ( A k ). Si n 1, n 2,, n k désignent les nombres de sujets dans ces groupes on a N = n 1 + + n k.
Plans Emboîtés : Toutes les VI sont inter-sujets. Si N sujets sont répartis en k groupes selon les modalités d une VI notée A on écrit S ( A k ). Si n 1, n 2,, n k désignent les nombres de sujets dans ces groupes on a N = n 1 + + n k. Si tous les groupes comportent le même nombre n de sujets, on dira que le plan est équilibré et on notera Dans ce cas on a N = k n. S n ( Ak ).
Lors d une planification d expériences, on est amené à manipuler deux facteurs A, B ou plusieurs, A, B, C, etc, dans ce cas on écrira S ( ) A B ou S ( ) A B C, etc.
Plans croisés ou à mesures répétées :Toutes les VI sont intra-sujets.
Plans croisés ou à mesures répétées :Toutes les VI sont intra-sujets. Si n sujets sont chacun soumis à k conditions expérimentales structurées selon les modalités d une VI notée A on écrit S n A k.
Plans croisés ou à mesures répétées :Toutes les VI sont intra-sujets. Si n sujets sont chacun soumis à k conditions expérimentales structurées selon les modalités d une VI notée A on écrit S n A k. Lors d une planification d expérience, on est amené à manipuler plusieurs facteurs à mesures répétées, A, B, C, etc, dans ce cas on écrira S n A B ou S n A B C, etc.
Plans mixtes
Plans mixtes Si N sujets sont répartis en k groupes selons les modalités d une VI notée A et si chaque sujet est observé t fois selon les modalité d une VI à mesures répétées T on écrit S ( A k ) T t.
Plans mixtes Si N sujets sont répartis en k groupes selons les modalités d une VI notée A et si chaque sujet est observé t fois selon les modalité d une VI à mesures répétées T on écrit S ( A k ) T t. On peut généraliser en considérant une ou plusieurs variables d emboîtement ( inter-sujets) et une ou plusieurs variables de croisement (intra-sujets).
Plans mixtes Si N sujets sont répartis en k groupes selons les modalités d une VI notée A et si chaque sujet est observé t fois selon les modalité d une VI à mesures répétées T on écrit S ( A k ) T t. On peut généraliser en considérant une ou plusieurs variables d emboîtement ( inter-sujets) et une ou plusieurs variables de croisement (intra-sujets). Par exemple ( ) S 10 A3 B 4 T 3 F 2.
exemple
exemple Nous avons recruté 5 groupes de goûteurs d une variété de yaourts, répartis selon l âge, des plus âgés aux plus jeunes. Chaque goûteur doit attribuer une note globale qui tient compte de plusieurs critères : sucre, onctuosité, goût,... On a obtenu les résultats suivants :
groupes G 1 G 2 G 3 G 4 G 5 9 9 13 10 12 8 6 8 19 11 6 6 6 14 9 8 6 14 5 23 10 11 13 10 12 4 6 13 11 10 6 3 10 14 19 5 8 15 11 7 11 11
groupes G 1 G 2 G 3 G 4 G 5 9 9 13 10 12 8 6 8 19 11 6 6 6 14 9 8 6 14 5 23 10 11 13 10 12 4 6 13 11 10 6 3 10 14 19 5 8 15 11 7 11 11 Les jugements attribués sont-ils dépendants de l âge?
C est une généralisation du test t de Student pour comparer les moyennes de k populations pour une variable X représentant l évaluation attribué par un individu choisi au hasard.. Son application nécessite la validation de deux conditions :
C est une généralisation du test t de Student pour comparer les moyennes de k populations pour une variable X représentant l évaluation attribué par un individu choisi au hasard.. Son application nécessite la validation de deux conditions : La variable X suit une loi normale sur chacune des k populations.
C est une généralisation du test t de Student pour comparer les moyennes de k populations pour une variable X représentant l évaluation attribué par un individu choisi au hasard.. Son application nécessite la validation de deux conditions : La variable X suit une loi normale sur chacune des k populations. Les variances de X sur ces k populations doivent être égales.
C est une généralisation du test t de Student pour comparer les moyennes de k populations pour une variable X représentant l évaluation attribué par un individu choisi au hasard.. Son application nécessite la validation de deux conditions : La variable X suit une loi normale sur chacune des k populations. Les variances de X sur ces k populations doivent être égales. On commence d abord par valider ces deux conditions par des tests adéquats. Nous reviendrons sur les tests de validations des deux conditions plus tard.
C est une généralisation du test t de Student pour comparer les moyennes de k populations pour une variable X représentant l évaluation attribué par un individu choisi au hasard.. Son application nécessite la validation de deux conditions : La variable X suit une loi normale sur chacune des k populations. Les variances de X sur ces k populations doivent être égales. On commence d abord par valider ces deux conditions par des tests adéquats. Nous reviendrons sur les tests de validations des deux conditions plus tard. Certains utilisateurs de l ANOVA omettent souvent la vérification des conditions et s abritent derrière la notion de robustesse.
Hypothèses On désigne par µ 1, µ 2,, µ k les moyennes théoriques associées aux différentes modalités de la variable indépendante. H 0 : µ 1 = = µ k
Hypothèses On désigne par µ 1, µ 2,, µ k les moyennes théoriques associées aux différentes modalités de la variable indépendante. H 0 : µ 1 = = µ k H 1 : Il existe i et j tels que µ i µ j
Hypothèses On désigne par µ 1, µ 2,, µ k les moyennes théoriques associées aux différentes modalités de la variable indépendante. H 0 : µ 1 = = µ k H 1 : Il existe i et j tels que µ i µ j On dispose de k échantillons prélevés dans ces populations de tailles respectives n 1,, n k. On note n = n 1 + + n k.
Notations x i j désigne la jème observation de ième groupe.
Notations x i j désigne la jème observation de ième groupe. T i le score total du ième groupe et C i la somme des carrés des scores de ce même groupe.
Notations x i j désigne la jème observation de ième groupe. T i le score total du ième groupe et C i la somme des carrés des scores de ce même groupe. T et C représentent le score total de tous les groupes ainsi que la somme des carrés.
Notations x i j désigne la jème observation de ième groupe. T i le score total du ième groupe et C i la somme des carrés des scores de ce même groupe. T et C représentent le score total de tous les groupes ainsi que la somme des carrés. n i T i = xj i, j=1
Notations x i j désigne la jème observation de ième groupe. T i le score total du ième groupe et C i la somme des carrés des scores de ce même groupe. T et C représentent le score total de tous les groupes ainsi que la somme des carrés. n i T i = xj i ( ), C i = x i 2, j j=1 n i j=1
Notations x i j désigne la jème observation de ième groupe. T i le score total du ième groupe et C i la somme des carrés des scores de ce même groupe. T et C représentent le score total de tous les groupes ainsi que la somme des carrés. n i T i = xj i ( ), C i = x i 2, j T = T1 + +T k, C = C 1 + +C k. j=1 n i j=1
Notations m 1, m 2,, m k les moyennes observées des k groupes. m i = T i n i, i = 1, 2,, k.
Notations m 1, m 2,, m k les moyennes observées des k groupes. m i = T i n i, i = 1, 2,, k. s 1 2,, s k 2, les variances et ŝ 1 2,, ŝ k 2, les variances estimées ( corrigées).
Notations m 1, m 2,, m k les moyennes observées des k groupes. m i = T i n i, i = 1, 2,, k. s 1 2,, s k 2, les variances et ŝ 1 2,, ŝ k 2, les variances estimées ( corrigées). s 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i n i
Notations m 1, m 2,, m k les moyennes observées des k groupes. m i = T i n i, i = 1, 2,, k. s 1 2,, s k 2, les variances et ŝ 1 2,, ŝ k 2, les variances estimées ( corrigées). s 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i n i T 2 i n i = C i. n i
Notations m 1, m 2,, m k les moyennes observées des k groupes. m i = T i n i, i = 1, 2,, k. s 1 2,, s k 2, les variances et ŝ 1 2,, ŝ k 2, les variances estimées ( corrigées). s 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i n i T 2 i n i = C i. n i ŝ 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i 1 n i
Notations m 1, m 2,, m k les moyennes observées des k groupes. m i = T i n i, i = 1, 2,, k. s 1 2,, s k 2, les variances et ŝ 1 2,, ŝ k 2, les variances estimées ( corrigées). s 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i n i T 2 i n i = C i. n i ŝ 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i 1 n i = C i T 2 i n i n i 1
Notations m 1, m 2,, m k les moyennes observées des k groupes. m i = T i n i, i = 1, 2,, k. s 1 2,, s k 2, les variances et ŝ 1 2,, ŝ k 2, les variances estimées ( corrigées). s 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i n i T 2 i n i = C i. n i ŝ 2 i = ni j=1 ( ) 2 ni ( ) x i 2 j=1 xi j j n i 1 n i = C i T 2 i n i n i 1 = n i s 2 i n i 1.
Notations m la moyenne de l échantillon global et S 2 intra l estimation intra-groupe la variance commune des k populations : m = T n = n 1m 1 + + n k m k. n
Notations m la moyenne de l échantillon global et S 2 intra l estimation intra-groupe la variance commune des k populations : m = T n = n 1m 1 + + n k m k. n S 2 intra =
Notations m la moyenne de l échantillon global et S 2 intra l estimation intra-groupe la variance commune des k populations : m = T n = n 1m 1 + + n k m k. n S 2 intra = n 1s 1 2 + + n k s k 2 n k
Notations m la moyenne de l échantillon global et S 2 intra l estimation intra-groupe la variance commune des k populations : m = T n = n 1m 1 + + n k m k. n S 2 intra = n 1s 1 2 + + n k s k 2 n k = (n 1 1)ŝ 2 1 + + (n k 1)ŝ 2 k n k
Statistiques descriptives de l exemple G 1 G 2 G 3 G 4 G 5 Tous les groupes n i 9 8 7 10 8 42 T i 63 55 77 120 107 422 C i 471 419 903 1566 1601 4960 m i 7 6, 875 11 12 13, 375 10, 047619 si 2 3, 3333 5, 1094 8 12, 6 21, 2344 ŝi 2 3, 75 5, 8393 9, 3333 14 24, 2679 Sintra 2 = 11, 4257
graphique des moyennes 18 Courbe des moyennes en fonction de l'âge 16 14 12 Evaluation 10 8 6 4 2 G1 G2 G3 G4 G5 groupe selon l'âge
Théorème de l analyse de la variance La variation totale est donnée par : SC T = k n i ( ) 2 Xj i X i=1 j=1
Théorème de l analyse de la variance La variation totale est donnée par : SC T = k n i i=1 j=1 ( ) 2 Xj i T 2 X = C n
Théorème de l analyse de la variance La variation totale est donnée par : SC T = k n i i=1 j=1 ( ) 2 Xj i T 2 X = C n Le degré de liberté de SC T est n 1.
Théorème de l analyse de la variance La variation totale est donnée par : SC T = k n i i=1 j=1 ( ) 2 Xj i T 2 X = C n Le degré de liberté de SC T est n 1. La variation factorielle (inter-groupes) est donnée par : k SC F = n i (X i X ) 2 i=1
Théorème de l analyse de la variance La variation totale est donnée par : SC T = k n i i=1 j=1 ( ) 2 Xj i T 2 X = C n Le degré de liberté de SC T est n 1. La variation factorielle (inter-groupes) est donnée par : SC F = k n i (X i X ) 2 = i=1 k i=1 Ti 2 T 2 n i n
Théorème de l analyse de la variance La variation totale est donnée par : SC T = k n i i=1 j=1 ( ) 2 Xj i T 2 X = C n Le degré de liberté de SC T est n 1. La variation factorielle (inter-groupes) est donnée par : SC F = k n i (X i X ) 2 = i=1 k Ti 2 T 2 k n i n = n i (m i ) 2 n(m 2 ). i=1 i=1
Théorème de l analyse de la variance La variation totale est donnée par : SC T = k n i i=1 j=1 ( ) 2 Xj i T 2 X = C n Le degré de liberté de SC T est n 1. La variation factorielle (inter-groupes) est donnée par : SC F = k n i (X i X ) 2 = i=1 k Ti 2 T 2 k n i n = n i (m i ) 2 n(m 2 ). i=1 i=1 Le degré de liberté de SC F est k 1.
Théorème de l analyse de la variance La variation résiduelle (intra-groupes) est donnée par : k n i SC R = (X ij X i ) 2. i=1 j=1
Théorème de l analyse de la variance La variation résiduelle (intra-groupes) est donnée par : k n i SC R = (X ij X i ) 2. i=1 j=1 Le degré de liberté de SC R est n k.
Théorème de l analyse de la variance La variation résiduelle (intra-groupes) est donnée par : k n i SC R = (X ij X i ) 2. i=1 j=1 Le degré de liberté de SC R est n k. On a l égalité suivante : SC T = SC F + SC R.
Théorème de l analyse de la variance La variation résiduelle (intra-groupes) est donnée par : k n i SC R = (X ij X i ) 2. i=1 j=1 Le degré de liberté de SC R est n k. On a l égalité suivante : SC T = SC F + SC R.
Statistique du test Avec l hypothèse de normalité et d égalité des variances, on démontre que, sous H 0, le rapport F (k 1, n k) = S 2 inter S 2 intra suit une loi de Fisher-Snedecor à (k 1, n k) ddl. C est la statistique du test Anova.
Statistique du test Avec l hypothèse de normalité et d égalité des variances, on démontre que, sous H 0, le rapport F (k 1, n k) = S 2 inter S 2 intra suit une loi de Fisher-Snedecor à (k 1, n k) ddl. C est la statistique du test Anova. Sous H 0, Sintra 2 et S inter 2 sont proches donc F est proche de 1.
Statistique du test Avec l hypothèse de normalité et d égalité des variances, on démontre que, sous H 0, le rapport F (k 1, n k) = S 2 inter S 2 intra suit une loi de Fisher-Snedecor à (k 1, n k) ddl. C est la statistique du test Anova. Sous H 0, Sintra 2 et S inter 2 sont proches donc F est proche de 1. Sous H 1, sinter 2 (variance des moyennes) est grand donc F est grand.
Tableau de synthèse de l ANOVA source ddl SC CM F p Inter-groupes 5 1 = 4 297.155 74.2887 6, 5 0, 0004 intra-groupes 42 5 = 37 422.75 11.4257 total 42 1 = 41 719.905 17.559 On dit que le facteur groupe a un effet significatif de p-value p=0,0004.
Tableau de synthèse de l ANOVA source ddl SC CM F p Inter-groupes 5 1 = 4 297.155 74.2887 6, 5 0, 0004 intra-groupes 42 5 = 37 422.75 11.4257 total 42 1 = 41 719.905 17.559 On dit que le facteur groupe a un effet significatif de p-value p=0,0004. Intensité de l effet du facteur : c est le pourcentage de variation totale expliqué par le facteur : R 2 = SC F SC T = 297.155 719.905 = 0.413.