ANALYSE DE VARIANCE ET COMPARAISON DE MOYENNES Fichier Statistica : EXEMPLE FORMATION 1.sta Ce fichier contient des informations (fictives) concernant un échantillon de 98 étudiants inscrits au module de statistique de Licence 2 de Psychologie. Soit les variables suivantes : CSE = la classe socio-économique des étudiants (favorisée vs défavorisée) PEDA = la pédagogie employée lors des cours intégrés. Deux pédagogies différentes ont été employées : 1 = un enseignement avec suivi du travail individuel (et des auto-évaluations) avant chaque séance 2 = un enseignement traditionnel avec correction collective des exercices. DESC = note (de 0 à 20) obtenue par les étudiants pour la partie «statistiques descriptives» INFE = note (de 0 à 20) obtenue par les étudiants pour la partie «statistiques inférentielle» On commence toujours par faire des statistiques descriptives (moyennes, variances, etc.) avant de se lancer dans des analyses inférentielles. 1
Statistiques descriptives 2
MÉTHODOLOGIE SOUS STATISTICA POUR RÉALISER UNE ANOVA : Plan S < A p > = ANOVA à un facteur ; comparaison de p échantillons (groupes) indépendants Après avoir validé ce choix, sélectionner les variables étudiées : Codes facteurs : permet de choisir les groupes que l on souhaite comparer (par défaut Statistica compare tous les groupes). Puis dans «Options», choisir le type d ANOVA que l on souhaite effectuer : En psychologie, on effectue généralement une ANOVA de Type III (pour plans expérimentaux). Par défaut, Statistica réalise une ANOVA de ce type. Cliquer sur «OK». 3
Cliquer sur «Autres résultats». Dans l onglet «Synthèse», cliquer sur «Stats descriptives par cellule». On obtient en sortie la table suivante : 4
Dans l onglet «Synthèse», cliquer sur «Tous les effets/graphiques» pour obtenir un graphique représentant les résultats. Dans l onglet «Synthèse», pour obtenir les résultats de l ANOVA, cliquer sur «Tester tous les effets» : On obtient alors le tableau récapitulatif de l ANOVA : ATTENTION : Il faut vérifier les conditions d applications de l ANOVA. 5
CONDITIONS D APPLICATION DE L ANOVA dans un plan S < A p > INDÉPENDANCE DES OBSERVATIONS Dans l onglet «Graphiques», cliquer sur «Nuages de points». On obtient le graphique suivant : 6
NORMALITÉ -> 2 méthodes : Module «Statistiques Élémentaires» : Dans le module «Statistiques Élémentaires», sélectionner «Statistiques descriptives». Dans l onglet «Normalité», sélectionner le test de normalité de Kolmogorov-Smirnov & Lilliefors et le test de Shapiro-Wilk. Il faut faire ces tests pour chacune des modalités de la variable indépendante (dans notre exemple la variable indépendante PEDA a deux modalités). Pour «filtrer» les données, passer par «select cases» (avec une version récente de Statistica, utiliser de préférence l option «par groupes»). Cliquer ensuite sur «Histogrammes». Test de normalité sur la variable : ce que vous avez appris Pour chaque échantillon, on obtient les histogrammes suivants (avec les tests de normalité) : PEDA = SUIVI PEDA = TRADI 7
Dans l onglet «Nuages de points», sélectionner la Droite de Henry (attention : la demander pour chaque groupe). PEDA = SUIVI PEDA = TRADI Remarque : Les Droite de Henry peuvent aussi s obtenir par le module «Graphiques», puis «Graphiques en 2D», «Tracés de Normalité». 8
Test de normalité sur les résidus : ce qu il faut faire Dans le module «ANOVA à un facteur», dans l onglet «Résidus», enregistrer les résidus. On obtient alors une nouvelle base de données avec les résidus dans la dernière colonne. On copie et colle la colonne qui correspond aux résidus (ici «DESCRES») dans la base de données initiale. 9
Puis dans le module «Statistiques Élémentaires», sélectionner «Statistiques descriptives». Pour chaque échantillon, on obtient les histogrammes suivants (avec les tests de normalité) : PEDA = SUIVI PEDA = TRADI Remarque : On obtient les mêmes tests de normalité pour la variable et les résidus. Dans l onglet «Nuages de points», sélectionner la Droite de Henry (attention : la demander pour chaque groupe). PEDA = SUIVI PEDA = TRADI Remarque : On obtient les mêmes Droites de Henry pour la variable et les résidus. 10
Dans le module «Statistiques Élémentaires», il est également possible d obtenir la normalité en passant par «Tables de fréquence» On obtient alors : Pour obtenir la Droite de Henry (penser à demander des graphiques pour chaque groupe) : PEDA = SUIVI PEDA = TRADI Remarque : Si on avait choisi les résidus de la variable on aurait obtenu les mêmes résultats aux tests de normalité et pour les Droites de Henry. 11
Module ANOVA à un facteur : Dans ce module, il est possible de vérifier les conditions de normalité mais seulement avec les droites de Henry pour chacun des échantillons (choisir «distribution des variables par groupe») : PEDA = SUIVI PEDA = TRADI HOMOSCEDASTICITÉ Module ANOVA à un facteur : Dans le module ANOVA à un facteur, dans l onglet «Hypothèses», on peut sélectionner les tests pour vérifier l homoscédasticité (= l homogénéité des variances). Cliquer sur test de Levene et aussi sur C de Cochran, Hartley, Bartlett. Voici les tableaux que l on obtient en sortie : 12
REMARQUES GÉNÉRALES pour le plan S < A p > Remarque 1 : Dans cet exemple, on compare deux moyennes pour deux échantillons indépendants. On peut obtenir le même résultat avec un t-test pour échantillons indépendants car t 2 = F. Dans «Options», sélectionner les tests de Levene et Brown & Forsythe pour vérifier l homoscédasticité des variances. Dans «Avancé», cliquer sur «Synthèse : Tests t». 13
Voici le tableau que l on obtient : Par comparaison, on obtenait le tableau de l ANOVA suivant : Ici 2.69 2 = 7.26 ATTENTION : Les conditions de normalité et d homoscédasticité des variances doivent être vérifiées lorsque l on effectue un test de Student pour échantillons indépendants. L homoscédasticité peut être obtenue dans le module «t-test pour échantillons indépendants». Pour la normalité, utiliser le module «Statistiques Élémentaires» (puis «Tables de fréquence» ou «Statistiques descriptives») comme on l a vu précédemment. Remarque 2 : Dans cet exemple, on compare deux moyennes pour deux échantillons indépendants mais la procédure est identique avec plus de deux échantillons indépendants. Reprenons l exemple, imaginons que les chercheurs ont introduit, non pas deux mais trois types de pédagogie lors des cours intégrés (variable PEDA) : 1 = un enseignement avec suivi du travail individuel (et des auto-évaluations) avant chaque séance 2 = un enseignement traditionnel avec correction collective des exercices. 3 = un enseignement avec un contrôle continu à chaque séance. Voici le tableau récapitulatif de l ANOVA : 14
Attention cependant à l interprétation des résultats avec plus de deux échantillons indépendants. Les résultats d une ANOVA renseignent sur l existence ou non d une différence significative entre les groupes, mais dès lors qu un effet implique une comparaison entre plus de deux groupes, on ne peut pas savoir où se situent les différences significatives entre les groupes. Il faut utiliser d autres outils pour tester des hypothèses plus fines : on peut effectuer des comparaisons de moyennes (contrastes ou analyses post-hoc). Il faut utiliser le module de l ANOVA pour réaliser des contrastes ou des post-hoc. Contraste a priori : Cliquer sur «Comparaisons planifiées» 2.69 2 = 7.26 Rentrer les coefficients pour chaque contraste. Cliquer sur «Calculer». Trois tableaux en sortie : - Un tableau récapitulatif avec les contrastes demandés et les coefficients. 15
- Un tableau avec la significativité pour chacun des contrastes effectués. - Un tableau qui correspond au tableau de l ANOVA celui présenté précédemment (= test univarié). Contraste a posteriori : Cliquer sur «Post-hoc» Cliquer sur «Bonferroni» pour avoir le tableau suivant : Cliquer sur «LSD de Fisher» pour avoir le tableau suivant : 16
Cliquer sur «HSD de Tukey» pour avoir le tableau suivant : Cliquer sur «Newman-Keuls» pour avoir le tableau suivant : Cliquer sur «Scheffé» pour avoir le tableau suivant : Cliquer sur «Duncan» pour avoir le tableau suivant : Cliquer sur «Dunnett» pour avoir le tableau suivant : 17
Remarque 3 : Si les conditions de normalité ou d égalité des variances ne sont pas toutes vérifiées, on peut réaliser un test non paramétrique. Mann Whitney = pour comparer deux échantillons indépendants = alternative au test de Student Remarque : on aurait pu choisir le test de Kolmogorov-Smirnov (moins puissant que Mann-Whitney). Vérifier l asymétrie et l aplatissement : 18
Kruskall-Wallis = pour comparer plus de deux échantillons indépendants = alternative à l ANOVA Remarque : on aurait pu choisir le test de la médiane (moins puissant que le test de Kruskall-Wallis). ATTENTION : Les tests non paramétriques ne permettent pas de réaliser des tests de type «contrastes». 19
Plan S <A p * B q > ANOVA à deux facteurs indépendants et interaction Rappel : L ANOVA à plusieurs facteurs permet d étudier les éventuels effets principaux de chaque facteur ainsi que les effets d interaction entre ces facteurs. L effet principal correspond à l effet de l un des facteurs sur la variable dépendante. L effet d interaction est l effet conjoint des facteurs manipulés sur la VD. Cliquer sur «OK» puis sur «Autres résultats». 20
Dans l onglet «Hypothèses», on peut sélectionner les tests pour vérifier l homoscédasticité. Cliquer sur test de Levene et aussi sur C de Cochran, Hartley, Bartlett. Voici les tableaux que l on obtient en sortie : 21
Vérifier la normalité avec les Droites de Henry. Penser à passer par le module «Statistiques élémentaires» pour avoir les tests de normalité. Demander de préférence les résidus Dans l onglet «Synthèse», pour obtenir les résultats de l ANOVA, cliquer sur «Tester tous les effets» : Dans l onglet «Synthèse», pour obtenir une table des statistiques descriptives, cliquer sur «Statistiques descriptives par cellule» : 22
Dans l onglet «Synthèse», cliquer sur «Tous les effets/graphiques» permet d obtenir un graphique représentant les résultats. Remarque : Les résultats d une ANOVA nous renseignent sur l existence ou non d une différence significative entre les groupes, mais dès lors qu un effet implique une comparaison entre plus de deux groupes, on ne peut pas savoir où se situent les différences significatives entre les groupes. Il faut utiliser d autres outils pour tester des hypothèses plus fines : on peut effectuer des comparaisons de moyennes (contrastes ou analyses post-hoc) ou on peut tester les effets simples (possible si les variables ont deux modalités mais pas plus). Contraste a priori Dans l onglet «Comparaisons planifiées», cliquer sur «Spécifier les contrastes des moyennes». Choisir «Ensemble de vecteurs». 23
Choisir les coefficients (ici on utilise les contrastes de Helmert pour quatre groupes, soit trois contrastes). Résultats pour le premier contraste : 24
Résultats pour le second contraste : Résultats pour le troisième contraste : 25
Contraste a posteriori : Cliquer sur «Post-hoc» Cliquer sur «Bonferroni» pour avoir le tableau suivant : Cliquer sur «LSD de Fisher» pour avoir le tableau suivant : Cliquer sur «HSD de Tukey» pour avoir le tableau suivant : 26
Cliquer sur «Newman-Keuls» pour avoir le tableau suivant : Cliquer sur «Scheffé» pour avoir le tableau suivant : Cliquer sur «Duncan» pour avoir le tableau suivant : Cliquer sur «Dunnett» pour avoir le tableau suivant : 27
Plan S * B q ANOVA à mesures répétées Dans un plan à mesures répétées, on cherche à vérifier des hypothèses sur les différences de moyennes obtenues par un seul groupe de n participants. Ce groupe est soumis à q traitements expérimentaux. Spécifier le nom du facteur répété et le nombre de modalités : Cliquer sur «OK». 28
Cliquer sur «Autres résultats». Sélectionner le «Test de sphéricité» pour vérifier l homoscédasticité. L homogénéité de la matrice des variances-covariances est mis à l épreuve par le test de Mauchly. Remarque : La condition de sphéricité n est pas pertinente pour le facteur «Test» qui ne possède que deux modalités. Cliquer sur «Tester tous les effets» pour obtenir le tableau récapitulatif de l ANOVA. Demander également les statistiques descriptives ou un graphique. 29
REMARQUES GÉNÉRALES pour le plan S * B q Remarque 1 : Dans cet exemple, on compare deux moyennes pour mesures appariées/répétées. On peut obtenir le même résultat avec un t-test pour mesures appariées car t 2 = F. Par comparaison, on obtenait le tableau de l ANOVA suivant : t 2 = 3,23 2 = 10,46 = F 30
Remarque 2 : On peut obtenir le même résultat avec un t-test avec un score de différence (DIFF = DESC INFE) que l on compare à une moyenne standard (ici 0). Par comparaison, on obtenait le tableau du t-test pour mesures répétées suivant : Remarque 3 : Si les conditions de normalité ou d égalité des variances ne sont pas toutes vérifiées, on peut réaliser un test non paramétrique. Wilcoxon = pour comparer deux mesures appariées/répétées = alternative au test de Student. 31
Remarque : on aurait pu choisir le test des signes (moins puissant que le test de Wilcoxon). Vérifier l asymétrie et l aplatissement : Friedman = pour comparer plus de deux mesures appariées/répétées = alternative à l ANOVA Reprenons l exemple, imaginons que les étudiants passent en fait trois tests : DESC = note (de 0 à 20) obtenue par les étudiants pour la partie «statistiques descriptives» INFE = note (de 0 à 20) obtenue par les étudiants pour la partie «statistiques inférentielles» ALGEBRE = note (de 0 à 20) obtenue par les étudiants pour la partie «algèbre linéaire» Remarque 4 : Avec plus de deux mesures appariées, on aurait pu utiliser le module de l ANOVA pour réaliser des contrastes ou des post-hoc. 32
Plan S < A p > * B q ANOVA avec un facteur d'emboitement et un facteur de répétitions = c'est un plan dit «mixte» 33
Cliquer sur «Autres résultats». Dans l onglet «Synthèse», cliquer sur «test de sphéricité» pour obtenir le tableau suivant : Remarques : - l'hypothèse de sphéricité n'est exigible que dans l'approche univariée de l'anova et la statistique de Mauchley n'apparaît pas si on ne précise pas que l on se situe dans cette approche. - la condition de sphéricité n'est pas pertinente pour le facteur «Test» qui ne possède que deux modalités. Dans l onglet «Hypothèses», cliquer sur test de Box pour obtenir le tableau suivant : 34
Dans l onglet «Hypothèses», choisir les Droites de Henry. Il est préférable de vérifier la normalité sur les résidus Dans l onglet «Synthèse», cliquer sur «Test de tous les effets» pour obtenir le tableau suivant : Dans l onglet «Synthèse», cliquer sur «Statistiques descriptives par cellule» permet d obtenir un graphique représentant les résultats. 35
Dans l onglet «Synthèse», cliquer sur «Tous les effets/graphiques» permet d obtenir un graphique représentant les résultats. Remarque : Dans le menu Statistiques, le module ANOVA ne permet pas de traiter un plan possédant plusieurs facteurs en mesures répétées. Sélectionner «Modèles Linéaires/Non Linéaires Avancés» puis «Modèle Linéaire Général». Si l on a qu un seul facteur répété, on obtient avec ce module exactement les mêmes résultats qu avec le module de l ANOVA. 36
Indiquer pour chaque facteur répété le nombre de modalités. Si vous avez plusieurs facteurs, on spécifie en premier le facteur avec le plus grand nombre de modalités. Cliquer sur «Autres résultats». 37
Dans l onglet «Synthèse», cliquer sur test de Box pour obtenir le tableau suivant : Dans l onglet «Hypothèses», choisir les Droites de Henry. Il est préférable de vérifier la normalité sur les résidus 38
Dans l onglet «Hypothèses», cliquer sur «Test M de Box». On obtient le tableau suivant : Dans l onglet «Synthèse», cliquer sur «Tester tous les effets» pour obtenir le tableau suivant : Remarque : Avec les plans à mesures répétées il est également possible de tester des contrastes ou post-hoc. 39