Chapitre 4 MANOVA Analyse de la variance multivariée
Objectif Un ensemble de facteurs de variation qualitatifs : les VI Expliquer Un ensemble de variables réponse quantitatives : les VD Tester les effets de VI sur l ensemble des VD Généralisation de l ANOVA à plusieurs VD
Les Données Les données résultent de l observation d un ensemble de variables numériques sur un échantillon aléatoire de sujets dans les différentes conditions d observation définies par les combinaison des modalités des différents facteurs
Plan d échantillonnage Données expérimentales : - Les facteurs sont des VI provoquées - Randomisation des sujets Données quasi-expérimentales : + des VI invoquées à valeurs fixées Données de simples observations : les facteurs varient librement!
Formules de plan Plan inter : mesures indépendantes les sujets sont répartis dans les groupes définis par le croisement des modalités des facteurs Plan intra : mesures répétées les sujets sont observés dans toutes les conditions définies par le croisement des facteurs Plan mixte : combine les deux types de facteurs rangé dans la rubrique mesures répétées
Exemple VD1 10 8 6 4 2 0-2 -4-6 -8-10 VD2 10 0-10 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
Exemple suite Récapitulatif des observations groupe 1,00 2,00 Total N Variance Moyenne N Variance Moyenne N Variance Moyenne VD1 VD2 20 20 16,842 16,842,0000,0000 20 20 16,842 16,842 1,5000-1,5000 40 40 16,987 16,987,7500 -,7500 groupe 1,00 2,00 Corrélations VD1 VD2 VD1 1,651 VD2,651 1 VD1 1,669 VD2,669 1
Exemple suite Tests des effets inter-sujets (ANOVA univariée) Source groupe Erreur Total corrigé Variable dépendante VD1 VD2 VD1 VD2 VD1 VD2 Somme des Moyenne des carrés ddl carrés F Signification 22,500 1 22,500 1,336,255 22,500 1 22,500 1,336,255 640,000 38 16,842 640,000 38 16,842 662,500 39 662,500 39
Modèle de MANOVA Soit le plan S <F k > A chaque modalité g de F (g =1,, k), on associe le vecteur des p variables réponses (Y 1 g, Y 2 g,, Y p g ) de moyenne (µ 1 g, µ 2 g,, µ p g ) et de matrice de variance covariance Σ NB : Σ ne dépend pas de g
Modèle de MANOVA Σ = (σ 1 ) 2 r 12 σ 1 σ 2 (σ 2 ) 2 M M O r 1p σ 1 σ p r 2 p σ 2 σ 2 L (σ p ) 2
Décomposition de la variance empirique Variance Totale var(y j ) SCT j Variance inter + Variance résiduelle SCF j SCR j
Décomposition de la covariance Covariance Totale cov(y j, Y j ) SPCT jj Covariance inter + Covariance résiduelle SPCF jj SPCR jj
Décomposition de la matrice de variance covariance V T = V inter +V R Matrice des sommes des carrés et des produits croisés Inter groupe Résidu VD1 VD2 VD1 VD2 VD1 VD2 22,500-22,500-22,500 22,500 640,000 422,507 422,507 640,000
Table de MANOVA Source ddl SSPC facteur k-1 V inter résidu N-k V R total N-1 V T
Inférence en MANOVA Modèle statistique : Homogénéité des matrices de variance covariance Indépendance des observations entre sujets Normalité du vecteur des variables réponse
Test d existence d un effet du facteur H 0 : le facteur n a pas d effet (µ g 1,K,µ g p ) = (µ 1,K,µ p ) pour tout g = 1,K,k On rejette H 0 si les variances et covariances inter sont suffisamment grandes par rapport aux variances et covariances résiduelles
Comment comparer des matrices? 4 statistiques sont usuellement proposées : La trace de Pillai :P Le lambda de Wilks : W La trace d Hotelling : H La plus grande racine de Roy : R
Propriétés des statistiques 0 P, P quand l effet 0 W 1, W quand l effet 0 H, H quand l effet P<H et P H le facteur a peu d effet 0 R, R quand l effet et R<H R H le facteur a peu d effet ou les VD sont très liées ou l effet ne concerne qu une VD
Tests multivariés Pour chacune des quatre statistiques, il existe une transformation qui suit sous H 0 une loi de Fisher lorsque les hypothèses du modèles sont vérifiées. La statistique de Pillai est celle qui est la plus robuste aux violations des hypothèses du modèle.
Effet groupe Trace de Pillai Lambda de Wilks Trace de Hotelling Plus grande racine de Roy Tests multivariés ddl de Valeur F l'hypothèse Erreur ddl Signification,171 3,828 2,000 37,000,031,829 3,828 2,000 37,000,031,207 3,828 2,000 37,000,031,207 3,828 2,000 37,000,031