Données - notations Analyse de variance F. Husson husson@agrocampus-ouest.fr avec interaction Lait Cacao Amer Acide Sucre Produit Juge Séance S1 J1 P6 3 5,5 7,5 S1 J1 P 1,, 6 7,6 5,5 S1 J1 P 1,8 3,6 5, S1 J1 P5 1,5 3,5 7,1 7,5 7,3 S1 J1 P1 1 5,5 9,3 8,6 8,1 S1 J1 P3 9 1 0 0,5 3,7 S1 J P5 3,9, 5,6,8 Questions Y a-t-il des différences d amertume entre chocolats? Les juges utilisent-ils l échelle de note de la même façon? L amertume des chocolats estelle évaluée de la même façon d une séance à l autre? Les juges évaluent-ils les chocolats de la même façon? 1 S1 J P6,,9 5,3 5,8 Données - exemple Données - notations Exemple : produits ; 3 juges; répétitions Produit 1 Produit Juge 1 Juge Juge 3 Moy 1 1 3 1 6 6 Moy 3 3 Prod Juge Note P1 J1 1 P1 J1 3 P1 J3 P1 J3 P J3 6 Y variable quantitative F1, F, variables qualitatives à I, J, modalités n ij répétitions pour le couple (i,j) 3
Questions Y a-t-il un effet «produit» sur la note? Y a-t-il un effet «juge» sur la note? Y a-t-il une interaction entre les deux facteurs? Tests Décision dans l incertain : notion de test 5 Définition de l interaction même écart Les effets produit et juge s additionnent Produit Produit 1 Juge 1 Juge Juge 3 Juge 1 Juge Juge 3 Produit 1 Produit Les effets produit et juge ne s additionnent pas : interaction entre ces facteurs Interaction : l effet d un facteur sur Y diffère selon les modalités de l autre Interaction positive : synergie Interaction négative : antagonisme 6 Écriture du modèle sous forme indicée Définition du modèle à facteurs effet moyen effet principal du niveau i du facteur 1 effet principal du niveau j du facteur effet de l interaction des facteurs 1 et pour les niveaux i et j résiduelle Écriture matricielle du modèle : 7 8
Contraintes 1 + I + J + IJ paramètres mais IJ paramètres indépendants modèle sur-paramétré besoin de contraintes Contraintes : Exemple : 9 10 Estimation des paramètres du modèle Par la méthode des moindres carrés Minimiser : Estimation des paramètres du modèle Cas particulier du plan équilibré (plan complet équirépété) : X X non inversible : sur-paramétrisation (besoin de contraintes) X X inversible : l estimateur de est : Propriétés : 11 1
Estimation des paramètres du modèle Prédiction et résidus Valeurs prédites : Résidus : Estimateur de la variabilité résiduelle Décomposition de la variabilité Cas complet et équirépété : les SC s additionnent I-1 n-1 J-1 (I-1)(J-1) ddl R. Propriété : 13 1 Objectifs : Test global d un effet simplification du modèle hiérarchisation des sources de variabilité Test du facteur A : Hypothèses : Statistique de test : Test global d un effet ces sommes de carré sont des variables indépendantes Rappel : alors et Y et Z indép 0.0 0. 0. 0.6 Idée : construire un test de comparaison de variance 15 rejet de 0 6 f Rejet 16
Test global d un effet Test de conformité d un coefficient Test de l interaction AB : Hypothèses : Statistique de test : Hypothèses : On sait que : d où : avec 0.3 rejet de 0.0 0. 0. 0.6 Statistique de test : Décision : si rejet de Intervalle de confiance : 0.0 0.1 0. -6 - - 0 6 Rejet Rejet 0 6 f Rejet 17 18 Prod Juge Note P1 J1 1 P1 J1 3 P1 J3 P1 J3 P J1 P J1 P J P J 6 P J3 P J3 6 Exemple library(factominer) AovSum(Note~ Produit+Juge+Produit:Juge,data=donnees) $Ftest Sum Sq Df CM F value Pr(>F) Prod 1.0000 1 1.0000 9 0.001 * Juge 8.0000.0000 3 0.1500 Prod:Juge 8.0000.0000 3 0.1500 Residuals 8.0000 6 1.3333 --- $Ttest Estimate Std.Error t value Pr(> t ) (Intercept) 3.0e+00 0.333 9.000e+00 0.000 Prod - P1-1.0e+00 0.333-3.000e+00 0.0 Prod - P 1.0e+00 0.333 3.000e+00 0.0 Juge - J1-1.0e+00 0.71 -.11e+00 0.078 Juge - J -1.3e-16 0.71 -.809e-16 1.000 Juge - J3 1.0e+00 0.71.11e+00 0.078 Prod-P1 : Juge-J1 1.0e+00 0.71.11e+00 0.078 Prod-P : Juge-J1-1.0e+00 0.71 -.11e+00 0.078 Prod-P1 : Juge-J -1.0e+00 0.71 -.11e+00 0.078 Prod-P : Juge-J 1.0e+00 0.71.11e+00 0.078 Prod-P1 : Juge-J3 -.e-16 0.71 -.710e-16 1.000 Prod-P : Juge-J3.e-16 0.71.710e-16 1.000 19 Extension de l analyse de variance Généralisation immédiate à un nombre quelconque de facteurs les données sont déséquilibrées : les SC ne s additionnent plus dépendent du modèle 0
Modèle linéaire Contextes d application Aucun contrôle expérimental des sources de variabilité Exemple : qualité en agro-alimentaire, microbiologie, En général : sources de variabilité quantitatives Modèle de régression Contrôle expérimental des sources de variabilité Exemple : amélioration des plantes, En général : sources de variabilité qualitatives Modèle d analyse de la variance Sources de variabilité de natures différentes Modèle d analyse de covariance (ou régression factorielle) 5-5 0 Homoscédasticité des résidus? Analyse des résidus y Frequency 30 0 0 10 0 Normalité des résidus? Tous ces modèles sont des modèles linéaires 1 1 3-0 6 Tests Shapiro-Wilks, Kolmogorov, Comparaison multiple l hypothèse H 0 du test global est rejetée, comparaison des moyennes à : Procédure LSD (Least gnificant Difference) ou PPDS (Plus Petite Différence gnificative) les moyennes i et i sont considérées différentes Problème : I(I-1)/ comparaisons, soit paires mal jugées Idée : Bonferroni, dak : modifier le risque Utiliser des lois de probabilités (Tuckey, Gabriel,) 3