Analyse de la variance à deux facteurs : dispositif équilibré

Documents pareils
STATISTIQUES. UE Modélisation pour la biologie

Exemples d application

Analyse de la variance Comparaison de plusieurs moyennes

FORMULAIRE DE STATISTIQUES

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Introduction à l approche bootstrap

Cours 9 : Plans à plusieurs facteurs

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Le Modèle Linéaire par l exemple :

VI. Tests non paramétriques sur un échantillon

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Exercice : la frontière des portefeuilles optimaux sans actif certain

Chapitre 5 : Flot maximal dans un graphe

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

PROBABILITES ET STATISTIQUE I&II

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Probabilités III Introduction à l évaluation d options

Évaluation de la régression bornée

Principe d un test statistique

Cours de méthodes de scoring

Probabilités sur un univers fini

Application sur le Dispositif en Blocs Complètement Randomisés

Architecture des Systèmes d Information Architecture des Systèmes d Information

Chapitre 3. Les distributions à deux variables

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

1 Complément sur la projection du nuage des individus

Relation entre deux variables : estimation de la corrélation linéaire

L Econométrie des Données de Panel

données en connaissance et en actions?

Cours d analyse numérique SMI-S4

Résolution de systèmes linéaires par des méthodes directes

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Solvabilité II Les impacts sur la tarification et l offre produit

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

INF6304 Interfaces Intelligentes

Modèles pour données répétées

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Analyse en Composantes Principales

1 Définition de la non stationnarité

TSTI 2D CH X : Exemples de lois à densité 1

Le risque Idiosyncrasique

Probabilités sur un univers fini

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Représentation d un entier en base b

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

Programmation linéaire et Optimisation. Didier Smets

Cours d initiation à la programmation en C++ Johann Cuenin

La classification automatique de données quantitatives

Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

OSGOODE HALL LAW SCHOOL Université York MÉMOIRE PRIVILÉGIÉ ET CONFIDENTIEL

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Exemple PLS avec SAS

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

3. Conditionnement P (B)

Package TestsFaciles

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Comment consolider des données

La place de SAS dans l'informatique décisionnelle

Méthode : On raisonnera tjs graphiquement avec 2 biens.

Biostatistiques : Petits effectifs

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

Cours Informatique Master STEP

Intégrales doubles et triples - M

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

NOTICE SUR LA SIGNATURE DES CONVENTIONS DE MASTERES SPECIALISES. Management de la Qualité Management de la Maintenance Management des Contrats Globaux

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Salon des Entrepreneurs Paris ème Édition. Entreprise individuelle ou société? Gérant minoritaire ou majoritaire? Quel statut choisir?

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Jean-Philippe Préaux

LES GENERATEURS DE NOMBRES ALEATOIRES

Hedging delta et gamma neutre d un option digitale

Cours de Tests paramétriques

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

afférent au projet de décret relatif aux obligations indexées sur le niveau général des prix

Cours 02 : Problème général de la programmation linéaire

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Arbres binaires de décision

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

IFT3245. Simulation et modèles

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Introduction à la Statistique Inférentielle

23. Interprétation clinique des mesures de l effet traitement

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Créer le schéma relationnel d une base de données ACCESS

CALCUL DES PROBABILITES

Transcription:

Analyse des données - Méthodes explicatives (STA102) Analyse de la variance à deux facteurs : dispositif équilibré Giorgio Russolillo Departement IMATH CNAM giorgio.russolillo@cnam.fr

Introduction Giorgio Russolillo STA102 2

Le problème On dispose d un échantillon de n individus sur lesquels on a observé 2 variables qualitatives (facteurs, x 1 et x 2 ) et une variable quantitative y. On veut étudier si les 2 facteurs ont un effet sur la variabilité de y facteurs var. quantitative Où : 2 ème facteur à J niveaux 1 er facteur à I niveaux Giorgio Russolillo STA102 3

Les notations i c est un des possibles niveaux du 1 er facteur, avec i = 1 I (n x 2) j c est un des possibles niveaux du 2 ème facteur, avec j = 1 J Chaque combinaison (i,j) définit un traitement et définit un «groupe»; en total on a I x J traitements n ij = nombre de répétions pour le traitement (i,j) dans chaque traitement k est l indice de répétition, k = 1 n ij Giorgio Russolillo STA102 4

Tableau des fréquences Niveaux du 2ème facteur 1 j J Tot. Niveaux di 1er facteur 1 n 11 n 1j n 1J n 1. i n i1 n ij n ij n i.... I n I1 n Ij n IJ n I. Tot. n. 1 n. j n. J n n i = J j=1 n ij i, j : n ij K Chaque traitement à été reçu pour le même nombre de répétitions K (constant) n j = i=1 n ij Giorgio Russolillo STA102 I Dispositif équilibré : Les effets des deux facteurs seront complètement distinguables, i.e. c est un dispositif orthogonal nombre total d observations J n = n j = n i = n ij j=1 i, j : n ij = n i n j n I i=1 i, j 5

Les notations Y ijk = valeur de la variable Y pour l individu k qui a reçu le traitement (i,j) Moyenne de la variable Y pour le traitement (i,j) Y j = 1 n j I n ij Y ijk i=1 k=1 Moyenne de la variable Y pour le niveau j du 2 ème facteur (n x 1) n ij k=1 Y ij = 1 n ij Y ijk Y = 1 n J j =1 Moyenne de la variable Y pour le niveau i du 1 er facteur I i=1 n ij k=1 Y ijk Y i = 1 n i Moyenne générale de la variable Y J n ij Y ijk j=1 k=1 Giorgio Russolillo STA102 6

Tableau des moyennes Niveaux du 2éme facteur 1 j J Tot. Niveaux du 1er facteur 1 Y 11 Y 1j Y 1J Y 1 i Y i1 Y ij Y ij Y i... I Y I1 Y Ij Y IJ Y I Tot. Y 1 Y j Y J Y Moyenne générale de Y pour le niveau i du 1 er facteur Moyenne générale de Y pour le niveau j du 2 ème facteur Moyenne générale de Y Moyenne de Y pour le traitement (i,j) Giorgio Russolillo STA102 7

Le modèle d analyse de la variance à deux facteur Giorgio Russolillo STA102 8

Le modèle d analyse de la variance à deux facteurs (1) Y ijk = µ ij + ε ijk { ε ijk } i.i.d. N ( 0,σ 2 ) à C est une généralisation du modèle de l analyse de la variance à 1 facteur où on fait apparaitre l effet du aux traitements Dans ce modèle on a : - Une espérance μ ij spécifique à chaque traitement - Une variance intra-traitement commune à tous les traitements Ce modèle ne fait pas apparaître explicitement les effets des différents facteurs Giorgio Russolillo STA102 9

Le modèle d analyse de la variance à deux facteurs (2) 1 + I + J + I*J paramètres à estimer facteurs var. quantitative Terme constant Effet principal du 1 er facteur Effet principal du 2 ème facteur Variable aléatoire Y ijk = µ +α i + β j + γ ij +ε ijk Terme d interaction, i.e. effet spécifique du traitement Terme résiduel aléatoire ( ) { ε ijk } i.i.d. N 0,σ 2 Giorgio Russolillo STA102 10

Le modèle d analyse de la variance à deux facteurs Y ijk = µ +α i + β j + γ ij +ε ijk µ ij { ε ijk } i.i.d. N ( 0,σ 2 ) Les valeurs de Y sont influencée par les deux effets principaux α i et β j des facteurs et par la présence du terme d interaction γ ij Giorgio Russolillo STA102 11

Ecriture matricielle du modèle Y = XΘ n I +1 +εn 1 [ n 1] [ ( )( J +1) ] [( I +1) ( J +1) 1] [ ] (Exemple avec I=2 et J=3) Partie relative à l effet principale du 2 ème Partie relative à facteur l interaction ε = n 1 ε 111! ε 11K ε 121! ε 12K ε 131! ε 13K ε 211! ε 21K ε 221! ε 22K ε 231! ε 23K Giorgio Russolillo STA102 12

Exemple : Les données On dispose d un échantillon de n = 24 effectifs Pour chaque observation, on a la variable quantitative y le facteur «a» (2 niveaux) le le facteur «b» (3 niveaux) 1 2 1 2 3 Giorgio Russolillo STA102 13

Exemple : Les données 2 ème facteur àfact_b, avec J= 3 niveaux 1 er facteur à fact_a, avec I=2 niveaux i = indice du niveau du factor «a», i = 1, 2 j = indice du niveau du factor «b», j = 1, 2, 3 3 x 2 = 6 Traitements k = indice de répétition dans chaque traitement, k = 1 n ij Giorgio Russolillo STA102 14

Exemple : Tableau des fréquences Facteur b 1 2 3 Tot. Facteur a 1 4 4 4 12 2 4 4 4 12 Tot. 8 8 8 24 n i = 3 j=1 n 1 j n j = 2 i=1 n i1 nombre total d observations 3 n = n j = n i = n ij j=1 2 i=1 6 i, j i, j : n ij 4 Dispositif équilibré, donc orthogonal : Les effets des deux facteurs seront complètement distinguables! Giorgio Russolillo STA102 15

Exemple : Tableau des données Y ijk = k ème obs pour le i ème niveau de a et le j ème niveau de b (n x 1) y 111 = 1 y 114 = 6 y 234 = 17 Giorgio Russolillo STA102 16

Exemple : Tableau des moyennes Tableau des moyennes de y conditionnées aux différents traitements 2ème facteur 1 2 3 Tot. 1er facteur 1 2 Y 11 = 3.5 Y 21 = 8.5 Y 12 = 9.75 Y 22 = 12.5 Y 13 = 17.75 Y 23 =15.25 Y 1 =10.333 Y 2 = 12.083 Moyenne de y pour le niveau 1 du factor «a» Tot. Y 1 = 6 Y 2 = 11.125 Y 3 = 16.5 Y = 11.208 Moyenne de y pour le niveau 2 du facteur «b» Moyenne générale de y Giorgio Russolillo STA102 17

Exemple : Statistiques élémentaires Moyennes et écarts types des y par traitement Trait 1 Trait 2 Trait 3 Trait 4 Trait 5 Trait 6 Moyenne pour le traitement 3, i.e. la moyenne des y pour les effectives qui appartient au group 1 du facteur «a» et au group 3 du facteur «b» Les 6 traitements n 12 = 4 à La variabilité est la même dans les différents groups, mais on observe des différences des moyennes assez fortes Giorgio Russolillo STA102 18

Distributions de Y pour chaque traitement Giorgio Russolillo STA102 19

L interaction Giorgio Russolillo STA102 20

Graphe de l interaction Y ijk = µ +α i + β j + γ ij +ε ijk Avec interaction µ ij = µ + α i + β j + γ ij j µ 1 j µ 2 j = = ( µ + α 1 + β j + γ 1 j ) ( µ + α 2 + β j + γ 2 j ) = = α 1 α 2 + γ 1 j γ 2 j à l écart entre 2 modalités du 1 er facteur dépende de l interaction avec le 2ème facteur Sans interaction µ ij = µ + α i + β j j µ 1 j µ 2 j = = ( µ + α 1 + β j ) ( µ + α 2 + β j ) = = α 1 α 2 à l écart entre 2 modalités du 1 er facteur est le même quel que soit le 2ème facteur, donc il est CONSTANT Giorgio Russolillo STA102 21

Graphe de l interaction Ce graphe permet de voir s il faut prévoir un terme d interaction dans le modèle (mais attention il ne serve pas à dire si il est significatif!!) Avec interaction j j' : µ 1 j µ 2 j µ 1 j' µ 2 j' Sans interaction j j' µ 1 j µ 2 j = µ 1 j' µ 2 j' moyennes 16 18 20 22 24 26 28 A B C niveaux du facteur 2 Est-ce qu il y a interaction? Est-ce que l hypothèse de parallélité est rejetée? Giorgio Russolillo STA102 22

Exemple : Graphes de l interaction Giorgio Russolillo STA102 23

Exemple : Graphes de l interaction 0 A Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B B I Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B B Giorgio Russolillo STA102 24

Exemple : Graphes de l interaction AB AI Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B BI ABI Y 0 5 10 15 20 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B Giorgio Russolillo STA102 25

Exemple : Graphes de l interaction 0 0 Y 9.7 9.8 9.9 10.0 10.1 Y 0 5 10 15 20 b1 b2 b3 B b1 b2 b3 B Giorgio Russolillo STA102 26

Décomposition de la variabilité totale Giorgio Russolillo STA102 27

Décomposition de la variabilité totale SCT = SCM + SCR ( Y ijk Y ) 2 = ( Y ij Y ) 2 n ij + Y ijk Y ij i j k i j i j k ( ) 2 SCT = SCR = ( Y ijk Y ) 2 i j k ( ) 2 SCM = Y ij Y n ij = Y ij Y i j ( Y ijk Y ) 2 i j k ij i j k ( ) 2 Giorgio Russolillo STA102 28

Décomposition de la variabilité totale Tableau d analyse de la variance (n ij = K pour tous les i et j) = n 1 Avec les résultats en cette table on ne peut pas décomposer l effet du traitement en effet respectifs des deux facteurs et de leur interaction On peut décomposer la SCM en somme des carrés due aux effets principaux et somme des carrés due à l interaction Giorgio Russolillo STA102 29

Décomposition de la somme des carrés expliqués Giorgio Russolillo STA102 30

Décomposition de la SCM Si le dispositif est orthogonal on peut décomposer la SCM de façon unique à «A» c est le 1 er facteur à «B» c est le 2 ème facteur à «I» c est l interaction SCM = SCA + SCB + SCI ( Y ij Y ) 2 n ij = i j ( Y i Y ) 2 n i + Y j Y + Y ij Y i Y j + Y i j ( ) 2 n j i j ( ) 2 n ij SCA = Somme des carrés due au facteur «a» SCB = Somme des carrés due au facteur «b» SCI = Somme des carrés due à l interaction Giorgio Russolillo STA102 31

Test de la signification du modèle Giorgio Russolillo STA102 32

Test de la signification du modèle On veux tester l hypothèse H 0 = {le traitement n a pas d effet sur le Y, i.e. les moyennes sont les mêmes pour les différents traitements } contre l hypothèse H 1 = {il existe un effet du traitement sur le Y} Dans un modèle de ANOVA à deux facteurs, ce test s écrit : H 0 = { Y ijk = µ +ε ikj } contre H 1 = { Y ijk = µ +α i + β j + γ ij +ε ijk } Cela est équivalent à : H 0 = { i :α i = 0, j : β j = 0, ( i, j) : γ ij = 0} contre H 1 = { ( i, j) :α i 0 ou β j 0 ou γ ij 0 } Giorgio Russolillo STA102 33

Lois des sommes des carrés sous H0 SCM ~ σ 2 χ H IJ 1 0 2 ( ) SCR ~ σ 2 2 χ H0 ( n IJ ) Giorgio Russolillo STA102 34

Test de la signification du modèle H 0 = { Y ijk = µ +ε ikj } contre H 1 = { Y ijk = µ +α i + β j + γ ij +ε ijk } Ce test se fait au moyen de la statistique de test de Fischer : ( ) ( ) F = SCM IJ 1 SCR n IJ Variance expliquée par les traitements Variance résiduelle La statistique de test F suit sous H 0 une loi de Fisher à IJ-1 et n- IJ degrés de liberté : F ~ F IJ 1,n IJ H 0 Ce test nous montre que l analyse de la variance à deux facteurs est équivalent à une analyse de la variance à un facteur avec IJ niveaux Giorgio Russolillo STA102 35

Test de la signification du modèle H 0 = { Y ijk = µ +ε ikj } contre H 1 = { Y ijk = µ +α i + β j + γ ij +ε ijk } Statistique de test ( ) ( ) F = SCM IJ 1 SCR n IJ Probabilité critique (p-value) Pr( F IJ-1,n-IJ > f ) observé Règle de décision On rejette l hypothèse H0 au niveau α si ( ) < α ou f observé > f IJ 1,n IJ,(1 α ) Pr F IJ-1,n-IJ > f observé Giorgio Russolillo STA102 36

Exemple : Tableau d analyse de la variance Nombre de traitements I x J = 6 : 6-1 = 5 Modèle ANOVA à 2 facteurs avec interaction (modèle «complète») n-1 = 24-1 = 23 n - IJ = 24 6 = 18 Probabilité critique < 0.05, on rejette l hypothèse H 0 : le facteur «a», le facteur «b» ou leur effet conjoint ont un effet significatif sur les y Giorgio Russolillo STA102 37

Réductions Giorgio Russolillo STA102 38

Sommes des carrés et réductions Dans un dispositif orthogonal la somme des carrés associé à chaque effet peut s exprimer en terme de réduction de la variabilité résiduelle, puisque elle mesure la diminution des résidus lorsqu on introduit l effet dans le modèle De façon générale, R(M 2 M 1 ) mesure la diminution de la SCR lorsque on passe du modèle plus simple (emboîté) au modèle plus complexe (avec plus de paramètres) Exemple : Modèle 1 à Y ijk = µ +α i +ε ijk Modèle 2 à Y ijk = µ +α i + β j +ε ijk à R(β μ,α) = SCR 1 -SCR 2 Modèles emboîtés : deux modèles sont dits emboîtés si l un peut être considéré comme un cas particulier de l autre. Cela revient à comparer un modèle de référence à un modèle réduit ou contraint Giorgio Russolillo STA102 39

Sommes des carrés et réductions On peut récrire les sommes des carrés dues aux facteurs ainsi que la somme des carrés due à l interaction en termes de réduction de la SCR en utilisant comme modèle de référence le modèle 0 : Y ijk = µ +ε ijk Somme des carrés de type I (Type I SS) : SCA = R( α µ ) SCB = R( β µ,α ) SCI = R( γ µ,α,β ) modèle 0 à Y ijk = µ +ε ijk modèle A à Y ijk = µ +α i +ε ijk modèle A à Y ijk = µ +α i +ε ijk modèle AB à Y ijk = µ +α i + β j +ε ijk Y ijk = µ +α i + β j +ε ijk modèle AB à Yijk = µ +α i + β j + γ ij +ε ijk modèle C à Modèle «complet» Giorgio Russolillo STA102 40

Sommes des carrés et réductions Type I SS : SCA = R( α µ ) modèle 0 à Y ijk = µ +ε ijk modèle A à Y ijk = µ +α i +ε ijk SCR M 0 = SCT SCA = R( α µ ) = SCT SCR M A Giorgio Russolillo STA102 41

Sommes des carrés et réductions Type I SS : SCB = R( β µ,α ) modèle A à Y ijk = µ +α i +ε ijk modèle AB à Y ijk = µ +α i + β j +ε ijk SCB = R( β µ,α ) = SCR M A SCR M AB Dans un dispositif équilibré : SCB = R( β µ,α ) = R( β µ ) Les séquences AB et BA donnent les mêmes sommes des carrés Giorgio Russolillo STA102 42

Sommes des carrés et réductions Type I SS : SCI = R( γ µ,α,β ) Y ijk = µ +α i + β j +ε ijk modèle AB à modèle C à Y ijk = µ +α i + β j + γ ij +ε ijk SCR M C = SCR SCI = R( γ µ,α,β ) = SCR M AB SCR Giorgio Russolillo STA102 44

Tests des effets des facteurs Giorgio Russolillo STA102 45

Loi des sommes des carrés des effets Cas d un dispositif orthogonal Sous l hypothèse α 1 = = α I = 0 (Pas d effet du facteur A) SCA~σ 2 2 χ ( I 1) Sous l hypothèse β 1 = = β J = 0 (Pas d effet du facteur B) SCB~σ 2 2 χ ( J 1) Sous l hypothèse γ 11 = = γ IJ = 0 (Pas d interaction) SCI ~σ 2 2 χ I 1 ( )( J 1) Giorgio Russolillo STA102 46

Test des effets de chaque facteur On veux tester de façon spécifique l effet de chacun des facteurs (n ij = K pour toutes les i et j) : 1 er facteur 2 ème facteur Interaction En moyenne sur l ensemble des niveaux du 2 ème facteur, le valeur moyenne de Y ne varie pas entre les différents niveaux du 1 er facteur, i.e. Y 1.. =Y 2.. = =Y I.. Il n existe pas d interaction entre les deux facteurs SCA = R( α µ ) Giorgio Russolillo STA102 47

Exemple : Test des effets de chaque facteur Effet des différents facteurs dans un modèle de ANOVA à 2 facteurs avec interaction (modèle «complèt») SCI C Effet de l interaction : la p-valeur est > 0.05 donc l effet de l interaction n est pas significatif au niveau 5% et on peut accepter un modèle sans interaction. Effet du facteur «b»: la p-value est < 0.001 donc l effet du facteur «b» est nettement significatif. Effet du facteur «a»: la p-value est > 0.05 donc l effet du facteur «a» n est pas significatif au niveau 5%, mais on ne peux pas le supprimer à ce stade. Giorgio Russolillo STA102 48

Exemple : Le modèle sans interaction Résultat pour le modèle : Y ijk = µ +α i + β j +ε ijk SCM AB = SCM C SCI C = = 518.70833-59.25 SCT AB =SCT C SCR AB = SCR C + SCI C = 209.25 + 59.25 Modèle complète : Giorgio Russolillo STA102 49

Ex : Le modèle sans interaction Résultat pour le modèle sans intération : Y ijk = µ + α i + β j + ε ijk SCA AB = SCA c mais: La SCR augmente Les DL augmentent Effet du facteur «a»: la P-value est >0.05 donc l effet du facteur «a» n est pas significatif au niveau 5% Modèle complète : Giorgio Russolillo STA102 50

Ex : Analyses séparées pour les deux facteurs Pour connaitre l effet de chacun deux facteurs sur y, on peux être tenté d effectuer une analyse de la variance séparée pour chacun des deux facteurs Effet facteur «a» : Modèle A à Y ijk = µ +α i +ε ijk Effet facteur «b» : Y ijk = µ + β j + ε ijk Modèle B à avec avec 2 { ε ijk } i.i.d. N ( 0,σ A ) 2 { ε ijk } i.i.d. N ( 0,σ B ) Cette hypothèse n a évidemment de sens que si dans chacun des ces deux modèle le facteur pas considéré à n a pas d effet, autrement les j*k répétitions du premier modèle et les les i*k répétitions du second modèle ne sont pas vraiment des répétitions! Giorgio Russolillo STA102 51

Ex : Le modèle A Résultat pour le modèle ANOVA à un facteur («a») : Y ijk = µ +α i +ε ijk SCM A = SCA AB, mais : - La SCR augmente - Les DL augmentent Probabilité critique >> 0.05, on ne rejette pas l hypothèse H 0 : le facteur «a» n as pas d effet significatif sur les y Modèle AB : Giorgio Russolillo STA102 52

Ex: Le modèle B Résultat pour le modèle ANOVA à un facteur («b») : Y ijk = µ + β j +ε ijk SCM B = SCB mais : - La SCR augmente - Les DL augmentent Modèle AB : Probabilité critique < 0.05, on rejette l hypothèse H 0 : le facteur «b» a un effet significatif sur y Giorgio Russolillo STA102 53

Comparaison des moyennes On peut vouloir tester l hypothèse H 0 = {deux moyennes sont les mêmes} contre l hypothèse H 1 = {les deux moyennes sont différentes} Ce test ce peut faire : à Au niveau facteur, on veut tester si deux moyennes sont les mêmes pour deux niveaux différents du même facteur, i.e. Y 1..=Y 2.. à Au niveau traitement, on veut tester si deux moyennes sont les mêmes pour deux traitements différents, i.e. Y ij.= Y i j. Dans tous les cas il faut considérer qu on fait des comparaisons multiples! Giorgio Russolillo STA102 54

Ex: Comparaison des moyennes pour le 1 er facteur Modèle A : Y ijk = µ +α i +ε ijk Rappel: Les d.d.l. sont égales à n-2 (où 2 est le nombre de paramètres à estimer: µ et α 1 ) La difference entre les deux niveaux du facteur «a» n est pas significative, ce qui est cohérent avec l absence d effet principal du facteur Giorgio Russolillo STA102 55

Ex : Comparaison des moyennes pour le 2 ème facteur Modèle B : Y ijk = µ + β j +ε ijk Rappel: Les d.d.l. sont égales à n-3 (où 3 est le nombre de paramètres à estimer: μ, β 1 et β 2 ) t critique : t ddl, α/2 où ddl=21, α/2 = (α * /2)/l = 0.025/3 et α * = 0.05 Le facteur «b» a un effet significative car toutes les différences entre les moyennes des trois niveaux sont significatives. Giorgio Russolillo STA102 56

Ex : Comparaison des traitements (Modèle complet) t critique : t ddl,α/2 =3.380362 où ddl = 18, α/2 = (α * /2)/l = 0.025/15 et α * =0.05 t obs Dans ce cas on rejet H 0 car t obs > t ddl,α/2, c.à.d. p * <α * p * = P(t 18 >5.910625) x 30 Giorgio Russolillo STA102 57

Ex : Comparaison des traitements (Modèle complet) Giorgio Russolillo STA102 58

Estimation des paramètres du modèle Giorgio Russolillo STA102 59

Estimation des paramètres du modèle Y ijk = µ + α i + β j + γ ij + ε ijk E( Y ) ijk = µ ij = µ + α i + β j + γ ij { ε ijk } i.i.d. N ( 0,σ 2 ) à Ce modèle n est pas identifiable donc on a besoin d introduire des contraintes sur les paramètres 1 + I + J + I*J paramètres à estimer I*J colonnes indépendants dans la matrice X à On doit introduire 1+I+J contraintes indépendantes sur les paramètres : (a) Contraintes naturelles (b) Contraintes de SAS Giorgio Russolillo STA102 60

Les différentes contraintes (a) Contraintes naturelles à Avec cette contrainte on impose à la somme des paramètres associes à chaque effet d être nul, i.e. : I α i = 0 i=1 1 contrainte 1 contrainte D où les estimateurs : J J β j = 0 i : γ ij j =1 j =1 = 0 j : γ ij = 0 I i=1 I+J-1 contraintes ˆ µ = Y ˆ α i = Y i Y ˆ β j = Y j Y ˆ γ ij = Y ij Y i Y j + Y Tous ces estimateurs s interprètent comme des écarts entre moyennes Giorgio Russolillo STA102 61

Les différentes contraintes (b) Contraintes de SAS à Avec cette contrainte tous les paramètres associes au dernier niveau de chaque facteur s annulent : α I = 0 β J = 0 i : γ ij = 0 j : γ Ij = 0 1 contrainte 1 contrainte I+J-1 contraintes D où les estimateurs : ˆ µ = Y IJ ˆ α i = Y ij Y IJ ˆ β j = Y Ij Y IJ ˆ γ ij = Y ij Y ij Y Ij + Y IJ Le traitement (I,J) joue le rôle de référence Giorgio Russolillo STA102 62

Prédiction La forme des estimateurs dépend des contraintes qu on applique à ATTENTION à L INTERPRETATION DES ESTIMATIONS DES PARAMETRES Toutefois la prédiction ne dépend pas des contraintes, elles est dans tous les cas : E ( Y ) ijk = Y ˆ ijk = ˆ µ + α ˆ i + ˆ β j + ˆ γ ij = Y ij Moyenne du traitement (i,j) à On a donc que I*J valeurs prédites possibles, une pour chaque traitement Giorgio Russolillo STA102 63

Ex: Estimation des paramètres Y IJ. C est la différence entre les moyennes des traitements a2b1 et a2b3 Giorgio Russolillo STA102 64

Estimateur de la variance des erreurs 2 S n IJ = SCR n IJ = i j k n IJ ( Y ijk Y ) 2 ij Nombre de paramètres à estimer une fois posé les contraintes Valeur prédite ˆ Y ijk = Y ij Giorgio Russolillo STA102 65

Test sur les paramètres Giorgio Russolillo STA102 66

Tests sur les paramètres On veut tester l hypothèse H 0 = {le paramètre est égal à 0} contre l hypothèse H 1 = {le paramètre est diffèrent de 0} On a IJ tests sur les paramètres : i I H 0 : { α i = 0} contre H 1 : { α i 0} j J H 0 : β j = 0 { } contre H 1 : { β j 0} ( ) H 0 : { γ ij = 0} contre H 1 : { γ ij 0} ( i, j) ( I,J) ( I, j) i,j Chacun de ces tests se effectue à travers un test de STUDENT Giorgio Russolillo STA102 67

Tests sur les paramètres Il faut interpréter le test associé à chacun des paramètres en fonction des contraintes choisies par SAS Dans le cas de la contrainte (b) les estimateurs étaient : ˆ µ = Y IJ ˆ α i = Y ij Y IJ ˆ β j = Y Ij Y IJ ˆ γ ij = Y ij Y ij Y Ij + Y IJ Le test H 0 = {β j =0} contre l hypothèse H 1 = {β j 0} s interprète comme : Est-ce que la moyenne obtenue pour le niveau j du 2 ème facteur est la même de celle obtenue pour le niveau J du 2 ème facteur lorsque le niveau I du 1 er facteur est fixé?, i.e. Y Ij.=Y IJ?. Giorgio Russolillo STA102 68

Ex :Test sur les paramètres (Modèle Complet) Rappel: Les d.d.l. de t sont égales à n-6 (le nombre de paramètres à estimer) La différence entre les moyennes des traitements a2b1 et a2b3 est significative N.B.: Les p-valeurs ne sont pas corrigées On retrouve les mêmes valeurs dans la table des comparaisons des traitements Giorgio Russolillo STA102 69

This presentation is made available through a Creative Commons Attribution- Noncommercial license. Details of the license and permitted uses are available at http://creativecommons.org/licenses/by-nc/3.0/ 2016 G. Russolillo Analyse de la variance à deux facteurs : Dispositif équilibré Title: Analyse de la variance à deux facteurs : Dispositif équilibré UE STA102 Attribution:. G. Russolillo, CNAM L. Trinchera, NEOMA Business School Giorgio Russolillo - STA102 70