Analyse de variance à un facteur Tests d hypothèses Analyse de variance à deux facteurs. Analyse de la variance ANOVA



Documents pareils
Analyse de la variance Comparaison de plusieurs moyennes

STATISTIQUES. UE Modélisation pour la biologie

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Chapitre 3. Les distributions à deux variables

FORMULAIRE DE STATISTIQUES

Cours 9 : Plans à plusieurs facteurs

Exemples d application

Introduction à l approche bootstrap

Le Modèle Linéaire par l exemple :

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

VI. Tests non paramétriques sur un échantillon

Cours de Tests paramétriques

Chapitre 4 : Régression linéaire

Principe d un test statistique

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Le risque Idiosyncrasique

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Théorie des sondages : cours 5

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

TABLE DES MATIERES. C Exercices complémentaires 42

Estimation et tests statistiques, TD 5. Solutions

1 Définition de la non stationnarité

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

NON-LINEARITE ET RESEAUX NEURONAUX

Application sur le Dispositif en Blocs Complètement Randomisés

Résumé du Cours de Statistique Descriptive. Yves Tillé

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Programmation linéaire et Optimisation. Didier Smets

4. Résultats et discussion

Statistique inférentielle TD 1 : Estimation

CarrotAge, un logiciel pour la fouille de données agricoles

avec des nombres entiers

Modèle GARCH Application à la prévision de la volatilité

Biostatistiques : Petits effectifs

Exercice : la frontière des portefeuilles optimaux sans actif certain

RÉSULTATS DE L OBSERVATOIRE TECHNICO-ÉCONOMIQUE DU RAD Synthèse Exercice comptable 2010

Comment bien régresser: La statistique peut-elle se passer d artefacts?

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Exercices de Statistique HEI /2015 A. RIDARD

Relation entre deux variables : estimation de la corrélation linéaire

Introduction à la Statistique Inférentielle

Exercices - Polynômes : corrigé. Opérations sur les polynômes

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Évaluation de la régression bornée

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS

Chapitre 5 : Flot maximal dans un graphe

Lois de probabilité. Anita Burgun

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Etude des propriétés empiriques du lasso par simulations

Régression linéaire. Nicolas Turenne INRA

Logiciel XLSTAT version rue Damrémont PARIS

La classification automatique de données quantitatives

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

Cours 02 : Problème général de la programmation linéaire

Introduction à la théorie des files d'attente. Claude Chaudet

3. Caractéristiques et fonctions d une v.a.

données en connaissance et en actions?

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Les indices à surplus constant

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

La théorie des anticipations de la structure par terme permet-elle de rendre compte de l évolution des taux d intérêt sur euro-devise?

T de Student Khi-deux Corrélation

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Programmes des classes préparatoires aux Grandes Ecoles

mon maïs fourrage, (GNIS) rassemble toutes les parties prenantes de la filière semences française, soit 72 entreprises de sélection,

Introduction aux Statistiques et à l utilisation du logiciel R

Calcul élémentaire des probabilités

Le contrôle de gestion des projets :

Analyse d outils de gestion des risques agricoles en Région wallonne. Rapport final

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Précision d un résultat et calculs d incertitudes

Statistique Descriptive Élémentaire

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Développement décimal d un réel

Correction du baccalauréat STMG Polynésie 17 juin 2014

Cours Fonctions de deux variables

Analyse en Composantes Principales

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Pierre Thérond Année universitaire

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Transcription:

Analyse de la variance ANOVA

Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3

Exemple. Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 21 candidats, 3 examinateurs (resp. 6,8 et 7 étudiants) Examinateur A B C Notes 10,11,11 8,11,11,13 10,13,14,14 12,13,15 14,15,16,16 15,16,16 Effectif 6 8 7 Moyenne 12 13 14

Exemple. Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 21 candidats, 3 examinateurs (resp. 6,8 et 7 étudiants) Examinateur A B C Notes 10,11,11 8,11,11,13 10,13,14,14 12,13,15 14,15,16,16 15,16,16 Effectif 6 8 7 Moyenne 12 13 14 effet d examinateur?

Exemple. Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 21 candidats, 3 examinateurs (resp. 6,8 et 7 étudiants) Examinateur A B C Notes 10,11,11 8,11,11,13 10,13,14,14 12,13,15 14,15,16,16 15,16,16 Effectif 6 8 7 Moyenne 12 13 14 effet d examinateur? ANOVA : pour étudier l effet des variables qualitatives sur une variable quantitative

Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3

Terminologie Modèles statistiques Estimation des paramètres facteur (variable qualitative) : prend un nombre fini de valeurs, une valeur = une classe.

Terminologie Modèles statistiques Estimation des paramètres facteur (variable qualitative) : prend un nombre fini de valeurs, une valeur = une classe. Exemple : facteur examinateur

Terminologie Modèles statistiques Estimation des paramètres facteur (variable qualitative) : prend un nombre fini de valeurs, une valeur = une classe. Exemple : facteur examinateur niveau (ou population) : les différentes valeurs prises par un facteur.

Terminologie Modèles statistiques Estimation des paramètres facteur (variable qualitative) : prend un nombre fini de valeurs, une valeur = une classe. Exemple : facteur examinateur niveau (ou population) : les différentes valeurs prises par un facteur. Ex : niveaux A, B, C

Terminologie Modèles statistiques Estimation des paramètres facteur (variable qualitative) : prend un nombre fini de valeurs, une valeur = une classe. Exemple : facteur examinateur niveau (ou population) : les différentes valeurs prises par un facteur. Ex : niveaux A, B, C test de l effet d un facteur : tester si les moyennes des populations sont égales.

Terminologie Modèles statistiques Estimation des paramètres facteur (variable qualitative) : prend un nombre fini de valeurs, une valeur = une classe. Exemple : facteur examinateur niveau (ou population) : les différentes valeurs prises par un facteur. Ex : niveaux A, B, C test de l effet d un facteur : tester si les moyennes des populations sont égales. La variable étudiée : Y, à valeurs numériques

Terminologie Modèles statistiques Estimation des paramètres facteur (variable qualitative) : prend un nombre fini de valeurs, une valeur = une classe. Exemple : facteur examinateur niveau (ou population) : les différentes valeurs prises par un facteur. Ex : niveaux A, B, C test de l effet d un facteur : tester si les moyennes des populations sont égales. La variable étudiée : Y, à valeurs numériques (note).

Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3

Terminologie Modèles statistiques Estimation des paramètres Un seul facteur F k niveaux k échantillons de tailles respectives n 1,..., n k

Terminologie Modèles statistiques Estimation des paramètres Un seul facteur F k niveaux k échantillons de tailles respectives n 1,..., n k Effectif total k n = i=1 n i

Terminologie Modèles statistiques Estimation des paramètres Un seul facteur F k niveaux k échantillons de tailles respectives n 1,..., n k Effectif total k n = i=1 À chaque expérience, on mesure la valeur de la variable Y. n i

Terminologie Modèles statistiques Estimation des paramètres Un seul facteur F k niveaux k échantillons de tailles respectives n 1,..., n k Effectif total k n = i=1 À chaque expérience, on mesure la valeur de la variable Y. Niveau (population) Nb. obs. Valeurs de Y 1 n 1 y 11, y 12,..., y 1n1 2 n 2 y 21, y 22,..., y 2n2 n i..... k n k y k1, y k2,..., y knk

Terminologie Modèles statistiques Estimation des paramètres Sommes et moyennes empiriques

Terminologie Modèles statistiques Estimation des paramètres Sommes et moyennes empiriques Pour le niveau i : n i Y i = j=1 Y i = 1 n i Y i = 1 n i Y ij n i j=1 Y ij

Terminologie Modèles statistiques Estimation des paramètres Sommes et moyennes empiriques Pour le niveau i : n i Y i = Globalement et j=1 Y i = 1 n i Y i = 1 n i Y = k Y i = i=1 Y = 1 n Y = 1 n Y ij n i j=1 k n i i=1 j=1 k Y i = 1 n i=1 Y ij Y ij k n i i=1 j=1 Y ij

Hypothèse : Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres les k échantillons sont indépendants et de loi Normale.

Hypothèse : Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres les k échantillons sont indépendants et de loi Normale. Les y ij sont des réalisations de la v.a. Y ij N (m i, σ 2 )

Hypothèse : Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres les k échantillons sont indépendants et de loi Normale. Les y ij sont des réalisations de la v.a. Y ij N (m i, σ 2 ) et Y ij, Y i j indépendantes pour i i ou j j.

Hypothèse : Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres les k échantillons sont indépendants et de loi Normale. Les y ij sont des réalisations de la v.a. Y ij N (m i, σ 2 ) et Y ij, Y i j indépendantes pour i i ou j j. Autrement dit, pour chaque i, (y ij ) j ni,..., y ini standard. est un échantillon

Hypothèse : Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres les k échantillons sont indépendants et de loi Normale. Les y ij sont des réalisations de la v.a. Y ij N (m i, σ 2 ) et Y ij, Y i j indépendantes pour i i ou j j. Autrement dit, pour chaque i, (y ij ) j ni,..., y ini standard. est un échantillon L écart-type (théorique) est le même pour tous les niveaux.

Hypothèse : Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres les k échantillons sont indépendants et de loi Normale. Les y ij sont des réalisations de la v.a. Y ij N (m i, σ 2 ) et Y ij, Y i j indépendantes pour i i ou j j. Autrement dit, pour chaque i, (y ij ) j ni,..., y ini standard. est un échantillon L écart-type (théorique) est le même pour tous les niveaux. La moyenne (théorique) peut varier avec le niveau.

Hypothèse : Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres les k échantillons sont indépendants et de loi Normale. Les y ij sont des réalisations de la v.a. Y ij N (m i, σ 2 ) et Y ij, Y i j indépendantes pour i i ou j j. Autrement dit, pour chaque i, (y ij ) j ni,..., y ini standard. est un échantillon L écart-type (théorique) est le même pour tous les niveaux. La moyenne (théorique) peut varier avec le niveau. On veut savoir si les moyennes m i sont toutes égales ou non.

Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3

Terminologie Modèles statistiques Estimation des paramètres Y ij N (m i, σ 2 ) Y ij = m i + ε ij i = 1,..., k j = 1,..., n i

Terminologie Modèles statistiques Estimation des paramètres Y ij N (m i, σ 2 ) Y ij = m i + ε ij i = 1,..., k j = 1,..., n i = µ + α i + ε ij avec ε ij N (0, σ 2 ). Avec - µ = «effet moyen» ; - α i = effet du niveau i du facteur F.

Terminologie Modèles statistiques Estimation des paramètres Y ij N (m i, σ 2 ) Y ij = m i + ε ij i = 1,..., k j = 1,..., n i = µ + α i + ε ij avec ε ij N (0, σ 2 ). Avec - µ = «effet moyen» ; - α i = effet du niveau i du facteur F. Contrainte : k i=1 n iα i = 0

Terminologie Modèles statistiques Estimation des paramètres Y ij N (m i, σ 2 ) Y ij = m i + ε ij i = 1,..., k j = 1,..., n i = µ + α i + ε ij avec ε ij N (0, σ 2 ). Avec - µ = «effet moyen» ; - α i = effet du niveau i du facteur F. Contrainte : k i=1 n iα i = 0 On veut tester si les α i sont tous nuls.

Terminologie Modèles statistiques Estimation des paramètres Vectoriellement, le modèle s écrit Y 11 Y 12. Y 1n1 Y 21 Y 22. Y 2n2. Y k1. Y knk = 1 0 0... 0 1 0 0... 0... 1 0 0... 0 0 1 0... 0 0 1 0... 0... 0 1 0... 0...... 0 0 0... 1... 0 0 0... 1 m 1 m 2.. m k + ε 11 ε 12. ε 1n1 ε 21 ε 22. ε 2n2. ε k1. ε knk

Terminologie Modèles statistiques Estimation des paramètres Y = X β + ε

Terminologie Modèles statistiques Estimation des paramètres Y = X β + ε Donc, l analyse de variance est un modèle linéaire.

Terminologie Modèles statistiques Estimation des paramètres 1 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres 2 3

(m i ) Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres Il faut trouver ainsi les valeurs des m i qui minimisent la fonction : T ((m i )) = k n i ε 2 ij = i=1 j=1 k n i (Y ij m i ) 2 i=1 j=1

(m i ) Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres Il faut trouver ainsi les valeurs des m i qui minimisent la fonction : T ((m i )) = k n i ε 2 ij = i=1 j=1 k n i (Y ij m i ) 2 i=1 j=1 On obtient que : ˆm i = Ȳ i.

(m i ) Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres Il faut trouver ainsi les valeurs des m i qui minimisent la fonction : T ((m i )) = k n i ε 2 ij = i=1 j=1 k n i (Y ij m i ) 2 i=1 j=1 On obtient que : ˆm i = Ȳ i. Sous l hypothèse de normalité et d indépendance des échantillons, Ȳ i est un estimateur sans biais de m i et ) ˆm i = Ȳ i N (m i, σ2 n i

Terminologie Modèles statistiques Estimation des paramètres µ, α i ε ij = ε + ( ε i ε ) + (ε ij ε i ) k n i ε 2 ij = i=1 j=1 k n i k n i k n i ε 2 + (ε i ε ) 2 + (ε ij ε i ) 2 i=1 j=1 i=1 j=1 i=1 j=1

Terminologie Modèles statistiques Estimation des paramètres µ, α i ε ij = ε + ( ε i ε ) + (ε ij ε i ) k n i ε 2 ij = i=1 j=1 k n i k n i k n i ε 2 + (ε i ε ) 2 + (ε ij ε i ) 2 i=1 j=1 i=1 j=1 i=1 j=1 On a ε ij = Y ij µ α i, ε i = Y i n i µ n i α i, ε i = Y i µ α i k k ε = Y n i µ n i α i, ε = Y nµ, ε = Y µ i=1 i=1

Terminologie Modèles statistiques Estimation des paramètres µ, α i k n i ε 2 ij = i=1 j=1 k n i k n i k n i (Y µ) 2 + (Y i Y α i ) 2 + (Y ij Y i ) 2 i=1 j=1 i=1 j=1 i=1 j=1

Terminologie Modèles statistiques Estimation des paramètres µ, α i k n i ε 2 ij = i=1 j=1 k n i k n i k n i (Y µ) 2 + (Y i Y α i ) 2 + (Y ij Y i ) 2 i=1 j=1 i=1 j=1 i=1 j=1 Le membre de droite est minimisé pour : ˆµ = Y, ˆα i = Y i Y

Terminologie Modèles statistiques Estimation des paramètres µ, α i k n i ε 2 ij = i=1 j=1 k n i k n i k n i (Y µ) 2 + (Y i Y α i ) 2 + (Y ij Y i ) 2 i=1 j=1 i=1 j=1 i=1 j=1 Le membre de droite est minimisé pour : ˆµ = Y, ˆα i = Y i Y On a bien k i=1 n i ˆα i = 0

Terminologie Modèles statistiques Estimation des paramètres µ, α i k n i ε 2 ij = i=1 j=1 k n i k n i k n i (Y µ) 2 + (Y i Y α i ) 2 + (Y ij Y i ) 2 i=1 j=1 i=1 j=1 i=1 j=1 Le membre de droite est minimisé pour : ˆµ = Y, ˆα i = Y i Y On a bien k i=1 n i ˆα i = 0 : k n i ˆα i = i=1 k k n i Y i n i Y = i=1 i=1 k Y i ny = 0 i=1

σ 2 Analyse de variance à un facteur Terminologie Modèles statistiques Estimation des paramètres L estimateur de σ 2 est : S 2 n = 1 n k k n i (Y ij Ȳ i ) 2 i=1 j=1

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes 1 Analyse de variance à un facteur 2 Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes 3

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Niveaux 1 seul niveau ou k niveaux?

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Niveaux 1 seul niveau ou k niveaux? H 0 : m 1 = m 2 =... = m k = m contre

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Niveaux 1 seul niveau ou k niveaux? H 0 : m 1 = m 2 =... = m k = m contre H 1 : i, j {1,..., k} tels que m i m j.

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Niveaux 1 seul niveau ou k niveaux? H 0 : m 1 = m 2 =... = m k = m contre H 1 : i, j {1,..., k} tels que m i m j. Ou : H 0 : α 1 = α 2 =... = α k = 0 contre

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Niveaux 1 seul niveau ou k niveaux? H 0 : m 1 = m 2 =... = m k = m contre H 1 : i, j {1,..., k} tels que m i m j. Ou : H 0 : α 1 = α 2 =... = α k = 0 contre H 1 : i {1,..., k} tel que α i 0

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Niveaux 1 seul niveau ou k niveaux? H 0 : m 1 = m 2 =... = m k = m contre H 1 : i, j {1,..., k} tels que m i m j. Ou : H 0 : α 1 = α 2 =... = α k = 0 contre H 1 : i {1,..., k} tel que α i 0 Sous H 0, le modèle a la forme : M reduit : Y ij = µ + ε ij

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes L estimation pour µ est ˆµ = Ȳ et la prévision de Y ij est Ŷ ij = ˆµ. Alors, le résidu, sous H 0 est : Y ij Ȳ. La variabilité totale est : k n i (Y ij Y ) 2 i=1 j=1 On peut écrire : Y ij Y = (Y ij Y i ) + (Y i Y )

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes L estimation pour µ est ˆµ = Ȳ et la prévision de Y ij est Ŷ ij = ˆµ. Alors, le résidu, sous H 0 est : Y ij Ȳ. La variabilité totale est : k n i (Y ij Y ) 2 i=1 j=1 On peut écrire : Y ij Y = (Y ij Y i ) + (Y i Y ) et on obtient : k n i (Y ij Y ) 2 = i=1 j=1 k n i k n i (Y ij Y i ) 2 + (Y i Y ) 2 i=1 j=1 i=1 j=1 (variabilité totale=variabilité résiduelle + variabilité due au modèle) : ST=SR+SM.

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Tableau d analyse de variance Source de variation ddl S.C. Carré moyen Régression k 1 SM SM/(k 1) Résiduelle n k SR SR/(n k) Totale n 1 ST

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes 1 Analyse de variance à un facteur 2 Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes 3

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Pour tester l hypothèse H 0 on utilise la statistique : Z = SM/(k 1) SR/(n k) F (k 1, n k) (sous H 0) Pour un risque α fixé, la zone d acceptation est : ZA H0,α = [0 ; f k 1,n k;1 α ]

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Exemple : Notes 21 candidats, 3 examinateurs (resp. 6,8 et 7 étudiants) Examinateur A B C Notes 10,11,11 8,11,11,13 10,13,14,14 12,13,15 14,15,16,16 15,16,16 Effectif 6 8 7 Moyenne 12 13 14

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Y ij = m i + ε ij i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Y ij = m i + ε ij i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7 ou encore Y ij = µ + α i + ε ij, i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Y ij = m i + ε ij i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7 ou encore Y ij = µ + α i + ε ij, i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7 Les estimations des paramètres : ˆµ = ȳ = 13.05, ˆα 1 = ȳ 1 ȳ = 12 13.05 = 1.05, ˆα 2 = ȳ 2 ȳ = 13 13.05 = 0.05, ˆα 3 = ȳ 3 ȳ = 14 13.05 = 0.95.

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Y ij = m i + ε ij i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7 ou encore Y ij = µ + α i + ε ij, i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7 Les estimations des paramètres : ˆµ = ȳ = 13.05, ˆα 1 = ȳ 1 ȳ = 12 13.05 = 1.05, ˆα 2 = ȳ 2 ȳ = 13 13.05 = 0.05, ˆα 3 = ȳ 3 ȳ = 14 13.05 = 0.95. H 0 : pas d effet examinateur sur la notation

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Y ij = m i + ε ij i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7 ou encore Y ij = µ + α i + ε ij, i = 1, 2, 3, j = 1,..., n i, n 1 = 6 n 2 = 8 n 3 = 7 Les estimations des paramètres : ˆµ = ȳ = 13.05, ˆα 1 = ȳ 1 ȳ = 12 13.05 = 1.05, ˆα 2 = ȳ 2 ȳ = 13 13.05 = 0.05, ˆα 3 = ȳ 3 ȳ = 14 13.05 = 0.95. H 0 : pas d effet examinateur sur la notation H 0 : m 1 = m 2 = m 3 = m contre H 1 : i j tel que m i m j H 0 : α 1 = α 2 = α 3 = 0 contre H 1 : i j tel que α i 0

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes On obtient : SM=12.95, SR=98

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes On obtient : SM=12.95, SR=98 donc z = (SM/(3 1))/(SR/(21 3)) = 1.19.

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes On obtient : SM=12.95, SR=98 donc z = (SM/(3 1))/(SR/(21 3)) = 1.19. La zone d acceptation est ZA H0 ;1 α = [0 ; f 2,18;0.95 ] = [0 ; 3.55].

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes On obtient : SM=12.95, SR=98 donc z = (SM/(3 1))/(SR/(21 3)) = 1.19. La zone d acceptation est ZA H0 ;1 α = [0 ; f 2,18;0.95 ] = [0 ; 3.55]. Donc, H 0 est acceptée : les examinateurs ont le même système de notation.

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes 1 Analyse de variance à un facteur 2 Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes 3

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Le rejet de l hypothèse d égalité des moyennes ne signifie pas que tous les m i sont différents entre eux. On cherche souvent à tester l égalité entre deux moyennes : H 0 : m h = m j contre H 1 : m h m j pour h j. On utilise la statistique de test : Z = Ȳ h Ȳ j SR 1 n k n + 1 h n j t n k (t n k : loi de Student à n k degrés de liberté.)

Tableau d analyse de variance Test d égalité des k effets Comparaison de moyennes Le rejet de l hypothèse d égalité des moyennes ne signifie pas que tous les m i sont différents entre eux. On cherche souvent à tester l égalité entre deux moyennes : H 0 : m h = m j contre H 1 : m h m j pour h j. On utilise la statistique de test : Z = Ȳ h Ȳ j SR 1 n k n + 1 h n j t n k (t n k : loi de Student à n k degrés de liberté.) La zone d acceptation ZA H0,1 α = [ t n k;1 α/2 ; t n k;1 α/2 ].

1 Analyse de variance à un facteur 2 3 Estimation des paramètres Tableau d analyse de variance Test d hypothèse Test d un facteur.

On a vu comment comparer les populations d un même facteur. Supposons maintenant qu un expérimentateur souhaite comparer l influence de trois régimes alimentaires et de deux exploitations sur la production laitière. Les résultats expérimentaux sont dans le tableau suivant. Expl R.alim A B C Total Moyenne 1 7 36 2 45 15 2 13 44 18 75 215 Total 20 80 20 120 Moyenne 10 40 10 20

1 Analyse de variance à un facteur 2 3 Estimation des paramètres Tableau d analyse de variance Test d hypothèse Test d un facteur.

Deux facteurs (variables) F1 et F2. p niveaux pour F1, q niveaux pour F2 Pour chaque couple (i, j) de niveaux, on a r( 1) observations de la variable dépendante Y.

Deux facteurs (variables) F1 et F2. p niveaux pour F1, q niveaux pour F2 Pour chaque couple (i, j) de niveaux, on a r( 1) observations de la variable dépendante Y. F1 / F2 1... i... p 1 y 111,..., y 11r... y i11,..., y i1r... y p11,..., y p1r...... j y 1j1,..., y 1jr... y ij1,..., y ijr... y pj1,..., y pjr...... q y 1q1,..., y 1jq... y iq1,..., y iqr... y pq1,..., y pqr Dans la cellule (i, j) : les valeurs (observations) y ijk : i : niveau (population) du facteur F 1, j : niveau de F 2 k : la k-ième répétition pour un couple (i, j).

Notations : y ij = r k=1 y ijk ȳ ij = 1 r y ij y i = q r j=1 k=1 y ijk ȳ i = 1 qr y y j = p r i=1 k=1 y ijk ȳ j = 1 pr y j y = p q r i=1 j=1 k=1 y ijk ȳ = 1 pqr y

Notations : y ij = r k=1 y ijk ȳ ij = 1 r y ij y i = q r j=1 k=1 y ijk ȳ i = 1 qr y y j = p r i=1 k=1 y ijk ȳ j = 1 pr y j y = p q r i=1 j=1 k=1 y ijk ȳ = 1 pqr y Les observations y ijk sont des réalisations de la v.a. Y ijk sur laquelle on fait les hypothèses : { Yijk N (m ij, σ 2 ) k = 1,..., r Y ijk, Y i j k indépendantes

En ce qui concerne le nombre r de répétitions on a 2 situations : r > 1 r = 1. Il n y a pas de répétition et on va noter Y ij par Y ij. Alors, les modèles statistiques considérés seront fonction de ces 2 situations.

En ce qui concerne le nombre r de répétitions on a 2 situations : r > 1 r = 1. Il n y a pas de répétition et on va noter Y ij par Y ij. Alors, les modèles statistiques considérés seront fonction de ces 2 situations. Même nombre de répétitions de l expérience pour chaque couple de facteurs.

Les problèmes étudiés sont les mêmes que pour un seul facteur : écrire un modèle statistique de Y fonction des facteurs ;

Les problèmes étudiés sont les mêmes que pour un seul facteur : écrire un modèle statistique de Y fonction des facteurs ; estimer les effets des niveaux des deux facteurs ;

Les problèmes étudiés sont les mêmes que pour un seul facteur : écrire un modèle statistique de Y fonction des facteurs ; estimer les effets des niveaux des deux facteurs ; test d hypothèse

1 Analyse de variance à un facteur 2 3 Estimation des paramètres Tableau d analyse de variance Test d hypothèse Test d un facteur.

Le modèle le plus simple est d additionner les effets du facteur F 1 avec les effets du facteur F 2 : m ij = µ + α i + β j

Le modèle le plus simple est d additionner les effets du facteur F 1 avec les effets du facteur F 2 : m ij = µ + α i + β j où : - µ est l effet moyen - α i est l effet dû au niveau i du facteur F 1 ; - β j est l effet dû au niveau j du facteur F 2 ;

Le modèle le plus simple est d additionner les effets du facteur F 1 avec les effets du facteur F 2 : m ij = µ + α i + β j où : - µ est l effet moyen - α i est l effet dû au niveau i du facteur F 1 ; - β j est l effet dû au niveau j du facteur F 2 ; Puisque Y ij N (m ij, σ 2 ) on peut considérer un modèle : Y ij = µ + α i + β j + ε ij Avec comme contraintes p α i = 0 i=1 q β j = 0 j=1

Il faut trouver les valeurs de m ij (ou de µ, α i, β j ) qui minimisent la fonction : T ((m ij ) ij ) = p q ε 2 ij = p q (Y ij m ij ) 2 = p q (Y ij µ α i β j ) 2 i=1 j=1 i=1 j=1 i=1 j=1 On utilise la même technique que pour l analyse de variance à un facteur, et on obtient : ˆα i = Y i Y ˆβ i = Y j Y ˆµ = Y La valeur prédite pour Y ij est : Ŷ ij = ˆµ + ˆα i + ˆβ j = Y i + Y j Y

Exemple. Analyse de variance à un facteur F1 : le régime alimentaire, prend 3 valeurs (A, B, C), donc p = 3. F2 : l exploitation, prend 2 valeurs (1 et 2), donc q = 2.

Exemple. Analyse de variance à un facteur F1 : le régime alimentaire, prend 3 valeurs (A, B, C), donc p = 3. F2 : l exploitation, prend 2 valeurs (1 et 2), donc q = 2. Modèle statistique : Y ij = µ + α i + β j i = 1, 2, 3 j = 1, 2 où : α i est l effet de l exploitation n i sur Y, β 1 est l effet du régime A sur la production laitière...

Estimations Analyse de variance à un facteur ˆµ = ȳ = 20,

Estimations Analyse de variance à un facteur ˆµ = ȳ = 20, ˆα 1 = ȳ 1 ȳ = 10 20 = 10, ˆα 2 = 20, ˆα 3 = 10,

Estimations Analyse de variance à un facteur ˆµ = ȳ = 20, ˆα 1 = ȳ 1 ȳ = 10 20 = 10, ˆα 2 = 20, ˆα 3 = 10, ˆβ 1 = ȳ 1 ȳ = 15 20 = 5, ˆβ 2 = 5.

Estimations Analyse de variance à un facteur ˆµ = ȳ = 20, ˆα 1 = ȳ 1 ȳ = 10 20 = 10, ˆα 2 = 20, ˆα 3 = 10, ˆβ 1 = ȳ 1 ȳ = 15 20 = 5, ˆβ 2 = 5. La prévision de Y 11 (exploitation 1 et régime alimentaire A) : Ŷ 11 = ˆµ + ˆα 1 + ˆβ 1 = 20 10 5 = 5.

Tableau d analyse de variance En partant de l identité : Y ij Y = (Y ij Y i Y j + Y ) + (Y i Y ) + (Y j Y )

Tableau d analyse de variance En partant de l identité : Y ij Y = (Y ij Y i Y j + Y ) + (Y i Y ) + (Y j Y ) On obtient : (Y ij Y ) 2 = (Y ij Y i Y j +Y ) 2 +q i,j i,j ou encore ST = SR + S F 1 + S F 2. p (Y i Y ) 2 +p i=1 q (Y j Y ) j=1

Tableau d analyse de variance En partant de l identité : Y ij Y = (Y ij Y i Y j + Y ) + (Y i Y ) + (Y j Y ) On obtient : (Y ij Y ) 2 = (Y ij Y i Y j +Y ) 2 +q i,j i,j ou encore ST = SR + S F 1 + S F 2. p (Y i Y ) 2 +p Source de variation ddl S.C. Carré moyen F1 p 1 S F 1 S F 1 /(p 1) F2 q 1 S F 2 S F 2 /(q 1) Résidu (p 1)(q 1) SR SR/(p 1)(q 1) Totale pq 1 ST i=1 q (Y j Y ) j=1

Tests Analyse de variance à un facteur Deux types d hypothèse : si le modèle significatif

Tests Analyse de variance à un facteur Deux types d hypothèse : si le modèle significatif ou effet de chaque facteur.

Tests Analyse de variance à un facteur Deux types d hypothèse : si le modèle significatif ou effet de chaque facteur. Modèle significatif? Le modèle n est pas significatif si aucun des deux facteurs n influence Y :

Tests Analyse de variance à un facteur Deux types d hypothèse : si le modèle significatif ou effet de chaque facteur. Modèle significatif? Le modèle n est pas significatif si aucun des deux facteurs n influence Y : H 0 : α 1 = = α p = β 1 = = β q = 0 contre : H 1 : i {1,..., p} ou j {1,..., q} t.q. α i 0 ou β i 0.

Tests Analyse de variance à un facteur Deux types d hypothèse : si le modèle significatif ou effet de chaque facteur. Modèle significatif? Le modèle n est pas significatif si aucun des deux facteurs n influence Y : H 0 : α 1 = = α p = β 1 = = β q = 0 contre : H 1 : i {1,..., p} ou j {1,..., q} t.q. α i 0 ou β i 0. Le modèle réduit est : Y ij = µ + ε ij.

Tests Analyse de variance à un facteur Deux types d hypothèse : si le modèle significatif ou effet de chaque facteur. Modèle significatif? Le modèle n est pas significatif si aucun des deux facteurs n influence Y : H 0 : α 1 = = α p = β 1 = = β q = 0 contre : H 1 : i {1,..., p} ou j {1,..., q} t.q. α i 0 ou β i 0. Le modèle réduit est : Y ij = µ + ε ij. Statistique de test : Z = (S F 1 + S F 2 )/(p + q 2) SR/(p 1)(q 1) F (p+q 2, (p 1)(q 1)) sous H 0

Test d un facteur Analyse de variance à un facteur Supposons que l on veut tester l effet de F1. H 0 : F1 n influe pas Y sachant que F2 est dans le modèle. H 0 : α 1 = = α p = 0 contre H 1 : i {1,..., p} t.q. α i 0. Le modèle réduit est : Y ij = µ + β j + ε ij.

Test d un facteur Analyse de variance à un facteur Supposons que l on veut tester l effet de F1. H 0 : F1 n influe pas Y sachant que F2 est dans le modèle. H 0 : α 1 = = α p = 0 contre H 1 : i {1,..., p} t.q. α i 0. Le modèle réduit est : Y ij = µ + β j + ε ij.(modèle à un facteur)

Test d un facteur Analyse de variance à un facteur Supposons que l on veut tester l effet de F1. H 0 : F1 n influe pas Y sachant que F2 est dans le modèle. H 0 : α 1 = = α p = 0 contre H 1 : i {1,..., p} t.q. α i 0. Le modèle réduit est : Y ij = µ + β j + ε ij.(modèle à un facteur) H 0 : la moyenne m ij ne dépend pas de i.

Test d un facteur Analyse de variance à un facteur Supposons que l on veut tester l effet de F1. H 0 : F1 n influe pas Y sachant que F2 est dans le modèle. H 0 : α 1 = = α p = 0 contre H 1 : i {1,..., p} t.q. α i 0. Le modèle réduit est : Y ij = µ + β j + ε ij.(modèle à un facteur) H 0 : la moyenne m ij ne dépend pas de i. Statistique de test : Z = (S F 1)/(p 1) SR/(p 1)(q 1) F (p 1, (p 1)(q 1)) sous H 0

Exemple. Analyse de variance à un facteur Le tableau d analyse de variance est : Source de variation ddl S.C. Carré moyen F1 2 1200 600 F2 1 150 150 Résidu 2 28 14 Totale 5 1378

Exemple. Analyse de variance à un facteur Le tableau d analyse de variance est : Source de variation ddl S.C. Carré moyen F1 2 1200 600 F2 1 150 150 Résidu 2 28 14 Totale 5 1378 Significativité du modèle : H 0 : α 1 = α 2 = α 3 = β 1 = β 2 = 0 : Z =

Exemple. Analyse de variance à un facteur Le tableau d analyse de variance est : Source de variation ddl S.C. Carré moyen F1 2 1200 600 F2 1 150 150 Résidu 2 28 14 Totale 5 1378 Significativité du modèle : H 0 : α 1 = α 2 = α 3 = β 1 = β 2 = 0 : Z = (S F 1 + S F 2 )/(3 + 2 2) SR/2 F (3, 2) sous H 0

Exemple. Analyse de variance à un facteur Le tableau d analyse de variance est : Source de variation ddl S.C. Carré moyen F1 2 1200 600 F2 1 150 150 Résidu 2 28 14 Totale 5 1378 Significativité du modèle : H 0 : α 1 = α 2 = α 3 = β 1 = β 2 = 0 : Z = (S F 1 + S F 2 )/(3 + 2 2) SR/2 F (3, 2) sous H 0 ZA = [0 ; f 3,2:0.95 ] = [0 ; 19.2],

Exemple. Analyse de variance à un facteur Le tableau d analyse de variance est : Source de variation ddl S.C. Carré moyen F1 2 1200 600 F2 1 150 150 Résidu 2 28 14 Totale 5 1378 Significativité du modèle : H 0 : α 1 = α 2 = α 3 = β 1 = β 2 = 0 : Z = (S F 1 + S F 2 )/(3 + 2 2) SR/2 F (3, 2) sous H 0 ZA = [0 ; f 3,2:0.95 ] = [0 ; 19.2], z obs = 1350/3 14 = 32.1 ZA.

Exemple. Analyse de variance à un facteur Le tableau d analyse de variance est : Source de variation ddl S.C. Carré moyen F1 2 1200 600 F2 1 150 150 Résidu 2 28 14 Totale 5 1378 Significativité du modèle : H 0 : α 1 = α 2 = α 3 = β 1 = β 2 = 0 : Z = (S F 1 + S F 2 )/(3 + 2 2) SR/2 F (3, 2) sous H 0 ZA = [0 ; f 3,2:0.95 ] = [0 ; 19.2], z obs = 1350/3 14 = 32.1 ZA. Donc H 0 est rejetée et le modèle est significatif.

Régime alimentaire influent? H 0 : α 1 = α 2 = α 3 = 0 sachant que l exploitation est dans le modèle.

Régime alimentaire influent? H 0 : α 1 = α 2 = α 3 = 0 sachant que l exploitation est dans le modèle. H 1 : i {1, 2, 3} t.q. α i 0.

Régime alimentaire influent? H 0 : α 1 = α 2 = α 3 = 0 sachant que l exploitation est dans le modèle. H 1 : i {1, 2, 3} t.q. α i 0. Sous H 0 : Y ij = µ + β j + ε ij, i = 1, 2, 3, j = 1, 2.

Régime alimentaire influent? H 0 : α 1 = α 2 = α 3 = 0 sachant que l exploitation est dans le modèle. H 1 : i {1, 2, 3} t.q. α i 0. Sous H 0 : Y ij = µ + β j + ε ij, i = 1, 2, 3, j = 1, 2. La statistique de test Z = S F 1/2 SR/2 suit la loi F (2, 2) sous H 0.

Régime alimentaire influent? H 0 : α 1 = α 2 = α 3 = 0 sachant que l exploitation est dans le modèle. H 1 : i {1, 2, 3} t.q. α i 0. Sous H 0 : Y ij = µ + β j + ε ij, i = 1, 2, 3, j = 1, 2. La statistique de test Z = S F 1/2 SR/2 suit la loi F (2, 2) sous H 0. ZA = [0 ; f 2,2:0.95 ] = [0 ; 19.0],

Régime alimentaire influent? H 0 : α 1 = α 2 = α 3 = 0 sachant que l exploitation est dans le modèle. H 1 : i {1, 2, 3} t.q. α i 0. Sous H 0 : Y ij = µ + β j + ε ij, i = 1, 2, 3, j = 1, 2. La statistique de test Z = S F 1/2 SR/2 suit la loi F (2, 2) sous H 0. ZA = [0 ; f 2,2:0.95 ] = [0 ; 19.0], z = 600 14 = 42.86 ZA.

Régime alimentaire influent? H 0 : α 1 = α 2 = α 3 = 0 sachant que l exploitation est dans le modèle. H 1 : i {1, 2, 3} t.q. α i 0. Sous H 0 : Y ij = µ + β j + ε ij, i = 1, 2, 3, j = 1, 2. La statistique de test Z = S F 1/2 SR/2 suit la loi F (2, 2) sous H 0. ZA = [0 ; f 2,2:0.95 ] = [0 ; 19.0], z = 600 14 = 42.86 ZA. Donc H 0 est rejetée, le régime alimentaire est un facteur influent pour la production laitière.

1 Analyse de variance à un facteur 2 3 Estimation des paramètres Tableau d analyse de variance Test d hypothèse Test d un facteur.

Par exemple, si on utilise deux engrais simultanément, on espère que l action des engrais se complète et que les plantes se développent mieux du fait de cette concomitance.

Par exemple, si on utilise deux engrais simultanément, on espère que l action des engrais se complète et que les plantes se développent mieux du fait de cette concomitance. On peut ainsi mesurer l influence de divers dosages de chacun des engrais.

Par exemple, si on utilise deux engrais simultanément, on espère que l action des engrais se complète et que les plantes se développent mieux du fait de cette concomitance. On peut ainsi mesurer l influence de divers dosages de chacun des engrais. L interaction peut être bénéfique (synergie) ou néfaste (antagonisme).

Par exemple, si on utilise deux engrais simultanément, on espère que l action des engrais se complète et que les plantes se développent mieux du fait de cette concomitance. On peut ainsi mesurer l influence de divers dosages de chacun des engrais. L interaction peut être bénéfique (synergie) ou néfaste (antagonisme). p valeurs pour le facteur F 1, q pour le facteur F 2, r observations pour chaque couple de facteur.

Le modèle est Y ijk = m ij + γ ij + ɛ ijk que l on écrit :Y ijk = µ + α i + β j + γ ij + ɛ ijk Les ɛ ijk sont des v.a. Normales, centrées et de même écart-type σ.

Le modèle est Y ijk = m ij + γ ij + ɛ ijk que l on écrit :Y ijk = µ + α i + β j + γ ij + ɛ ijk Les ɛ ijk sont des v.a. Normales, centrées et de même écart-type σ. Contraintes : α i = 0 i β j = 0 j γ ij = 0 ij

Le modèle est Y ijk = m ij + γ ij + ɛ ijk que l on écrit :Y ijk = µ + α i + β j + γ ij + ɛ ijk Les ɛ ijk sont des v.a. Normales, centrées et de même écart-type σ. Contraintes : α i = 0 i β j = 0 j γ ij = 0 ij Lien entre (m ij ) et (α i ), (β j ), (γ ij ) α i = m i. m.., β j = m.j m.., γ ij = m ij m i. m.j + m..

Les hypothèses à tester peuvent être H O : α 1 = α 2 = = α p = 0 ou m 1. = m 2. = = m p. ou H O : β 1 = β 2 = = β p = 0 ou m.1 = m.2 = = m.p

Les hypothèses à tester peuvent être ou H O : α 1 = α 2 = = α p = 0 ou m 1. = m 2. = = m p. H O : β 1 = β 2 = = β p = 0 ou m.1 = m.2 = = m.p ou l absence d interactions : H 0 : γ 11 = γ 12 = = γ pq = 0

On calcule les sommes des carrés des écarts S F 1 = qr i (y i ȳ ) 2 (p 1) ddl S F 2 = pr j (y j ȳ ) 2 (q 1) ddl S F 12 = ST S F 1 S F 2 SR (p 1)(q 1) ddl SR = ijk (y ijk ȳ ij ) 2 pq(r 1) ddl ST = ijk (y ijk ȳ ) 2 (rpq 1) ddl

Tableau d analyse de la variance Sources ddl Sommes Carrés moyens 1er facteur p 1 S F 1 S F 1 /(p 1) 2ème facteur q 1 S F 2 SM F 2 /(q 1) Interaction (p 1)(q 1) S F 12 S F 12 /((p 1)(q 1)) Résidus pq(r 1) SR SR/(pq(r 1)) Totaux pqr 1 ST

On commence par tester l interaction

On commence par tester l interaction : sous H 0, f F 12 = S F 12/((p 1)(q 1)) SR/(pq(r 1)) suit la loi de Fisher ((p 1)(q 1), pq(r 1)).

On commence par tester l interaction : sous H 0, f F 12 = S F 12/((p 1)(q 1)) SR/(pq(r 1)) suit la loi de Fisher ((p 1)(q 1), pq(r 1)). On rejette H 0 lorsque f F 12 dépasse le fractile d ordre 1 α de cette loi. Si on accepte H 0 (pas d interaction), on teste l influence de F 1 puis de F 2 :

En l absence d interaction, sous H 0 (respectivement H 0 ) f F 1 = S F 1/(p 1) SR/pq(r 1) et f F 2 = S F 2/(q 1) SR/pq(r 1) suivent des lois de Fisher à (p 1, pq(r 1)) (respectivement (q 1, pq(r 1))) degrés de liberté. On rejette l hypothèse H 0 (ou H 0 ) si la valeur f observée est supérieure au fractile d ordre 1 α de la loi en question.

1 Analyse de variance à un facteur 2 3 Estimation des paramètres Tableau d analyse de variance Test d hypothèse Test d un facteur.

Exemples Analyse de variance à un facteur On sélectionne plusieurs régions (1er facteur), puis, à l intérieur de chacune des régions, plusieurs exploitations agricoles (2ème facteur), et on mesure la quantité de lait produite annuellement par r vaches dans chacune des exploitations : y ijk.

Exemples Analyse de variance à un facteur On sélectionne plusieurs régions (1er facteur), puis, à l intérieur de chacune des régions, plusieurs exploitations agricoles (2ème facteur), et on mesure la quantité de lait produite annuellement par r vaches dans chacune des exploitations : y ijk.

Exemples Analyse de variance à un facteur On sélectionne plusieurs régions (1er facteur), puis, à l intérieur de chacune des régions, plusieurs exploitations agricoles (2ème facteur), et on mesure la quantité de lait produite annuellement par r vaches dans chacune des exploitations : y ijk. : aucune raison d avoir un lien entre les exploitations n 1 de chacun des régions. y i : moyenne des exploitations de la région i

Exemples Analyse de variance à un facteur On sélectionne plusieurs régions (1er facteur), puis, à l intérieur de chacune des régions, plusieurs exploitations agricoles (2ème facteur), et on mesure la quantité de lait produite annuellement par r vaches dans chacune des exploitations : y ijk. : aucune raison d avoir un lien entre les exploitations n 1 de chacun des régions. y i : moyenne des exploitations de la région i : intéressant. y j : moyenne des j-ièmes exploitations de chaque région

Exemples Analyse de variance à un facteur On sélectionne plusieurs régions (1er facteur), puis, à l intérieur de chacune des régions, plusieurs exploitations agricoles (2ème facteur), et on mesure la quantité de lait produite annuellement par r vaches dans chacune des exploitations : y ijk. : aucune raison d avoir un lien entre les exploitations n 1 de chacun des régions. y i : moyenne des exploitations de la région i : intéressant. y j : moyenne des j-ièmes exploitations de chaque région : non pertinent.

Modèle : Y ijk = µ + α i + β j i + ɛ ijk

Modèle : Y ijk = µ + α i + β j i + ɛ ijk µ : production moyenne α i : apport de la région i β i j : apport de l exploitation j dans la région i

Modèle : Y ijk = µ + α i + β j i + ɛ ijk µ : production moyenne α i : apport de la région i β i j : apport de l exploitation j dans la région i ɛ ijk : vaiid Normale centrée et de variance σ 2.

Décomposition de la variance y ijk y = (y i y ) + (y ij y i ) + (y ijk y ij ) ST = ijk (Y ijk Y ) 2 = ijk [ (Yi Y ) 2 + (Y ij Y i ) 2 + (Y ijk Y ij ) 2] = qr i (Y i Y ) 2 + r jk (Y ij Y i ) 2 + ijk (Y ijk Y ij ) 2 = SM a + SM b a + SR

Tableau d analyse de la variance Sources ddl Sommes Carrés moyens 1er facteur p 1 SM a SM a /(p 1) 2ème facteur p(q 1) SM b a SM b a /(p(q 1)) Résidus pq(r 1) SR SR/(pq(r 1)) Totaux pqr 1 ST

On peut tester Si le 1er facteur a une influence : H 0 : a 1 =... = a p = 0 On calcule (SM a /(p 1))/(SM b a /p(q 1)) et on le compare à F 1 α;p 1;p(q 1) Si le 2ème facteur une influence à l intérieur du 1er H 0 : β j i = 0, pour tous i et j. On calcule SM b a /(p(q 1))/(SR/(pq(r 1))) et on le compare à F 1 α;p(q 1),pq(r 1)

Exemple : Rendement fourrager dans 2 types de prairies, 3 prairies pour chacun des 2 types, 5 parcelles dans chacune des 3 2 prairies. n Type 1 Type 2 Pr. 1 Pr. 2 Pr. 3 Pr. 1 Pr. 2 Pr. 3 1 2.06 1.59 1.92 2.91 1.57 2.43 2 2.99 2.63 1.85 3.27 1.82 2.17 3 1.98 1.98 2.14 3.45 2.69 2.37 4 2.95 2.25 1.33 3.92 3.25 2.89 5 2.70 2.09 1.83 4.34 3.11 2.24

Exemple : Rendement fourrager dans 2 types de prairies, 3 prairies pour chacun des 2 types, 5 parcelles dans chacune des 3 2 prairies. n Type 1 Type 2 Pr. 1 Pr. 2 Pr. 3 Pr. 1 Pr. 2 Pr. 3 1 2.06 1.59 1.92 2.91 1.57 2.43 2 2.99 2.63 1.85 3.27 1.82 2.17 3 1.98 1.98 2.14 3.45 2.69 2.37 4 2.95 2.25 1.33 3.92 3.25 2.89 5 2.70 2.09 1.83 4.34 3.11 2.24 On calcule les moyennes pour chacune des prairies : 2.536, 2.108, 1.814 et 3.578, 2.488, 2.420. La moyenne globale est égale à 2.491. On a SM a = 3.427, SM b a = 5.541, SR = ST SM a SM b a = 5.742

On obtient le tableau d analyse de la variance Sources ddl Sommes Carrés moyens Type p 1 = 1 SM a = 3.427 SM a /(p 1) = 3.427 Prairie p(q 1) = 4 SM b a = 5.541 SM b a /(p(q 1)) = 1.385 Résidus pq(r 1) = 24 SR = 5.742 SR/(pq(r 1)) = 0.239 Totaux pqr 1 = 29 ST = 14.710

On peut tester : Si le 1er facteur a une influence : SM a /(p 1) SM b a /(p(q 1)) = 3.427 1.385 = 2.474

On peut tester : Si le 1er facteur a une influence : SM a /(p 1) SM b a /(p(q 1)) = 3.427 1.385 = 2.474 à comparer avec F 0.95;1;4 = 7.71 : non significatif

On peut tester : Si le 1er facteur a une influence : SM a /(p 1) SM b a /(p(q 1)) = 3.427 1.385 = 2.474 à comparer avec F 0.95;1;4 = 7.71 : non significatif Si le 2ème facteur a une influence à l intérieur du 1er : SM b a /(p(q 1) SR/(pq(r 1)) = 1.385 0.239 = 5.79

On peut tester : Si le 1er facteur a une influence : SM a /(p 1) SM b a /(p(q 1)) = 3.427 1.385 = 2.474 à comparer avec F 0.95;1;4 = 7.71 : non significatif Si le 2ème facteur a une influence à l intérieur du 1er : SM b a /(p(q 1) SR/(pq(r 1)) = 1.385 0.239 = 5.79 à comparer avec F 0.95;4;24 = 2.8 : significatif

On peut tester : Si le 1er facteur a une influence : SM a /(p 1) SM b a /(p(q 1)) = 3.427 1.385 = 2.474 à comparer avec F 0.95;1;4 = 7.71 : non significatif Si le 2ème facteur a une influence à l intérieur du 1er : SM b a /(p(q 1) SR/(pq(r 1)) = 1.385 0.239 = 5.79 à comparer avec F 0.95;4;24 = 2.8 : significatif Cela signifie que le type de prairie n a pas d influence significative sur le rendement fourrager,

On peut tester : Si le 1er facteur a une influence : SM a /(p 1) SM b a /(p(q 1)) = 3.427 1.385 = 2.474 à comparer avec F 0.95;1;4 = 7.71 : non significatif Si le 2ème facteur a une influence à l intérieur du 1er : SM b a /(p(q 1) SR/(pq(r 1)) = 1.385 0.239 = 5.79 à comparer avec F 0.95;4;24 = 2.8 : significatif Cela signifie que le type de prairie n a pas d influence significative sur le rendement fourrager,mais que les prairies ne sont pas homogènes à l intérieur d un type donné.