Analyse de variance à un facteur

Documents pareils
Mesure avec une règle

Les jeunes économistes

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks

Exercices d Électrocinétique

Remboursement d un emprunt par annuités constantes

TD 1. Statistiques à une variable.

Chapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique

Montage émetteur commun

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

GEA I Mathématiques nancières Poly. de révision. Lionel Darondeau

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

Grandeur physique, chiffres significatifs

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES

PREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174)

Chapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3.

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF

DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS

STATISTIQUE AVEC EXCEL

Editions ENI. Project Collection Référence Bureautique. Extrait

ÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS.

IDEI Report # 18. Transport. December Elasticités de la demande de transport ferroviaire: définitions et mesures

Calcul de tableaux d amortissement

Fiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage

Généralités sur les fonctions 1ES

Corrigé du problème de Mathématiques générales Partie I

Économétrie. Annexes : exercices et corrigés. 5 e édition. William Greene New York University

Dirigeant de SAS : Laisser le choix du statut social

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.

COMPARAISON DE MÉTHODES POUR LA CORRECTION

Corrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio

CHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES

BUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES

Page 5 TABLE DES MATIÈRES

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.

UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS

Les prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe

GATE Groupe d Analyse et de Théorie Économique DOCUMENTS DE TRAVAIL - WORKING PAPERS W.P Préférences temporelles et recherche d emploi

hal , version 1-14 Aug 2009

MODÈLE D ISING À UNE ET DEUX DIMENSIONS.

1.0 Probabilité vs statistique Expérience aléatoire et espace échantillonnal Événement...2

Pratique de la statistique avec SPSS

I. Présentation générale des méthodes d estimation des projets de type «unité industrielle»

INTRODUCTION. Jean-Pierre MAGNAN Chef de la section des ouvrages en terre Département des sols et fondations Laboratoire central

Système solaire combiné Estimation des besoins énergétiques

Prêt de groupe et sanction sociale Group lending and social fine

Interface OneNote 2013

VIELLE Marc. CEA-IDEI Janvier La nomenclature retenue 3. 2 Vue d ensemble du modèle 4

Paquets. Paquets nationaux 1. Paquets internationaux 11

LA SURVIE DES ENTREPRISES DÉPEND-ELLE DU TERRITOIRE D'IMPLANTATION?

EH SmartView. Identifiez vos risques et vos opportunités. Pilotez votre assurance-crédit. Services en ligne Euler Hermes

La Quantification du Risque Opérationnel des Institutions Bancaires

Thermodynamique statistique Master Chimie Université d Aix-Marseille. Bogdan Kuchta

L enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir

CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE?

MEMOIRE. Présenté au département des sciences de la matière Faculté des sciences

1. Les enjeux de la prévision du risque de défaut de paiement

Impôt sur la fortune et investissement dans les PME Professeur Didier MAILLARD

santé Les arrêts de travail des séniors en emploi

CHAPITRE DEUX : FORMALISME GEOMETRIQUE

Dynamique du point matériel

RAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD

Terminal numérique TM 13 raccordé aux installations Integral 33

Integral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation

Documents de travail. «La taxe Tobin : une synthèse des travaux basés sur la théorie des jeux et l économétrie» Auteurs

La théorie classique de l information. 1 ère partie : le point de vue de Kolmogorov.

Intégration financière et croissance économique : évidence empirique dans. la région MENA

Semestre : 4 Module : Méthodes Quantitatives III Elément : Mathématiques Financières Enseignant : Mme BENOMAR

Réseau RRFR pour la surveillance dynamique : application en e-maintenance.

Stéganographie Adaptative par Oracle (ASO)

Projet de fin d études

P R I S E E N M A I N R A P I D E O L I V E 4 H D

THESE. Khalid LEKOUCH

UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE

TRAVAUX PRATIQUES SPECTRO- COLORIMETRIE

Prise en compte des politiques de transport dans le choix des fournisseurs

DOIT-ON UTILISER LA STANDARDISATION DIRECTE OU INDIRECTE DANS L ANALYSE DE

OPTIMALITÉ DU MÉCANISME DE RATIONNEMENT DE CRÉDIT DANS LE MODÈLE ISLAMIQUE DE FINANCEMENT

Une analyse économique et expérimentale de la fraude à l assurance et de l audit

Pro2030 GUIDE D UTILISATION. Français

TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1

II - Notions de probabilité. 19/10/2007 PHYS-F-301 G. Wilquet 1

Étranglement du crédit, prêts bancaires et politique monétaire : un modèle d intermédiation financière à projets hétérogènes

Analyse des Performances et Modélisation d un Serveur Web

EURIsCO. Cahiers de recherche. Cahier n L épargne des ménages au Maroc : Une analyse macroéconomique et microéconomique.

- Acquisition de signaux en sismologie large bande. - Acquisition de signaux lents, magnétisme, MT.

Evaluation de performances d'ethernet commuté pour des applications temps réel

Be inspired. Numéro Vert. Via Caracciolo Milano tel fax

LICENCE DE SCIENCES PHYSIQUES UV 3LSPH50. Année MODÉLISATION. Recherche des paramètres d'une représentation analytique J.P.

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à

Afflux de capitaux, taux de change réel et développement financier : évidence empirique pour les pays du Maghreb

CONSERVATOIRE NATIONAL DES ARTS ET METIERS

Pour plus d'informations, veuillez nous contacter au ou à

INTERNET. Initiation à

Le Prêt Efficience Fioul

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

Transcription:

MAT738 Chaptre 6 Analse de varance On présente c quelques cas partculers d un modèle lnéare général dans lequel les varables explcatves sont qualtatves. Ce sont des modèles d analse de plans d expérence dans lesquels des valeurs d une varables sont classées selon les condtons dans lesquelles elles ont été observées, ou le tratement qu a été applqué. Comme, par exemple, la récolte de céréales dans pluseurs terrans, classée selon le tpe d engras utlsé. Les tratements peuvent être caractérsés par un seul «facteur» (tpe d engras, par exemple); ou par plus d un, comme, par exemple, le tpe d engras et l espèce de céréale. On parle alors d un modèle à un facteur, à deux facteurs, etc. 6. Le modèle Analse de varance à un facteur L'analse de varance à un facteur fournt un test qu généralse le «test de Student» pour comparer deux moennes: on compare moennes ( ) au leu de. Exemple 6.. Le tableau suvant présente les résultats d'une expérence conçue pour détermner s la source des proténes dans l'almentaton des poussns a un effet sur leur taux de crossance. Un groupe de 60 poussns sont réparts en 3 groupes, chacun recevant une almentaton dont les proténes provennent d'une source dfférente : bœuf, céréales, ou porc. Boeuf Céréales Porc Boeuf Céréales Porc 90 07 49 73 98 94 76 95 8 0 74 79 90 97 73 8 56 96 64 80 86 04 98 86 98 8 8 95 0 5 74 97 07 88 0 7 74 06 00 8 08 90 67 70 87 77 9 95 89 6 7 86 0 78 58 8 9 05 La premère queston posée est la suvante : a-t-l des dfférences entre les dfférentes sources de proténes (quant à leur effet sur la crossance)? Le graphque suvant en donne une premère dée : REG06AnovaCourtH avrl 0

Pods 50 60 70 80 90 0 MAT738 Analse de varance Boeuf Céréales Porc Source À premère vue, les dfférences ne semblent pas être très mportantes : les écarts entre les médanes semblent mneurs lorsqu'on les compare aux varatons de pods. Voc, pour quantfer ces observatons, les moennes et les varances de pour chaque groupe : Bœuf Céréales Porc Échantllon complet Moennes 89,6 84,9 88, 87,56667 Varances 33,763 4,836 57,64 60,354 Une étude comme celle décrte au derner exemple llustre un plan d'expérence classque destné à détermner l'effet de dfférents tratements sur les valeurs d'une varable aléatore. La démarche est la suvante : On répartt un échantllon de n ndvdus en groupes ; chaque groupe subt un tratement dfférent ; on observe les valeurs de sur toutes les untés de l'échantllon ; on décde s les dfférences entre est groupes sont sgnfcatve à la lumère des moennes des groupes et de leurs varance. Il n'est pas oblgatore, ben que préférable, que les effectfs des groupes soent les mêmes. Exemple 6.. Les données suvantes sont des ndces de la dstorson du son produt par des bandes magnétques [Battacharra, Gour K., Johnson, Rchard A. (977) Statstcal concepts and methods, Wle, New Yor, p.50]. Les bandes magnétques appartennent à 4 catégores, A, B, C et D, qu dffèrent selon le tpe d endut qu les recouvre. Le but de l'analse est de détermner s le tpe d endut a un effet sur la qualté du son, telle que mesurée par l'ndce de dstorson. Indces de dstorson de quatre tpes de bandes magnétques A B C D 0 4 7 5 8 6 5 8 4 7 5 5 5 5 7 6 5 5 8 REG06AnovaCourtH avrl 0

MAT738 Analse de varance 3 Nous décrrons le modèle qu servra à l'analse. Le lecteur peut garder en mémore le derner exemple de façon à concrétser la descrpton. Les données sont classées en catégores ( = 4 dans l exemple), la e catégore aant n observatons, =,...,. Sot j la j e observaton de la catégore (dans l exemple 6.., l'ndce de dstorson de la j e bande de la catégore ). Les données peuvent être présentées dans le format suvant : T T... T...... Nous supposons que n Moennes.. Varances S... n n..... S j = + j où les j sont ndépendantes et j ~ (0 ; ).. S S Les paramètres nconnus du modèle sont,...,µ et. Nous acceptons c comme en régresson lnéare une hpothèse d'homoscédastcté : même varance pour tous les j. L'objectf usuel d'une analse de varance est de détermner s'l a des dfférences entre les populatons, c'est-à-dre de tester l'hpothèse L'alternatve est la négaton de H o : H o : = = = H o : au mons une des égaltés = j ( j) n est pas vérfée 6. Décomposton des sommes de carrés Défnssons. = n j j n La somme des carrés totale, SCT, est,.. SCT = = n j j n = n ( j.. ) j n Cette somme peut être décomposée en deux sommes de carrés, la somme des carrés explquée SCE, et la somme des carrés résduelle, SCR où SCE = n(... ), et SCR = Nous pouvons alors démontrer que SCT = SCE + SCR n n ( j. ) j n ( ) j j.. = n (... ) +. n ( j. ) j REG06AnovaCourtH 3 avrl 0

4 MAT738 Analse de varance Remarques SCT, la somme des carrés totale, est une mesure de la dsperson des j, ndépendamment des catégores. SCT = (n-)s, où S est la varance de toutes les données. La dsperson des j est en parte attrbuable au fat que les tratements sont dfférents. C'est la parte explquée SCE, une mesure des dfférences entre les dfférents tpes de bande magnétque, donc attrbuable aux tratements. On remarque que l'écart au carré globale est pondéré par la talle n du groupe. (... ) entre la moenne du groupe est la moenne SCR est la parte résduelle, la dsperson entre les bandes d'un même tpe, donc attrbuable au fat que ces mesures varent naturellement d'une bande à l'autre, même quand elles sont fabrquées de la même façon (même endut). Lorsque les µ sont égaux, les moennes échantllonnales devraent être assez rapprochées les unes des autres et SCE devrat être pette. Donc nous devrons rejeter H o s SCE est grand. Mas pour évaluer l'mportance de la somme SCE l faudrat la mettre en relaton avec la tendance naturelle que les ont à j varer, c'est-à-dre, SCR. Le test sera donc foncton du rapport SCE/SCR. 6.3 Proprétés des sommes de carrés Nous allons trer les proprétés fondamentales des sommes de carrés à partr d'un cas partculer très smple: le trage d'un seul échantllon d'une populaton normale. Théorème Sot,,, n n varables aléatores ndépendantes, toutes de lo(μ ; σ ), = n et S = n ) ~(μ ; σ /n) ) (n-)s /σ ~ n n ( ) n ) et S sont ndépendantes. Démonstratons. Alors ) Ce résultat découle du fat que toute combnason lnéare de varables normales ndépendantes est normale (Théorème..). ) Nous réécrrons la statstque (n-)s /σ sous forme matrcelle afn d'utlser les théorèmes du document 3 sur la dstrbuton de formes quadratques. Le vecteur = [ ; ; ; n ]' est de lo normale multdmensonnelle de moenne μe (où e est un vecteur de n ) et de matrce de covarance = σ I. On a, tout d'abord, (n-)s /σ n = ( ) = C où C = I-ee'/n, n car ( ) n n = ( ) / n = '-(e') /n = '-(e')(e')/n = '-'(ee/n)' = 'C. La statstque (n-)s /σ ' C s'écrt donc = z'cz, où z = /σ ~(μe ; I). On vérfe asément que C est dempotente et que Cμ = μce = 0. Donc d'après le corollare du théorème..3, z'cz ~ r où r = r(a). Il reste à détermner r = r(c). Pusque C est dempotente, d'après le théorème. du document 0, r(c) Ŕ tr(c) = tr(i)-tr(ee'/n) = tr(i)-tr(e'e/n) = n -. REG06AnovaCourtH 4 avrl 0

MAT738 Analse de varance 5 ) est foncton de e' et (n-)s /σ est foncton de 'C. Mas étant donné que C est dempotente et smétrque, 'C = 'CC = 'C'C = (C)'(C), ce qu veut dre que 'C est foncton de C. Il sufft donc d'établr l'ndépendance de deux fonctons lnéares e' et C. D'après le théorème 0.., l sufft de vérfer que e'c = 0, ce qu asément fat. Nous énonçons c quelques proprétés des sommes de carrés. SCR/ ~ et les sont ndépendantes de SCR. n. SCE/ ~ ( ) où = s H o est vrae. 3. SCR et SCE sont ndépendantes. n ( ) et = n 4. MCR = SCR/(n-) est un estmateur sans bas de. n. Donc = 0 s et seulement Table d'analse de varance Il exste comme avec la régresson une façon tradtonnelle de présenter les résultats d'une analse de varance. Nous ajoutons à la table usuelle une colonne d'espérances mathématques : Source Somme de carrés Degrés de lberté Moenne des carrés Explquée SCE = n (... ) - MCE = SCE Espérances des moennes des carrés n ( ) Résduelle SCR = Total SCT = n- MCR = SCR n ( j. ) j n n ( ) j j.. n- MCT = SCT n n ( ) n Les espérances c-dessus justfent le chox du rapport F = MCE/MCR, pusque MCE et MCR ont la même espérance s et seulement s H est vrae, alors que s H o o est fausse, MCE a tendance à être plus grand que MCR et le rapport F sera en conséquence grand. La dstrbuton de F est connue sous H o. Nous savons que lorsque H o est vrae, F = MCE MCR SCE /( ) = ~ -;n- SCR /( n ) Remarquez que l'espérance de MCR d'après la table d'analse de varance est et donc un estmateur sans bas de est MCR : ˆ = MCR = SCR n et donc la statstque F est une mesure rédute des écarts entre les moennes : n... ( ) F =. ˆ REG06AnovaCourtH 5 avrl 0

6 MAT738 Analse de varance Exemple numérque Revenons à l'exemple 6... Désgnons par Q la somme des carrés des écarts à l'ntéreur de la classe : Q = ( ) j. Les résultats sont présentés dans le tableau c-dessous. La moenne globale des quatre classes est = 5. A B C D Somme des carrés = = 7 = 6 3 = 5 4 SCE = n ( )... = 68 Q = 38 Q = 30 Q 3 = Q 4 = 4 SCR = j Q = 94 Voc la table d analse de varance: Source Somme de carrés dl Moenne des carrés F Explquée SCE = 68 3 MCE = 68/3 =,67 MCE MCR = 4,34 SCT = 6 Espérances des moennes des carrés Résduelle SCR = 94 8 MCR = 94 /8 = 5, σ Total SCT = 6 MCT = 6/ = 7,7 n ( ) n ( ) n Le pont crtque de nveau = 0,05 pour une 3,8 est F 3,8;0,05 = 3,6. Pusque F = 4,34 > 3,6, les dfférences sont sgnfcatves. Voc les résultats d'une analse de varance fate avec le logcel R. > anova(lm(~bande)) Analss of Varance Table Response: Df Sum Sq Mean Sq F value Pr(>F) bande 3 68.000.667 4.3404 0.084 * Resduals 8 94.000 5. La valeur p (colonne «Pr(>F)») représente la probablté, sous Ho, qu une statstque de lo 3;8 prenne une valeur supéreure ou égale à 4,3404 est 0,084. Cec montre que les dfférences entre les bandes sont sgnfcatves, du mons au nveau de %. 6.4 Estmaton des paramètres Les µ sont des paramètres qu'on peut également estmer par la méthode des mondres carrés. Nous chosssons les valeurs µ qu mnmsent la somme des carrés des écarts entre les observatons j et leurs moennes µ j qu dans ce modèle dépendent de mas pas de j: Q = n ( ) j j j = n ( ) j j Nous pouvons mnmser chaque somme n ( ) j j séparément par rapport à µ, et l est ben REG06AnovaCourtH 6 avrl 0

MAT738 Analse de varance 7 connu que la valeur ˆ de µ qu mnmse cette somme de carrés est ˆ = Pour détermner un ntervalle de confance pour, nous utlsons le fat que ~( ; /n ) et que T = ˆ / n où ˆ = ~ t n-. Donc un ntervalle de confance est donné par t ˆ t ˆ n ; / n ; / n ˆ. Nous avons ˆ MCR = 5, et avec = 0,05, tn-;/ =,0. Un ntervalle de con- 5, 5, fance pour est donné par [,0 ;,0 ] = [9,85 ; 4,5]. 5 5 Certanes des quanttés qu ntervennent dans ces calculs sont fournes par le logcel : > a<-lm(~bande) > b<-predct.lm(a,data.frame(bande=""),se.ft=t) > b $ft [] $se.ft [].098 On a donc l estmaton ( ) =, et l écart-tpe estmé de est crtque t n-;/ =,00 est donné par la commande > talpha<-qt(.975,8) > talpha [].009 ˆ ˆ n =,098. Le pont L ntervalle de confance est donc [-,00(,098) ; +,00(,098) ] = [9,85 ; 4,5]. En fat le calcul peut être entèrement fourn par R : > b<-predct.lm(a,data.frame(bande="a"),se.ft=t,nterval="confdence",level=.95) > b $ft ft lwr upr [,] 9.85898 4.470 $se.ft [].098 On peut obtenr ces résultats pour pluseurs paramètres à la fos (l ntervalle est à 95 % s le nveau n est pas précsé) : > predct.lm(a,data.frame(bande=c("a","b","c","d")),nterval="confdence") ft lwr upr 9.85898 4.470 7 4.599467 9.40053 3 6 4.85368 7.8463 4 5 3.039973 6.96003 REG06AnovaCourtH 7 avrl 0

8 MAT738 Analse de varance Une nterprétaton du numérateur de F Nous pouvons consdérer toute somme de carrés explquée comme une dfférence de sommes de carrés résduelles. La somme des carrés résduelle est, par défnton, n ( ˆ ) j j j, la somme des carrés des écarts entre les observatons et leur moenne estmée. Pusque on a SCR = ˆ j = ˆ = n ( ) j j Mas la somme des carrés totale est elle auss une somme de carrés résduelle : c est la somme des carrés résduelle dans le modèle j = µ + j, le modèle dans lequel les moennes des groupes sont toutes égales. Mas ce modèle est précsément le modèle stpulé par l'hpothèse nulle. On peut donc écrre SCT = n ( ) j j = SCR o où la notaton SCR o sgnfe qu'l s'agt d'une somme de carrés résduelle sous un modèle rédut, rédut par les contrantes de H o. La somme des carrés explquée, qu est la dfférence SCT - SCR peut alors s'écrre comme SCE = SCR o - SCR S est le nombre de degrés de lberté de SCR et o est le nombre de degrés de lberté de SCR o, alors le rapport F devent F = SCR o SCR /( o ) SCR / Cette formule est assez générale: le rapport F est toujours de cette forme. La dfférence SCR o - SCR, la somme des carrés explquée, représente la réducton d erreur due à l'ntroducton du modèle plus complexe. La dfférence o - représente la dfférence entre le nombre de degrés de lberté de SCR o et le nombre de degrés de lberté de SCR. Interprétaton de la statstque F lorsque les n sont égaux S n = = n = r, la moenne des carrés explquée peut s écrre comme MCE = statstque F peut s écrre comme F = ( ) ( ) ˆ varance échantllonnale des, dsons S, et donc estme la même chose s et seulement s les moen- nes sont égales. Snon, est «fausse». r ( ) ( ) ˆ = n (... ) la ( ) ( ). Le dénomnateur est une estmaton de la varance de. Le numérateur est la S estme + ( ) et prendra une valeur d autant plus élevée que H o ˆ r = REG06AnovaCourtH 8 avrl 0

MAT738 Analse de varance 9 Une autre paramétrsaton du modèle Une autre façon d'exprmer les paramètres du modèle est où les satsfont j = + + j = 0. Pusque E( j ) = +, nous avons forcément la relaton µ = µ +., ce qu permet d exprmer chaque µ en foncton de µ et de. Inversement, pusque µ = nµ + = nµ, on a µ = µ /n et = µ - µ, ce qu permet d exprmer µ et les en foncton des µ. Les deux modèles sont donc équvalents. L'ntenton dans cette deuxème paramétrsaton est de décomposer la moenne de la e classe en deux partes, l'une, µ, commune à toutes les classes, et l'autre,, propre à la e classe. C'est une paramétrsaton qu prévot l'hpothèse qu sera testée, sot = = = = 0. Elle a cependant quelques nconvénents causés par l'ntroducton de + au leu de paramètres: les et µ. Cet accrossement du nombre de paramètres n'est pas réel, pusqu'on ntrodut une contrante qu ramène à la dmenson de l'espace des paramètres. Mas ces manpulatons causent des dffcultés nutles. 6.5 Test d'ajustement à une drote Revenons à la régresson lnéare. Nous avons jusqu c posé, comme parte du modèle, l'hpothèse que l'espérance E( ) est une foncton lnéare o + x des x ŕ sans autre évdence que le nuage de ponts. Dans certans cas, cependant, l est possble de soumettre cette supposton à un test statstque. C'est le cas où une même valeur x est accompagnée de pluseurs valeurs de,,,...,. Sot x, x, x les n valeurs dstnctes de x. (Il a en tout n = n observatons, mas seulement valeurs dstnctes de x.) Le modèle de régresson s'écrt o : j = o + x + j Mas pour tester cette hpothèse de lnéarté, nous commençons par un modèle plus général, dans lequel nous n'mposons pas la lnéarté, sot : j = + j Or le modèle est le modèle d'analse de varance ntrodut dans ce chaptre et le modèle o est le modèle de régresson ntrodut au chaptre 4. Nous pouvons, dans le modèle, tester l'hpothèse que le modèle o s'applque, c'est-à-dre, l'hpothèse lnéare = o + x Le rapport F pour tester cette hpothèse aura pour numérateur une somme de carrés explquée exprmée comme la dfférence de deux somme de carrés résduelles, SCE = SCR o - SCR, où SCR est smplement la somme des carrés résduelle dans le modèle et SCR o est la somme des carrés résduelle dans le modèle rédut par l'hpothèse nulle, sot le modèle o. Nous avons déjà des formules pour ces sommes de carrés: SCR = n j j. ( ) REG06AnovaCourtH 9 avrl 0

0 MAT738 Analse de varance SCR o = n j ( ˆ ˆ x ) j o où ˆ o et ˆ sont les estmateurs de o et défns au chaptre 4. Quelques manpulatons algébrques permettent d'écrre la dfférence SCR o - SCR de la manère nstructve suvante: SCR o - SCR = ˆ ˆ n x o ( ) Cette somme de carrés devrat être pette s l'hpothèse µ = o + x est vrae, car estme µ et ˆ o + ˆ estme o + x. Le nombre de degrés de lberté est n- pour SCR et n- pour SCR o. Donc SCR - o x SCR a - degrés de lberté (ce qu s'explque: la somme a termes et paramètres estmés). La statstque F est donc SCRo - SCR /( ) F = ~ -;n- SCR /( n ) Exemple 6.5. On a prélevé les données suvantes sur 4 ordnateurs afn d'analser la relaton entre la vtesse de l'ordnateur et son prx. ID Vtesse (mhz) Prx ($) ID Vtesse (mhz) Prx ($) 5 045 $ 3 33 4 898 $ 5 069 $ 4 33 5 48 $ 3 5 00 $ 5 50 43 $ 4 5 394 $ 6 50 4 78 $ 5 5 499 $ 7 50 4 678 $ 6 5 499 $ 8 50 6 995 $ 7 5 499 $ 9 66 495 $ 8 5 55 $ 0 66 600 $ 9 5 3 70 $ 66 999 $ 0 33 708 $ 66 4 499 $ 33 999 $ 3 66 7 995 $ 33 699 $ 4 66 8 999 $ Le graphque suvant montre qu'l a une certane relaton. Elle est plutôt fable, mas elle exste. La relaton est-elle lnéare? Fgure 6.5. Prx Régresson Prx vs Vtesse 9000 8000 7000 Y = 34. + 60.5690X R-Sq = 6.9 % 6000 5000 4000 3000 000 5 35 45 Vtesse 55 65 REG06AnovaCourtH 0 avrl 0

5 33 50 66 MAT738 Analse de varance Nous fasons d'abord une analse descrptve parallèle au rasonnement du test formel qu suvra. Nous commençons par adopter une modèle qu fat le mons d'hpothèses possbles, c'est-à-dre, on suppose seulement que les moennes des 4 groupes (5 mhz, 33 mhz, 50 mhz, et 66 mhz) sont µ, µ, µ 3 et µ 4, sans aucune restrcton sur les µ. On estme ces moennes par les moennes échantllonnales, qu sont = 48,; = 3346,4; 3 = 4570,75; 4 =493,67. L'hpothèse de lnéarté est l'hpothèse que µ = o + x, =,, 3, 4, c'est-à-dre, que les 4 moennes se stuent sur une drote. Le graphque suvant présente les moennes ans qu'une boîte qu résume les données dans chaque classe : Fgure 6.5. Prx 9000 Boîte de Prx par Vtesse (Les moennes sont marquée par des ponts) 8000 7000 6000 5000 4000 3000 000 000 Vtesse Le modèle de régresson lnéare suppose que µ = o + x et fournt une estmaton des coeffcents: Prx = ˆ o + ˆ x = 34 + 60,6x Dans ce modèle, l'estmaton des moennes des 4 groupes est: 34+60,6(5) = 648,43; 34+60,6(33) = 33,984; 34+60,6(50) = 46,657; 34+60,6(66) = 53,760. Nous devons donc comparer les deux séres d'estmaton, celles basées sur le modèle d'analse de varance (les ) et celles basées sur le modèle de régresson (les ˆ o + ˆ x ): Vtesse () 5 mhz 33 mhz 50 mhz 66 mhz Effectf (n ) 9 5 4 6 Modèle d'anova ( ) 48, 3346,4 4570,75 493,67 Modèle de régresson ( ˆ o + ˆ x ) 648,43 33,984 46,657 53,760 La statstque pour tester l'hpothèse de lnéarté est F = SCRo -SCR /( ) SCR /( n ) REG06AnovaCourtH avrl 0

MAT738 Analse de varance qu sut une lo -;n- sous l'hpothèse de lnéarté. Applquant l'une des formules de SCR o -SCR, nous obtenons SCR o - SCR = n ( ˆ ˆ o x ) = 9(48,-648,43) + 5(3346,4-33,984) + 4(4570,75-46,657) + 6(493,67-53,760) = 383 95. Le nombre de degrés de lberté est - = 4 - =. Quant à SCR, c'est la somme des carrés des écarts entre les observatons et leur moenne estmée, sot SCR = n ( ) j j = 9 ( j ) + 5 ( j ) + = 049 806 + 659 489 + 0 66 995 + 4 3 65 = 65 549 94 Le nombre de degrés de lberté de SCR est n- = 4-4 = 0. Donc la valeur de F est 4 ( 3j 3) + 6 ( ) 4j 4 F = SCRo -SCR /( ) SCR /( n ) 66933866 6554994 /(4 ) = 6554994 /(4 4) = 0,, ce qu, à et 0 degrés de lberté, est non sgnfcatf : on ne rejette pas l'hpothèse de lnéarté. Cec complète le test. Remarque. On peut montrer que n SCR o - SCR = n ( ˆ ˆ j x ) j o - ( ) j j, ce qu sgnfe que le test est basé sur une comparason des résduels sous le modèle de régresson avec les résduels sous un modèle d'analse de varance. Le modèle de régresson étant plus restrctf, la somme des carrés résduelle est supéreure ou égale à celle d un modèle d analse de varance. Mas la dfférence ne devrat pas être mportante s le modèle de régresson est bon. C est ce qu explque pourquo cette dfférence fgure au numérateur de la statstque F. S le modèle de régresson est ncorrect, les observatons s'élogneraent des estmatons ˆ o + ˆ x plus que ne le feraent les ; par conséquent les résduels seraent mportants et SCR o serat ben plus grand que SCR. Une comparason vsuelle montre pourquo on ne rejette pas l'hpothèse de lnéarté : les résduels des deux modèles ne sont pas très dfférents : REG06AnovaCourtH avrl 0

MAT738 Analse de varance 3 Fgure 6.5.3 Résduel 4000 Comparason des résduels Ceux de l'analse de varance et ceux de la régresson 3000 000 000 0-000 -000-3000 Anova Régresson En passant, on peut auss montrer que SCR o - SCR = n ( ˆ ˆ j x ) ( j ) j o Remarque S la fgure 5. ne montre pas d'évdence de non lnéarté, elle suggère en revanche que les varances varent avec la vtesse. Le graphque suvant le montre encore. On verra mantenant que dans le cas présent l est possble de tester l'hpothèse d'homoscédastcté. Fgure 6.5.4 Résduel 4000 Résduels vs Vtesse (Anova) 3000 000 000 0-000 -000-3000 5 35 45 55 65 Vtesse 6.6 Test d homogénété de varances Supposons encore que nous n aons de valeurs dstnctes de x : x,, x, et que pour x on avat n valeurs,,, n, correspondantes, où n > pour chaque. Il est alors possble de tester l hpothèse d'homoscédastcté, une hpothèse qu autrement ferat parte du modèle et serat supposée vrae sans démonstraton. On commence donc avec un modèle qu ne suppose pas l'homoscédastcté, sot REG06AnovaCourtH 3 avrl 0

4 MAT738 Analse de varance Homogénété de varances j = + j, où j ~ (0 ; ). Dans ce modèle, on teste l hpothèse H o : = = S est le rapport des maxmums de vrasemblance, alors s les n sont assez grands, la statstque Q = - ln sut à peu près une lo à - degrés de lberté lorsque H o est vrae. Il est asé de vérfer (lorsqu on remplace les estmateurs du maxmum de vrasemblance par les estmateurs sans bas) que Q = (n-)ln(s p ) - ( n )ln( ) s où s = n j (.) j n et s = p ( n ) s n = MCR. Nous effectuons les calculs avec les données de l'exemple sur les ordnateurs. Il ne faut pas oubler, cependant, que le test est approxmatf, pusqu'l est basé sur l'hpothèse que les n sont grands, ce qu n'est pas le cas; et également sur l'hpothèse que les données sont normales, ce dont on ne peut pas être sûr. On a n = 4 et = 4. Les valeurs des n sont 9, 5, 4, et 6. Les valeurs des et s sont 56 6 ; 94 87 ; 3 538 998 ; et 8 44 75 s = 377496. Fnalement, Q = 6,0646. p Le nveau de sgnfcaton est P( 3 > 6,0646) = 0,00, ce qu est hautement sgnfcatf. On peut rejeter l hpothèse d homoscédastcté. Cette concluson est conforme à ce qu on vot dans le graphque des résduels, qu semble ndquer clarement que la dsperson des prx augmente avec les vtesses (et le fat, auss, que les s crossent de façon également mportante). 6.7 Combnasons lnéares des moennes Il est possble également d'estmer des combnasons lnéares des µ et de tester des hpothèses à propos de ces combnasons lnéares. Sot = c µ une combnason lnéare avec coeffcents fxes c. Un estmateur sans bas ˆ de est c ˆ = une foncton lnéare des moenne et de varance (c ) /n. La varable c. La dstrbuton de ˆ s obtent faclement: ˆ est, qu à leur tour sont fonctons lnéares des. Donc ˆ est normale, de REG06AnovaCourtH 4 avrl 0

MAT738 Analse de varance 5 Z = ˆ c / n ~ (0 ; ) Pusque n'est pas connue, nous remplaçons Z par T = ˆ ˆ c / n, et on peut démontrer que T ~ t n- Cec nous permet de détermner un ntervalle de confance pour et de tester des hpothèses du genre H o : = o. En partculer, nous pouvons tester des hpothèses à propos de la dfférence entre des moennes, ou encore à propos de certanes moennes partculères. Exemple 6.7. Dans le problème traté au début du chaptre, supposons que le tratement A est partculer dans le sens que c est le tratement emploé régulèrement, alors que les tros autres sont des tratements expérmentaux. On veut donc comparer le tratement tradtonnel à l ensemble des tratements expérmentaux, c est-à-dre, on veut tester l hpothèse On a H o : µ = (/3)(µ + µ 3 + µ 4 ), ou encore, H o : 3µ - µ - µ 3 - µ 4 = 0. 3() 7 6 5 T = = -3,43 5, 3 5 4 7 6 Pusque t 8;0,05 =,0, on rejette H o à 5%. On peut donc conclure que l ndce de dstorson des bandes expérmentales est supéreur, en moenne, à celu des bandes tradtonnelles. REG06AnovaCourtH 5 avrl 0

6 MAT738 Analse de varance Analse de varance à deux facteurs facteurs crosés On présente c quelques cas partculers d un modèle lnéare général dans lequel la varable endogène est exprmée en foncton de deux varables exogènes qualtatves. 6.8 Décomposton des sommes de carrés Les résultats d une expérence sont souvent classés selon plus d un facteur, comme dans l exemple suvant. Exemple 6.8. [Battacharra, Gour K., Johnson, Rchard A. (977) Statstcal concepts and methods, Wle, New Yor, p.498]. Consdérons l'expérence suvante, dont l objet est de détermner l'effet de deux hormones sur le pods des cobaes. Les deux hormones et les quanttés admnstrées sont Hormone A (Œstradol) 0 0,5 mg/jour Hormone B (Progestérone) 0 0, mg/jour 0 mg/jour Le plan d'expérence est appelé «plan factorel» ; les deux facteurs A et B sont «crosés», dans le sens que nous avons des sujets pour chaque combnason d'un nveau de A et un nveau de B. La varable observée Y est le gan de pods durant la pérode d observaton. Les données sont les suvantes : Hormone B (Progestérone) Hormone A (Œstradol) 0 0, mg/jour 0 mg/jour 0 mg/jour -9 - -4 8-8 -9 7 3 3 0,5 mg/jour -0-9 -8-3 -0-4 3 9 8 Le modèle est dt équlbré lorsqu l a un même nombre r d observatons dans chaque case. Ic r = 3. Le modèle s'exprme de la façon suvante. Sot la j e observaton du nveau du facteur A et du nveau j du facteur B. On suppose que les j sont ndépendantes et que E( j ) = j ; Var( j ) =, =,, a; j =,, b (6.8.) On présente également le modèle de la façon équvalente suvante: j = µ j + j, j ~ (0 ; ), j ndépendantes. (6.8.) Il est possble de trater ces données à l'ade d'un modèle d'analse de varance smple à un facteur de a b nveaux, auquel cas on obtent tout de sute une décomposton de la somme des carrés totale: a b r (...) j = j a b j ( j....) + r a b r ( ) j j. j où j. est la moenne des données de la case,j,... est la moenne de toutes les données. Avec les sgles habtuels, cette décomposton s'écrt SCT = SCE + SCR où SCE a ab- degrés de lberté. La moenne MCE = SCE peut servr au numérateur d'une statstque ab F pour tester l'hpothèse que les ab moennes sont toutes égales. Le dénomnateur est toujours MCR = SCR. Mas lorsque les données sont classées selon deux facteurs, cette décomposton est nsuffsante: lorsqu on conclut qu l a un effet sgnfcatf, l mporte de savor s l s agt de l effet de l'un des fac- ab( r ) teurs, de l'autre, ou d une nteracton entre les deux. La somme SCE, qu mesure les écarts entre les ab moennes, se décompose en tros partes, désgnées par SCA, SCB et SCAB REG06AnovaCourtH 6 avrl 0

MAT738 Analse de varance 7 r a b (...) a j j. = br (.....) b + ar (.....) a b j j +r (........) j j j SCE = SCA + SCB + SCAB où.. est la moenne des données de la e lgne et.. est la moenne des données de la j e colonne. j SCA, qu est la dsperson entre les dfférents nveaux de A, a (a-) degrés de lberté, SCB, la dsperson entre les dfférents nveaux de B, a (b-) degrés de lberté, et SCAB, une mesure des «nteractons» entre A et B, a (a-)(b-) degrés de lberté. Consdérons les tros hpothèses suvantes: H A : Le facteur A n'a pas d'effet: µ. =... = µ a., µ. = jµ j /b H B : Le facteur B n'a pas d'effet: µ. =... = µ. b, µ. j = µ j /a H AB : Aucune nteracton entre A et B: µ j - µ.- µ. j + µ = 0 j, où µ = j µ j /ab. Une autre paramétrsaton Les paramètres naturels dans ce contexte sont, à part la varance σ, les a b moennes μ j des groupes. Mas tradtonnellement, on désgne plutôt certanes fonctons lnéares des moennes comme paramètres et l équaton (6.8.) est écrte plutôt comme j = + + j + j + j, =,, a ; j =,, b (6.8.3) À part µ, ces paramètres ne sont pas des moennes : ce sont des dfférences de moennes. Le sens de ces paramètres est: : l'effet du e nveau du facteur A j : l'effet du j e nveau du facteur B j : l'effet de l'nteracton entre le e nveau de A et le j e de B Formellement, en termes des moennes, voc comment se défnssent les paramètres {µ,,, }: µ = µ (même sens dans les deux paramétrsatons) = µ. - µ j = µ. j - µ j = µ j - µ. - µ. j + µ Ces paramètres sont défns en prévson des hpothèses qu on souhate normalement tester, sot les tros hpothèses classques H A, H B et H C. Car celles-c s exprment très smplement comme cec: H A : =... = a = 0 H B : =... = b = 0 H AB : j = 0 pour tout et tout j. Remarque Dans cette paramétrsaton, on a a alpha, b bêta, et ab gamma, ce qu donnerat, à premère vue, + a + b + ab = (a+)(b+) paramètres ŕ alors que les {µ j } sont au nombre de ab. On aurat créé de nouveaux paramètres. Il n'en est ren : l espace paramétrque demeure de dmenson ab, tout comme l espace des moennes {µ j }, et ce grâce à certanes restrctons qu on mpose aux α, β et γ, sot : = 0 ; j j = 0 ; j = 0 pour tout j ; j j = 0 pour tout. Ces restrctons découlent de la sgnfcaton que nous avons donnée aux paramètres. Par exemple, la somme Σ α est nécessarement nulle s α = μ.-μ. REG06AnovaCourtH 7 avrl 0

8 MAT738 Analse de varance 6.9 Tests d'hpothèses On peut démontrer que:. SCA, SCB, SCAB et SCR sont ndépendantes.. SCA/ a ( A), où A = br (µ -. µ) /. 3. SCB/ b ( B), où B = ar j(µ.j - µ) /. 4. SCAB/ ( ), où = r AB j(µ j - µ.- µ.j + µ) /. ( a)( b) AB 5. SCR/ ab ( r ) centrale. Les tests approprés pour H A, H B, et H AB découlent drectement de ces proprétés. Les résultats de l'analse sont tradtonnellement présentés sous la forme d'une table d'analse de varance qu, pour une analse à deux facteurs crosés, prend la forme suvante: Tableau 6.9. Table d analse de varance Source Facteur A Somme de carrés Degrés de lberté Moenne de carrés a SCA = br (.....) a- MCA = SCA/(a-) b j j Facteur B SCB = ar (. ) b- MCB = SCB/(b-) Interactons SCAB = r a b... (....) j j j (a-)(b-) MCAB = SCAB/(a-)(b-) Espérances des moennes de carrés + br b a (. ) a ar (. ) j + j b + a b r ( ) j j.. j ( a)( b) Résduel Total SCR = a b r j j SCT = a b r j. j... j ab(r-) abr- MCR = SCR/ab(r-) MCT = SCT/(n-) Les statstques pour tester les hpothèses H A, H B, et H AB sont F A = MCA MCR F B = MCB MCR et les espérances c-dessus justfent les régons crtques F AB = MCAB MCR F A a-,ab(r-);, F B ~ b-,ab(r-); et F AB ~ (a-)(b-),ab(r-);. Remarque Les statstques F peuvent s exprmer comme un quotent de deux estmateurs de la varance de..... certanes moennes. Par exemple, F A = br a ( ) ( ) a a ( ) ( a )..... = = ˆ ˆ br a ( ) ( a )..... a pour dénomnateur un estmateur sans bas de la varance de ˆ.. ; et pour.. REG06AnovaCourtH 8 avrl 0

Perte de pods -0-0 0 0 0 MAT738 Analse de varance 9 numérateur la varance échantllonnale des.., laquelle est sans bas pour vrae. s et seulement s H A est Voc la table d'analse de varance (par le logcel R) pour les données sur l'effet des deux hormones sur le gan de pods des cobaes : > anova(lm(z~oestradol*progesterone)) Df Sum Sq Mean Sq F value Pr(>F) oestradol.5.5 0.76 0.68 progesterone 488.8 409.4 33.966.46e-05 *** oestradol:progesterone 9.0 64.5 0.909 0.489 Resduals 85.3 70.9 La seule valeur sgnfcatve est celle pour la progestérone ŕ un nveau de sgnfcaton nféreur à 0,0005. Le nveau de sgnfcaton est 0,68 pour l'œstradol et 0,49 pour les nteractons. Donc la progestérone stmule la crossance, l'œstradol n'a aucun effet. L'effet de la progestérone est le même, quelle que sot la quantté de l'œstradol consommée. On peut fare une analse vsuelle de l nteracton à partr du tableau suvant, qu représente les pertes moennes de pods selon le tratement suv. Les données dans les cellules sont les moennes échantllonnales j, qu estment les µ j : Progestérone Œstradol 0 mg 0, mg 0mg Moenne 0 mg -4,66667-6,333333 7,66667 -, 0,5 mg -9,00000-5,666667 6,33333 0,5556 Moenne -6,8333-6,0000,0000-0,778 Voc une représentaton graphque de ces moennes : Moennes des pertes de pods 0,5 mg Estradol 0 mg Estradol.0.5.0.5 3.0 Dose Progesterone L nteracton exste au nveau de l'échantllon : les drotes ne sont pas parallèles. Mas nous venons de conclure que cette absence de parallélsme n'est pas sgnfcatve, c'est-à-dre qu'l est possble que dans la populaton les deux lgnes soent en fat parallèles. REG06AnovaCourtH 9 avrl 0

0 MAT738 Analse de varance 6.0 Le sens de l'hpothèse de non nteracton L'absence d'nteractons est défne formellement par les équatons j -. -. j +.. = 0 pour tout, j Mas on peut démontrer que cette formulaton est équvalente à ou encore pour toute pare j, j, la dfférence j - j est ndépendante de pour toute pare,, la dfférence j - j est ndépendante de j Le premer énoncé µ = µ j. + µ. j - µ.., µ j = µ. + µ. j' - µ. et donc µ j - µ = µ. j' j - µ. j', ndépendante de. Récproquement, s µ j - µ est ndépendante de alors µ j' j - µ = µ. j' j - µ. j' (/b) j' (µ j - µ j' ) = (/b) j' (µ. - µ. j j') µ j - µ. = µ..j - µ.. j -. -. j +.. = 0. Donc l absence d'nteractons sgnfe que la dfférence entre deux nveaux du facteur A est constante: elle ne dépend pas du nveau du facteur B (A et B peuvent, ben sûr, être échangés dans l énoncé.) L'hpothèse de non nteracton est auss appelée hpothèse d'addtvté pusqu elle sgnfe que j -.. = (. -..) + (. j -..) = + j C est donc l hpothèse que l effet combné des deux tratements ( j -..) est la somme de deux effets: celu du tratement A (. -..) et celu du tratement B (. j -..). 6. Une hpothèse partculère L hpothèse H B pourrat manquer d ntérêt en présence d nteractons car elle concerne l égalté de l effet moen du progestérone, la moenne étant prse sur les deux nveaux d œstradol. Il pourrat être plus ntéressant de tester l hpothèse que la progestérone n a pas d effet lorsque le nveau d œstradol est fxe, par exemple, en l absence d œstradol, ou en présence de 0,5 mg d œstradol. Sot H A B : La progestérone n a pas d effet en l absence de l œstradol : = = 3 H A B : La progestérone n a pas d effet en présence de 0,5 mg d œstradol : = = 3 La somme des carrés du numérateur pour tester la premère hpothèse est la dsperson des tros moennes de la premère lgne du tableau : SCA B = 3{[ 4,667 (,)] [6,333 (,)] [7,667 (,)] } = 690,889. La statstque pour tester cette hpothèse est SCA F = B/ 690,889/ =,9699, MCR 70,9 ce qu, à et degrés de lberté, correspond à une p-valeur de 0,004. De la même façon, on obtent pour H A B la statstque SCA F = B/ MCR = 356,889/ 70,9 =,9538, ce qu, à et degrés de lberté correspond à une p-valeur de 0,000079. Donc les deux hpothèses, H A B et H A B sont chacune rejetée ndvduellement. Mas on pourrat auss tester les deux hpothèses smultanément : REG06AnovaCourtH 0 avrl 0

MAT738 Analse de varance La statstque F pour tester H A B est [SCA B SCA B]/4 = MCR H A B : H A B et H A B : = = 3 et = = 3. [690,889 356,889]/ 4 79,9 = 4947,778/ 4 = 36,944 79,9 79,9 À 4 et degrés de lberté, cec correspond à une p-valeur de 0,00006. = 7,43540. Il est utle de remarquer c une autre formulaton de l hpothèse H A B : H A B et H A B. Elle est tout à fat équvalente à H B et H AB. Elle peut donc être testée par la statstque F = [SCB+SCAB]/( ) [488,8+9,0]/( ) = MCR 70,9 = 7,43540, la même statstque. Formulaton générale Consdérons une classfcaton à deux facteurs, A et B aant a et b nveaux, respectvement, et r observatons par case. Le tableau suvant présente une autre décomposton de la somme des carrés totale. Source Somme de carrés Tableau 6.. Table d analse de varance alternatve Degrés de lberté Moenne de carrés MCA B = SCB+SCAB ab ( -) Espérances des moennes de carrés a Facteur A SCA = br (.....) a- MCA = SCA a br a -..... + ( ) a SCA B = SCB + SCAB = a b Facteur A B r a b j ( j... ) a(b-) ab ( ) Résduel Total SCR = a b r j j SCT = a b r j. j... j ab(r-) MCR = abr- MCT = SCT n SCR ab( r ) r... + j ( j ) 6. Estmaton dans un modèle restrent par une hpothèse S certanes des hpothèses consdérées semblent, en vertu des données et des tests, très plausbles, l est tentant de les adopter comme parte du modèle. Cec permet de smplfer la descrpton du phénomène étudé. Une hpothèse qu smplfe consdérablement le modèle est l'hpothèse de non-nteracton. S on l'adopte, le modèle devent E( j ) = µ j = µ. + µ. j - µ Dans ce cas, les moennes µ j sont estmées dfféremment. On admet faclement (et on peut le justfer formellement) que les moennes des marges (c'est-à-dre, les µ. et les µ. j ) sont estmées par les moennes échantllonnales correspondantes. On a donc le tableau suvant en premer temps: REG06AnovaCourtH avrl 0

Perte de pods -0 0 0 0 MAT738 Analse de varance Progestérone Œstradol 0 mg 0, mg 0 mg Moenne 0 mg ˆ. = -, 0,5 mg ˆ. = 0,5556 Moenne ˆ. ˆ. ˆ. 3 =,0000 ˆ = -0,778 à part, les paramètres estmés dans le tableau c-dessus sont en fat les seuls paramètres à estmer, pusque les µ j sont toutes fonctons des µ. et des µ. j. En utlsant la relaton ˆ j = ˆ. + ˆ. j - ˆ, on obtent les estmatons suvantes: Progestérone Œstradol 0 mg 0, mg 0 mg Moenne 0 mg -7,66667-6,833333,6667 ˆ. = -, 0,5 mg -6,00000-5,66667,83333 ˆ. = 0,5556 Moenne ˆ. = -6,8333 ˆ. = -6,0000 ˆ. =,0000 3 ˆ = -0,778 Voc une représentaton graphque de ces moennes: Moennes sous l'hpothèse d'addtvté 0,5 mg Estradol 0 mg Estradol.0.5.0.5 3.0 Dose Progesterone Les drotes sont parallèles, et c'est précsément le sens de non-nteracton. 6.3 Suggeston pour le calcul des espérances Secton omse dans la verson courte 6.4 Expresson matrcelle Nous présentons c une expresson matrcelle du modèle, ans qu une dscusson sur l orthogonalté des effets. Les queston auxquelles on répond sont ) quel est le len entre l orthogonalté et l addtvté des sommes de carrés? et ) quel est le len entre les effectfs des cases et l orthogonalté? Pour concrétser, consdérons les données suvantes, classées selon deux facteurs : REG06AnovaCourtH avrl 0

MAT738 Analse de varance 3 Facteur A B B B 3 A 3 3 A 3 3 Posons j = + α + j + j, avec les contrantes j j j j = 0, de sorte qu on peut écrre j les moennes comme cec : Facteur B B B B 3 Moennes Facteur A A +α + + +α + + +α - - - - +α A -α + - -α + - -α - - + + -α Moennes + + - - Le modèle d analse de varance à deux facteurs peut s écrre en langage matrcelle E() = X où 3 3 3 3, =, et X = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0. Parttonnons X selon les effets prncpaux A, B et leurs nteractons AB : X = [X o X X X 3 ], les parttons aant, respectvement,,, et colonnes, correspondant à, à α, aux et aux. Sot et sot P le projecteur orthogonal sur (X ), = 0,,, 3, P j le projecteur sur ([X X j ]), P j le projecteur sur ([X X j X ]), etc., P = P 03. Pour généralser quelque peu, supposons que les matrces X o, X, X et X 3 ont, respectvement,, a, b, et (a-)(b-) colonnes. Les sommes de carrés au numérateur des statstques F pour tester les hpothèses habtuelles H A (α = 0), H B ( = = 0), et H AB ( = = 0), sont où F A = SCA / ( a ) SCR / ( n ab), F B = SCB / ( a ) SCR / ( n ab), F AB = SCAB / ( a )( b ) SCR / ( n ab) SCA = (P-P 03 ), SCB = (P-P 03 ), SCAB = (P-P 0 ) et SCR = (I - P). Or ces sommes de carrés ne sont pas toujours celles qu fgurent dans une table d analse de varance. Le but d une analse de varance est de décomposer une somme de carrés totale SCT = (I - P 0 ) d abord en, REG06AnovaCourtH 3 avrl 0

4 MAT738 Analse de varance sa parte explquée et sa parte résduelle, et ensute sa parte explquée en une somme SCT = SCE + SCR = (P - P 0 ) + (I - P); SCE = SCA + SCB + SCAB. Or les sommes des carrés défnes c-dessus ne satsfont pas toujours cette condton : en général, SCA + SCB + SCAB = (P-P 03 ) + (P-P 03 ) + (P-P 0 ) (P - P 0 ) Pour s assurer que la somme des sommes de carrés donne ben SCE, certans logcels les défnssent autrement. Procédant successvement, SCA, SCB et SCAB sont défnes comme cec : SCA = (P 0 -P 0 ); SCB = (P 0 -P 0 ) ; SCAB = (P-P 0 ) Mas que testent ces sommes, fgurant au numérateur d une statstque F? Généralement, elles ne testent pas ce qu on prétend tester, à mons qu elles coïncdent avec celles défnes plus haut, c est-à-dre, à mons que (P-P 03 ) = (P 0 -P 0 ) ; (P-P 03 ) = (P 0 -P 0 ); (P-P 0 ) = (P-P 0 ). Or ces égaltés sont vérfées s et seulement s les colonnes X, X, et X 3 sont mutuellement orthogonales, c est-à-dre, s X X j = 0, j. Cec découle du fat que dans ce cas, P 03 = P 0 + P + P + P 3. Et quand est-ce que, dans un modèle à deux facteurs, ces matrces sont mutuellement orthogonales? Quand les données sont équlbrées, c est-à-dre, quand chaque case content le même nombre d observatons. On le vérfe en calculant le produt X X, dans l exemple : X X = 0 0 0 0 0 0 0 0 0 0 0 0 8 4 0 0 0 0 4 8 0 0 0 0 0 0 8 4 0 0 0 0 4 8 Il sufft d ajouter quelques observatons à certanes des cases pour rompre cette orthogonalté (répétez certanes des lgnes de X un nombre négal de fos pour vor). Pourquo l orthogonalté est-elle souhatable? Pour vor ce qu se passe lorsque l orthogonalté n est pas : β vérfée, consdérons le modèle E() = X = X X β. La somme des carrés pour tester l hpothèse H : = 0 est (P - P ). S X et X sont mutuellement orthogonaux, P = P +P et P - P = P et la ' ' statstque devent smplement P. Snon, P - P = ( I P ) P [ P ( I P ) P ] P ( I P ). La dfférence. ' ' entre P et '( I P ) P [ P ( I P ) P ] P ( I P ) peut être mportante, et elle l est d autant plus que P P est dfférent de 0. 6.5 Analse de varance à deux facteurs facteurs emboîtés Nous avons consdéré à la secton.4 une décomposton partculère de la somme de carrés totale : les sommes SCB et SCAB sont fusonnées en une somme notée SCA B. Dans l exemple présenté, l s agssat d un chox, une alternatve que l expérmentateur peut adopter ou écarter. Mas l exste des cas Les formules de SCA et SCB montrent qu en fat on teste H A dans un modèle où seul le facteur A est présent; et on teste H B dans un modèle qu ne comprend que les facteurs A et B, sans nteractons. REG06AnovaCourtH 4 avrl 0

MAT738 Analse de varance 5 où la décomposton en.4 s mpose, car la décomposton classque n a pas de sens. C est le cas des données suvantes qu représentent la teneur en matères grasses (en cg) par 00 g d orange de 6 dfférentes varétés emploées par un fabrcant de produts almentares. Chacune des varétés provent de tros pas dfférents : Varété Pas P P P3 Moenne V 3,5 4,0,5 4,5 3,0 3,0 3,0 4,5 5,5 5,0,5 3,0 3,66667 V 5,0 5,5 3,5 3,5 4,5 4,0 4,0 3,5 3,0 4,0 4,0 5,0 4,500 V3 5,0 4,5 5,5 6,0 5,5 4,5 5,0 4,5 5,0 5,0 6,5 5,5 5,0833 V4 8,5 6,0 6,5 7,0 7,0 7,0 9,0 8,5 8,0 6,5 7,0 7,0 7,33333 V5 6,0 5,5 6,0 8,5 6,5 6,5 3,5 7,0 4,5 7,5 8,5 7,5 6,45833 V6 7,0 9,0 6,0 7,0,0 7,0 8,5 8,5 7,0 7,0 9,0 8,0 7,9667 Moenne 5,7967 5,6047 5,95833 5,7847 L'expérence vse à détermner s l a des dfférences entre les varétés et entre les pas quant à la teneur en matères grasses. À premère vue, l s agt d une analse de varance à deux facteurs. Mas la dfférence c vent du fat que les pas P, P, et P3 ne sont pas les mêmes pour chaque varété : ls pourraent représenter, par exemple, le Brésl, les États-uns et le Mexque pour la varété V; l Inde, la Chne et l Iran pour la varété V; etc. Nous avons ben deux facteurs, la varété consttuant, dsons, le facteur A; et la provenance le facteur B. Mas ls ne sont pas crosés, ls sont emboîtés : le facteur B (la provenance) est emboîté dans A. Une analse de varance comme celle de la secton précédente donnerat les résultats suvants: > anova(lm(~varete*provenance)) Source DF SS MS F P varete 5 79.64 35.98 38.47 0.000 provenance.507 0.753 0.8 0.45 Interacton 0 4.36.433.60 0.0 Error 54 50.437 0.934 Total 7 55.93 Cette analse est correcte en ce qu concerne les varétés : le test pour H A est le même dans les deux cas. En ce qu concerne la provenance (facteur B) ou les nteractons, cette analse serat fautve, car certanes des moennes calculées dans le modèle à effets crosés n ont plus de sens. Comme par exemple.j qu ntervent dans le calcul de SCB: ce serat la moenne des oranges provenant du pas portant le label P j, ce qu n est pas sensé. L hpothèse H AB non plus. Une hpothèse concernant la provenance qu est rasonnable est la suvante : Il n a pas de dfférence entre les provenances d une même varété, et ce, pour toutes les varétés. Formellement, cette hpothèse, que nous désgnerons par H A B, s exprme par H A B : = = = b pour =,,, a La moenne des carrés qu fgurera au numérateur de la statstque F est MCA B = a b ( j. ) j r ab ( ), REG06AnovaCourtH 5 avrl 0

6 MAT738 Analse de varance le nombre de degrés de lberté étant a(b-). La somme entre les accolades, r (...) j j, mesure les écarts entre les pots à l ntéreur d un même tratement. Donc la statstque F prendra une valeur élevée s l a d mportantes dfférences entre les pots à l ntéreur d un même tratement. La statstque F correspondante est On peut montrer que SCA B = SCB + SCAB : a b r (...) j j F A B = MCA B MCR a = br (.. ) + r a b (..... ) j j j, ce qu explque auss le nombre de degrés de lberté : (b-)+(a-)(b-) = a(b-). Table d analse de varance : > anova(lm(~varete/provenance)) Df Sum Sq Mean Sq F value Pr(>F) varete 5 79.64 35.98 38.466 < e-6 *** varete:provenance 5.833.53.3048 0.0858 * Resduals 54 50.438 0.934 Paramétrsaton Une façon de paramétrer ce modèle: avec la correspondance suvante: µ j = E( j ). = µ + + j() µ = µ (même sens dans les deux paramétrsatons) = µ. - µ j = (µ. j - µ) + (µ j - µ. - µ. j + µ) = µ j - µ. b Analse de varance à deux facteurs avec une observaton par cellule 6.5 Analse de varance à deux facteurs avec une observaton par cellule Dans une analse de varance à deux facteurs, l arrve qu on n at qu une seule observaton par cellule. Pusque l estmateur MCR de la varance est une mesure de la dsperson des données d une même cellule, cet estmateur n exste pas dans ce cas. Il est nécessare alors d mposer certanes contrantes aux paramètres afn d obtenr une estmaton de. Ce problème une généralsaton du test d égalté de deux moennes avec données apparées. Le modèle Consdérons les données suvantes. Exemple [George W. Snedecor et Wllam G. Cochran, Statstcal methods, Sxth edton, Iowa State, p. 30] On prend une certane mesure de la teneur en eau des feulles des arbres de tros espèces d agrumes sous tros condtons d ensolellement (9 arbres en tout). Voc les données : REG06AnovaCourtH 6 avrl 0

MAT738 Analse de varance 7 Ensolellement Orange Shamout Pamplemousse Clémentne. Solel 90 3 08,3333 Ombre partelle 86 73 89 8,66667 Ombre 80 6 8 74,33333. j 9,66667 75 97,66667 88,44444 On a donc en tout a b observatons j, et le modèle est où les j sont ndépendantes, j ~ (0 ; ). j = j + j, =,, a; j =,, b (c a = b = 3) La somme des carrés explquée SCE = a b ( ) j j.. se décompose ans: Dans l exemple, on a a b ( ) a j j.. = b (. ) b.. + a (. ) j j.. + a b ( ) j j.. j.. SCT = SCA + SCB + SCAB. SCT = (-88,44) + (90-88,44) + + (8-88,44) = 8, SCA = 3[(08,33-68,44) + (8,67-68,44) + (74,33-68,44) ] = 884, SCB = 3[(9,67-68,44) + (75-68,44) + (97,67-68,44) ] = 850,8889 SCAB = SCT Ŕ SCA Ŕ SCB = 87, Les sommes de carrés SCA, SCB, et SCAB sont ndépendantes, et dvsées par elles suvent chacune une lo, généralement non centrale. Le problème qu se pose c, c est qu l n a pas de somme de carrés résduelle (dsperson à l ntéreur des cases), et donc pas d estmateur de varance. Les espérances des moennes de carrés MCA = SCA/(a-), sont présentées dans le tableau suvant: MCB = SCB/(b-) et MCAB = SCAB/[(a-)(b-)] Moenne de carrés Degrés de lberté Espérance MCA a- b +. ) a MCB b- b a +. ) j j b MCAB (a-)(b-) a b.. + j j j ( a)( b) a b MCT ab- + ( ) j j ( a)( b) On vot ben qu aucun des quotents possbles ne peut servr à tester les hpothèses usuelles H A, H B et H AB. Il sera donc nécessare d'mposer quelques contrantes supplémentares. La contrante normalement mposée est a REG06AnovaCourtH 7 avrl 0

8 MAT738 Analse de varance où. = b j j j -. -. j +.. = 0 pour tout, j ;. j = b a j a b a ;.. = ab j Ce postulat, appelé hpothèse d addtvté ou de non nteracton, que nous ne pouvons pas tester et consdérons comme parte du modèle, rédut l'espérance de MCAB à et nous permet de tester les hpothèses suvantes: H A : Les µ. sont égaux : F A = MCA MCAB a-,(a-)(b-) lorsque H A est vrae. H B : Les µ. j sont égaux : F B = MCB MCAB b-,(a-)(b-) lorsque H B est vrae. Dans l exemple, j F A = MCA 884, / 3 43,6 et F B = MCAB 87, / 4 MCB 850,89 / 3 MCAB 87, / 4 9,536. Les p-valeurs correspondantes sont (à 3 et 4 degrés de lberté dans les deux cas) 0,00953 pour F A et 0,00865 pour F B. Les deux facteurs sont donc fortement sgnfcatfs. Voc les résultats produts par le logcel R : > anova(lm(~solel+espece)) Analss of Varance Table Df Sum Sq Mean Sq F value Pr(>F) solel 884. 94. 43.60 0.00953 ** espece 850.89 45.44 9.536 0.00865 ** Resduals 4 87..78 Sute omse dans la verson courte Modèle à effets aléatores Supposons qu'on veulle détermner s la consommaton d'essence d'une voture neuve vare d'une voture à l'autre. On prélève les données suvantes, qu représentent la dstance (en mlles) parcourue sur un gallon d'essence par 4 votures. Le nombre d'essas vare d'une voture à l'autre. Voture Voture Voture 3 Voture 4 9 5 0 3 4 4 4 6 5 7 6 6 7 Au premer abord, l'allure des données ans que la queston posée suggèrent une analse de varance à un facteur. Mas supposons que les 4 votures sont de fabrcaton dentque et que le but de l'expérence n'est pas ŕ comme l le serat dans une analse de varance classque ŕ de savor s'l a une dfférence entre les 4 votures utlsées pour l'expérence, mas plutôt de savor s'l a une dfférence entre les votures en général. Les 4 votures ne consttuent donc pas 4 populatons dont on veut comparer les moennes: elles REG06AnovaCourtH 8 avrl 0

MAT738 Analse de varance 9 représentent en fat un échantllon de talle 4 d'une populaton de votures de même marque, même modèle. S j représente la j e observaton sur la e voture, nous pouvons consdérer un modèle dont l'équaton est dentque à celle du modèle d'analse de varance à un facteur, sot j = + + j =,, ; j =,, n où est l écart entre la moenne générale de toutes les votures de la populaton et la moenne de la e voture trée dans la populaton. Pusque les votures sont trées au hasard, les ne sont pas des paramètres, mas des varables aléatores, de même que les j. Nous supposerons que les et les j sont mutuellement ndépendantes et que ~ (0 ; ), j ~ (0; ) Le paramètre µ est une constante. Nous appellerons ce modèle le modèle à effets aléatores, pour le dstnguer du modèle dscuté précédemment, lequel par contraste s'appellera modèle à effets fxes. Le paramètre est une mesure de la dsperson entre les moennes des votures, alors que est une mesure de la dsperson entre les dfférents essas effectués avec la même voture. Remarque. Les varables aléatores sont des constantes une fos les votures choses. En d'autres termes, la dstrbuton condtonnelle des observatons j, étant donné,...,, est dentque à celle qu est stpulée par le modèle à effets fxes. L'hpothèse que nous voulons tester s'exprme par: H o rédut le modèle à j = + j, H o : 0 =,, ; j =,, n Ce modèle est dentque à celu auquel se rédut le modèle à effets fxes lorsqu'on mpose à celu-c l'hpothèse =...=. Donc sous H o la statstque F a la même dstrbuton c que dans le modèle a effets fxes. Nous devrons néanmons développer les proprétés des sommes de carrés SCR et SCE dans le contexte d'un modèle à effets aléatores, d'abord pour justfer la régon crtque F > F -,n-;, ensute pour permettre le calcul de la foncton de pussance. Somme de carrés résduelle. La somme des carrés résduelle est SCR = n ( j. ) = j Pusque les j sont ndépendantes, j (0 ; ), on dédut que n ( ) j j. SCR ~ exactement comme dans le modèle à effets fxes et on dédut également que MCR = SCR/(n-) est un estmateur sans bas de : n E(MCR) = Somme de carrés explquée. La somme des carrés explquée est foncton des moennes échantllonnales. = + +. Les sont ndépendantes, Var( ) = Var(µ + + )= Var(. ) + Var( ) =. + /n, REG06AnovaCourtH 9 avrl 0

30 MAT738 Analse de varance S = [.,..., où = [,..., ] et ]', alors. µ = E( ) = µe et = Var( ) = I + D -, La somme des carrés explquée D = n 0 0 0 0 n 0 0 n peut s'écrre sous forme matrcelle comme SCE = n(... ) = n - n... SCE = ' D Dee' D n Cette somme de carrés ne sut pas en général une lo. Consdérons séparément les cas où les n sont égaux et négaux. Cas où les effectfs sont égaux S n =... = n = r, alors et = Var( ) = ( + /r )I SCE r La statstque F = MCE/MCR peut s'écrre comme ~ centrale F = MCE MCR = r MCE /( r ) MCR / Le e facteur à drote sut toujours une lo -,n- ; donc la statstque F c-dessus sut une lo de Fsher s et seulement s le premer facteur vaut, c'est-à-dre, s et seulement s = 0. Snon, F a tendance a prendre des valeurs plus grandes que celle d'une varable de lo -,n-. Cec justfe l'emplo de la statstque F et de la régon crtque Cas où les effectfs ne sont pas égaux F = MCE MCR > -,n-; Lorsque les n ne sont pas égaux, le numérateur n'est pas une h-deux et la statstque n'est donc pas une Fsher. Cependant, le test demeure valde pusque, lorsque H o est vrae, SCE/ sut une lo h-deux à - degrés de lberté. Le chox de la régon crtque se justfe par le fat que E(MCE) = + n n n ( ) REG06AnovaCourtH 30 avrl 0

MAT738 Analse de varance 3 laquelle espérance est supéreure à celle du dénomnateur [E(MCR) = ], et lu est égale s et seulement s = 0. Exemples. Supposons qu'on veulle savor s le succès au jeu de pnball est une queston de hasard pur, ou s l'adresse du joueur est pour quelque chose. On chost ndvdus et on fat jouer le e ndvdu n fos. Sot le score du j e ndvdu au j e essa. Dans l'équaton du modèle, le terme représente «l'apttude» du e joueur, c est-à-dre, sa moenne à long terme. Pusque ce joueur a été chos au hasard, est une varable aléatore. Cette varable a une certane varance,, qu mesure les écarts d'apttude entre les personnes. L'hpothèse que = 0 est l'hpothèse qu'l n' a pas de dfférence entre les ndvdus, ce qu dans notre contexte sgnfe que l'apttude n'entre en ren dans le succès au jeu. Pour un fxe, la varance condtonnelle de est j, qu est donc la dsperson des scores pour un même joueur. Par contre, la varance ncondtonnelle de j est Var( j ) = + La composante est attrbuable au hasard; l'autre, ndvdus. Remarquez auss que = Cov( j ; j ) pour tout j et j, est attrbuable aux dfférences d'apttude entre les En d'autres termes, est la covarance entre deux scores obtenus par un même joueur (et attrbuable unquement au fat qu'l s'agt du même joueur). Cette covarance est nulle s l'apttude du joueur ne contrbue pas à son succès. Fnalement, le quotent = est une mesure de l'mportance de l'apttude au jeu, par opposton au hasard pur. Ce quotent est auss le coeffcent de corrélaton entre deux scores obtenus par un même joueur. Il est appelé coeffcent de corrélaton nterne. Le coeffcent de corrélaton nterne, auss appelé coeffcent de corrélaton famlale, tent ses orgnes de l'applcaton suvante. Une certane caractérstque est mesurée sur tous les membres de pluseurs famlles (ou les membres de pluseurs portées d'anmaux), j étant l'observaton sur le j e membre de la e famlle. mesure la dsperson entre les membres d'une même famlle (pusque = Var( j ), alors que mesure les écarts entre les famlles. Le coeffcent de corrélaton nterne pourrat être consdéré comme une mesure de la force de l'hérédté ou d'autres facteurs envronnementaux propres à la famlle. Estmateurs de paramètres. À partr des expresson des espérances E(MCR) et E(MCE) on obtent des estmateurs sans bas des paramètres et : ˆ = MCR et ˆ = MCE-MCR n où n o = n o n n( ) Remarquez que l estmateur de est une dfférence de moennes de carrés. Il a donc un nconvénent majeur: l peut prendre des valeurs négatves. REG06AnovaCourtH 3 avrl 0

3 MAT738 Analse de varance Intervalles de confance Il est également possble de détermner un ntervalle de confance pour lorsque n =... = n = r. La statstque F = MCE/MCR sut une lo -;n- s H o : = 0 est vrae; autrement, c'est qu sut une lo -;n-. Alors Par la défnton de, pour avor r MCE /( ) = MCR / F r P F ; n; / F F ; n; / = - r r =. Nous substtuons cette expresson à l'équaton c-dessus ( r ) P F ; n; / F F ; n; / = - ( r ) Quelques manpulatons permettent d'exprmer les négaltés entre parenthèses sous la forme où F = -;n- ;-/ et F = -;n-;/. F F F ( r ) F F F F ( r ) F Secton omse dans la verson courte Analse de varance à tros facteurs RÉSUMÉ Analse de varance à un facteur Le modèle : j = + j ; j ~ (0 ; ), =,, ; j =,,n H o : = = = Table d'analse de varance Degrés Source Somme de carrés Moenne des carrés de lberté Explquée SCE = n (... ) - MCE = SCE Espérances des moennes des carrés n ( ) Résduelle SCR = Total SCT = n- MCR = SCR n ( j. ) j n n ( ) j j.. n- MCT = SCT n n ( ) n Test de H o : F = MCE MCR SCE /( ) = SCR /( n ) ~ -;n- lorsque H o est vrae REG06AnovaCourtH 3 avrl 0

MAT738 Analse de varance 33 Estmaton des paramètres : ˆ = ; Var( ˆ ) = ; n ˆ = MCR = Test d'ajustement à une drote n observatons comportent < n valeurs dstnctes de x, x, x. Les valeurs qu correspondent à x sont,,..., n. SCR n Modèle ntal : : j = μ + ε j ; =,, ; j =,, n H o : hpothèse de lnéarté H o o : j = o + x + j est le modèle d'analse de varance et o est le modèle de régresson. Numérateur du rapport F pour tester H o SCE = (SCR o Ŕ SCR)/(-), où SCR o et SCR sont les sommes de carrés résduelles dans o et, respectvement, sot : SCR = ; SCR o = n (.) j j SCR o - SCR = ˆ ˆ n ( x ) o ; F = Test d homogénété de varances j = + j, où j ~ (0 ; ). n j SCRo - SCR /( ) ~ -;n- SCR /( n ) H o : = = ( ˆ ˆ x ) j o n (.) j j s = estme dans le modèle ; s ( n ) s = = MCR estme σ sous H p o. n n Q = (n-)ln(s p ) - ( n )ln( ) s ~ à peu près sous H o Combnasons lnéares des moennes Sot = c µ. ˆ = c ˆ = c. ˆ o H o : φ = φ o. Sous H o, Z = ~ (0 ; ) ; T = c / n ˆ o ~ t n- ˆ c / n Analse de varance à deux facteurs facteurs crosés j = µ j + j, j ~ (0 ; ), j ndépendantes. H A : Le facteur A n'a pas d'effet: µ. =... = µ a., µ. = jµ j /b H B : Le facteur B n'a pas d'effet: µ. =... = µ. b, µ. j = µ j /a H AB : Aucune nteracton entre A et B: µ j - µ.- µ. j + µ = 0 j, où µ = j µ j /ab. REG06AnovaCourtH 33 avrl 0

34 MAT738 Analse de varance Source Facteur A Somme de carrés Degrés de lberté Moenne de carrés a SCA = br (.....) a- MCA = SCA/(a-) b j j Facteur B SCB = ar (. ) b- MCB = SCB/(b-) Interactons SCAB = r a b... (....) j j j (a-)(b-) MCAB = SCAB/(a-)(b-) Espérances des moennes de carrés + br b a (. ) a ar (. ) j + j b + a b r ( ) j j.. j ( a)( b) Résduel Total SCR = a b r j j SCT = a b r j. j... j ab(r-) abr- MCR = SCR/ab(r-) MCT = SCT/(n-). SCA, SCB, SCAB et SCR sont ndépendantes.. SCA/ a ( A), où A = br (µ -. µ) /. 3. SCB/ b ( B), où B = ar j(µ -.j µ) /. 4. SCAB/ ( ), où = r AB j(µ j - µ.- µ.j + µ) /. ( a)( b) AB 5. SCR/ ab ( r ) centrale. Analse de varance à deux facteurs facteurs emboîtés H A B : = = = b pour =,,, a ; MCA B = Source Facteur A Facteur A B Résduel Total Somme de carrés Degrés de lberté a b ( j. ) j r ab ( ) Moenne de carrés a SCA = br (.....) a- MCA = SCA br a - + SCA B = SCB + SCAB = r a b j ( j... ) SCR = a b r j j SCT = a b r j. j... j a(b-) MCA B = SCB+SCAB ab ( -) ab(r-) MCR = SCR ab( r ) abr- MCT = SCT n, F A B = MCA B MCR Espérances des moennes de carrés a (..... ) a a b r... + j ( j ) ab ( ) REG06AnovaCourtH 34 avrl 0

MAT738 Analse de varance 35 Deux facteurs avec une observaton par cellule On suppose les nteractons nulles Moenne de carrés Degrés de lberté Espérance MCA a- + b a (. ) a MCB b- a +. ) j j b MCAB (a-)(b-) a b.. + j j j ( a)( b) a b MCT ab- + ( ) j j ( a)( b) H A : Les µ. sont égaux : F H B : Les µ. j sont égaux : F Modèle à effets aléatores A = MCA MCAB a-,(a-)(b-) lorsque H A est vrae. B = MCB MCAB b-,(a-)(b-) lorsque H B est vrae. j = + + j =,, ; j =,, n ; ~ (0 ; ), j ~ (0; ) ; H o : 0 j = + j n... ( ), =,, ; j =,, n ; F = ~ - ; n- sous H o. ˆ b REG06AnovaCourtH 35 avrl 0

36 MAT738 Analse de varance Annexe Données llustrant une analse de varance à tros facteurs Facteur A Facteur B Facteur C 3 30 3 5 36 3 4 3 50 48 40 43 60 3 50 3 57 45 54 4 47 3 53 3 5 55 47 47 6 3 5 3 34 3 5 3 38 3 38 3 35 3 3 36 3 3 38 3 40 3 39 3 38 3 34 3 3 7 3 3 REG06AnovaCourtH 36 avrl 0

Annexe Optons de contrastes Anova à un facteur Sot, et 3 les moennes des tros cases et la moenne des tros. Paramétrsaton «treatment» : = +, avec = 0. Ic, = ; = + ; 3 = + 3. 0 0 0 0 La relaton est 0 ou 0 0 3 3 0 3 3 > optons(contrasts=c("contr.treatment","contr.pol")) > optons()$contrasts [] "contr.treatment" "contr.pol" > lm(~b) Coeffcents:objects() (Intercept) B B3-6.83 0.83 38.83 = - 3 = 3 - Paramétrsaton «sum»: = + avec la contrante = 0. Ic, = + ; = + ; 3 = - -. La 0 relaton est 0 ou 3 3 3 3 3 > optons(contrasts=c("contr.sum","contr.pol")) > optons()$contrasts [] "contr.sum" "contr.pol" > lm(~b) Coeffcents: (Intercept) B B -0.778-6.5556-5.7 = - = - Paramétrsaton «helmert» : = - - 3 ; = + - 3 ; 3 = + 3 ; ou = ( + + 3 )/3, = ( - )/; = [ 3 -( + )/]/3. La relaton est = ou 3 3 0 6 3 0 3 3 3 > optons(contrasts=c("contr.helmert","contr.pol")) > optons()$contrasts [] "contr.helmert" "contr.pol" > lm(~b) Coeffcents: (Intercept) B B -0.778 5.467.389 ( - )/ [ 3 -( + )/]/3

38 Analse de la varance Paramétrsaton «pol» : On suppose que = o + x + x, x =, =,, 3. On aurat donc = = 3 o G, où = et G = 4. Mas on modfe les colonnes de G, sauf la premère, de façon à ce qu elles 3 9 soent orthogonales à la premère et les unes aux autres. Pour ce fare, on remplace la e colonne x = par sa 3 projecton sur le complément orthogonal de la premère, = (I-ee /3)x = 0 ; ensute on projette la 3e colonne x 3 = 4 sur le complément orthogonal de l espace engendré par les deux premères colonnes, ce qu donne 3 = 9 / 3 /3. Fnalement on dvse et 3 par leur norme, respectvement ½ et (/3) ½. Fnalement, le vecteur est / 3 / / 6 o /3 /3 défn par = 0/ / 6, ou = / 0 / / / 6 / 6 /3 / 6 3 > optons(contrasts=c("contr.pol","contr.pol")) > optons()$contrasts [] "contr.pol" "contr.pol" > lm(~b) Coeffcents: (Intercept) B.L B.Q -0.778 7.4593 7.0083 Anova à deux facteurs Paramétrsaton «treatment» Voc les 6 moennes en termes des paramètres,,, 3,, 3 Hormone B (Progestérone) Hormone A (Estradol) 0 0, mg/jour 0 mg/jour 0 mg/jour + + 3 0,5 mg/jour + + + + + + 3 + 3 Voc les valeurs estmées des paramètres,,, 3,, 3 > optons(contrasts=c("contr.treatment","contr.pol")) > optons()$contrasts [] "contr.treatment" "contr.pol" > lm(~a*b) Coeffcents: (Intercept) A B B3 A:B A:B3-4.667-4.333 8.333 3.333 5.000 3.000 REG06AnovaCourtH 38 0-04- 9:50

Analse de la varance à un facteur 39 Paramétrsaton «sum» Voc les 6 moennes en termes des paramètres,,, 3,, Hormone B (Progestérone) Hormone A (Estradol) 0 0, mg/jour 0 mg/jour 0 mg/jour + + + + + + + - - - - 0,5 mg/jour - + - - + - - - - + + Voc les 6 valeurs estmées des paramètres,,, 3,, > optons(contrasts=c("contr.sum","contr.pol")) > optons()$contrasts [] "contr.sum" "contr.pol" > lm(~a*b) Coeffcents: Intercept) A B B A:B A:B -0.777778-0.8333333-6.5555556-5.7 3.0000000 0.5000000 Paramétrsaton «helmert» Voc les 6 moennes en termes des paramètres,,, 3,, Hormone B (Progestérone) Hormone A (Estradol) 0 0, mg/jour 0 mg/jour 0 mg/jour - - - + + - + - - + - + - 0,5 mg/jour + - - - - + + - + - + + -+ Voc les estmatons des paramètres,,, 3,, > optons(contrasts=c("contr.helmert","contr.pol")) > optons()$contrasts [] "contr.helmert" "contr.pol" > lm(~a*b) Coeffcents: (Intercept) A B B A:B A:B -0.778 0.8333 5.467.389.500.7500 > optons(contrasts=c("contr.pol","contr.pol")) > optons()$contrasts [] "contr.pol" "contr.pol" > lm(~a*b) Coeffcents: (Intercept) A.L B.L B.Q A.L:B.L A.L:B.Q -0.778.785 7.4593 7.0083 6.5000 0.8660 REG06AnovaCourtH 39 /04///9:50