ANOVA avec un facteur aléatoire

Documents pareils
FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

c. Calcul pour une évolution d une proportion entre deux années non consécutives

1 Mesure et intégrale

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Chapitre 3 : Fonctions d une variable réelle (1)

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Statistique descriptive bidimensionnelle

Cours de Statistiques inférentielles

STATISTIQUE : TESTS D HYPOTHESES

SÉRIES STATISTIQUES À DEUX VARIABLES

Chapitre 3 : Transistor bipolaire à jonction

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Processus et martingales en temps continu

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Dénombrement. Chapitre Enoncés des exercices

STATISTIQUE AVANCÉE : MÉTHODES

Cours 5 : ESTIMATION PONCTUELLE

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

EXERCICES : DÉNOMBREMENT

Comportement d'une suite

Processus géométrique généralisé et applications en fiabilité

Limites des Suites numériques

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

CHAPITRE 2 SÉRIES ENTIÈRES

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Exercices de mathématiques

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Séquence 5. La fonction logarithme népérien. Sommaire

Principes et Méthodes Statistiques

Les Nombres Parfaits.

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Suites et séries de fonctions

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Statistique Numérique et Analyse des Données

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Etude de la fonction ζ de Riemann

55 - EXEMPLES D UTILISATION DU TABLEUR.

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

20. Algorithmique & Mathématiques

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

DETERMINANTS. a b et a'

Université Pierre et Marie Curie. Biostatistique PACES - UE

Probabilités et statistique pour le CAPES

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

4 Approximation des fonctions

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Séries réelles ou complexes

14 Chapitre 14. Théorème du point fixe

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Formation d un ester à partir d un acide et d un alcool

Chap. 5 : Les intérêts (Les calculs financiers)

Baccalauréat S Asie 19 juin 2014 Corrigé

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

Régulation analogique industrielle ESTF- G.Thermique

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Initiation à l analyse factorielle des correspondances

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Échantillonnage et estimation

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Module 3 : Inversion de matrices

Comment les Canadiens classent-ils leur système de soins de santé?

Des résultats d irrationalité pour deux fonctions particulières

Séries numériques. Chap. 02 : cours complet.

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Semestre : 4 Module : Méthodes Quantitatives III Elément : Mathématiques Financières Enseignant : Mme BENOMAR

Donnez de la liberté à vos données. BiBOARD.

Télé OPTIK. Plus spectaculaire que jamais.

Faites prospérer vos affaires grâce aux solutions d épargne et de gestion des dettes

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

Risque de longévité et détermination du besoin en capital : travaux en cours

Terminale S. Terminale S 1 F. Laroche

Introduction : Mesures et espaces de probabilités

Nous imprimons ce que vous aimez!

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Chaînes de Markov. Arthur Charpentier

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Solutions particulières d une équation différentielle...

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Création et développement d une fonction audit interne*

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Options Services policiers à Moncton Rapport de discussion

MESURE DE L'INFORMATION

Le chef d entreprise développe les services funéraires de l entreprise, en

Transcription:

Chapitre 7 ANOVA avec u facteur aléatoire Jusqu à maiteat, o a supposé que les modalités du facteur étudié ot été choisies parce qu elles étaiet itrisèquemet itéressates. Le modèle à effets fixes porte sur des traitemets bie défiis que l ANOVA permet de comparer etre eux. Cosidéros l exemple suivat: Exemple 7. O s itéresse au iveau de mathématiques des étudiats des cégeps de la régio de Québec. O pred alors u échatillo de 20 fiissats de chaque cégep de la régio de Québec. O leur admiistre ue épreuve commue et o compare les résultats. C est ue expériece avec effets fixes. Les modalités du facteur étudié sot les cégeps de la régio de Québec. Ce facteur est fixe. Supposos maiteat qu o veuille répodre à la questio suivate: Est ce que le iveau de mathématiques est variable d u cégep à l autre das la provice de Québec. Si tel est le cas, o demade de mesurer cette variabilité. O sélectioe das u premier temps u échatillo parmi les cégeps de la provice; esuite o procède comme avat et o tire au hasard 20 étudiats de chaque cégep (il s agit d u échatilloage à deux degrés). O s itéresse autat aux cégeps échatilloés qu à ceux que e l ot pas été car o veut étudier la variabilité iter-cégeps des compéteces e mathématiques. Das ce cotexte le facteur cégep est aléatoire.

7. ANOVA à u facteur aléatoire Das ue ANOVA à u facteur fixe, o a supposé le modèle Y ij µ i + e ij (7.) pour i,, I et j,, i. Das ce modèle, {µ,, µ I } sot des costates alors e ij N(0, ). O peut aussi écrire (7.) sous la forme: où {µ, τ, τ 2,, τ I } sot des costates vérifiat I τ i 0. Y ij µ + τ i + e ij (7.2) Das le cas d u effet aléatoire, les modalités des facteurs sot elles-mêmes aléatoires. Le modèle s écrit alors sous la même forme que (7.2) où µ est ue costate, τ i N(0, τ) pour i,, I, e ij N(0, ) pour i,, I, j,, i et τ i et e ij idépedates. Avec ce modèle, Y ij N(µ, στ 2 + ). O dit alors que στ 2 et sot les composates de la variace. Ue partie de la variabilité de Y est expliquée par la variabilité etre les traitemets ( τ), l autre par la variabilité résiduelle ( ). Das l ANOVA à u facteur fixe, o cosidère l hypothèse H 0 : µ µ 2 µ I. Cette derière a plus de ses das le cotexte d ue ANOVA à u facteur aléatoire puisque les modalités sot elles-mêmes aléatoires. O veut tester si le facteur ifluece la variabilité de Y. L hypothèse ulle s écrit H 0 : σ τ 0. L hypothèse alterative postule que le facteur a ue effet sur la variabilité de Y. Elle s écrit H : σ τ > 0. Das l exemple précédet, l hypothèse alterative spécifie la présece d ue variabilité iter-cégeps des compéteces mathématiques, sas préciser exactemet la ature des différeces etre les cégeps. Bie que les deux scéarios soiet très différets l u de l autre, o utilise la même règle de décisio das les deux cas, c est à dire: O rejette H 0 si MSB MSE > F I,N I,α Supposos pour l istat que le pla est balacé. Soit la taille commue des échatillos. Das ce cadre, les moyees des échatillos Ȳi. s écrivet: Ȳ i. Y ij j µ + τ i + ē i. 2

où ē i. { j e ij }/ N(0, /). O a alors Ȳ i. N(0, στ 2 + σ2 ) i,,. Les variables Ȳi. état idépedates et idetiquemet distribuées, o a alors (I )MSB + τ χ 2 I. (7.3) Das ce cadre, le SSB s écrit SSB i (Ȳi. Ȳ..) 2 (Ȳi. Ȳ..) 2 ({τ i τ. } + {ē i. ē.. }) 2 (7.4) où τ. I τ i /I et ē.. I ē i. /I. D autre part, pour i,, I, o a : ( )S 2 i (Y ij Ȳi.) 2 j (e ij ē i. ) 2 j Doc ( )S 2 i χ 2 idépedammet les ues des autres, et par coséquet (N I)MSE ( )S 2 i χ 2 N I (7.5) D après 7.4, MSB e déped que de {τ, τ 2,, τ I } et {ē., ē 2.,, ē I. }. D après 7.5, MSE e déped que de {S 2, S 2 2,, S 2 I }. Parmi les hypothèses de ce modéle, figure l idépedace des e ij et τ i, l idépedace des esembles {τ, τ 2,, τ I } et {S 2, S 2 2,, S 2 I } s e suit. D autre 3

part, o sait, d après le chapitre, que les esembles {ē., ē 2.,, ē I. } et {S 2, S 2 2,, S 2 I } sot idépedats. O coclut alors que les statistiques M SB et M SE sot idépedates. L idépedace de MSB et MSE et les relatios 7.3 et 7.5 doet alors: F + τ MSB MSE F I,N I (7.6) Sous H 0, cette derière équatio deviet MSB/MSE F I,N I. D où la régio de rejet aocée plus haut. 7.2 Estimatio des variaces et τ D après 7.5, l estimatio de est idetique au cas d u facteur fixe. Aisi, u itervalle de cofiace pour au iveau α est doé par: [ (N I)MSE, χ 2 N I,α/2 (N I)MSE ] χ 2 N I, α/2 D après 7.3, o a : E[MSB] + τ. D après 7.5, o a E[MSE]. Doc o a: E[ MSB MSE ] τ. La statistique (MSB MSE)/ est u estimateur sas biais de τ. Cepedat, il arrive qu o ait MSB < MSE, et doc u estimateur égatif pour la variace, ce qui est pas souhaitable. O préfère doc l estimateur: MSB MSE ˆσ τ 2 si MSB MSE 0 si MSB < MSE. Noter que c est la méthode des momets qui a été utilisée pour estimer τ. C est à partir des espéraces de MSE et de MSB que l estimateur a été costruit. O peut motrer que cet estimateur est aussi u estimateur du maximum de vraisemblace (la vraisemblace du modèle avec effets aléatoires est compliquée à écrire car deux observatios proveat du même échatillo sot correlées puisque qu ellet partaget le même τ i ). L estimateur ˆ τ est ue combiaiso liéaire de deux khi-deux. Sa loi est complexe et ous empèche d avoir 4

des itervalles de cofiaces exacts pour τ. Cepedat, o peut cotruire des itervalles de cofiaces exacts pour τ/( τ + ) ou approximatifs pour τ. E effet, d après 7.3, o a α P {F I,N I, α/2 P { (MSB MSE P {g( (MSB MSE MSB MSE F I,N I,α/2} + στ 2 ) σ2 τ F I,N I,α/2 σ 2 (MSB MSE )) g( σ2 τ F I,N I,α/2 σ ) g( 2 (MSB MSE F I,N I, α/2 )} (7.7) F I,N I, α/2 ))} où g( ) est ue foctio croissate défiie par g(t) t/(t + ). O obtiet alors l itervalle de cofiace suivat pour τ/( τ + ) : MSB F I,N I,α/2 MSE [ MSB + ( )F I,N I,α/2 MSE, MSB F I,N I, α/2 MSE MSB + ( )F I,N I, α/2 MSE ] Le rapport τ/( τ+ ) doe la proportio de la variabilité totale expliquée par l hétérogééité etre les modalités du facteur aléatoire. Lorsque N I est grad, l estimatio de par MSE deviet plus précise et o peut alors écrire MSE. L équatio 7.7 s écrit alors α P { (MSB MSE P { ( MSB F I,N I,α/2 ) σ2 τ MSE (MSB MSE MSB F I,N I, α/2 )} MSE) στ 2 F I,N I,α/2 ( MSE)} F I,N I, α/2 O e déduit u itervalle de cofiace approximatif au iveau α pour τ. 5

7.3 Puissace de l ANOVA à u facteur aléatoire O rappelle que P uissace P (rejetter H 0 H est vrai) Das le cas d u test F de l aova avec u facteur aléatoire, de seuil α, cette puissace s écrit comme suit: où τ/. P ( ) P ( MSB MSW > F MSB I,N I,α + στ 2 MSW F I,N I) P (F I,N I > F + στ 2 I,N I,α ) P (F I,N I > + F I,N I,α) Voici, e R, le programme qui calcule cette puissace puissace.aova.radom<-fuctio(,i,delta,alpha) { N<-*I ff<-qf(palpha,dfi-,df2n-i,cp0,lower.tailf)/(delta+) ## ou ff<-qf(p-alpha,dfi-,df2n-i,cp0,lower.tailt)/(delta+) result<-pf(qff,dfi-,df2n-i,lower.tailf) ## ou result<-(-pd(qff,dfi-,df2n-i,lower.tailt)) retur(result) } Pour α 0.05, I 5 et 20, o obtiet le graphe suivat: 7.4 Le cas o balacé Si les tailles d échatillos sot iégales le résultat (7.3) e tiet plus. Sous H 0 : στ 2 0, MSB est toujours proportioelle à ue variable alétoire ayat ue distributio χ 2 I et le test F d homogéité peut-être utilisé pour tester H 0. 6

Puissace d ue ANOVA avec effet aleatoire, I5, 20, alpha0.05 puissace 0.2 0.4 0.6 0.8.0 0.0 0.5.0.5 2.0 alterative Pour estimer τ, o peut utiliser la méthode des momets. Pour calculer l espérace de SSB o ote que { } E(SSB) E i (Ȳi Ȳ ) 2 { } E i (Ȳi µ) 2 ( i )(Ȳ µ) 2 ( ) I i στ 2 + σ2 2 i στ 2 i i { (I ) + στ 2 (I ) (i ) 2 /(I ) }, où est la taille d échatillo moyee. Aisi l estimateur des momets de τ est [ ˆσ τ 2 MSB ˆ ] [ max ( i ) 2 /{ I(I )}, 0 MSB ˆ ] max ( CV 2 { i }/I), 0. Cet estimateur est pas u estimateur du maximum de vraisemblace. Das SAS, o peut estimer τ das ue aalyse de variace à u facteur aléatoire de deux faços différetes: par la méthode des momets avec l optio radom de la procédure glm ou par la méthode du maximum de vraisemblace avec la procédure mixed. La théorie sous jacete a cette derière procédure est vue das les cours de plaificatio d expérieces et de régressio gradué. 7