L analyse de variance à deux critère de classification



Documents pareils
Analyse de la variance Comparaison de plusieurs moyennes

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

STATISTIQUES. UE Modélisation pour la biologie

FORMULAIRE DE STATISTIQUES

Application sur le Dispositif en Blocs Complètement Randomisés

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Théorie des sondages : cours 5

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Cours 9 : Plans à plusieurs facteurs

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Principe d un test statistique

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

TABLE DES MATIERES. C Exercices complémentaires 42

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

BIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Estimation et tests statistiques, TD 5. Solutions

Statistiques Descriptives à une dimension

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Evaluation de la variabilité d'un système de mesure

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

T de Student Khi-deux Corrélation

Leçon N 4 : Statistiques à deux variables

Exemples d application

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

Introduction aux Statistiques et à l utilisation du logiciel R

Aide-mémoire de statistique appliquée à la biologie

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Introduction à l approche bootstrap

Biostatistiques : Petits effectifs

Variables Aléatoires. Chapitre 2

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

FIMA, 7 juillet 2005

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

La classification automatique de données quantitatives

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

4. Résultats et discussion

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Le Modèle Linéaire par l exemple :

Statistique : Résumé de cours et méthodes

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Soutenance de stage Laboratoire des Signaux et Systèmes

Hedging delta et gamma neutre d un option digitale

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Introduction : Les modes de fonctionnement du transistor bipolaire. Dans tous les cas, le transistor bipolaire est commandé par le courant I B.

Statistiques descriptives

Évaluation de la régression bornée

Quelques rappels concernant la méthode expérimentale

L échelle du ph est logarithmique, c està-dire

Exemples d Analyses de Variance avec R

Electron S.R.L. - MERLINO - MILAN ITALIE Tel ( ) Fax Web electron@electron.it

Comparaison de populations

Logiciel XLSTAT version rue Damrémont PARIS

Ventilation : Mesure et réglage des débits

3. Caractéristiques et fonctions d une v.a.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Analyse en Composantes Principales

Principes généraux de la modélisation de la dispersion atmosphérique

Relation entre deux variables : estimation de la corrélation linéaire

Current challenges for Audit Authorities and Groups of Auditors in ETC and IPA programmes and perspectives for the future

Chapitre 7 Les solutions colorées

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Séries Statistiques Simples

EPREUVES AU CHOIX DU CANDIDAT. Durée : De 09 h 00 à 12 h 00 (Heure de Yaoundé, TU + 1)

Chapitre 4 : Régression linéaire

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

Statistique inférentielle TD 1 : Estimation

Chapitre 3. Les distributions à deux variables

La nouvelle planification de l échantillonnage

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

TSTI 2D CH X : Exemples de lois à densité 1

5. Matériaux en contact avec l eau

Précision d un résultat et calculs d incertitudes

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Activités de mesures sur la masse à l aide d unités de mesure conventionnelles. L unité de mesure la plus appropriée

PERSPECTIVES FINANCIERES DES PETITES VILLES

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Science et technique. La température et la durée de stockage sont des facteurs déterminants. Viande bovine et micro-organisme pathogène

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

TESTS D'HYPOTHESES Etude d'un exemple

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

données en connaissance et en actions?

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Introduction à la Statistique Inférentielle

LES MODELES DE SCORE

NOUVEAU COMPATIBLE COFRAC. Validez la conformité de vos échantillons en un seul geste. Le tube témoin enregistreur de température

Transcription:

L analyse de variance à deux critère de classification Objectif : comparer l influence de chaque facteur sur la moyenne de plusieurs (k) groupes indépendants d observations La méthode détaillée ci-dessous s applique uniquement quand les deux critères (variables qualitatives)sont indépendants, et s il y a une seule unité d expérimentation pour chaque groupe. -La première variable qualitative a r catégories et - la deuxième a s catégories - r x s observations Cette analyse correspond grosso modo à une double ANOVA à un critère de classification

Cette méthode nous permet uniquement de tester l effet de chaque critère uniquement, mais PAS l interaction H 0 : Les moyennes de la variable x ne sont pas affectées par le critère A. µ 1 = µ 2 = = µ r H 0 : Les moyennes de la variable x ne sont pas affectées par le critère B. µ 1 = µ 2 = = µ s Puisqu on a deux séries d hypothèses, on a deux statistiques F :

T = ( x) 2

Exemple : Robert!!! Robert s intéresse à l effet des strates d un lac et du type de nutriments présents dans 4 différentes zones du lac sur la quantité de bactéries présentes dans l eau. Robert veut être certain d avoir de la bonne eau à son chalet.

Étape 1 : Question biologique Est-ce que le nombre de bactéries par ml d eau varie selon la strate à laquelle l échantillon a été pris? Est-ce que le nombre de bactéries par ml d eau varie selon le traitement? Étape 2 : Hypothèses H 0 : La profondeur n affecte pas le nombre de bactéries par ml (hypothèse A) H1 : La profondeur affecte le nombre de bactéries par ml (hypothèse A) H 0 : La présence de nutriments n affecte pas le nombre de bactéries par ml (hypothèse B) H1 : La présence de nutriments affecte le nombre de bactéries par ml (hypothèse B)

Étape 3 :Choix du test Le test statistique utilisé est une ANOVA à deux critères de classification où : Étape 4 : Conditions d application Normalité des données dans tous les groupes et ce, pour chaque combinaison des critères Indépendance des observations Équivariance de ces groupes Étape 5 : Distribution de la variable auxiliaire Sous H 0, la variable F A se distribue selon la loi de Fisher à υ1 = (r-1) = 2 et υ2 = (r-1)(s-1) = 8 degrés de liberté et la variable F B se distribue selon la loi de Fisher à υ1 = (s-1) = 4 et υ2 = (r-1)(s-1) = 8 d.d.l.

Étape 6 : Règles de décision Pour un seuil α = 0.05 On rejette H 0 (il y a un effet des strates) si F A > 4,46. On rejette H 0 (il y a un effet des traitements) si F B > 3,84 Étape 7 : Calcul du test

Étape 8 : Décision statistique Puisque F A = 9,71 > 4,46, on rejette H 0 : Les strates ont un effet des sur le nombre de bactéries. Puisque F B = 1,91 < 3,84, on ne rejette pas H 0 : pas d effet des traitements sur le nombre de bactéries.

Étape 9 : Interprétation biologique Les bactéries sont sensibles à la concentration d oxygène, qui varie passablement entre les différentes strates d un lac, mais pas aux types de nutriments qui ont été utilisés lors de l expérience.

ANOVA factorielle à deux critères de classification n égaux = orthogonal experimental design Ce type d ANOVA permet de tester, en plus de l effet isolé de chacun des facteurs, l effet de l interaction des deux. Pour cela il faut disposer de plusieurs mesures pour chaque combinaison de niveaux, c est-à-dire dans chaque cellule. Les résultats permettent de tester trois séries d hypothèses :

H 0 : Les moyennes de la variable x ne sont pas affectées par le critère A. µ 1 = µ 2 = = µ r H 0 : Les moyennes de la variable x ne sont pas affectées par le critère B. µ 1 = µ 2 = = µ s H 0 : Les critères A et B n interagissent pas sur les moyennes.

SC = Somme des carrés des écarts Dispersion totale = SCT Dispersion intragroupe ( due aux erreurs ) = SCE Dispersion due aux facteur A ou B = SCEA ou SCEB Dispersion des cellules = SCcells Mesure de la dispersion (variation) totale SCT a b n SCT = X C 2 d.d.l. = N-1 C = a b n N X 2

Mesure de la dispersion (variation) du facteur A SCA a b n X = bn 2 C d.d.l. = a-1 Mesure de la dispersion (variation) du facteur B SCB b a n 2 X d.d.l. = b-1 = C an

Mesure de la dispersion (variation) des cellules SCcells SCcells a b n X = n 2 C d.d.l. = ab-1 Mesure de la dispersion (variation) de l interaction AxB SCAB SCAB = SCcells (SCA + SCB) d.d.l. = (a-1)(b-1)

Mesure de la dispersion (variation) intragroupe (dûe aux erreurs) SCE SCE= SCT SCcells d.d.l. = ab(n-1)

Calculs : T = ( x) 2 Interaction

Exemple : Le régime miracle! On désire quantifier l efficacité de trois types de régimes, de quatre intensités d activité physique ainsi que l interaction de ces deux critères sur la perte de poids.

Étape 1 : Question biologique Quel est l effet du régime, de l exercice physique ainsi que de leur interaction sur la perte de poids? Étape 2 : Déclaration des hypothèses H 0 : Le régime n affecte pas la perte de poids (hypothèse A) µ reg1 = µ reg2 = µ reg3 H 1 : Le régime affecte la perte de poids (hypothèse A) µi µj pour au moins un i j H 0 : L activité physique n affecte pas la perte de poids (hypothèse B) µ ex1 = µ ex2 = µ ex3 H 1 : L activité physique affecte la perte de poids (hypothèse B) µi µj pour au moins un i j H 0 : L activité physique et le régime n interagissent pas sur la perte de poids H 1 : L activité physique et le régime interagissent sur la perte de poids.

Étape 3 : Choix du test Le test statistique utilisé est une ANOVA factorielle à deux critères de classification où : Étape 4 : Conditions d application Normalité des données dans tous les groupes et ce, pour chaque combinaison des critères Équivariance de ces groupes Indépendance des observations Étape 5 : Distribution de la variable auxiliaire Sous H 0, la variable F A se distribue selon la loi de Fisher à υ1 = (r-1) = 2 et υ2 = rs(k-1) = 60 d.d.l. la variable F B se distribue selon la loi de Fisher à υ1 = (s-1) = 3 et υ2 = rs(k-1) = 60 d.d.l. la variable F AB se distribue selon la loi de Fisher à υ1 = (r-1)(s-1) = 6 et υ2 = rs(k-1) = 60 d.d.l.

Étape 6 : Règles de décision Pour un seuil α = 0,05 : On rejette H 0 (donc il y a un effet des régimes) si F A > 3,15. On rejette H 0 (donc il y a un effet des exercices) si F B > 2,76 On rejette H 0 (donc il y a une interaction) si F AB > 2,25. Étape 7 : Calcul du test

Étape 8 : Décision statistique Puisque F A = 3,435 > 3,15, on rejette H 0 : il y a un effet des régimes. Puisque F B = 26,743 > 2,76, on rejette H 0 : il y a un effet des exercices. Puisque F AB = 3,954 > 2,25, on rejette H 0 : il y a une interaction. Étape 9 : Interprétation biologique Le régime et l exercice physique permettent de perdre du poids car ils permettent de contrôler le taux de gras. De plus, l effet du régime sur la perte de poids variera en fonction de l activité physique et vice-versa.

Modèle I : les 2 facteurs ont des effets fixes Modèle II : les niveaux des facteurs sont aléatoires Modèle III : modèle mixte entre I et II effet Modèle I Modèle II Modèle III A & B fixes A &B aléatoires A fixe & B aléatoire Facteur A CM A/CM e CM A/CM AB CM A/CM AB Facteur B CM B/CM e CM B/CM AB CM B/CM e Interaction A x B CM AB/CM e CM AB/CM e CM AB/CMe

ANOVA factorielle à deux critères de classification n inégaux et non proportionnels S il manque une mesure ou qqes, on peut l estimer selon la formule : Xˆ = aa + bb + cc +... ( k 1) X i j l N + k 1 a b c... Somme de toutes les données dans le niveau i du facteur A Somme de toutes les autres données Ou plus simple on remplace par les cellules manquantes par la valeur moyenne des données, puis on fait l anova MAIS avec le ddl total et le ddl des cellules calculés sur le vrai nombre de mesures

S il en manque plus Voir les modèles GLM (General Linear Model) ou on recommence tout