Analyse de Variance. Groupe 1... Groupe K x 1,1... x... ... ... x... = µ + α i. + e ij. x ij



Documents pareils
Analyse de la variance Comparaison de plusieurs moyennes

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Analyse en Composantes Principales

Cours 9 : Plans à plusieurs facteurs

Introduction à l approche bootstrap

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Etude des propriétés empiriques du lasso par simulations

TP 1 Introduction à Matlab Février 2009

Couples de variables aléatoires discrètes

1 Complément sur la projection du nuage des individus

Application 1- VBA : Test de comportements d'investissements

Introduction aux Statistiques et à l utilisation du logiciel R

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

Modèles pour données répétées

Calcul Formel et Numérique, Partie I

TABLE DES MATIERES. C Exercices complémentaires 42

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 3. Les distributions à deux variables

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

Exemples d application

Évaluation de la régression bornée

Lois de probabilité. Anita Burgun

FORMULAIRE DE STATISTIQUES

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

MÉTHODES NUMERIQUES. Cours. Licence de Physique Année Universitaire : Licence Chimie, parcours Physique. Semestre S3

Cours d analyse numérique SMI-S4

VI. Tests non paramétriques sur un échantillon

Simulation de variables aléatoires

Cours Informatique Master STEP

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

Résolution de systèmes linéaires par des méthodes directes

Calcul Formel et Numérique, Partie I

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

PROJET MODELE DE TAUX

Retentissement de la réforme de l'ircantec 2008 sur la retraite des Praticiens Hospitaliers.

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Evaluation de la variabilité d'un système de mesure

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

1. Structure d'un programme FORTRAN 95

Figure 1 Différents éléments influençant les mesures de seuil réalisées en champ visuel

Théorie des sondages : cours 5

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Équation de Langevin avec petites perturbations browniennes ou

Principe d un test statistique

Application sur le Dispositif en Blocs Complètement Randomisés

Examen de Logiciels Statistiques

Démonstration de la conjecture de Dumont

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

ISFA 2 année Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples

Exercice : la frontière des portefeuilles optimaux sans actif certain

Notes introductives à Matlab

TP 0 : INTRODUCTION À MATLAB

LABO 5 ET 6 TRAITEMENT DE SIGNAL SOUS SIMULINK

Notion de fonction. Série 1 : Tableaux de données. Série 2 : Graphiques. Série 3 : Formules. Série 4 : Synthèse

Cours 02 : Problème général de la programmation linéaire

LES GENERATEURS DE NOMBRES ALEATOIRES

Chapitre 5 : Flot maximal dans un graphe

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite

Examen Médian - 1 heure 30

données en connaissance et en actions?

Cours d algorithmique pour la classe de 2nde

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

LES DÉTERMINANTS DE MATRICES

Python - introduction à la programmation et calcul scientifique

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

La boucle for La boucle while L utilisation du if else. while (condition) { instruction(s) }

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Introduction. Préambule. Le contexte

La classification automatique de données quantitatives

1 Introduction et modèle mathématique

Cours Bases de données 2ème année IUT

Modèles et Méthodes de Réservation

Analyse des correspondances avec colonne de référence

Relation entre deux variables : estimation de la corrélation linéaire

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Apprentissage Automatique

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Chapitre 4 : Régression linéaire

Aide-mémoire de statistique appliquée à la biologie

Algorithmes pour la planification de mouvements en robotique non-holonome

Travaux pratiques avec RapidMiner

LES PLANS D EXPERIENCES

Le stockage local de données en HTML5

Cours 4 : Agrégats et GROUP BY

Découverte du tableur CellSheet

Analyse Combinatoire

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Enquête auprès des parents

Travail de projet sur VBA

Transcription:

Analyse de Variance Analyse de Variance à 1 Facteur L'objectif de l'analyse de variance à 1 facteur est de tester l'égalité des moyennes théoriques d'une variable quantitative de différents groupes ou de différents niveaux du facteur considéré Les observations sont sous la forme : Groupe 1 Groupe K x 1,1 x K, 1 x 1, n 1 x K, T 1 T K n K m 1 = T 1 n 1 m K = T K n K N = K n i i= 1 N = K T i i= 1 Le modèle de cette analyse est le suivant : Les hypothèses testées : x ij = µ + α i + e ij H 0 : égalité des moyennes, les groupes sont homogènes ou tous les α i prennent pour valeur 0 H 1 : les groupes ne sont pas homogènes ou au moins un des α i est différent des autres Les conditions d'applications : Tous les x ij suivent des lois Normales de même variance σ 2 (estimée par s e2 ), ou, ce qui est identique, les e ij sont "Normaux", indépendants et de même variance σ 2 (estimée par s e2 )

Le tableau d Analyse de Variance est le suivant : Origine Σ des carrés ddl Variance F (a) (b) (a)/(b) Intergroupe K 2 T i i =1 n i T 2 g N K-1 S 2 S 2 s e 2 Intragroupe K i = 1 n i 2 x ji j = 1 K i= 1 T i 2 n i N-K s e 2 Totale K n i i =1 j =1 2 x ji T 2 g N N-1

Un programme d'anova avec MATLAB : function [F,F0,Pvalue] = ANOVA1(x,k); [F,F0,Pvalue] = ANOVA1(x,k) ANOVA oneway (10/01/2001) x : data matrix k : number of observation by groupe soit x est une matrice de "size(n K)", avec K groupe et n observations par groupe (ie chaque groupe dans une colonne) soit x est un vecteur et k indique la repartition des observations dans les K groupes (eg k(1) observation pour le premier groupe k(length(k)) observation pour le Keme groupe) F : F value F0 : Fseuil pour alpha = 005 Pvalue ATTENTION : Dans le cas de decomposition orthogonale de la variance, ========= il faudrait utiliser "la variance intra" calculee avec toutes les datas => MODIFICATION de la FONCTION de facon a introduire "varintra" et "df2" N = length(x(:)); [n K] = size(x); somx2 = sum(x(:)^2); if K==1 n = k; K = length(n); na = 1; nb = 0; for i=1:k if i>1 na = na + n(i-1); end nb = nb + n(i); Ti(i) = sum(x(na:nb)); end Tg = sum(ti); somcinter = sum(ti^2/n) - Tg^2/N; somcintra = somx2 - sum(ti^2/n); else [n K] = size(x); Ti = sum(x); Tg = sum(ti); somcinter = sum(ti^2/n) - Tg^2/N; somcintra = somx2 - sum(ti^2/n); end somctotal = somx2 - Tg^2/N; somcintra = -999 si varintra est donnee df2 = N-K ou df2 = df2 df1 = K-1; df2 = N-K; varinter = somcinter / df1; varintra = somcintra / df2; vartotal = somctotal / (N-1); F = varinter/varintra; F0 = qf(095,df1,df2); Pvalue = 1-pf(F,df1,df2);

clc; fprintf('\n\n'); fprintf('============================\n'); fprintf(' Analysis of Variance Table \n'); fprintf('===============================================================\n'); fprintf(' Source df Sums of Squares Variances F\n'); fprintf('---------------------------------------------------------------\n'); fprintf(' Inter 20f 82f 82f 63f\n',df1,somCinter,varinter,F); fprintf(' Intra 20f 82f 82f\n',df2,somCintra,varintra ); fprintf(' Total 20f 82f 82f\n',N- 1,somCtotal,vartotal); fprintf('====================================================\n'); fprintf(' F Fseuil Pvalue\n'); fprintf('-----------------------------------\n'); fprintf(' 63f 63f 47f\n',F,F0,Pvalue); fprintf('===================================\n\n\n'); Exercices : =================== ANALYSE DE VARIANCE =================== FONCTIONS UTILISEES : ===================== ANOVA1m Bartlettm UTILISER "help name_function" pour obtenir des informations sur les fonctions utilisees Exercice 1 : ------------ On mesure le nombre de colonies bactériennes en fonction de 5 milieux de culture différents (k=5) Pour chaque milieu de culture on a fait 10 comptages (ni=10) Les caractéristiques des milieux de culture ont-ils une influence sur le nombre de bactéries qui se développent? Répondre à la question précédente avec un seul test statistique A B C D E 10 11 7 12 7 12 18 14 9 6 8 12 10 11 10 10 15 11 10 7 6 13 9 7 7 13 8 10 8 5 9 15 9 13 6 10 16 11 14 7 8 9 7 10 9 9 13 9 11 6

Exercice 2 : ------------ Dans une étude sur la pollution par insecticides dans les grands lacs américains, on a suivi l'évolution de la concentration de pesticides contenue dans des poissons carnivores (perches, sandres et brochets) Les résultats exprimés en mg/g (DDT, DDD et DDE) en fonction de l'âge des poissons sont les suivants : 2 ans 3 ans 4 ans 5 ans 6 ans 0144 0285 0418 0675 113 0171 0295 0441 0685 118 0178 0321 0451 0726 121 0184 0354 0451 0736 123 0193 0359 0458 0197 0361 0461 0198 0362 0464 0199 0364 0465 0199 0373 0465 0206 0382 0469 0216 0403 0475 0258 0407 0480 0413 La quantité moyenne de pesticides (DDE+DDD+DDT) varie-t-elle selon l'âge des poissons? Exercice 3 : ------------ Une étude a porté sur l'effet mutagène de 6 substances (labellées de A à F) 54 cultures cellulaires ont été répartis par tirage au sort dans les 6 groupes et pour chaque groupe on a donc effectué 9 fois la même expérience Les chiffres du tableau suivant ont été obtenus : A B C D E F ----------------------------------- 32 39 38 39 34 25 34 32 39 38 32 32 33 47 48 45 33 28 32 38 48 45 33 33 34 49 47 38 40 25 41 47 42 34 33 23 34 33 38 38 35 25 38 37 39 38 38 28 42 48 42 36 41 31 --------------------------------------------------- 320 370 381 351 319 250 (somme des x) 11406 15570 16275 13799 11397 7046 (somme des x^2) Analyser les résultats obtenus en regardant si les 6 substances on un effet identique Après cette première analyse on s'est aperçu que l'on avait en fait, analyser l'effet de 2 substances X1 et X2 D'après le cahier d'expérience, la substance X1 aurait été utiliser pour les groupes A et E et la substance X2 pour les groupes B, C, D Dans le cas F on n'aurait utiliser aucune substance Ces résultats permettent ils de retrouver des effets homogènes des substances X1 et X2? Les substances X1 et X2 ont elles des effets identiques?