Exercices sur le cours d Analyse de la Variance

Documents pareils
Analyse de la variance Comparaison de plusieurs moyennes

Lire ; Compter ; Tester... avec R

Introduction aux Statistiques et à l utilisation du logiciel R

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Un exemple de régression logistique sous

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Étude des flux d individus et des modalités de recrutement chez Formica rufa

MODELE A CORRECTION D ERREUR ET APPLICATIONS

TABLE DES MATIERES. C Exercices complémentaires 42

Exemples d application

Données longitudinales et modèles de survie

Modèles pour données répétées

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Principe d un test statistique

Exemple PLS avec SAS

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Chapitre 3. Les distributions à deux variables

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Imputation du salaire d ego dans TeO

Exemples d Analyses de Variance avec R

Introduction à la statistique non paramétrique

Leçon N 4 : Statistiques à deux variables

Biostatistiques : Petits effectifs

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Statistiques Descriptives à une dimension

Principe de symétrisation pour la construction d un test adaptatif

Probabilités III Introduction à l évaluation d options

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

STRICTEMENT CONFIDENTIEL

Estimation et tests statistiques, TD 5. Solutions

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Cours 9 : Plans à plusieurs facteurs

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 6. Fonction réelle d une variable réelle

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Langage SQL : créer et interroger une base

IFT3245. Simulation et modèles

Evaluation de la variabilité d'un système de mesure

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Introduction à l approche bootstrap

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

1 Définition de la non stationnarité

ITLB Indices du prix de revient au 1 er mars 2015

LE GRAND ÉCART L INÉGALITÉ DE LA REDISTRIBUTION DES BÉNÉFICES PROVENANT DU FRACTIONNEMENT DU REVENU

Chapitre 5 : Flot maximal dans un graphe

INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R

Étude comparative sur les salaires et les échelles salariales des professeurs d université. Version finale. Présentée au

TESTS D'HYPOTHESES Etude d'un exemple

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

NOTIONS DE PROBABILITÉS

Annexe commune aux séries ES, L et S : boîtes et quantiles

Modèle GARCH Application à la prévision de la volatilité

25/01/05 TD Entrepôt de données IHS / Master ICA

Modèles Estimés sur Données de Panel

Évaluation de la régression bornée

23. Interprétation clinique des mesures de l effet traitement

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE

Cours 02 : Problème général de la programmation linéaire

Statistiques descriptives

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

ACP Voitures 1- Méthode

Processus de compétitivité : Facteurs et évaluation

Compte rendu de LA37 B, TP numéro 1. Evolution de la température et du degrée d'hydratation

Application sur le Dispositif en Blocs Complètement Randomisés

MATHS FINANCIERES. Projet OMEGA

Théorie des sondages : cours 5

Fonctions homographiques

PRINCIPES DE LA CONSOLIDATION. CHAPITRE 4 : Méthodes de consolidation. Maître de conférences en Sciences de Gestion Diplômé d expertise comptable

Cours de méthodes de scoring

Méthode : On raisonnera tjs graphiquement avec 2 biens.

T2- COMMENT PASSER DE LA VITESSE DES ROUES A CELLE DE LA VOITURE? L E T U N I N G

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

108y= 1 où x et y sont des entiers

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

COURS GESTION FINANCIERE A COURT TERME SEANCE 2 COUVERTURE DU BESOIN DE FINANCEMENT CHOIX DU NIVEAU DU FONDS DE ROULEMENT

véhicule hybride (première

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Exercice 6 Associer chaque expression de gauche à sa forme réduite (à droite) :

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

Comparaison de populations


Le modèle de régression linéaire

Chapitre 2 Les ondes progressives périodiques

L Econométrie des Données de Panel

Représentation d une distribution

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Logiciel XLSTAT version rue Damrémont PARIS

Les réponses à vos questions

Calcul Stochastique pour la finance. Romuald ELIE

Transcription:

Exercices sur le cours d Analyse de la Variance Chapitre 4 - Validatation des hypothèses d une ANOVA à un facteur Exercice 1 Pour tester la normalité nécessaire pour qu une ANOVA soit valide, On peut utiliser le test de shapiro-wilk. Le code R est le suivant : > shapiro.test(delai) Shapiro-Wilk normality test data: delai W = 0.9496, p-value = 0.1654 La probabilité critique est de 0,1654 et dépasse donc le seuil habituel de 5 %. On ne rejette pas significativement l hypothèse nulle de normalité. L hypothèse de normalité des délais de guérison en jours est acceptée. On peut aussi remarquer que l étude des résidus (faite dans le corrigé dans le fichier chap3c, exercice 2) apporte aussi des renseignements quant à la gaussianité des résidus. Des tests d égalité des variances peuvent aussi être menés. Par exemple, avec le test de Levene, le code R est le suivant : > library(car) > levenetest(delai~traitement, data=x) Levene s Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 4 0.5851 0.6763 25 La probabilité critique est de 0,6763 et dépasse donc le seuil habituel de 5 %. On ne rejette pas significativement l hypothèse nulle d homogénéité des variances. L hypothèse d égalité des variances est donc acceptée. On aurait aussi pu faire le test de Bartlett, obtenu via la commande : > bartlett.test(delai~traitement) Le résultat du test est le suivant : 1

Bartlett test of homogeneity of variances data: delai by traitement Bartlett s K-squared = 2.4197, df = 4, p-value = 0.6591 La probabilité critique est de 0,6591 et dépasse donc le seuil habituel de 5 %. On ne rejette pas significativement l hypothèse nulle d homogénéité des variances. L hypothèse d égalité des variances est donc une fois encore acceptée. Remarque 0.1 Si l hypothèse de normalité avait été violée, on aurait tout de même pu faire un test similaire au test F de l ANOVA dans ce cas. Il s agit du test de Kruskal et Wallis. Le code R est le suivant : > kruskal.test(delai~traitement,data=x) Kruskal-Wallis rank sum test data: delai by traitement Kruskal-Wallis chi-squared = 11.01, df = 4, p-value = 0.02645 La probabilité critique est de 0,02645 et ne dépasse pas donc le seuil habituel de 5 %. Cela permet de conclure là aussi (voir corrigé de l exercice 2 du chapitre 3) que les effets d au moij s deux traitements sont différents. Exercice 2 à Exercice 6 Les solutions ne sont pas écrites car il s agit de reproduire, mutatis mutandis, tout ce qui a été détaillé dans l exercice 1 ci-dessus. Exercice 7 1. Le code R pour tracer les boîtes à moustaches est le suivant : > carbu<-rep(1:4,c(6,6,6,6)) > conso<-c(21,24,25,20,34,17,23,23,32,23,32,15,18,19,28,19,24,14, + 20,21,25,15,29,9) > carbu<-factor(carbu) > don<-data.frame(carbu,conso) > moy<-tapply(don$conso,don$carbu,mean) > moy > ecart<-tapply(don$conso,don$carbu,sd) > ecart > ecart.g<-sd(don$conso) > ecart.g > plot(don$carbu,don$conso,col="green") > points(1:4,moy,pch="@") > abline(h=moy.g) 2

Figure 1 Boîtes à moustaches de consommation par carburateurs On obtient la figure ci-dessus. 2. La variable à expliquer, consommation, est une variable continue. La variable explicative que nous considérons, le type de carburateur, carburateur, est qualitative et contrôlée. Le plan qui a été utilisé pour réaliser l expérience comporte des répétitions, nous pouvons donc essayer de nous servir d un modèle d analyse de la variance à un facteur contrôlé. Nous introduisons le modèle suivant : Y i,j = µ + α i + ε i,j, i = 1,, 4, j = 1,, 6, avec la contrainte supplémentaire : 4 α i = 0, i=1 où la variable Y i,j est la consommation de la voiture équipée du carburateur i lors du j-ème essai. Nous postulons les hypothèses classiques suivantes pour les erreurs : ε i,j et ε k,l sont indépendants si (i, j) (k, l) avec 1 i, k 4, et 1 j, l 6, (i, j), 1 i 4, 1 j 6, L(ε i,j ) = N (0, σ 2 ). Ce modèle comporte 6 répétitions pour chaque niveau du facteur. Il s agit donc d un plan expérimental équilibré. 3. Effectuons un test d homogénéité des variances des erreurs : H 0 : σ 2 1 = σ 2 2 = σ 2 3 = σ 2 4 3

contre H 1 : Il existe au moins une variance différente des autres Ne connaissant pas la loi des erreurs, on peut effectuer un test de levene > library(car) > levenetest(conso~carbu, data=don) Cela donne : Levene s Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 3 0.194 0.8992 20 La probabilité critique valant 0,8992, on ne rejette pas l hypothèse H 0. On ne rejette pas significativement l hypothèse nulle d homogénéité des variances. L hypothèse d égalité des variances est donc acceptée. On s intéresse maintenant à la normalité de Y i,j. Un test de Shapiro-Wilk peut être mené : > shapiro.test(conso) Shapiro-Wilk normality test data: conso W = 0.9804, p-value = 0.9037 La probabilité critique valant 0,9037, on ne rejette pas l hypothèse H 0. Le test n est donc pas significatif au niveau α = 5 %, et nous ne rejettons pas l hypothèse H 0. Comme l hypothèse de normalité des erreurs n a pas été rejetée (voir ci-dessus), on peut s intéresser à nouveau à l hypothèse d homogénéité des variances portant sur les erreurs : H 0 : σ 2 1 = σ 2 2 = σ 2 3 = σ 2 4 contre H 1 : Il existe au moins une variance différente des autres Il est maintenant possible d utiliser le test paramétrique de Bartlett puisque ses conditions d application, la normalité des erreurs, sont vérifiées. > bartlett.test(conso~carbu) Les résultats sont les suivants : Bartlett test of homogeneity of variances data: conso by carbu Bartlett s K-squared = 0.6503, df = 3, p-value = 0.8848 4

Le test n est pas significatif car 0,8848 est bien supérieur à α = 5 %. Nous ne pouvons rejeter l hypothèse nulle H 0 à ce seuil. Les résultats sont cohérents avec ceux obtenus précédemment. 4. Déterminons si le facteur carburateur a un effet sur la consommation. Nous testons donc les hypothèses : H 0 : α 1 = α 2 = α 3 = α 4 = 0 contre Le code R est le suivant : H 1 : Il existe i 0 {1, 2, 3, 4} tel que α i0 0. > modele<-aov(conso~carbu,data=don) > summary(modele) Le tableau d analyse de variance est le suivant : Df Sum Sq Mean Sq F value Pr(>F) carbu 3 100.8 33.61 0.888 0.464 Residuals 20 757.0 37.85 La probabilité critique associée à la statistique de Fisher est de 0,464. Elle est bien supérieure à α = 5 % ; le test n est donc pas significatif à ce seuil et on peut ne peut rejeter l hypothèse nulle H 0 d absence d effet du facteur carburateur sur la consommation. Donc, au niveau α = 5 %, le facteur carburateur n a pas d effet significatif sur la consommation. Les estimations des coefficients du modèle sont données via le code R suivant : > library(factominer) > AovSum(conso~carbu,data=don) On obtient alors directement via cette commande, et le tableau de l analyse de la variance et les estimations des coefficients : $Ftest SS df MS F value Pr(>F) carbu 100.83 3 33.611 0.888 0.4643 Residuals 757.00 20 37.850 F test Estimate Std. Error t value Pr(> t ) (Intercept) 22.083333 1.255820 17.5847949 1.240826e-13 carbu - 1 1.416667 2.175144 0.6512980 5.222681e-01 carbu - 2 2.583333 2.175144 1.1876610 2.488811e-01 carbu - 3-1.750000 2.175144-0.8045446 4.305431e-01 carbu - 4-2.250000 2.175144-1.0344144 3.132890e-01 Nous remarquons que le carburateur A 4 nous fait consommer le moins de carburant. Néanmoins, puisque nous n avons pu rejeter H 0 d absence d effet du facteur carburateur sur la consommation au seuil α = 5 %, ce comportement n est pas significativement différent des autres à ce seuil. 5