Analyse de la variance et régression
|
|
- Raphaël Giroux
- il y a 7 ans
- Total affichages :
Transcription
1 Analyse de la variance et régression Rappel du cours Les ANOVA (ou analyses de la variance) généralisent le test t de Student aux cas où il y a plus de moyennes à comparer (au lieu de 2 dans le t-test). Dans ce cas là, il n est pas légitime d effectuer plusieurs tests t (par exemple pour 3 moyennes A, B et C, comparer la moyenne A à la moyenne B, puis la B à la C et la A à la C) car les comparaisons ne sont plus indépendantes entre elle (A vs B n est pas indépendant de A vs C, car A est impliqué dans les deux comparaisons). Lorsqu on effectue plusieurs comparaisons non indépendantes, l erreur de type I augmente (la probabilité de rejeter H0 à tort, c est à dire le risque α, est en réalité plus importante que le 5% que l on fixe ordinairement). L ANOVA permet de contourner ce problème en faisant un test global. En situation non paramétrique (c est à dire sur des données ordinales, ou bien sur des données quantitatives absolument pas gaussiennes et non transformables)par exemple en remplaçant x par log(x), il existe un équivalent à l ANOVA : le test de Kruskal-Wallis que nous avons déjà utilisé dans le TD précédent pour la comparaison de 2 moyennes en situation non paramétriques, mais aussi utilisable pour plus de 2 moyennes. Tout comme le test de Student, l ANOVA suppose la normalité de vos échantillons (testée avec la fonction shapiro.test(...)) et avec qqnorm et qqline. En théorie, il faut également que les variances soient égales. On a déjà comparer les variances avec le test f de fisher. On peut aussi utiliser le test de bartlett pour des comparaison multiples de variances (bartlett.test), même si en pratique il existe des variantes du test qui acceptent des variances inégales (au moins pour les ANOVA à un facteur). ANOVA à un facteur Reprenons l'exemple évoqué pendant le cours (cf tableau ci dessous). On étudie 5 milieu de culture de A à E pour favoriser le développement de culture de bactéries. On possède 10 tubes pour chacun des milieux et on compte le nombre de colonies. Quel est le milieu le plus favorable au développement des bactéries? Le tableau ci dessous expose les données issues d'un tableur : A B C D E Avant de commencer, veuillez noter que les données sont organisées par variable dans R : ce n est pas intuitif (vous ne noteriez pas vos données comme ça sous Excel) mais les logiciels de statistique
2 fonctionnent de cette façon. Ainsi, le jeux de données culture contient 2 colonnes, une première colonie qui contient le nombre de colonies par tube et une colonne milieu qui indique le milieu de culture. On a déjà exécuter le chargement d'un fichier externe en indiquant le chemin du document. On peut procéder aussi ainsi : getwd() donne le répertoire courant dans le menu de R, on peut utiliser la commande File /Change Dir et renommer le répertoire courant ou se trouve le fichier culture.csv puis > culture <- read.table("culture.csv", sep=";",header=t) On va d'abord visualiser ces données : > str(culture) > plot(culture$milieu, culture$colonies) Vous noterez que R a reconnu que les données de l abscisse sont du type facteur et dessine des boîtes à moustaches. Nous sommes bien dans une situation d ANOVA à 1 facteur. Tout d abord, il vous faut vérifier les hypothèses de base, c est à dire la normalité et l égalité des variances. Les commandes sont (par exemple) : > attach(culture) > shapiro.test(colonies[1:10]) > shapiro.test(colonies[11:20]) > shapiro.test(colonies[21:30]) > shapiro.test(colonies[31:40]) > shapiro.test(colonies[41:50]) data: Colonies[41:50] W = , p-value = La p -value est >> 0.05 : il n'y a pas d'écart significatif à la normalité R> bartlett.test(list(colonies[1:10], Colonies[11:20], Colonies[21:30], Colonies[31:40],Colonies[41:50])) Bartlett test for homogeneity of variances data: list(colonies[1:10], Colonies[11:20], Colonies[21:30], Colonies[31:40], Colonies[41:50]) Bartlett's K-squared = , df = 4, p-value = Même résultat, la p -value est >> 0.05 : il n'y a pas d'écart significatif entre les variances. L inconvénient de la notation par variable sous R est qu il faut lui dire que le premier groupe de milieu A va des valeurs 1 à 10, puis que le deuxième va de 11à 20, etc...mais la commande split simplifie la vie. Le test de Bartlett devient, par exemple, > bartlett.test(split(colonies,milieu))
3 Bartlett test for homogeneity of variances data: split(colonies, Milieu) Bartlett's K-squared = , df = 4, p-value = Les conditions étant remplies, on peut donc utiliser l'anova pour ces data et passer notre ANOVA à l aide de la commande suivante : > resultat<-aov(colonies~milieu) Le sigle aov est l abréviation de analysis of variance. Les ANOVA travaillent avec des formules. Ici, la formule dit que l on veut comparer les valeurs de colonies lorsqu elles sont groupées par Milieu. Le résultat de aov n est pas terrible, comme vous pouvez le constater en l affichant : > resultat Call: aov(formula = Colonies ~ Milieu) Terms: Milieu Residuals Sum of Squares Deg. of Freedom 4 45 Residual standard error: Estimated effects may be unbalanced En fait, pour que R donne le résultat de l ANOVA qui est stocké dans resultat, il faut le lui demander à l aide de la fonction summary : > summary(resultat) Df Sum Sq Mean Sq F value Pr(>F) Milieu e-05 *** Residuals Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 On retrouve ici le tableau d'analyse de variance Origine de la variance Degré de liberté (df) Somme des carrés des écarts Valeur de F de fisher P value associé Entre colonnes (entre milieu de culture) 4 (k colonnes 1) e-05 Intra colonne ou résiduelle 45 (N observations k) Total La p value étant plus inférieure à la valeur 0.05, les moyennes entre les 4 milieux de culture sont très différents en moyenne au risque e-05 d observer ce résultat d expérience au hasard. Pour connaître parmi ces 5 milieux, lesquels sont les plus propices au développement des bactéries,
4 il faut maintenant les comparer 2 à 2. La multiplication de tests t de Student au risque alpha de 5 %, (il faut faire ici 10 tests successifs) accroît beaucoup le risque de trouver une différence au hasard entre 2 milieux (le risque alpha augmente). On utilise donc des tests de comparaison de moyenne qui prennent en compte cette dérive. R sait faire le test «honestly significant difference» de Tukey en donnant l intervalle de confiance, ce qui est suffisant pour conclure (si l IC n inclut pas 0, la différence est significative). La syntaxe est la suivante :! TukeyHSD(resultat)! Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = Colonies ~ Milieu) $Milieu diff lwr upr B-A C-A D-A E-A C-B D-B E-B D-C E-C E-D Vous pouvez directement visualisez le résultat du test de Tukey en le donnant à la fonction plot R> plot(tukeyhsd(resultat)) detach(culture) permet de détacher le fichier par défaut Comprenez bien ces résultats? Que concluez vous
5 Corrélation Le coefficient de corrélation de Pearson (sans unité, entre -1 et 1), permet de rechercher une liaison entre un paramètre Y et X, de mesurer l intensité de cette liaison et d associer un niveau de significativité. Si p < 0.05, il est possible de tracer la droite qui lie y et x selon une régression linéaire. Les données Y et X doivent être distribués normalement, de même variance et les résidus constants. Sinon, on peut utiliser un test non paramétrique, le test des rangs de Spearman. Régression linéaire Modèle (et ses hypothèses) On dispose de deux variables X et Y, et on essaye de prédire les valeurs de Y à partir de celles de X. Pour cela, on suppose que Y s'obtient à partir de X de la manière suivante : Y = a + b * X + bruit où a et b sont des réels (à déterminer) et le bruit suit une distribution gaussienne de moyenne nulle. On mesure la concentration d un médicament dans le sang (X) et dans le cerveau (Y). Les concentrations sont elles corrélées? Tracez la droite de régression si nécessaire. X Y
6 > medic <- read.table("medic.csv", sep=';',header=t) > shapiro.test(medic$x) data: medic$x W = , p-value = > shapiro.test(medic$y) data: medic$y W = 0.982, p-value = > qqnorm(medic$x);qqline(medic$x) > qqnorm(medic$y);qqline(medic$y) > cor.test(medic$x,medic$y) Pearson's product-moment correlation data: medic$x and medic$y t = , df = 18, p-value = 2.785e-05 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: sample estimates: cor Le coefficient de corrélation est 0.79 avec p très faible : les 2 variables sont liés avec une intensité de liaison élevée On peut donc tracer la droite de régression. Créons une fonction dans R > courber <- function (x, y) { + plot(x,y, main=paste("cor =", round(cor(x,y), digits=2))) + abline(lm(y~x), col='red', lwd=3) + }! courber(medic$x, medic$y)!
7 TD/TP N 5 Dans un service de cancérologie où beaucoup de patients sont en souffrance physique et morale, on décide de mesurer la satisfaction des patients à la fin du séjour par une enquête avec un auto questionnaire. Un score de réponse global de 10 (minimum de satisfaction) à 50 (maximum de satisfaction) est calculé pour chaque patient. L enquête porte sur 90 patients différents. 1/ On se demande si l age intervient dans la réponse au questionnaire de satisfaction. Les patients sont répartis en 3 classes d âge : 20-45, 46-65, plus de 65. Faites une ANOVA pour rechercher s il existe une différence significative selon la classe d âge et laquelle? Les données figurent dans le fichier csv (satisfaction_a) 2/ On possède aussi l age de chaque patient et on peut aussi corréler les données entre age et le score de satisfaction. Etudier la liaison entre les variables. Les données figurent dans le fichier csv (satisfaction_c) Score patient par groupe d age qui sont nommées A, B, C dans le fichier. Patients 20a-45a 46a-65a plus de 65a
8 > satis_a <- read.table("satisfaction_a.csv", sep=';',header=t) > str(satis_a) `data.frame': 90 obs. of 2 variables: $ Score : int $ GroupeAge: Factor w/ 3 levels "A","B","C": ! plot(satis_a$groupeage,satis_a$score) > shapiro.test(satis_a$score[1:30]);shapiro.test(satis_a$score[31:60]);shapiro.test(satis_a$score[61 :90]) data: satis_a$score[1:30] W = , p-value = (on dit que le test est robuste. ) data: satis_a$score[31:60] W = , p-value = data: satis_a$score[61:90] W = , p-value = > resultat<-aov(satis_a$score~satis_a$groupeage) > resultat Call: aov(formula = satis_a$score ~ satis_a$groupeage) Terms: satis_a$groupeage Residuals Sum of Squares Deg. of Freedom 2 87 Residual standard error: Estimated effects may be unbalanced > summary(resultat) Df Sum Sq Mean Sq F value Pr(>F) satis_a$groupeage * Residuals Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 > TukeyHSD(resultat) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = satis_a$score ~ satis_a$groupeage) $"satis_a$groupeage" diff lwr upr B-A
9 C-A C-B / > satis_c <- read.table("satisfaction_c.csv", sep=';',header=t) > str(satis_c) `data.frame': 90 obs. of 2 variables: $ AGE : int $ SCORE: int > attach(satis_c) > plot(score, AGE) > shapiro.test(score) data: SCORE W = , p-value = > shapiro.test(age) data: AGE W = 0.945, p-value = On ne peut pas utiliser le test de corrélation de pearson, car l age n est pas distribué normalement On utilise le teste des rangs de spearman > cor.test(rank(score), rank(age)) Pearson's product-moment correlation data: rank(score) and rank(age) t = , df = 88, p-value = alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: sample estimates: cor
Lire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailAnalyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailExemples d Analyses de Variance avec R
Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailRégression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr
Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Plus en détailDidacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.
1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailDeuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1
Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1 V. Fiolet Université de Mons-Hainaut 2006-2007 Nous allons aujourd hui nous intéresser à la tâche de classification
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailMicrosoft Excel : tables de données
UNIVERSITE DE LA SORBONNE NOUVELLE - PARIS 3 Année universitaire 2000-2001 2ème SESSION SLMD2 Informatique Les explications sur la réalisation des exercices seront fournies sous forme de fichiers informatiques.
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailDETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES
Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application
Plus en détailUn exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Plus en détailchoisir H 1 quand H 0 est vraie - fausse alarme
étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts
Plus en détailModèle de calcul des paramètres économiques
Modèle de calcul des paramètres économiques selon norme SIA 480 Calcul de rentabilité pour les investissements dans le bâtiment Version 3.2 1. Introduction 1.1 Version Excel Le modèle de calcul a été développé
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailPackage TestsFaciles
Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26
Plus en détailIBM SPSS Statistics Base 20
IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailLecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailHedging delta et gamma neutre d un option digitale
Hedging delta et gamma neutre d un option digitale Daniel Herlemont 1 Introduction L objectif de ce projet est d examiner la couverture delta-gamma neutre d un portefeuille d options digitales Asset-Or-Nothing
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détail1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Plus en détailExamen de Logiciels Statistiques
G. Hunault Angers, mai 2011 Licence MEF Examen de Logiciels Statistiques On s intéresse ici au dossier EAEF01 qui contient un extrait des données du recensement américain. On trouvera ces données et leur
Plus en détailI. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):
Master Chimie Fondamentale et Appliquée : spécialité «Ingénierie Chimique» Examen «Programmation, Simulation des procédés» avril 2008a Nom : Prénom : groupe TD : I. Programmation I. 1 Ecrire un programme
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détail2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des
2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des marques déposées de Minitab, Inc. aux Etats-Unis et
Plus en détailDensité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas
Fiche TD avec le logiciel : tdr335 Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas F. Menu, A.B. Dufour, E. Desouhant et I. Amat La fiche permet de se familiariser
Plus en détailLes ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel
Champagne-Ardenne Les ateliers du Resclin Préparation des données issues d Epi-Info en utilisant le tableur Excel Mars 2007 SOMMAIRE 1. RAPPEL 1.1.Qu'est ce qu'un chemin d'accès? 1.2.Qu'est ce qu'une base
Plus en détailÉtude de cas Assurance (d après une étude de Philippe Périé, CISIA)
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont
Plus en détailUne variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)
CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailSéance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Plus en détailLa fonction ET et la fonction OU. La Fonction ET
La Fonction ET La fonction ET ne peut afficher que deux résultats: VRAI : Si les résultats de tous les tests logiques sont VRAI FAUX : Si le résultat d au moins l'un des tests logiques est FAUX. Structure
Plus en détail1. Introduction...2. 2. Création d'une requête...2
1. Introduction...2 2. Création d'une requête...2 3. Définition des critères de sélection...5 3.1 Opérateurs...5 3.2 Les Fonctions...6 3.3 Plusieurs critères portant sur des champs différents...7 3.4 Requête
Plus en détailUtilisation de l outil lié à MBKSTR 9
Utilisation de l outil lié à MBKSTR 9 Avec MBKSTR, vous disposez d un outil fonctionnant sous Excel (version 97 au minimum) et permettant de faire les études financières suivantes : Aide à la vente avec
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailMulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2), 79-82.
MOTHER-BABY ASSESSMENT SCALE Mulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2), 79-82. Instrument de Mother-Baby Assessment scale mesure
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailEncryptions, compression et partitionnement des données
Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des
Plus en détailINTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R
INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R Y. BROSTAUX (1) RÉSUMÉ Cette note constitue une introduction au langage et à l'environnement de programmation 5 dans sa version 1.4.1 pour
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailMedication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.
Medication Management Ability Assessment (MMAA) Patterson TL, Lacro J, McKibbin CL, Moscona S, Hughs T, Jeste DV. (2002) Medication management ability assessment: results from a performance based measure
Plus en détailCOMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES
J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailPrésentation du logiciel
Chapitre A Présentation du logiciel R Pré-requis et objectif La lecture du chapitre sur l installation de R dans les Annexes peut se révéler utile. Ce chapitre présente les origines, l objectif et les
Plus en détailMYXTRACTION. 2009 La Business Intelligence en temps réel
MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables
Plus en détailPremiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1
Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase
Plus en détailEssais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire
Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire Sylvie CHABAUD Direction de la Recherche Clinique et de l Innovation : Centre Léon Bérard - Lyon Unité de Biostatistique
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailHENDRICH FALL RISK MODEL (HFRM)
HENDRICH FALL RISK MODEL (HFRM) Hendrich, A. L., Bender, P. S., & Nyhuis, A. (2003). Validation of the Hendrich II Fall Risk Model: a large concurrent case/control study of hospitalized patients. Appl.Nurs
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailDans l'article précédent, vous avez appris
Pour les débutants Les différents formats de sortie proposés par PHPExcel La bibliothèque orientée objet PHPExcel permet de lire et créer des fichiers pour tableurs. Dans cette série d articles, vous apprendrez
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailUtiliser un tableau de données
Utiliser un tableau de données OBJECTIFS : - Définir une Base de Données. - Présentation : tableau de données. - Création d un tableau de données - Gestion d un tableau de données. - Trier et Filtrer des
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailMesure agnostique de la qualité des images.
Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailPrivate banking: après l Eldorado
Private banking: après l Eldorado Michel Juvet Associé 9 juin 2015 Toutes les crises génèrent de nouvelles réglementations Le tournant de 2008 Protection des clients MIFID, UCITS, FIDLEG Bilan des banques
Plus en détailRecherche dans un tableau
Chapitre 3 Recherche dans un tableau 3.1 Introduction 3.1.1 Tranche On appelle tranche de tableau, la donnée d'un tableau t et de deux indices a et b. On note cette tranche t.(a..b). Exemple 3.1 : 3 6
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailPratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»
Centre de recherche en démographie et sociétés UCL/IACCHOS/DEMO Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie» 1 2 3+ analyses univariées Type de variables
Plus en détailCahiers de l IMA. Fascicule SPSS
Octobre 2008 Numéro 41 Cahiers de l IMA Fascicule SPSS Ingrid Gilles Eva G. T. Green Paola Ricciardi Joos Régis Scheidegger Chiara Storari Thomas Tuescher Pascal Wagner-Egger Ricciardi-Joos Ricciardi-Joos
Plus en détailTests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes
, avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire
Plus en détailComment faire des étiquettes
Comment faire des étiquettes Révision 0.1 31/03/2004 Réalisé avec : OOo 1.1.0 Plate-forme / Os : Toutes n révision, mode d'emploi n révision : x.yz x : n de version majeure, par exemple 0 pour une phase
Plus en détailQuelques précisions concernant les commandes de Ticket Restaurant électronique par fichier Excel
Quelques précisions concernant les commandes de Ticket Restaurant électronique par fichier Excel. Commande de cartes Afin de faciliter votre compréhension, les champs obligatoires sont surlignés en jaune
Plus en détailCours Fonctions de deux variables
Cours Fonctions de deux variables par Pierre Veuillez 1 Support théorique 1.1 Représentation Plan et espace : Grâce à un repère cartésien ( ) O, i, j du plan, les couples (x, y) de R 2 peuvent être représenté
Plus en détailModèle GARCH Application à la prévision de la volatilité
Modèle GARCH Application à la prévision de la volatilité Olivier Roustant Ecole des Mines de St-Etienne 3A - Finance Quantitative Décembre 2007 1 Objectifs Améliorer la modélisation de Black et Scholes
Plus en détailGestion des données avec R
Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................
Plus en détailNOTICE TELESERVICES : Payer un impôt et gérer les contrat de paiement des impôts professionnels
NOTICE TELESERVICES : Payer un impôt et gérer les contrat de paiement des impôts professionnels Sommaire Sommaire... 1 Objet de la notice... 2 A qui s adresse cette notice?... 2 Pré-requis... 2 Notion
Plus en détailUne introduction au langage R
Une introduction au langage R Faouzi LYAZRHI UP Biostatistique Ecole Nationale Vétérinaire, 23, chemin des Capelles, BP 87614, F-31076 Toulouse cédex email : f.lyazrhi@envt.fr 2005 1. INSTALLER R 3 2.
Plus en détailLE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs
Plus en détailStatistique inférentielle TD 1 : Estimation
POLYTECH LILLE Statistique inférentielle TD : Estimation Exercice : Maîtrise Statistique des Procédés Une entreprise de construction mécanique fabrique de pièces demoteurdevoiturepourungrandconstructeur
Plus en détailTP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne
Objectifs : Ce TP est relatif aux différentes méthodes de codage d une information binaire, et à la transmission en bande de base de cette information. Les grandes lignes de ce TP sont l étude des méthodes
Plus en détailItem 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Plus en détailPLATEFORME SAAS D'ENVOI DE SMS. Guide du débutant UTILISER LA PLATEFORME SMSMODE TUTORIEL
PLATEFORME SAAS D'ENVOI DE SMS Guide du débutant UTILISER LA PLATEFORME SMSMODE TUTORIEL Sommaire PARTIE PARTIE PARTIE 3 PARTIE 4 PARTIE 5 PARTIE 6 PARTIE 7 CREER UN COMPTE CLIENT SMSMODE CREER SA PREMIERE
Plus en détailModules Prestashop - ExportCatalogue / EXPORT IMPORT POUR MODIFICATIONS EN MASSE DANS PRESTASHOP VERSION 2.0. 1 - Optim'Informatique
IMPORT / EXPORT POUR MODIFICATIONS EN MASSE DANS PRESTASHOP VERSION 2.0 1 - Optim'Informatique Installation INSTALLATION Pour installer le module ExportProduits copier le répertoire exportcatalogue dans
Plus en détailLES MODELES DE SCORE
LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d
Plus en détail