Package LeLogicielR. February 19, 2015



Documents pareils
Package TestsFaciles

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Lire ; Compter ; Tester... avec R

«Cours Statistique et logiciel R»

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Initiation à l analyse en composantes principales

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Statistiques Descriptives à une dimension

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Logiciel XLSTAT version rue Damrémont PARIS

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Introduction à la statistique non paramétrique

Extraction d information des bases de séquences biologiques avec R

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Les concepts de base, l organisation des données

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Analyse exploratoire des données

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction à la statistique descriptive

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Principe d un test statistique

Introduction à MATLAB R

FONCTION DE DEMANDE : REVENU ET PRIX

Annexe commune aux séries ES, L et S : boîtes et quantiles

Docteur José LABARERE

LES TYPES DE DONNÉES DU LANGAGE PASCAL

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

ET 24 : Modèle de comportement d un système Boucles de programmation avec Labview.

L obésité et le diabète de type 2 en France : un défi pour la prochaine décennie. DANIEL RIGAUD CHU de Dijon

PHOTO ROYAUME DE BELGIQUE /KINDOM OF BELGIUM /KONINKRIJK BELGIE. Données personnelles / personal data

Statistique : Résumé de cours et méthodes

Statistique Descriptive Élémentaire

Introduction à l approche bootstrap

TABLE DES MATIERES. C Exercices complémentaires 42

ntred 2007 Résultats de l étude Description des personnes diabétiques

Nombre dérivé et tangente

Aide - mémoire gnuplot 4.0

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

23. Interprétation clinique des mesures de l effet traitement

Entre mal-être et bien être : comment vont les étudiants. Premiers résultats. Damien BERTHILIER Président La Mutuelle des Étudiants LMDE-EPSE

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

SEMIN- Gestion des couleurs sous R. Michel BAYLAC. MNHN Département Systématique et Evolution OSEB

LIVRET DU CANDIDAT LES DEUX OPTIONS FACULTATIVES DANSE AU BACCALAURÉAT

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Chapitre 3. Les distributions à deux variables

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Disparités entre les cantons dans tous les domaines examinés

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Monitoring des données relatives au poids effectué par les services médicaux scolaires des villes de Bâle, Berne et Zurich

Optimiser ses graphiques avec R

Infolettre #18 : Les graphiques avec Excel 2010

La migraine. Foramen ovale perméable. Infarctus cérébral (surtout chez la femme)

données en connaissance et en actions?

INF6304 Interfaces Intelligentes

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

: seul le dossier dossier sera cherché, tous les sousdomaines

Liste des cours BAC+3 BAC+5 en Management & Leadership

Cours 7 : Utilisation de modules sous python

Gestion des données avec R

Maple: premiers calculs et premières applications

DOSSIER DE CANDIDATURE PEDAGOGIQUE En seconde Année du MASTER «Sciences de l Ingénieur» (SDI) Année universitaire

R01 Import de données

Du bon usage de gnuplot

MARS rapport d analyse. étude de la situation nutritionnelle des enfants vus par Médecins du Monde à Mayotte

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Séance 0 : Linux + Octave : le compromis idéal

Item 169 : Évaluation thérapeutique et niveau de preuve

ROYAUME DE BELGIQUE / KINGDOM OF BELGIUM / KONINKRIJK BELGIE

Apllication au calcul financier

ECOWIN PRO. A retenir

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Données longitudinales et modèles de survie

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

VI. Tests non paramétriques sur un échantillon

Développement d une application pilote

Utilisation du Logiciel de statistique SPSS 8.0

PHP et mysql. Code: php_mysql. Olivier Clavel - Daniel K. Schneider - Patrick Jermann - Vivian Synteta Version: 0.9 (modifié le 13/3/01 par VS)

CHAPITRE 1 : DE LA FONCTION DE DEMANDE DU CONSOMMATEUR À LA DEMANDE DE MARCHÉ

Interface PC Vivago Ultra. Pro. Guide d'utilisation

Laboratory accredited by the French Home Office (official gazette date February 5 th, 1959, modified) Valid five years from August 27 th, 2013

Le risque Idiosyncrasique

Intérêt diagnostic du dosage de la CRP et de la leucocyte-estérase dans le liquide articulaire d une prothèse de genou infectée

Liste des cours BAC+3 BAC+5 en Publicité & Relations Publiques

Document d orientation sur les allégations issues d essais de non-infériorité

Tutoriel Mathematica Les graphiques

Relation entre deux variables : estimation de la corrélation linéaire

Analyse des durées de vie avec le logiciel R

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Représentation d une distribution

Transcription:

Type Package Package LeLogicielR February 19, 2015 Title Functions and datasets to accompany the book ``Le logiciel R: Maitriser le langage, Effectuer des analyses statistiques'' (french) Version 1.2 Date 2012-04-20 Author Lafaye de Micheaux Pierre, Drouilhet Remy, Liquet Benoit Maintainer P Lafaye de Micheaux <lafaye@dms.umontreal.ca> This package provides functions and datasets for the reader of the book ``Le logiciel R: Maitriser le langage, Effectuer des analyse statistiques''. The documentation and help pages are written in french. Language fr License GPL (>= 2) LazyLoad yes Depends xtable, RColorBrewer, gdata, IndependenceTests Encoding latin1 Repository CRAN Date/Publication 2012-12-15 15:55:07 NeedsCompilation yes R topics documented: LeLogicielR-package.................................... 2 camembert.......................................... 2 cor0.test........................................... 3 cor2.test.2.sample...................................... 4 diagcroix.......................................... 6 flashy.plot.......................................... 7 fleches............................................ 8 IMC.ENFANT....................................... 8 1

2 camembert INFARCTUS........................................ 9 INTIMA.MEDIA...................................... 10 NUTRIAGE......................................... 11 POIDS.NAISSANCE.................................... 12 tuyauxorgue......................................... 13 Index 15 LeLogicielR-package Package illustrant le livre: Le Logiciel R Details Ce package permet d utiliser certaines fonctions contruites à l occasion de l écriture du livre :Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques. Vous pouvez aussi y trouver les jeux de données utilisées dans ce livre. Package: LeLogicielR Type: Package Version: 0.5 Date: 2010-10-09 License: GPL(>=2.0) LazyLoad: yes Livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques camembert Diagramme circulaire Cette fonction offre une variante de la fonction pie

cor0.test 3 camembert(x, col = NULL, family = "HersheyScript") Arguments x col family variable qualitative un vecteur de chaine de caractères pour la couleur de chaque modalité famille de polices pour le titre. Par défaut, la police utilisée est "HersheyScript". Value Un graphique Chapitre 9 (Statistique descriptive) du livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques See Also pie data(nutriage) attach(nutriage) matgras <- as.factor(matgras) levels(matgras) <- c("beurre","margarine","arachide","tournesol","olive","isio4","colza","canard") require("rcolorbrewer") col <- brewer.pal(8,"pastel2") camembert(matgras,col) detach(nutriage) cor0.test Test du coefficient de correlation Test du coefficient de corrélation entre deux variables quantitatives cor0.test(x, y, rho0 = 0, alternative = c("two.sided", "less", "greater"))

4 cor2.test.2.sample Arguments x y rho0 alternative un vecteur numérique est un vecteur numérique réel indiquant la valeur du coefficient de corrélation pour l hypothèse nulle. Par défaut rho0 vaut 0 Hypothèse alternative du test. Trois tests sont possibles: bilatéral ("two.sided"), unilatéral inférieur ("less"), unilatéral supérieur ("greater"). Par défaut c est l hypothèse "two.sided". Value Retourne une liste : statistic p.value La valeur de la statistique de test La valeur-p du test Chapitre 11 (Intervalles de confiance et tests d hypothèses) du livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques See Also cor.test data(imc.enfant) attach(imc.enfant) cor0.test(poids,taille) detach(imc.enfant) cor2.test.2.sample Comparaison de deux coefficients de correlation Test de l égalité de deux coefficients de corrélation cor2.test.2.sample(x1, y1, x2, y2, alternative = c("two.sided", "less", "greater"))

cor2.test.2.sample 5 Arguments x1 y1 x2 y2 alternative x1 vecteur numérique associé à y1 y1 vecteur numérique associé à x1 x2 vecteur numérique associé à y2 y2 vecteur numérique associé à x2 Hypothèse alternative du test. Trois tests sont possibles: bilatéral ("two.sided"), unilatéral inférieur ("less"), unilatéral supérieur ("greater"). Par défaut c est l hypothèse "two.sided" Value Retourne une liste contenant statistic p.value La valeur de la statistique de test La valeur-p du test Chapitre 11 (Intervalles de confiance et tests d hypothèses) du livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques See Also cor0.test data(imc.enfant) attach(imc.enfant) indf <- which(sexe=="f") # Permet de recuperer les indices des filles. indg <- which(sexe=="g") # Permet de recuperer les indices des garcons. cor2.test.2.sample(taille[indf],poids[indf],taille[indg],poids[indg]) detach(imc.enfant)

6 diagcroix diagcroix Diagramme en croix Le diagramme en croix affiche pour chaque observation une petite croix au-dessus de la modalité correspondante diagcroix(x, titre, col, family = "HersheyScript") Arguments x titre col family variable qualitative chaine de caractères pour le titre du graphique vecteur de chaines de caractères pour la couleur de chaque modalité famille de polices pour le titre. Par défaut, la police utilisée est "HersheyScript". Value Un graphique Chapitre 9 (Statistique descriptive) du livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques data(nutriage) attach(nutriage) situation <- as.factor(situation) levels(situation) <- c("seul","couple","famille","autre") diagcroix(situation,col=c("orange","darkgreen","black","tan")) detach(nutriage)

flashy.plot 7 flashy.plot Croisement de deux variables quantitatives Cette fonction permet d enjoliver le graphique fournit par la fonction plot() dans le cadre du croisement de deux variables quantitatives flashy.plot(x,y,facteur, family = "HersheyScript",xlab="",ylab="") Arguments x y facteur family xlab ylab vecteur numérique vecteur numérique vecteur numérique sous la forme d un facteur famille de polices du titre. Par défaut, la police utilisée est "HersheyScript". chaine de caractères, étiquette des x chaine de caractères, étiquette des y Value Un graphique Chapitre 9 (Statistique descriptive) du livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques See Also plot data(nutriage) attach(nutriage) sexe <- as.factor(sexe) levels(sexe) <- c("homme","femme") flashy.plot(poids,taille,sexe,xlab="taille",ylab="poids") detach(nutriage)

8 IMC.ENFANT fleches La fonction fleches Cette fonction permet d ajouter une flèche sur les extrémités des axes d un graphique fleches(x = TRUE, y = TRUE) Arguments x y logique. La valeur par défaut est TRUE indiquant une flèche sur l axe des abscisses logique. La valeur par défaut est TRUE indiquant une flèche sur l axe des ordonnées Chapitre 9 (Statistique descriptive) du livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques curve(cos(x),xlim=c(-10,10)) fleches() IMC.ENFANT Indice de masse corporelle chez les enfants Ce jeu de données provient d une étude épidémiologique traitée par une équipe de l Institut de santé publique d épidémiologie et de développement (ISPED) de Bordeaux. Un échantillon de dossiers d enfants a été saisi. Ce sont des enfants vus lors d une visite en 1ère section de maternelle en 1996-1997 dans des écoles de Bordeaux (Gironde, France). L échantillon est constitué de 152 enfants âgés de 3 ou 4 ans.

INFARCTUS 9 data(imc.enfant) Format Un data frame avec 152 observations mesurées sur les 6 variables suivantes. SEXE un facteur ayant les niveaux F et G zep un facteur ayant les niveaux N et O poids un vecteur numérique an un vecteur numérique mois un vecteur numérique taille un vecteur numérique Source http://www.biostatisticien.eu/springer/ data(imc.enfant) str(imc.enfant) INFARCTUS Etude sur l infarctus du myocarde Ce jeu de données provient d une étude épidémiologique traitée par une équipe de l Institut de santé publique d épidémiologie et de développement (ISPED) de Bordeaux. Il s agit d une étude cas-témoins sur l infarctus du myocarde data(infarctus)

10 INTIMA.MEDIA Format Details Un data frame avec 449 observations mesurées sur les 10 variables suivantes. NUMERO un vecteur numérique INFARCT un vecteur numérique CO un vecteur numérique TABAC un vecteur numérique AGE un vecteur numérique POIDS un vecteur numérique TAILLE un vecteur numérique IMC un vecteur numérique ATCD un vecteur numérique HTA un vecteur numérique Les données suivantes sont issues d une enquête cas-témoins dont le but était d évaluer l existence d un risque plus élevé de survenue d un infarctus du myocarde chez les femmes qui utilisent ou ont utilisé des contraceptifs oraux. L étude a été menée auprès de 149 femmes ayant eu un infarctus du myocarde (cas) et 300 femmes n en n ayant pas eu (témoins). Source http://www.biostatisticien.eu/springer/ data(infarctus) str(infarctus) INTIMA.MEDIA Epaisseur de l intima-media Ce jeu de données provient d une étude épidémiologique traitée par une équipe de l Institut de santé publique d épidémiologie et de développement (ISPED) de Bordeaux. L épaisseur de l intimamédia est un marqueur reconnu d athérosclérose. Elle a été mesurée par échographie sur un échantillon de 110 sujets en 1999 dans les CHU de Bordeaux. Des informations sur les principaux facteurs de risque ont aussi été recueillies.

NUTRIAGE 11 data(intima.media) Format Un data frame avec 110 observations mesurées sur les 9 variables suivantes. SEXE un vecteur numérique AGE un vecteur numérique taille un vecteur numérique poids un vecteur numérique tabac un vecteur numérique paqan un vecteur numérique SPORT un vecteur numérique mesure un vecteur numérique alcool un vecteur numérique Source http://www.biostatisticien.eu/springer/ data(intima.media) str(intima.media) NUTRIAGE Alimentation chez des personnes agees Ce jeu de données provient d une étude épidémiologique traitée par une équipe de l Institut de santé publique d épidémiologie et de développement (ISPED) de Bordeaux. Un échantillon de personnes âgées résidant à Bordeaux (Gironde, France) a été interrogé en 2000 dans le cadre d une enquête nutritionnelle. L échantillon est constitué de 226 sujets. data(nutriage)

12 POIDS.NAISSANCE Format Un data frame avec 226 observations mesurées sur les 13 variables suivantes. sexe un vecteur numérique situation un vecteur numérique the un vecteur numérique cafe un vecteur numérique taille un vecteur numérique poids un vecteur numérique age un vecteur numérique viande un vecteur numérique poisson un vecteur numérique fruit_crus un vecteur numérique fruit_legume_cuits un vecteur numérique chocol un vecteur numérique matgras un vecteur numérique Source http://www.biostatisticien.eu/springer/ data(nutriage) str(nutriage) POIDS.NAISSANCE Poids de naissance Ce jeu de données provient d une étude épidémiologique traitée par une équipe de l Institut de santé publique d épidémiologie et de développement (ISPED) de Bordeaux. Il s agit d une enquête concernant les facteurs de risque associés au faible poids de naissance de nourrissons (données collectées au centre médical de Baystate dans le Massachusetts pendant l année 1986). data(poids.naissance)

tuyauxorgue 13 Format Un data frame avec 189 observations mesurées sur les 11 variables suivantes. ID un vecteur numérique AGE un vecteur numérique LWT un vecteur numérique RACE un vecteur numérique SMOKE un vecteur numérique PTL un vecteur numérique HT un vecteur numérique UI un vecteur numérique FVT un vecteur numérique BWT un vecteur numérique LOW un vecteur numérique Source http://www.biostatisticien.eu/springer/ data(poids.naissance) str(poids.naissance) tuyauxorgue Diagramme en tuyaux d orgues Diagramme en tuyaux d orgues tuyauxorgue(x, col, titre, pareto = FALSE, freq.cumul = FALSE, family = "HersheyScript")

14 tuyauxorgue Arguments x Value col titre pareto variable qualitative vecteur de chaines de caractères pour la couleur de chaque modalité chaine de caractères pour le titre du graphique logique. TRUE pour un diagramme de Pareto. Par défaut pareto est FALSE freq.cumul logique. TRUE pour ajouter la courbe des fréquences cumulées. Par défaut freq.cumul est FALSE family Un graphique famille de polices pour le titre. Par défaut, la police utilisée est "HersheyScript" Chapitre 9 (Statistique descriptive) du livre: Le logiciel R, Maitriser le langage, Effectuer des analyses statistiques See Also barplot data(nutriage) attach(nutriage) situation <- as.factor(situation) levels(situation) <- c("seul","couple","famille","autre") col <- c("gray","orangered","lightgoldenrodyellow","red") tuyauxorgue(situation,col) detach(nutriage)

Index Topic datasets IMC.ENFANT, 8 INFARCTUS, 9 INTIMA.MEDIA, 10 NUTRIAGE, 11 POIDS.NAISSANCE, 12 Topic package LeLogicielR-package, 2 barplot, 14 camembert, 2 cor.test, 4 cor0.test, 3, 5 cor2.test.2.sample, 4 diagcroix, 6 flashy.plot, 7 fleches, 8 IMC.ENFANT, 8 INFARCTUS, 9 INTIMA.MEDIA, 10 LeLogicielR (LeLogicielR-package), 2 LeLogicielR-package, 2 NUTRIAGE, 11 pie, 3 plot, 7 POIDS.NAISSANCE, 12 tuyauxorgue, 13 15