PRÉSENTATION DU LOGICIEL R



Documents pareils
Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

1 Introduction - Qu est-ce que le logiciel R?

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Introduction à MATLAB R

Les concepts de base, l organisation des données

TP 1. Prise en main du langage Python

Lire ; Compter ; Tester... avec R

Séance 0 : Linux + Octave : le compromis idéal

Aide - mémoire gnuplot 4.0

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Initiation à LabView : Les exemples d applications :

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA

Initiation à la Programmation en Logique avec SISCtus Prolog

Première session de travail

Gestion des données avec R

R01 Import de données

Annexe commune aux séries ES, L et S : boîtes et quantiles

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

INTRODUCTION AU LOGICIEL R

Premiers pas avec Mathematica

Introduction aux Statistiques et à l utilisation du logiciel R

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

TP1 - Prise en main de l environnement Unix.

LES TYPES DE DONNÉES DU LANGAGE PASCAL

Présentation du langage et premières fonctions

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Introduction à la présentation graphique avec xmgrace

Python - introduction à la programmation et calcul scientifique

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Débuter avec Excel. Excel

Cours 7 : Utilisation de modules sous python

GUIDE Excel (version débutante) Version 2013

Aide-mémoire de statistique appliquée à la biologie

Une introduction au langage R

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

CAPTURE DES PROFESSIONNELS

Calcul Formel et Numérique, Partie I

Découverte du tableur CellSheet

Jérôme Mathieu janvier Débuter avec R. Ce document est disponible sur le site web :

Initiation au logiciel R

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Initiation à l analyse en composantes principales

Calcul Formel et Numérique, Partie I

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

RECOPLUS LOGICIEL DE GESTION DES RECOMMANDES NOTICE D UTILISATION DE RECOPLUS RESEAU. N de série

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Statistique : Résumé de cours et méthodes

Algorithmique et programmation : les bases (VBA) Corrigé

L informatique en BCPST

Logiciel XLSTAT version rue Damrémont PARIS

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Infolettre #18 : Les graphiques avec Excel 2010

SPHINX Logiciel de dépouillement d enquêtes

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

EXCEL TUTORIEL 2012/2013

TP1 : Initiation à l algorithmique (1 séance)

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Optimiser ses graphiques avec R

STAGE IREM 0- Premiers pas en Python

C2i Niveau 1 Enoncé Activité 1 UPJV

Gnuplot. Chapitre Lancer Gnuplot. 3.2 Options des graphes

Mon aide mémoire traitement de texte (Microsoft Word)

Note de cours. Introduction à Excel 2007

Programmation Web. Madalina Croitoru IUT Montpellier

TD d économétrie appliquée : Introduction à STATA

Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1

Tutoriel Création d une source Cydia et compilation des packages sous Linux

TP 1 Introduction à Matlab Février 2009

SUGARCRM MODULE RAPPORTS

3.2. Matlab/Simulink Généralités

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

1 TD 2 : Construction d'une chier Acrobat et envoi par

Info0101 Intro. à l'algorithmique et à la programmation. Cours 3. Le langage Java

Classe de première L


La Clé informatique. Formation Excel XP Aide-mémoire

Utilisation d objets : String et ArrayList

(Mis à jour : 7 déc. 12)

VOS PREMIERS PAS AVEC TRACENPOCHE

Maple: premiers calculs et premières applications

Services bancaires par Internet aux entreprises. Guide pratique pour : Rapports de solde Version

données en connaissance et en actions?

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

Statistiques à une variable

Initiation à la programmation en Python

TP 1 Prise en main de l environnement Unix

Traceur de courbes planes

Access et Org.Base : mêmes objectifs? Description du thème : Création de grilles d écran pour une école de conduite.

Parcours FOAD Formation EXCEL 2010

Compléments de documentation Scilab : affichage de texte et formatage de nombres

Notice d utilisation

Chess Arbiter Pro (version Dames) Notice d utilisation

1. Structure d'un programme FORTRAN 95

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

INITIATION AU LOGICIEL SAS

TD3: tableaux avancées, première classe et chaînes

Transcription:

PRÉSENTATION DU LOGICIEL R SAMY TINDEL, D APRÈS AURÉLIE GUEUDIN ET IRINA IOANNOU 1. Fonctionnement de R 1.1. Prise en main. Lorsqu on lance R sur l ordinateur, une fenêtre appelée console s ouvre à l écran. Dans cette console, le signe > apparaît. Ce signe indique que R est prêt à exécuter les commandes. Par exemple, une commande très simple consiste à effectuer une opération: > 4+1 [1] 5 Le chiffre entre crochets indique que l affichage commence au premier élément de réponse. Ici, il n y a qu un élément de réponse. Deuxième exemple: on effectue la commande suivante, qui consiste à simuler un échantillon de taille 10, selon une loi normale de moyenne 0 et de variance 1: > rnorm (10,0,1) [1] - 1. 7345376-0. 9117214-0. 9472176 0. 2573009 0. 2253460 [6] - 1. 3903420-2. 0235993-0. 6502747 0. 4188200 0. 9547340 Ici, les chiffres [1] et [6] entre crochets indiquent que l affichage commence au premier élément de réponse, pour la première ligne, et au 6ème élément de réponse pour la 2ème ligne. 1.2. Sauvegarder votre travail. Sur R, on travaille dans un script. Sous Windows, on ouvre un nouveau script en allant dans >Fichier>Nouveau document. On enregistre ce script, avec une extension.r (par exemple : essai.r). Taper par exemple 1+1 dans ce script, sélectionner la ligne tapée, puis un click droit avec la souris permet d exécuter cette ligne : le résultat est affiché dans la console. Taper une seconde ligne avec 2+3, sélectionner cette nouvelle ligne et l exécuter. On pourra à nouveau ouvrir, utiliser et modifier ce script à une prochaine séance de travail. Pour noter des commentaires dans le script, il suffit de les écrire après le symbole #. La ligne écrite après ce signe est ignorée par R. Par exemple : > rnorm (10,0,1) #10 réalisations d une loi gaussienne. Dans R, il faut mettre des. au lieu des virgules, pour les décimales. 2. Répertoire de travail, lecture de fichiers 2.1. Repérage. Le répertoire courant ou répertoire de travail est le répertoire dans lequel se trouve les fichiers de données sur lesquelles on travaille. Pour indiquer à R le répertoire courant, il faut (sous Windows) aller dans Fichier, puis Changer le répertoire courant et sélectionner le répertoire voulu. On peut aussi le faire directement en ligne de commande: > setwd (" C:/ mon_repertoire ") Pour savoir dans quel répertoire on est, taper getwd() dans la console. 1

2 LICENCE 2 - LVE/CMI 2.2. Lecture de fichiers. Une fois le répertoire courant spécifié, R peut lire des fichiers de données stockées dans des fichiers texte via la fonction read.table. Par exemple, si on a un fichier nommé data.dat, la commande > mydata <- read. table (" data. dat ") crée un tableau de données, nommé mydata, et chaque colonne du tableau est nommée par défaut V1, V2, etc. Pour appeler une colonne d un tableau de données, il suffit d écrire: > le nom du tableau $ le nom de la colonne Par exemple, la commande mydata$v1 permet d afficher la première colonne du tableau mydata. Utilisation de la fonction read.table: > read. table (" file ", header = FALSE ) où: file : nom du fichier à lire (entre ). header = TRUE ou FALSE suivant que le fichier contient ou non les noms des variables sur la première ligne. Par défaut, header = FALSE. Remarque: Si le fichier contient des valeurs non numériques, read.table() va lire la colonne contenant ces valeurs comme des facteurs. 2.3. Ecriture des données en fichier.txt. Voici comment créer un fichier texte, lisible par R. Ouvrir le bloc-note et y copier les données. Les données doivent être en colonnes. Si on donne des noms aux colonnes, ils doivent être sans espace. Remplacer les virgules par des points. Enregistrer sous extension.txt. 2.4. Enregistrer des données dans un fichier texte. A l inverse, on peut utiliser R pour écrire un fichier de données. > write. table (x, file = " data. txt ", append = FALSE ) Ici x est le nom des données à écrire, file est le nom du fichier où vont s écrire les données, append =TRUE si on ajoute les données sans effacer celles éventuellement existantes dans le fichier, =FALSE si on les efface avant d écrire l objet. Par défaut, append = FALSE. 2.5. Packages. Certaines fonctions de R ne sont disponibles que dans des packages. Pour ouvrir un package sur R, voici comment faire : > library ( pgirmess ) Si R donne un message d erreur, aller dans le menu Package, puis Charger le package, et enfin sélectionner le package voulu. Si le package n est pas dans la liste proposée, aller dans le menu Package, puis Installer le(s) package(s), et enfin laissez vous guider (R va sur Internet, et cherche le package que vous lui demandez).

LOGICIEL R 3 3. Opérations de base 3.1. Calculatrice. R peut effectuer toutes les opérations de base (avec +,,, /). > (10 + 2) * 5 [1] 60 3.2. Opérateurs de comparaison et logiques. Effectuer par exemple, les commandes suivantes: 1<2, 2<1, 1 <=1, 1==1, 1!=1, (1==1)&(2!=1), (1 <1) (2!=1). Le tableau suivant récapitule les différents opérateurs disponibles dans R. Remarque : on utilisera l opérateur & pour spécifier une inégalité du type 0 < x < 1, qui sera codée ainsi : 0<x & x <1. 3.3. Créer, lister et effacer des objets en mémoire. Le nom d un objet doit commencer par une lettre et peut comporter des lettres, des chiffres et des points. Un objet peut être crée avec l opérateur assigner, qui s écrit avec une flèche composée d un signe < accolé avec un signe. > n <- 15 + 2 > n [1] 17 Attention: R distingue les minuscules des majuscules! Ainsi X et x pourront servir à nommer des objets distincts. > x <- 1 > X <- 10 > x [1] 1 > X [1] 10 La fonction ls permet d afficher la liste de tous les objets en mémoire (seulement leur nom). > nom <- " Carmen "; n1 <- 10; n2 <- 100; m <- 0.5 > ls () [1] "m" "n1" "n2" " nom " Notons ci-dessus l usage du point-virgule pour séparer, sur la même ligne, des commandes distinctes. La fonction ls.str() affiche des détails supplémentaires sur les objets en mémoire : > ls.str () m : num 0.5 n1 : num 10 n2 : num 100 name : chr " Carmen " Ci-dessus, num signifie que la variable est numérique, tandis que chr signifie que la variable est une suite de caractères. Pour effacer des objets en mémoire, on utilise la fonction rm(), rm(x) permet d effacer l objet x, rm(x,y) permet d effacer les objets x et y, rm(list=ls()) efface tous les objets en mémoire.

4 LICENCE 2 - LVE/CMI 3.4. Aide en ligne. L aide en ligne de R est très utile pour l utilisation des fonctions. L aide est disponible directement pour une fonction donnée. Par exemple, >? lm affichera, dans R, l aide concernant la fonction lm(). L appel de l aide ouvre une page où vous trouvez, sur la première ligne, des informations générales (nom du package où se trouve la fonction interrogée), ensuite le nom de la fonction interrogée, et enfin divers paragraphes (les plus utiles sont Arguments, Value et Examples): Description, donnant une brève description de la fonction. Usage, donnant tous les arguments et options de la fonction. Arguments, détaillant chacun des arguments de la fonction. Détails, donnant plus d informations sur la fonction. Value, expliquant ce que renvoie la fonction. See also, renvoyant à d autres fonctions, proches de la fonction interrogée. Examples, donnant des exemples. 4. Vecteurs Remarque: les vecteurs peuvent être vus comme des suites de nombres. 4.1. Création de vecteurs. On peut taper directement le vecteur en utilisant la fonction c: >c(0,2,5,7,3) [1] 0 2 5 7 3 La fonction rep crée un vecteur qui aura tous ses éléments identiques: >rep (2,4) [1] 2 2 2 2 >x<- rep (c (1,2),2) [1] 1 2 1 2 >rep (x,3) [1] 1 2 1 2 1 2 1 2 1 2 1 2 La fonction seq peut créer des séquences de nombres réels de la manière suivante >seq (a,b,h) ou seq (a,b,by=h) où le premier nombre indique le début de la séquence, le second la fin, et le troisième l incrément utilisé dans la progression de la séquence. > seq (1, 5, 0.5) [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 On peut aussi utiliser: seq(a, b,length=n) ou seq(from=a,to=b,length=n), qui créent un vecteur constitué de n points répartis uniformément entre a et b. > seq ( from =1, to =5, length =9) [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 Une suite d entiers, par exemple de 1 à 30, peut être générée par >x < -1 :30 On a ainsi un vecteur x avec 30 éléments. La fonction sequence va créer une suite de séquences de nombres entiers qui chacune se termine par les nombres donnés en arguments de cette fonction :

> sequence (4:6) [1] 1 2 3 4 1 2 3 4 5 1 2 3 4 5 6 > sequence (c (10,5)) [1] 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 LOGICIEL R 5 Les fonctions suivantes : numeric(n), logical(n) et character(n) créent des vecteurs de taille n, composés de 0 pour numeric, de FALSE pour logical, et de pour character. 4.2. Opérations avec les vecteurs. Extraction: x[n] est la nième composante du vecteur x. Ainsi on a: x[10]: 10ème composante du vecteur x x[c(1,4,8)]: 1ère, 4ème et 8ème composantes du vecteur x[-2]: suppression de la 2ème composante du vecteur x[c(-2,-5)]: suppression des 2ème et 5ème composantes du vecteur x[c(t,f,f,f)]: seules les 1ère, 5ème,9ème, etc. composantes sont gardées x[x>5]: seules les composantes supérieures à 5 sont gardées. Voici encore quelques exemples : > x <- 1: 10 > x[x >= 5] <- 20 > x [1] 1 2 3 4 20 20 20 20 20 20 > x[x == 1] <- 25 > x [1] 25 2 3 4 20 20 20 20 20 20 > x[x %%2==0] # x %%2 vaut 0 si x est pair, 1 sinon [1] 2 4 6 8 10 Concaténation: si x et y sont deux vecteurs, alors z<-c(x,y) est le vecteur issu de la concaténation de x et y. Opérations mathématiques: > x <- 1:4 > y <- c (1,10,20,4) > z <- x + y > z [1] 2 12 23 8 >a < -10 >z<-a*x >z [1] 10 20 30 40 On trouve aussi toutes les fonctions mathématiques de base (log, exp, log10, log2, sin, cos, tan, asin, acos, atan, abs, sqrt). A titre d exemples, sqrt(y) est le vecteur des racines prises terme à terme, log(y) est le vecteur des logarithmes pris terme à terme. Longueur d un vecteur: length(y) Tri: sort(y) 5. Matrices Notons que pour R, les matrices peuvent être considérées comme des tableaux.

6 LICENCE 2 - LVE/CMI 5.1. Création de matrices. Une matrice peut être créée avec la fonction matrix(data = données, nrow = nblignes, ncol = nbcolonnes). R remplit alors la matrice par colonnes. Si on veut que R la remplisse par ligne, il faut ajouter l option byrow: matrix(data = données, nrow = nblignes, ncol = nbcolonnes,byrow= TRUE). > matrix ( data =5, nr =2, nc =2) [,1] [,2] [1,] 5 5 [2,] 5 5 > matrix (1:6, 2, 3) [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 > matrix (1:6, 2, 3, byrow = TRUE ) [,1] [,2] [,3] [1,] 1 2 3 [2,] 4 5 6 Nommer lignes et colonnes : >y<- matrix (1:6, nrow =2) > colnames (y)<-c("a","b","c") > rownames (y)<-c(" France "," Italie ") > y A B C France 1 3 5 Italie 2 4 6 5.2. Opérations sur les matrices. Extraction: y[2,1] donne l élément de la 2ème ligne et 1ère colonne y[2,] donne la 2ème ligne y[,2] donne la 2ème colonne y[,-1] enlève la 1ère colonne y[-1,-1] enlève la 1ère ligne et la 1ère colonne y[,c(-10:-20)] si y est une matrice de plus de 20 colonnes, cette commande enlève les colonnes 10 à 20. Demander la dimension d une matrice: dim(y). Par exemple, une matrice composée de 2 lignes et 2 colonnes aura pour dimension le couple de valeurs [2,2] ; par contre sa longueur length sera 4. Calcul par dimension : apply(y,1,mean) calcule la moyenne (mean) de chaque ligne. La fonction apply(y,2,mean) calcule la moyenne (mean) de chaque colonne. Les fonctions rbind() et cbind() juxtaposent des matrices en conservant respectivement les lignes et les colonnes. > m1 <- matrix (1, nr = 2, nc = 2) > m2 <- matrix (2, nr = 2, nc = 2) > rbind (m1, m2) [,1] [,2] [1,] 1 1 [2,] 1 1 [3,] 2 2

LOGICIEL R 7 [4,] 2 2 > cbind (m1, m2) [,1] [,2] [,3] [,4] [1,] 1 1 2 2 [2,] 1 1 2 2 Le produit matriciel est réalisé avec %*%. > rbind (m1, m2) %*% cbind (m1, m2) [,1] [,2] [,3] [,4] [1,] 2 2 4 4 [2,] 2 2 4 4 [3,] 4 4 8 8 [4,] 4 4 8 8 Ou encore: > cbind (m1, m2) %*% rbind (m1, m2) [,1] [,2] [1,] 10 10 [2,] 10 10 6. Conversion d objets Il y a 3 modes pour un objet : numérique, logique, ou caractère. as.numeric permet de convertir un objet de mode logique ou caractère en mode numérique. > as. numeric ( FALSE ) [1] 0 > as. numeric ( TRUE ) [1] 1 > as. numeric ("10") [1] 10 > as. numeric ("a") [1] NA as.logical permet de convertir un objet de mode numérique ou caractère en mode logique. >as. logical (0) [1] FALSE > as. logical (10) [1] TRUE > as. logical (" FALSE ") [1] FALSE > as. logical (" TRUE ") [1] TRUE > as. logical (" bonjour ") [1] NA as.character permet de convertir un objet de mode logique ou numérique en mode caractère. > as. character (4) [1] "4" > as. character ( FALSE ) [1] " FALSE "

8 LICENCE 2 - LVE/CMI > as. character ( TRUE ) [1] " TRUE " On peut aussi convertir un vecteur en facteur avec as.factor (très utile pour les ANOVA): > x =1:5 > as. factor (x) [1] 1 2 3 4 5 Levels : 1 2 3 4 5 7. Graphiques R offre une grande variété de graphiques. Pour avoir une petite idée des possibilités offertes, il suffit de taper la commande demo(graphics). 7.1. Fonctions graphiques principales. Nous ne présentons ici que plot, boxplot et hist: plot(z) trace le nuage de points dont les ordonnées sont les valeurs de z. plot(x,y) trace le nuage de points d abscisses les valeurs de x et d ordonnées celles de y. boxplot(x) trace la boîte à moustaches correspondant aux valeurs de x. hist(x) trace l histogramme correspondant aux valeurs de x. Les options main = "Titre du graphe", xlab= "Titre abscisses" ainsi que ylab="titre ordonnées" permettent de donner des titres au graphiques et aux axes. Les options xlim=c(min, max), ylim=c(min, max) définissent les limites des deux axes. L option col="couleur" permet de choisir la couleur (noire par défaut). On peut, avant de tracer quoi que ce soit, taper par(mfcol=c(nr,nc)): cela permettra d afficher nr nc graphiques sur la même feuille. Par exemple, par(mfcol=c(2,3)) affichera 6 graphiques sur la même feuille. Pour la fonction plot(), l option pch= nombre entre 1 et 25 permet de changer le symbole utilisé pour tracer le nuage de point (par défaut, c est un petit cercle noir). De même, on peut choisir la taille du symbole, par l option cex= valeur numérique. Pour la fonction hist, l option labels = TRUE permet de rajouter, au dessus de chaque bâton de l histogramme, le décompte d observations dans la classe. Avec l option proba=true, les ordonnées de l histogramme sont rapportées en fréquences (de manière à ce que la somme des aires des bâtons fasse 1). On peut tracer des boxplot plus élaborés. Si on dispose de données appartenant à divers niveaux d un facteur, on peut représenter un boxplot des données pour chaque niveau. Si par exemple, on dispose d un fichier de données, dont la première colonne V 1 est constituée de tailles d individus, et la seconde colonne V2 est constituée du sexe de l individu ( Homme, Femme ), on peut représenter deux boxplots : le premier pour les Hommes, le second pour les Femmes. On procède ainsi: > boxplot (V1~V2, col =c(" lightpink ", " lightblue ")) On a précisé des couleurs différentes ici, pour rendre la figure plus lisible. 7.2. Fonctions graphiques secondaires. Voici encore quelques fonctions utiles. La fonction points(x,y) ajoute des points à un graphe déjà existant. Ces points ont pour abscisses x et pour ordonnées y. La fonction lines(x,y) agit de même, mais avec des lignes.

LOGICIEL R 9 La fonction legend(x,y, c("variable 1","variable 2",?),pch=c(pch1,pch2,?)) ajoute une légende à un graphique. Elle sera placée à l abscisse x, l ordonnée (facultatif) y, elle comportera les noms des variables indiquées, avec les symboles indiqués par pch. A propos de l histogramme, on peut lui ajouter une courbe représentant la densité estimée des données. Considèrons par exemple, les données de quantités de lait produite par de jeunes vaches. On aura une forte densité de valeurs autour de la valeur moyenne, puis la densité des valeurs diminuera à mesure qu on s éloigne de cette valeur moyenne. On peut estimer cette densité avec R, via la fonction density. Si les données sont répertoriées dans le vecteur z, on tape alors la commande dst<-density(z). On rajoute alors la courbe densité estimée, via la commande suivante : lines(dst$x,dst$y) qui tracera la courbe densité, avec les abscisses dst$x, et les ordonnées dst$y. 8. Statistiques Descriptives On reprendra ici les notions sur les indices numériques et les représentations graphiques. 8.1. Paramètres numériques. Voici une liste de commandes qui servent à résumer des données: Notons aussi que: sum, prod, max, min, which.max, which.min range, length, mean, median, var, cov. L écart type peut se calculer avec la fonction sd(x). summary(x) permet de donner un résumé d informations statistiques sur l échantillon x. 8.2. Représentations graphiques. Nous verrons les histogrammes, plots et boxplots. 8.2.1. Histogramme. La fonction se nomme hist(namefile$var). Un exemple se trouve dans le fichier t3var.txt. Une version simple d utilisation est: t3var <- read. table (" t3var. txt ", h = T) hist ( t3var$tai ) Voici une version plus complète: hist ( t3var$tai, col = grey (0.9), main = " Taille des étudiants ", xlab = " Taille [cm ]", ylab = " Effectifs ", labels = TRUE, ylim = c(0, 15)) Une autre version avec ajustement à la loi normale: hist ( t3var$tai, col = grey (0.9), main = " Taille des étudiants ", xlab = " Taille [ cm ]", proba = TRUE ) x <- seq ( from = min ( t3var$tai ), to = max ( t3var$tai ), length = 100) lines (x, dnorm (x, mean ( t3var$tai ), sd( t3var$tai ))) mtext (" Ajustement ( moyen ) a une loi normale ") Enfin une version avec la densité de probabilité réelle: dst <- density ( t3var$tai ) hist ( t3var$tai, col = grey (0.9), main " Taille des étudiants ", xlab = " Taille [cm ]", proba = TRUE, ylim = c(0, max ( dst$y ))) lines ( dst$x, dst$y )

10 LICENCE 2 - LVE/CMI 8.2.2. Tracé de courbes. La fonction de base est plot(). Nous suivons toujours l exemple du fichier t3var.txt. La commande suivante donne une relation de type x y: plot ( t3var$tai, t3var$poi ) Voici une version plus sophistiquée: plot ( t3var$tai, t3var$poi, pch = ifelse ( t3var$sex ==" h", 1, 19)) legend (" topleft ", inset = 0.01, c(" Homme ", " Femme "), pch = c(1, 19)) 8.2.3. Boxplot. La fonction de base est boxplot(). Par exemple: boxplot ( t3var$tai ~ t3var$sex, col = c(" lightpink ", " lightblue "), main = " Comparaison taille Homme - Femme ", ylab = " Taille ") On peut découper la fenêtre graphique (pour avoir plusieurs graphiques visibles) avec par(mfcol=c(nb de lignes, nb de colonnes)). Exemple : par(mfcol=c(2,3)) permet d afficher 6 graphiques sur la même feuille. 9. Projet On rédigera un compte-rendu de TP avec deux parties. Partie 1: Analyse des données de taille et poids. On se basera sur les données du fichier t3var.txt, et on essaiera de répondre aux questions suivantes à l aide d outils de statistique descriptive: (1) Donner des caractéristiques globales de la taille et du poids sur notre échantillon. (2) Comparer les sous échantillons masculin et féminin. (3) Etudier la relation entre taille et poids. Partie 2: Analyse de données biologiques. On choisira un jeu de données de caractère biologique ou biomédical, récupérées d une source sûre. On essaiera alors de faire parler ces données à l aide des outils passés en revue dans cette introduction. Conseils pour le compte-rendu. Il est demandé de suivre les étapes suivantes pour résoudre chaque exercice: (1) Rappeler clairement ce qui est demandé. (2) Expliquer la méthodologie suivie pour la résolution du problème. (3) Donner le listing commenté du programme utilisé. (4) Illustrer, graphiquement ou à l aide d un tableau, les résultats obtenus. (5) Commenter ces résultats. Cette étape est bien entendu importante, et souvent négligée. On ne demande pas forcément un commentaire très long, mais au moins quelques remarques pertinentes. Important: Les compte rendus sont à faire en binôme. Les rapports doivent être envoyés en format.pdf à l adresse suivante: samy.tindel@univ-lorraine.fr.