Master EBE Introduction à R et Statistique inférentielle



Documents pareils
1 Introduction - Qu est-ce que le logiciel R?

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Introduction à MATLAB R

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA

Séance 0 : Linux + Octave : le compromis idéal

R00 Installation du logiciel R sous Windows

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

INTRODUCTION A JAVA. Fichier en langage machine Exécutable

Package TestsFaciles

1. Structure d'un programme FORTRAN 95

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Atelier Le gestionnaire de fichier

Jérôme Mathieu janvier Débuter avec R. Ce document est disponible sur le site web :

Les concepts de base, l organisation des données

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

R01 Import de données

TD d économétrie appliquée : Introduction à STATA

Initiation au logiciel R

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

La boucle for La boucle while L utilisation du if else. while (condition) { instruction(s) }

Édu-groupe - Version 4.3

Lire ; Compter ; Tester... avec R

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Présentation du logiciel

Présentation du langage et premières fonctions

Calcul Formel et Numérique, Partie I

Anne Tasso. Java. Le livre de. premier langage. 10 e édition. Avec 109 exercices corrigés. Groupe Eyrolles, , ISBN :

EXCEL et base de données

TP 1 Prise en main de l environnement Unix

Statistiques à une variable

TP1 : Initiation à l algorithmique (1 séance)

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr

3.2. Matlab/Simulink Généralités

INTRODUCTION AU LOGICIEL R

BIRT (Business Intelligence and Reporting Tools)

Introduction à la présentation graphique avec xmgrace

Aide - mémoire gnuplot 4.0


Etude des propriétés empiriques du lasso par simulations

AWS avancé. Surveiller votre utilisation d EC2

Automatiser la création de comptes utilisateurs Active Directory

Plan du cours. Historique du langage Nouveautés de Java 7

Algorithmique I. Algorithmique I p.1/??

STAGE IREM 0- Premiers pas en Python

Guide d utilisation. Version document 0.8. Trouver toute la documentation sur :

Brevet informatique et internet - Collège

Installation et lancement d ETHNOS Configuration requise... 5 Installation... 5 Lancement Les modules d ETHNOS... 7

Algorithmique et programmation : les bases (VBA) Corrigé

Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1

ACQUISITION. Traitement de l image. Classement. Préparation. Ouverture. Performance

TP1. Outils Java Eléments de correction

Cours Informatique Master STEP

Examen de Logiciels Statistiques

AIDE ENTREPRISE SIS-ePP Plateforme de dématérialisation des marchés publics

Dossier I Découverte de Base d Open Office

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

Principales Evolutions Version

Mysql avec EasyPhp. 1 er mars 2006

WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/ bits, Windows 2008 R2 et Windows bits

Affectation standard Affectation modifiée (exemple)

Bureautique Initiation Excel-Powerpoint

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

PHP CLÉS EN MAIN. 76 scripts efficaces pour enrichir vos sites web. par William Steinmetz et Brian Ward

Gestion des données avec R

Installation et configuration du serveur syslog sur Synology DSM 4.0

TP 1. Prise en main du langage Python

26 Centre de Sécurité et de

Witbox. Manuel de Repetier-Host. Witbox

Introduction à. Oracle Application Express

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

AUVRAY Clément (168187) HOMBERGER Alexandre (186897) GLADE. Langages, outils et méthodes pour la programmation avancée Page 1 sur 12

IMAGES NUMÉRIQUES MATRICIELLES EN SCILAB

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

Examen Médian - 1 heure 30

Dans cette Unité, nous allons examiner

Guide utilisateur i-milo >> Décisionnel

TP1 - Prise en main de l environnement Unix.

Organiser le disque dur Dossiers Fichiers

Groupe Eyrolles, 2003, ISBN : X

Atelier individuel. Linux 101. Frédérick Lefebvre & Maxime Boissonneault frederick.lefebvre@calculquebec.ca U. Laval - Janv. 2014

Utiliser Dev-C++ .1Installation de Dev-C++ Table des matières

Introduction à l informatique en BCPST

< Atelier 1 /> Démarrer une application web

Guide Utilisateur Easy Share

L informatique en BCPST

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

La Clé informatique. Formation Excel XP Aide-mémoire

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

1) Installation de Dev-C++ Téléchargez le fichier devcpp4990setup.exe dans un répertoire de votre PC, puis double-cliquez dessus :

Comment créer des rapports de test professionnels sous LabVIEW? NIDays 2002

Les outils numériques permettant l enregistrement de documents audiovisuels diffusés sur Internet sont nombreux. Certains sont gratuits.

Principe de fonctionnement du lanceur d'application "AdisTlsStartCfgLotus"

Sommaire. 1 Introduction Présentation du logiciel de commerce électronique 23

ODH. Mon Espace. Manuel d utilisation. MON ESPACE ODH Manuel d utilisation. Une question? Contactez le service client au

Initiation à linfographie

Transcription:

Master EBE Introduction à R et Statistique inférentielle R est un logiciel de calcul statistique et probabiliste. Il est développé dans le cadre du projet GNU http://www.gnu.org/ ), c est donc un logiciel libre qui présente l avantage d être enrichi par l ensemble des personnes de bonne volonté grâce au système des package. C est un langage de script (ligne de commandes) orienté objet. Il est disponible pour différentes palteformes (Windows, Linux, Unix, MacOS). Enfin on trouve de nombreuses documentations en ligne. Pour mémoire ici, on peut citer le site officiel : http://cran.r-project.org/, vous trouverez à cette adresse toutes les informations nécessaires pour l installation de R, et un manuel en français à l usage des (pseudo) débutants http://cran.r-project.org/ doc/contrib/paradis-rdebuts_fr.pdf 1 Aide R possède une aide très sophistiquée, accessible en mode commande ou au format HTML. Pour accéder à l aide HTML il faut taper help.start(), ou sélectionner Aide, Aide HTML dans le menu. On a alors accès à des manuels (introduction à R en particulier), à la documentation des packages, et à un moteur de recherche. L aide en mode commande se fait par l intermédiaire de la fonction help() ou bien?nomfonction?read.csv?read.table Les exemples proposés à la fin de la description des fonctions aident beaucoup en général à comprendre leur fonctionnement. On peut aussi se poser des questions sur un sujet bien précis :Comment faire un test de student?. Pour cela on utilise la commande help.search qui recherche dans la documentation à quel endroit le mot apparaît. help.search("student") 2 Lecture des données Copier le fichier T:\Master-EBE\DYST_TD_Intro\Chacals.csv dans votre répertoire personnel, puis l ouvrir avec un éditeur de texte (NotePad par exemple) et noter comment le fichier est constitué. On veut maintenant l importer dans R 1

# ce qui se trouve derriere # est un commentaire, ce n est pas executé setwd("monrépertoire") matable <- read.table( chacal.csv,header=true, sep=";") matable names(matable) head(matable) matable$taille matable$sexe matable <- read.table("chacals.csv",header=true, colclasses=c("numeric","factor"), sep=";") matable$taille matable$sexe ls() taille attach(matable) taille sexe 3 Objets R travaille avec des objets. Les données, les graphiques, les fonctions, les résultats d analyse sont des objets. Les objets les plus courants sont : vector vecteur composé d une seule variable data.frame tableau de données. Il contient le nom des variables. list liste d objet, généralement le résultat d une analyse. Chaque élément de la liste est accessible en tapant le nom de la liste suivi du symbole $ et du nom de l élément. La plupart des objets ont un attribut de classe. Les plus courants sont numeric, logical, integer, factor, character, data.frame,... objects() class(matable) class(sexe) class(taille) class(taille/10) 4 Graphiques Avant d analyser les données, il est bon de les visualiser. R dispose d immenses capacités graphiques... qui ne sont pas toujours faciles à utiliser. On se contente de quelques exemples.?plot plot(taille,main="taille en fonction du numero de l individu") plot(taille,col=sexe,main="taille en fonction du numero de l individu",pch=20) legend("topright", legend=c("male","femelle"), pch=20, col=c(1,2)) 2

plot(sexe,taille,main="taille des cr^anes de chacals en fonction du sexe")?boxplot 5 Etude du jeu de données Chacals 5.1 Création de variables et calculs élémentaires On voudrait centrer les tailles des crânes pour cela, on a besoin de calculer la moyenne et de calculer la différence entre la taille d un crâne et la moyenne. 5.1.1 Sur l échantillon complet moy <- mean(taille) taille.cent <-taille -moy ecart2 <- taille.cent^2 A l aide de la variable ecart2, de la fonction sum et de la fonction length calculer la variance de l échantillon. Comparer au résultat de la fonction var. Pour ajouter une variable à notre table de données, il suffit de concaténer cette variable avec le reste de la table, en expliquant à R qu on veut ajouter une colonne. matable<-cbind(matable,taille.cent, ecart2) head(matable) 5.1.2 Extraire un sous echantillon Pour sélectionner uniquement les femelles chacals, on dispose de l opérateur [ ]. A partir des commandes suivantes, on peut calculer la moyenne et la variance de l échantillon en fonction du sexe. taille.femelle<- taille[sexe==2] taille.male<-taille[sexe==1] moy.male<- mean(taille.male)... La fonction by permet de faire la même chose plus facilement.?by 5.2 Un premier test On se demande si la taille d un crâne de chacal mâle est différente de la taille d un crâne d un chacal femelle. On met en place un test de Student. Justifier l hypothèse d égalité des variances. help.search("student")?t.test 3

6 Simulation On veut simuler un échantillon gaussien X 1,..., X 15 de moyenne µ = 10 et de variance σ 2 = 4. Pour cela on peut utiliser la fonction rnorm. monechantillon <- rnorm(15,mean=10,sd=2) hist(monechantillon) monechantillon <- rnorm(60,mean=10,sd=2) hist(monechantillon) On veut maintenant vérifier que l estimateur de la moyenne suit une loi normale de moyenne µ et de variance???? mesechantillons <- matrix(rnorm(60*50,mean=10,sd=2),ncol=50, nrow=60) mesechantillons <- as.table(mesechantillons) mesechantillons moy.estim <- apply(mesechantillons,2,mean) hist(moy.estim, freq=f) qqnorm(moy.estim) Vérifier par un QQplot que moy.est suit la loi attendue. 7 A vous de jouer Dans le cadre d une étude phyto-écologique dans les Vosges, on a noté, pour une série de 260 peuplements de hêtres ou de sapins, le type d humus réparti en six classes de niveau trophique décroissant : dysmoder, moder, mull moder, mull acide, mull mésotrophe et mull eutrophe. Les effectifs obtenus par essence et classe d humus sont donnés dans le tableau suivant : Dysmoder Moder Mull model Mull acide Mull méso Mull eutrophe total Sapin 36 36 17 40 16 12 157 Hêtre 9 11 20 32 25 6 103 Que peut-on dire de la répartition des espèces par type d humus? 8 Compléments 8.1 Fonctions Une fonction associe un objet (la sortie) à un ensemble d objets (les arguments d entrée). Les arguments d entrée peuvent être définis par défaut. Ils sont associés à un nom générique qui peut être omis si l ordre des arguments est celui de la définition. L objet en sortie est le plus souvent une liste. La description des fonctions de R est accessible par l aide en ligne en tapant?nomdelafonction.?seq seq(1,10) seq(to=10,from=1,by=1) seq(to=10,from=1,l=10) 4

seq(1,10,2) seq(1,10,l=5) tri = sort(taille, index.return=true) tri$x;tri$ix 8.2 Fichiers script Un fichier script permet d écrire plusieurs commande à la fois et de les exécuter séquentiellement (c est un programme) ou bien de créer une nouvelle fonction. On donne habituellement l extension.r au fichier texte contenant les instructions. La commande source(nomprogramme) permet d exécuter le programme ou la fonction. Boucles et tests boucles tests for (indices in vecindices){ instructions } while (condition) { instructions } if (condition){ instructions } else { instructions } fonction sortie = function(arg1=defaut1,arg2=defaut2,...){ instructions return(sortie) } fecart<- function(taille.ind, taille.echant){ vmessage=c( Mignon, Normal, EFFRAYANT ) tiers<-round(length(taille.echant)/3) seuils<-rep(0,2) seuils[1]<-sort(taille.echant)[tiers] seuils[2]<-sort(taille.echant)[2*tiers] groupe<-sum(taille.ind>seuils)+1 diagnostic = list(groupe=groupe, message=vmessage[groupe]) return(diagnostic) } fecart(125,taille) detach(matable) 8.3 Sauvegarde R propose à la fin de chaque session de sauvegarder tout l espace de travail. Celui-ci est en général énorme et contient beaucoup d objets intermédiaires inutiles. Pour sauvegarder uniquement quelques objets, utiliser la fonction save(). Pour charger les données sauvegardées utiliser la fonction load(). save(t.taille, matable,file= sauve.res ) rm(matable); matable; load( sauve.res ); matable 5

Pour sauvegarder un tableau de donnéees au format ASCII utiliser la fonction write.table() write.table(matable,file= resultats.txt,quote=false,row.names=false,col.names=c( Sexe, Pour sauvegarder un graphique on peut soit utiliser le menu de la fenêtre graphique, soit utiliser les fonctions pdf(), postscript(), jpeg(). pdf("mongraphique") hist(taille) dev.off() 6