SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA



Documents pareils
R01 Import de données

Première session de travail

Gestion des données avec R

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

1 Introduction - Qu est-ce que le logiciel R?

Dans l'article précédent, vous avez appris

Module d anonymisation

Introduction à MATLAB R

TP : Gestion d une image au format PGM

Initiation au logiciel R

td3a correction session7az

Cegid Business Line. Version 2008 Release 2. Service d'assistance Téléphonique

Nous avons utilisé plusieurs Script :

FICHIERS INDEX DES COMPTES ANNUELS DÉPOSÉS AUPRÈS DE LA BANQUE NATIONALE DE BELGIQUE

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

1. Structure d'un programme FORTRAN 95

Programmation linéaire

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

1 Recherche en table par balayage

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Vous venez d acquérir un fichier de données issues de la Base de données SIRENE. Comment utiliser votre fichier?

TD3: tableaux avancées, première classe et chaînes

Projet de programmation (IK3) : TP n 1 Correction

Créez votre propre Archive Darwin Core

1 Lecture de fichiers

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

Débuter avec EXPRESS. Alain Plantec. 1 Schema 2

INTRODUCTION AU LOGICIEL R

Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Une introduction au langage R

Business Intelligence avec Excel, Power BI et Office 365

ET 24 : Modèle de comportement d un système Boucles de programmation avec Labview.

CREATION COMPLETE D UN DOMAINE WINDOWS 2000 AVEC UN SERVEUR DE FICHIERS

Initiation à la Programmation en Logique avec SISCtus Prolog

Introduction à Linux (pour le HPC) «Linux 101» Présentation :

Chap III : Les tableaux

Création de fonds de cartes statiques et dynamiques avec R et Google Maps

Guide d implémentation. Paiement par identifiant Fichier des cartes arrivant à expiration

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

Exploitation des données issues de BE ( utilisation du tableur CALC) Fiche de travail (individuelle ou en binôme)

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

Création d'un site dynamique en PHP avec Dreamweaver et MySQL

La technologie au collège

Module Communication - Messagerie V6. Infostance. Messagerie

Les dates SAS expliquées à ma fille

Manuel d utilisation de Gestion 6

Importer un fichier CSV

Progitek Extraire Web s version 4.0 (Prix public 19 NET ) DESCRIPTION

Auguria_PCM Product & Combination Manager

Export et import des RIB et IBAN avec les progiciels LD

Lire ; Compter ; Tester... avec R

PHP et mysql. Code: php_mysql. Olivier Clavel - Daniel K. Schneider - Patrick Jermann - Vivian Synteta Version: 0.9 (modifié le 13/3/01 par VS)

Initiation à l analyse en composantes principales

WordPress :: Migrer son site du local vers le serveur en ligne

Exemples d Analyses de Variance avec R

Génie Logiciel I. Cours VI - Typage statique / dynamique, fonctions virtuelles et classes abstraites, flots d entrées / sorties, et string

Mysql avec EasyPhp. 1 er mars 2006

CREATION WEB DYNAMIQUE

Techniques de Programmation pour Internet

ANNEXE 8 : Le Mailing

Import des utilisateurs depuis Sconet et STSweb - mise à jour du 04/10/06

Projet Matlab : un logiciel de cryptage

Introduction à. Julien Barnier Centre Max Weber CNRS UMR 5283 Version septembre

Modules Prestashop - ExportCatalogue / EXPORT IMPORT POUR MODIFICATIONS EN MASSE DANS PRESTASHOP VERSION Optim'Informatique

Logiciel de Gestion Electronique de Dossiers

Transmission d informations sur le réseau électrique

Créer vos données sources avec OpenOffice, adieu Excel

PHP 4 PARTIE : BASE DE DONNEES

Cahier Technique Liaison Comptabilité Api / Sage ECF

Tout d abord les pré-requis : Au menu un certain nombre de KB

Installation de CPA STUDIO :

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

Présentation Backup.XML DossierBase/Preferences/Backup/Backup.XML DossierBase Preferences/Backup/

Pascal Weber - Expert en organisation

Améliorations Sage Gestion Commerciale version 7.71 Sage Comptabilité version 7.72

Gestion de gros fichiers binaires (images) en APL*PLUS III

IN Cours 1. 1 Informatique, calculateurs. 2 Un premier programme en C

Programmation C. Apprendre à développer des programmes simples dans le langage C

SOFI Gestion+ Version 5.4. Echanges de données informatiques Spicers Sofi gestion+ Groupements. SOFI Informatique. Actualisé le

Bases de données documentaires et distribuées Cours NFE04

INTRODUCTION A JAVA. Fichier en langage machine Exécutable

Cours Informatique Master STEP

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Cours 420-KEG-LG, Gestion de réseaux et support technique. Laboratoire 06

Reproductibilité des expériences de l article "Analyse et réduction du chemin critique dans l exécution d une application"

Séance 0 : Linux + Octave : le compromis idéal

Business Intelligence

Théorie et codage de l information

Python Les fondamentaux du langage

L informatique en BCPST

Calcul Formel et Numérique, Partie I

Soge-Net est accessible à l ensemble de nos clients : particuliers, professionnels ou associations.

Stockage du fichier dans une table mysql:

R pour les débutants

UltraBackup NetStation 4. Guide de démarrage rapide

TIC. Tout d abord. Objectifs. L information et l ordinateur. TC IUT Montpellier

Transcription:

SEMIN Données sous R : stockage et échange Julio PEDRAZA ACOSTA UMR 5202 Origine Structure et Evolution de la Biodiversité Département Systématique et Evolution, MNHN pedraza@mnhn.fr SEMIN R du MNHN 10 Juin 2008

Données sous R : Stockage et Echange Julio Pedraza Acosta Juin, 2008 1 / 11

Fil d Ariane Types de Format sur quoi on travaille Les scripts Garder son code au chaud Format texte standard Les données dans leur plus simple appareil Autres formats sinon ça serait trop facile Bonux vers l infini et au-dela 2 / 11

Types de Format Les scripts : fichier en format texte contenant des COMMANDES extension monscript.r monscript.r fonction de lecture : source() Les données en format R : fichier ASCII ou binaire contenant des objets R ( vecteurs,matrix, data.frame, listes, etc...) extension mesdonnees.rdata or mesdonnees.rda fonctions : save() load() Les données en format texte : fichiers texte simples (.tab ou.txt ) ou csv contenant un tableau de données fonctions read.table() write.table()... Les données en format perso et autres fantaisies fichiers avec une structuration particulière fonctions : soit fonction spécifique soit "manos a la obra" 3 / 11

les Scripts Les scripts sont une suite de commandes R dans un fichier texte. ex : 0.MonMegaScript.r Il a, par convention, l extension.r ou.r Il peut être appelé avec la fonction source() ex : 1.AppelDeMonScript.r source(file, local = FALSE, echo = verbose, print.eval = echo, verbose = getoption("verbose"), prompt.echo = getoption("prompt"), max.deparse.length = 150, chdir = FALSE, encoding = getoption("encoding"), continue.echo = getoption("continue"), skip.echo = 0) 4 / 11

le format R R dispose d un format propre de stockage de ces objets. Il enregistre des objets par la fonction save() soit en binaire soit en "clair" : save(...,ascii =TRUE) Dans un fichier RData on peut enregistrer un ou plusieurs objets. soit save( objet1,objet2..., file="./fichierdonnees.rdata") soit save( list= /liste avec les noms des objets à enregistrer/, file="./fichierdonnees.rdata") Pour charger les objets on utilise la fonction load() ex : 2.FormatR.r compress dans save() permet de "gzipper" le fichier. load() le lira sans problème 5 / 11

en format Text et CSV R peut utiliser des tableaux dans des fichiers en format texte Ils sont lus suivant deux paramètres : un délimiteur qui sépare les valeurs ( sep=...) un encapsuleur de chaînes de caractères (quote=...) On distingue deux types par conventions suivant le séparateur des colonnes : les fichiers texte (.txt ) où sep est un espace les fichiers csv (comma separated values) où sep est, ou ; la séparation de lignes se fait par des retours chariots. Format très pratique car faciles de modification avec des éditeurs de texte / tableurs et des nombreux logiciels peuvent les traiter. 6 / 11

en format Text et CSV : Lecture Une fonction read.table() avec des nombreux paramètres read.table(file, header = FALSE, sep = "", quote = ", dec = ".", row.names, col.names, as.is =!stringsasfactors, na.strings = "NA", colclasses = NA, nrows = -1, skip = 0, check.names = TRUE, fill =!blank.lines.skip, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#", allowescapes = FALSE, flush = FALSE, stringsasfactors = default.stringsasfactors(), encoding = "unknown") Plusieurs fonctions qui ne changent que par leurs paramètres par défaut : read.csv read.csv2 read.delim read.delim2 7 / 11

en format Text et CSV : Ecriture Je vous le donne en mil... write.table(x, file = "", append = FALSE, quote = TRUE, sep = " ", eol = "(slash)n", na = "NA", dec = ".", row.names = TRUE, col.names = TRUE, qmethod = c("escape", "double")) Et comme pour read.table(), on a write.csv() et write.csv2() Note : un paramètre append qui permet d ajouter l objet à la fin du fichier Avec ce type de fichier il est très facile d importer/exporter des vecteurs, data.frames, matrices. ex : 3.FormatTexteCsv.r Pour les listes c est une autre histoire... 8 / 11

Autres formats C est ici que les choses deviennent d-r-ôles. Il faut créer un "connecteur" sur le fichier soit en lecture soit en ecriture avec file() fichierlu <- file("nomfichier.txt") Il faut utiliser des fonctions de lecture comme scan() et read.lines() puis ecrire du code (arghhh) pour découper les valeurs à extraire et les affecter à un objet Pour créer un fichier au format voulu il faut créer les lignes voulues et utiliser la fonction cat() ou write.lines() et fermer le connecteur avec close() close(fichierlu) ex : 4.LectureContourBeeji.r 9 / 11

Bonux : Plusieurs fichiers Pour travailler avec plusieurs fichiers on peut s aider de : des boucles pour traiter les fichiers un par un getwd() et setwd() pour récupérer et changer de répertoire courant list.files() pour lister des fichiers dans un répertoire. des expressions régulières pour filtrer les fichiers "Y manos a la obra" ex : 5.LectureRepertoirePoints.r 10 / 11

Lancée des tomates Questions? 11 / 11