Quelques trucs et astuces



Documents pareils
Package TestsFaciles

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

TP 1. Prise en main du langage Python

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

INTRODUCTION A JAVA. Fichier en langage machine Exécutable

Gestion des données avec R

Cours 1 : Introduction. Langages objets. but du module. contrôle des connaissances. Pourquoi Java? présentation du module. Présentation de Java

Ricco Rakotomalala R.R. Université Lyon 2

1 Introduction - Qu est-ce que le logiciel R?

Excel avancé. Frédéric Gava (MCF)

Présentation du langage et premières fonctions

SQL MAP. Etude d un logiciel SQL Injection

Introduction à l informatique en BCPST

Programmation Web. Madalina Croitoru IUT Montpellier

Comment utiliser FileMaker Pro avec Microsoft Office

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

TP, première séquence d exercices.

SPHINX Logiciel de dépouillement d enquêtes

Sage 100 CRM - Guide de la Fusion Avancée Version 8. Mise à jour : 2015 version 8

TRANSFOLIO version Introduction

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

TP Bases de données réparties

Parcours FOAD Formation EXCEL 2010

1 Définition et Appel d une fonction. V. Phan Luong. Cours 4 : Fonctions

Le langage SQL Rappels

EXCEL PERFECTIONNEMENT CALCULS AVANCES

Introduction aux Statistiques et à l utilisation du logiciel R

Partie publique / Partie privée. Site statique site dynamique. Base de données.

Introduction à MATLAB R

TP1. Outils Java Eléments de correction

Les concepts de base, l organisation des données

Algorithme. Table des matières

Page Paragraphe Modification Mise en page du document Le bouton "Format de page" est maintenant "Page"

Logiciel Libre Cours 3 Fondements: Génie Logiciel

Comment créer des rapports de test professionnels sous LabVIEW? NIDays 2002

Initiation à Excel. Frédéric Gava (MCF)

EP60.92 Projet d application pluridisciplinaire La chasse aux trésors

Qu est ce qu un ?

Comment se servir de l utilitaire de validation?

Anne Tasso. Java. Le livre de. premier langage. 10 e édition. Avec 109 exercices corrigés. Groupe Eyrolles, , ISBN :

Module 16 : Les fonctions de recherche et de référence

Transmission d informations sur le réseau électrique

Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines)

Débuter avec Excel. Excel

Paramètres des services Les 3 environnements de saisie Paramètres des sous-services Saisie déportée avec ProfNOTE...

Business Intelligence

PRESENTATION / FORMATION

L informatique en BCPST

AutoCAD Petit exercice sous

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

IFT2255 : Génie logiciel

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

PaperCut MF. une parfaite maîtrise de vos impressions, copies et scans.

«Clustering» et «Load balancing» avec Zope et ZEO

Comment envoyer un en gardant les adresses de ses correspondants confidentielles!!!

ULC-S Inspection et mise à l essai des réseaux avertisseurs d incendie

Algorithmique et Programmation, IMA

CONFIGURATION... 2 Créer le compte bancaire... 3 Sélectionner un compte par défaut... 6 Configurer la numérotation des reçus...

FEN FICHE EMPLOIS NUISANCES

ETAFI Millésime 2010 (v.22.2 Oct./2010) Service d'assistance Téléphonique : ou

N importe qui possédant un code MS valide peut initier la rencontre. Néanmoins, il serait préférable de laisser cette

STAGE IREM 0- Premiers pas en Python

données en connaissance et en actions?

Ceci est un Chromebook, ton ordinateur!

CHAPITRE I FONCTIONS STATISTIQUES, DE DATE & HEURE... 1

Chapitre 10 Mettre en œuvre un cluster Hadoop

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Remise à niveau d un programme JAVA du domaine public

La dernière base de données de Teradata franchit le cap du big data grâce à sa technologie avancée

TP1 : Initiation à Java et Eclipse

Classes et Objets en Ocaml.

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Chapitre 1 Qu est-ce qu une expression régulière?

Quelques éléments de compilation en C et makefiles

TP 8: LES OPERATEURS ENSEMBLISTES

Guide d utilisation commandes des pièces de rechange Rev.1.0.3

Syllabus BOB 50 «Pas à pas» Paiement : Virements bancaires

Excel 2007 Niveau 3 Page 1

Base élèves : des étiquettes avec OpenOffice 2.0

Initiation à la programmation en Python

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Taxe Produit Assurance (TPA) au Québec

INSTRUCTIONS POUR LA PRISE D APPEL INTERNET

1 Lecture de fichiers

et Groupe Eyrolles, 2006, ISBN :

Le Langage SQL version Oracle

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

WinBooks Logistics 5.0

LES DECIMALES DE π BERNARD EGGER

Programme d Accès Communautaire / Atelier 4 Initiation à Microsoft Excel PLAN DE COURS 3 MICROSOFT EXCEL 4 LANCER EXCEL 4

Déplacer un serveur d'impression

Assistant d e tablissement de Tableaux

Notice d utilisation

Tutoriel : utilisation de l outil de veille TaDaweb

Dans cette Unité, nous allons examiner

Python - introduction à la programmation et calcul scientifique

Formula Negator, Outil de négation de formule.

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Transcription:

Cogmaster, 2009.

Plan Commandes utiles 1 Commandes utiles 2 3

La fonction merge(1) Cette fonction est très utile pour obtenir une data.frame unique à partir par exemple des données provenant de deux expériences. Sa syntaxe est relativement simple. Elle prend comme deux premiers arguments la première data.frame comme second argument la seconde data.frame. Les arguments suivants by.x et by.y indique quel colonne sera pris comme identifiant commun aux deux tableaux. En effet on ne peut pas utiliser les noms d observations pour la fusion. La data.frame résultat est reclassé en fonction des valeurs de la colonne identifiant.

La fonction merge(2) Par exemple on peut faire un exemple pour mélanger les données démographiques du TP 2 : lifew <- merge(tmpm,tmpf,by.x="country",by.y="country") Les arguments all, all,x, all.y permettent d inclure des observations qui seraient repsectivement pas dans et pas dans y, pas dans x, pas dans y. Par défaut la valeur est all=false. Seules les valeurs présentes à la fois dans x et dans y sont la data.frame d arrivée. L argument suffix permet d ajouter un suffixe spécifique quand des colonnes ont le même nom dans les 2 data.frames. Par défaut les suffixes sont.x et.y.

La fonction unique La fonction unique() est très pratique et très simple. Elle renvoie tout simplement les valeurs uniques d un vecteur. Par exemple du vecteur c(1,1,3,3,4,5 elle va renvoyer le vecteur c(1,3,4,5). Elle est particulièrement précieuse pour les variables character ou pour compter les modalités d une variable pseudo continue.

Les ambigüités du langage R - S3 R est un langage à la base qui n est pas purement orienté objet. Par contre rapidement un pseudo modèle objet dont le nom est S3 a été créé. Il ne s agit pas d un vrai langage objet mais plutôt de la possibilité supplémentaire de donner un type particulier à un ensemble de données. La plupart des fonctions et paquets utilisent ce système. Quelques commandes que nous verrons permettent assez simplement d extraire les données et de retrouver les fonctions associés aux objets et inversement. Mais ces fonctions font qu il existe une certaine confusion entre type et objet dans les documents traitant de R.

Les ambigüités du langage R - S4 Il existe une extension beaucoup plus récente qui est un vrai langage objet (incluant l héritage multiple et polymorphisme) dont le nom est S4. Son interprétation est plus lente que le code non S4. De plus son implémentation est relativement complexe et n est pas aussi intuitive que dans d autres langages tels que Java ou Python. S4 ne sera pas aborder au cours de ce cours car il est un peu trop complexe et demande de solides connaissances en programmation. Certains paquets utilisent cette technologie comme lme4 par exemple pour les modèles mixtes.

L affichage des données et le S3(1) L affichage de beaucoup de fonctions R s accompagne de texte. Il suffit pour cela de faire tout simplement cette commande : t.test(c(rnorm(100),rnorm(100,2))~gl(2,100)) Est affiché le résultat test de Student (comparaison de deux moyennes). Les valeurs sont automatiquement affichées avec le texte adéquat. Ceci parce qu il n y a pas d affectation. En effet la fonction utilise invisible(). Sans affectation R comprends qu on veut imprimer à l écran le résultat et appelle la fonction print(). Les deux commandes sont donc équivalentes : t.test(c(rnorm(100),rnorm(100,2))~gl(2,100)) print(t.test(c(rnorm(100),rnorm(100,2))~gl(2,100)))

L affichage des données et le S3(2) Pour stocker l objet, avec la fonction invisible, il suffit de faire une affectation. resultat <- t.test(c(rnorm(100),rnorm(100,2))~gl(2,100)) Dans ce cas l objet est stocké dans la variable resultats resultat print(resultat) R imprime les résultats sous forme intelligible mais on ne peut récupérer les valeurs.

L affichage des données et le S3(3) En fait si on tape la commande : str(resultat) R nous indique que toutes les valeurs (ou presque) peuvent être récupérés sous forme plus pratique. Par exemple si on veut extraire la p.value il suffit de taper : resultat$p.value Pourquoi a-t-on alors l affichage des valeurs et du texte formaté lorsqu on demande l affichage de l objet?

L affichage des données et le S3(4) Cela est lié au fait qu une simple étiquette est apposé sur l objet. Ce principe est celui du système S3. On peut accéder au type d objet par la commande class(). class(resultat) Dans ce cas on voit que l objet est de type htest. Au moment de l affichage, R va rechercher si pour cette étiquette il existe une fonction print() dédiée. Si on tape la commande suivante on obtient la liste de toutes les fonctions print disponible. Les fonctions sont appelées print.nomdelobjet. methods("print") On peut retrouver la fonction print.htest qui nous concerne dans ce cas.

L affichage des données et le S3(5) Donc quand on récupère des calculs et qu on constate la présence d un affichage on peut suspecter que l objet renvoyé par R est un objet de type S3 (ou S4). Ceci ne se limite pas à la fonction print. Pour les objets de base, notamment les tests statistiques, de nombreuses fonctions sont disponibles. Pour connaître les fonctions existantes pour un type d objet donné, il suffit de taper la commande : methods(class="htest") Dans l exemple du test de Student, il n existe que la fonction print. Mais pour des tests plus complexes comme pour les ANOVAs que nous verrons en fin de cours il existe de nombreuses fonctions. Par exemple pour l ANOVA : methods(class="aov")

L affichage des données et le S3(5) Lorsqu on récupère un résultat sous forme il y a donc deux choses qui peuvent être utiles : methods(class=class(objet)) : elle permet de connaître les fonctions disponibles pour l objet sur lequel on travaille. On trouve des fonctions pour l impression, la représentation graphique, l extraction de résultats,... str(objet) qui permet d accéder directement aux valeurs si aucune fonction permettant d accéder à ces valeurs n existent. Le système est similaire pour les objets S4 et les commandes présentées marche par contre il s agit d un vrai système objet dont la description dépasse le cadre de ce cours.