L interface utilisateur de R



Documents pareils
1) Installation de Dev-C++ Téléchargez le fichier devcpp4990setup.exe dans un répertoire de votre PC, puis double-cliquez dessus :

WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/ bits, Windows 2008 R2 et Windows bits

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

Comment utiliser FileMaker Pro avec Microsoft Office

Présentation du logiciel

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

Notes pour l utilisation d Expression Web

PRÉSENTÉ PAR : NOVEMBRE 2007

Gestion des documents avec ALFRESCO

Securexam Consignes pour l EFU Les 2, 3 et 4 juin 2015

Guide d utilisation 2012

L informatique en BCPST

Utiliser Dev-C++ .1Installation de Dev-C++ Table des matières

Accès au Serveur de PAIE «SPV» par INTERNET Paramétrage du poste de travail «Windows»

Guide d installation de MySQL

TP1 - Prise en main de l environnement Unix.

Guide de l utilisateur Mikogo Version Windows

Installation et utilisation du client FirstClass 11

26 Centre de Sécurité et de

Atelier Le gestionnaire de fichier

TP1 : Initiation à l algorithmique (1 séance)

Mon aide mémoire traitement de texte (Microsoft Word)

Environnements de développement (intégrés)

Créer le schéma relationnel d une base de données ACCESS

On trouvera sur le site du CCDMD un exemple d album construit avec Cantare. (

Comment créer des rapports de test professionnels sous LabVIEW? NIDays 2002

Manuel de System Monitor

TP 1 Prise en main de l environnement Unix

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

VOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET

< Atelier 1 /> Démarrer une application web

AIDE TECHNIQUE POUR L UTILISATION DE GÉODEQ III VUES D ENSEMBLE DU QUÉBEC

Tutorial Terminal Server sous

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES

Découvrez Windows NetMeeting

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

FileMaker Pro 12. Guide de configuration de l installation réseau

Installation des outils OCS et GLPI

Guide de configuration. Logiciel de courriel

Chapitre 1 Qu est-ce qu une expression régulière?

Introduction à Eclipse

Eclipse atelier Java

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

Inspiration 7.5. Brève description d Inspiration. Avantages d Inspiration. Inconvénients d Inspiration

ENVOI EN NOMBRE DE MESSAGES AUDIO

Manuel utilisateur. Version 1.6b

AVEC LIVE TRADER, VISEZ PLUS HAUT POUR VOS INVESTISSEMENTS

Créer un premier document avec Pages

Organiser le disque dur Dossiers Fichiers

CARPE. Documentation Informatique S E T R A. Version Août CARPE (Documentation Informatique) 1

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

N importe qui possédant un code MS valide peut initier la rencontre. Néanmoins, il serait préférable de laisser cette

Installation d un ordinateur avec reprise des données

Manuel du Desktop Sharing

FEN FICHE EMPLOIS NUISANCES

Guide de déploiement

pas à pas prise en main du logiciel Le Cloud d Orange - Transfert de fichiers sur PC et MAC Le Cloud

EXCEL TUTORIEL 2012/2013

Dans cette Unité, nous allons examiner

Connecteur Zimbra pour Outlook 2007 et 2010 (ZCO) w

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

Groupe Eyrolles, 2003, ISBN : X

Le langage C. Séance n 4

1 Introduction - Qu est-ce que le logiciel R?

FileMaker Server 14. Guide de démarrage

Rapports d activités et financiers par Internet. Manuel Utilisateur

SOMMAIRE. Présentation assistée sur ordinateur. Collège F.Rabelais 1/10

Préparation à l installation d Active Directory

IBM SPSS Collaboration and Deployment Services Deployment Manager 5 - Instructions d installation

Réglages du portail de P&WC

Groupe Eyrolles, 2006, pour la présente édition, ISBN :

Introduction à l informatique en BCPST

Créer des étiquettes avec les adresses d'un tableau Calc

Séance 0 : Linux + Octave : le compromis idéal

GUIDE DE DÉMARRAGE. SitagriPro Infinite FINANCEAGRI. Un service. c o r p o r a t e

Installation EPLAN platform 2.4

Séminaire d information MIGRATION WINDOWS 7 ET OFFICE 2010

GUIDE Excel (version débutante) Version 2013

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Optimiser pour les appareils mobiles

claroline classroom online

INCORPORER EXCEL EN LIGNE DANS UN FICHIER CRÉÉ AVEC L ÉDITEUR DE TEXTE 15 avril 2015

Tropimed Guide d'installation

Tutoriaux : Faites vos premiers pas avec Microsoft Visio 2010

Installation d OpenVPN

Comment accéder à d Internet Explorer

Manuel d utilisation pour la plateforme BeExcellent MANUEL D UTILISATION POUR LA PLATEFORME BEEXCELLENT

Guide de l utilisateur. Faites connaissance avec la nouvelle plateforme interactive de

Déploiement de SAS Foundation

guide d utilisation de showtime

Création d un site Internet

Antidote et vos logiciels

SUPPORT DE COURS ACCESS 2010

Créer vos données sources avec OpenOffice, adieu Excel

MO-Call pour les Ordinateurs. Guide de l utilisateur

Introduction au logiciel de gestion bibliographique Zotero

USTL - Licence ST-A 1ère année Initiation à la programmation TP 1

Transcription:

2 L interface utilisateur de R Vous lisez sûrement ce livre parce que vous avez un problème que vous aimeriez résoudre en R. Vous pourriez, par exemple, vouloir : savoir si certains résultats sont statistiquement significatifs ; tracer des données pour faciliter leur compréhension ; analyser des données génomiques. R est un environnement logiciel permettant de réaliser des calculs statistiques et de tracer des données. Il est formé de nombreux composants. Dans ce livre, le terme "R" désignera donc plusieurs choses : un langage informatique ; l interpréteur qui exécute le code écrit en R ; un système de tracé de graphiques décrits à l aide du langage R ; l application Windows, Mac OS ou Linux qui comprend l interpréteur, le système de tracé, les packages standard et l interface utilisateur. Ce chapitre décrit brièvement l interface utilisateur et la console de R en montrant les différences entre les plates-formes. Si vous n avez jamais utilisé de langage interactif, ce chapitre vous donnera également quelques bases que vous devez connaître pour travailler avec R. Nous étudierons rapidement l interface graphique de chaque plate-forme, puis nous aborderons le point le plus important : la console R. L interface graphique de R Commençons par lancer R et examinons son interface graphique sur les différentes plates-formes. Lorsque l on ouvre l application R avec Windows ou Max OS X, on voit apparaître une fenêtre de commandes et des menus. Sur la plupart des systèmes Linux, en revanche, R s exécutera simplement en ligne de commande.

8 Les bases de R Partie I Windows Par défaut, R est installé dans le répertoire %ProgramFiles%R (généralement, C:\Program Files\R) et placé dans le menu Démarrer sous le groupe R. Le lancement de R dans Windows produit l affichage d une interface utilisateur comme celle de la Figure 2.1. Cette fenêtre graphique contient une barre de menus, une barre d outils et la console R. Figure 2.1 Interface utilisateur de R avec Windows 7. Mac OS X L installateur par défaut installera une application appelée R dans le répertoire Applications ; son lancement provoquera l apparition d une fenêtre comme celle de la Figure 2.2. Comme avec Windows, vous disposez alors d une barre de menus, d une barre d outils contenant les fonctions classiques et de la console R. Avec Mac OS, vous pouvez également lancer R à partir de Terminal sans passer par l interface graphique. Pour ce faire, lancez Terminal (qui se trouve dans le répertoire Utilitaires du répertoire Applications), puis tapez "R" sur la ligne de commande qui s affiche afin de lancer R.

Chapitre 2 L interface utilisateur de R 9 Figure 2.2 Interface utilisateur de R avec Mac OS X. Linux et Unix Avec Linux, vous pouvez lancer R à partir de la ligne de commande en tapant : R Notez qu il s agit d un R majuscule : avec Linux, les noms de fichiers sont sensibles à la casse. À la différence de Mac OS et de Windows, cette commande lancera une session interactive directement sur la ligne de commande, mais vous pouvez également lancer R dans une fenêtre ressemblant à celle offerte par les autres platesformes. Pour ce faire, utilisez la commande suivante : R -g Tk & R se lancera alors en arrière-plan dans sa propre fenêtre, comme le montre la Figure 2.3. Comme sur les autres systèmes, cette fenêtre contient une barre de menus proposant quelques fonctions classiques, mais elle n a pas de barre d outils. La fenêtre principale sert de console R.

10 Les bases de R Partie I Figure 2.3 Interface Tk pour Linux. Autres interfaces graphiques Un utilisateur habitué aux interfaces graphiques trouvera sans doute curieux que l interface graphique standard de R implémente aussi peu de fonctionnalités. En fait, ses menus ne proposent que des fonctionnalités très rudimentaires : lecture de l aide, gestion de plusieurs fenêtres, édition des fichiers sources et des fichiers de données, etc. On ne trouve aucun sous-menu, bouton ou palette pour charger des données, les transformer, les tracer, pour construire des modèles ou pour n importe quel autre travail intéressant sur les données. Les interfaces des applications commerciales comme SAS, SPSS et S-PLUS proposent bien plus de fonctionnalités. Plusieurs projets ont pour but de créer une interface graphique plus pratique pour R : Rcmdr Le projet Rcmdr est un package R qui fournit une interface graphique alternative. Vous pouvez l installer comme n importe quel package R. Il propose des boutons pour charger des données et ses menus permettent d accéder à de nombreuses fonctions R. Rkward Rkward est un joli frontal graphique pour R. Il offre une palette et des menus pour l analyse, des outils d édition des données et un environnement de développement. C est encore un jeune projet qui fonctionne actuellement mieux sur les plates-formes Linux (bien qu il existe des versions compilées pour Windows). Il est disponible à partir de l URL http://sourceforge.net/apps/mediawiki/rkward/.

Chapitre 2 L interface utilisateur de R 11 R Productivity Environment Revolution Computing a récemment présenté un nouvel environnement de développement appelé R Productivity Environment qui offre de nombreuses fonctionnalités pour analyser les données : un éditeur de scripts, un navigateur d objets, un débogueur visuel, etc. Cet environnement n est disponible que pour Windows et fait partie de la suite REvolution R Enterprise. Vous trouverez d autres projets à l URL http://www.sciviews.org/_rgui/. La console R La console R est l outil le plus important. Elle permet de taper des commandes R et de voir les réponses du système. Les commandes que vous entrez sont appelées expressions. Une partie du système R, appelée l interpréteur, lit ces expressions et répond par un résultat ou un message d erreur. Si vous avez déjà pratiqué la ligne de commande (le programme cmd.exe de Windows, par exemple) ou un langage interactif comme LISP 1, tout ceci devrait vous sembler familier. Dans le cas contraire, ne vous inquiétez pas : les interfaces en ligne de commande ne sont pas si compliquées qu elles en ont l air. R dispose de quelques outils permettant d économiser la frappe, pour trouver ce dont vous avez besoin et pour détecter les erreurs courantes. En outre, vous disposez d un livre de référence sur R qui vous explique comment faire tout ce que vous voulez. Personnellement, je pense qu une interface en ligne de commande est la meilleure façon d analyser les données. Lorsque j ai fini de travailler sur un problème, j aime bien enregistrer toutes les étapes que j ai suivies (savoir comment j ai chargé les données, si j ai pris un échantillon aléatoire, comment j ai pris cet échantillon, si j ai créé de nouvelles variables, les paramètres utilisés par mes modèles, etc.). Tout ceci est très simple à obtenir avec une interface en ligne de commande. Lorsqu on lance R, on obtient une fenêtre contenant la console R qui affiche un message comme celui-ci : R version 2.13.0 (2011-04-13) Copyright (C) 2011 The R Foundation for Statistical Computing ISBN 3-900051-07-0 Platform: x86_64-unknown-linux-gnu (64-bit) R est un logiciel libre livré sans AUCUNE GARANTIE. Vous pouvez le redistribuer sous certaines conditions. Tapez license() ou licence() pour plus de détails. R est un projet collaboratif avec de nombreux contributeurs. 1. En fait, R partage beaucoup de points communs avec LISP : les deux langages permettent de calculer des expressions sur le langage lui-même et utilisent des structures internes similaires pour stocker les données. Tous les deux utilisent aussi beaucoup de parenthèses.

12 Les bases de R Partie I Tapez contributors() pour plus d information et citation() pour la façon de le citer dans les publications. Tapez demo() pour des démonstrations, help() pour l aide en ligne ou help.start() pour obtenir l aide au format HTML. Tapez q() pour quitter R. > Cette fenêtre affiche quelques informations de base sur R la version qui s exécute, des renseignements sur sa licence, des rappels pour obtenir de l aide puis une invite de commande. Par défaut, R affichera le signe supérieur (">") dans la console pour indiquer qu il attend que vous tapiez une commande. Il vous invite à saisir quelque chose et c est donc la raison pour laquelle ce symbole est appelé invite de commande. Ce livre contient de nombreux exemples d expressions que j ai saisies dans R, ainsi que les réponses du système : tous ces exemples montrent l invite de commande de R afin de bien différencier ce qui est saisi et les réponses du système. Vous ne devez donc pas taper le caractère > lorsqu il apparaît en début de ligne mais uniquement ce qui se trouve après l invite de commande. L extrait de code suivant, par exemple : > 17 + 3 [1] 20 signifie : J ai tapé "17 + 3" à l invite de commande de R. L ordinateur a répondu en affichant "[1] 20" (nous verrons plus loin ce que cela signifie). Essayez vous-même : tapez 17 + 3 à l invite de R et appuyez sur la touche Entrée. Vous devriez obtenir une réponse identique. Parfois, une commande R ne tient pas sur une seule ligne. Si vous entrez une commande incomplète et que vous validiez la ligne en tapant sur Entrée, vous remarquerez que l invite de commande se change en signe plus ("+"). Voici un exemple : > 1 * 2 * 3 * 4 * 5 * + 6 * 7 * 8 * 9 * 10 [1] 3628800 Dans certains cas, ces invites peuvent prêter à confusion (notamment avec les longues expressions qui contiennent des inégalités ou qui réalisent des sommes) ; c est la raison pour laquelle la plupart des plates-formes utilisent des couleurs différentes pour le texte saisi et les réponses de R. Le Tableau 2.1 résume les différentes couleurs par défaut.

Chapitre 2 L interface utilisateur de R 13 Tableau 2.1 : Couleurs du texte en mode interactif Plate-forme Invite de commande Texte saisi Résultat affiché Mac OS X Violet Bleu Noir Windows Rouge Rouge Bleu Linux Noir Noir Noir Édition de la ligne de commande Sur la plupart des plates-formes, R permet de revenir sur les commandes précédemment tapées 1. Vous constaterez sûrement que les deux touches d édition les plus importantes sont les flèches haut et bas du curseur. Vous pouvez parcourir l historique des commandes précédentes à l aide de ces deux touches. La flèche vers le haut vous ramène vers les commandes les plus anciennes et la flèche vers le bas, les plus récentes. Ces deux touches sont très pratiques pour répéter une commande avec une modification mineure (un paramètre différent, par exemple) ou pour corriger une erreur de frappe (une parenthèse manquante, par exemple). La commande history() permet également d obtenir la liste des commandes qui ont été tapées précédemment 2. R propose aussi la complétion automatique pour les noms de fonctions et de fichiers : la touche de tabulation fait apparaître la liste des terminaisons possibles. Mode batch Le mode interactif de R est très pratique pour la plupart des analyses ad hoc mais, dans certains cas, taper chaque commande peut se révéler fastidieux. Supposons, par exemple, que vous vouliez réaliser plusieurs fois la même opération (charger les données d une expérience, les transformer, produire trois graphiques en PDF puis quitter) : R permet d exécuter un ensemble de commandes en séquence et de sauvegarder les résultats dans un fichier c est ce que l on appelle le mode batch. Vous pouvez lancer R en mode batch à partir de l invite du shell (pas celle de la console R), ce qui facilite l automatisation des analyses puisqu il suffit ensuite de modifier quelques variables et de les relancer. Pour, par exemple, charger un ensemble de commandes à partir du fichier graphiques.r, vous utiliserez une commande comme celle-ci : % R CMD BATCH graphiques.r 1. Sur les systèmes Linux et Mac OS X, la ligne de commande utilise la bibliothèque readline de GNU et autorise un grand nombre de commandes d édition. Windows offre moins de possibilités. 2. À l heure où ce livre est écrit, la commande history() ne fonctionne pas correctement avec Mac OS X car elle affiche le dernier historique sauvegardé, pas celui de la session courante.

14 Les bases de R Partie I R exécutera les commandes du fichier graphiques.r et produira un fichier de sortie nommé graphiques.rout contenant les résultats. Si vous le souhaitez, vous pouvez indiquer un autre nom de fichier de sortie. Pour, par exemple, placer les résultats dans un fichier dont le nom comprend la date du jour (sur un Mac ou un système Unix), vous pourriez utiliser la commande suivante : % R CMD BATCH graphiques.r graphiques_`date "+%Y%m%d"`.log Si vous produisez des graphiques en mode batch, n oubliez pas de préciser le dispositif de sortie et les noms des fichiers. Pour plus d informations sur l exécution de R à partir de la ligne de commande et pour connaître toutes les options disponibles, lancez-le avec l option --help : % R --help Vous pouvez également lancer des commandes en mode batch depuis la console R, en utilisant la commande source. Consultez l aide de cette commande pour plus d informations. Utilisation de R depuis Microsoft Excel Si vous connaissez bien Microsoft Excel ou si vous travaillez avec beaucoup de fichiers Excel, vous pouvez lancer directement R à partir de ce tableur grâce au programme RExcel (qui ne fonctionne que sur les systèmes Windows). Le site http://rcom.univie.ac.at/ contient toutes les informations utiles ainsi qu un installateur qui installera R et tout ce qui est nécessaire à l exécution de RExcel. Si R est déjà installé sur votre machine, vous pouvez également installer RExcel comme un package de CRAN. Les commandes suivantes téléchargent RExcel, configurent le serveur RCOM, installent RDCOM et lancent l installateur de RExcel : > install.packages("rexcelinstaller", "rcom", "rsproxy") > # Configuration de rcom > library(rcom) > comregisterregistry() > library(rexcelinstaller) > # Commande R pour installer RDCOM > installstatconndcom() > # Commande R pour installer REXCEL > installrexcel() Il suffit ensuite de suivre les indications pour installer RExcel. Avec Excel 2007, vous devrez sélectionner l onglet Add-Ins pour trouver le menu présenté à la Figure 2.4. Pour utiliser RExcel, sélectionnez d abord R Start dans ce menu puis, pour tester son bon fonctionnement, exécutez ensuite les opérations suivantes : 1. Entrez un ensemble de valeurs numériques dans une colonne d Excel (B1:B5, par exemple).

Chapitre 2 L interface utilisateur de R 15 2. Sélectionnez les valeurs que vous avez saisies. 3. Dans le menu RExcel choisissez l option Put R Var > Array. 4. Dans la boîte de dialogue qui s ouvre pour vous demander le nom de l objet que vous voulez créer dans Excel, tapez v et appuyez sur Entrée. Ceci aura pour effet de créer dans R un tableau (un vecteur, ici) contenant les valeurs que vous avez entrées. Ce tableau s appellera v. 5. Sélectionnez ensuite une cellule vide dans Excel. 6. Dans le menu RExcel, allez dans Get R Value > Array. 7. Dans la boîte de dialogue qui s ouvre pour vous demander de saisir une expression R, tapez (v - mean(v)) / sd(v), ce qui aura pour effet de modifier le contenu de v afin que sa moyenne soit 0 et son écart-type, 1. 8. Inspectez le résultat renvoyé par Excel. Figure 2.4 Utilisation de RExcel à partir de Microsoft Excel 2007. La feuille de calcul Demo accessible dans le menu RExcel contient des exemples d utilisation plus intéressants. Vous pouvez vous servir des fonctions Excel pour évaluer des expressions de R, utiliser des expressions R dans des macros et même tracer des graphiques depuis Excel.

16 Les bases de R Partie I Autres façons de lancer R Plusieurs projets open-source permettent de combiner R avec d autres applications : Comme application web Rapache permet d incorporer les analyses de R dans une application web (vous pouvez, par exemple, mettre en place un site qui présente des rapports détaillés à l aide de graphiques de type treillis lattices produits par R). Pour plus d informations sur ce projet, consultez la page http://biostat.mc.vanderbilt. edu/rapache/. Comme serveur Rserve permet d accéder à R depuis d autres applications (vous pouvez, par exemple, écrire un programme Java qui utilisera R pour certains calculs). Comme son nom l indique, Rserve est implémenté comme un service réseau : une même instance Rserve peut gérer les calculs de plusieurs utilisateurs sur des machines différentes. Une façon d utiliser Rserve consiste à l installer sur un serveur disposant d une grosse puissance de calcul et de beaucoup de mémoire, afin que les utilisateurs puissent réaliser des traitements qu ils auraient du mal à réaliser sur leurs propres machines. Pour plus d informations sur ce projet, consultez la page http://www.rforge.net/rserve/index.html. Depuis Emacs ESS (Emacs Speaks Statistics) est un module Emacs permettant d exécuter R directement depuis Emacs. Pour plus d informations, voir http://ess.r-project.org/.