L enseignement et la formation au logiciel R : un retour d expérience

Documents pareils
Gestion des données avec R

Guide préparatif «Automatiser sa vigie sur Twitter avec R» 1

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Migration et import de données

Extraction d informations stratégiques par Analyse en Composantes Principales

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

OpenText StreamServe Cours Customer Communication Management L essentiel

Les Enjeux du Référencement de Sites Internet. Un livre blanc réalisé par Benchmark Group pour Netbooster

CALENDRIER DES RDV CCIMP DES TIC 1 ER SEMESTRE 2011

Du marketing dans ma PME!

GESTMAX Les nouveautés. Nous avons le plaisir de vous présenter les nouvelles fonctionnalités de la version 1.19 de votre application GestMax.

10 points clés pour bien démarrer votre projet web

TYPO3 & Synomia Cédric Tempestini <ctempestini@archriss.com>

L aspect de votre logiciel a été modifié et reprend désormais la nouvelle charte graphique Sage.

Centre Des Usages. Une question? : Neos-SDI Paris rue Auber Paris Tél. : commerce@neos-sdi.com

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

SharePoint 2013 L'environnement de travail collaboratif

FreeMind. Freeplane XMind. 2 e édition. Bien démarrer avec le Mind Mapping. . Groupe Eyrolles, 2010, ISBN :

Lancez le setup, après une phase de décompression, la fenêtre d installation des prérequis apparaît, il faut les installer :

GUIDE DE DÉMARRAGE. SitagriPro Infinite FINANCEAGRI. Un service. c o r p o r a t e

Atelier E-TOURISME Optimiser la visibilité de son site sur les moteurs de recherche. ecotourismepro.jimdo.com

Référencement de votre site Web Google et autres moteurs de recherche (4ième édition)

CCI DE SAÔNE-ET-LOIRE - ATELIER ENP 18 MAI La création de sites internet

Installation de Premium-RH

Guide explicatif de l utilisation. de la plateforme d éducation en ligne (e-learning)

Comme cet outil est un des outils majeurs professionnels, Facebook vous propose également une Aide.

Le nouveau marketing urbain à l heure du numérique

TP 6 Installation et configuration d une site internet avec un CMS Illustration avec Wordpress

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Enseigner les Lettres avec les TICE

SOLUTIONS INTERNET KIOSQUES INTERACTIFS

performance commerciale

Programme. Scénariser un MOOC. Intitulé de l'atelier : Formateurs : Christine VAUFREY Thomas Laigle. Programme atelier Scénariser un MOOC Page 1 sur 7

Déployer une Stratégie Web Globale

INTRODUCTION A JAVA. Fichier en langage machine Exécutable

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

Introduction MOSS 2007

Groupe Eyrolles, 2003, ISBN : X

COMMUNIQUER PLUS AISÉMENT AVEC L AWEX.

Généralités. Premier lancement

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.

HTML5 et CSS3 pour des sites Responsive Web Design

Sites internet des partis politiques, Facebook et Twitter : Les grands perdants de l élection présidentielle 2012

Comment utiliser les réseaux sociaux pour redonner le plaisir de la langue française?

Etude des outils du Cloud Computing

Catalogue de formations

Les outils actuels permettent-ils d automatiser la production de cartes? De quels outils dispose-t-on?

Fiche technique Les fonctionnalités selon les versions de Sage CRM. Introduction

Le logiciel de création de site internet IZISPOT est un outil très puissant et qui est assez simple après quelques temps d utilisation.

Comparatif CMS. Laurent BAUREN S Bérenger VIDAL Julie NOVI Tautu IENFA

REQUEA. v PD 20 mars Mouvements d arrivée / départ de personnels Description produit

23 Octobre 2014 à 15h. Comment faire de la publicité en ligne pour développer votre entreprise?

Cyberclasse L'interface web pas à pas

Installer un serveur de listes de diffusion

Documentation. Présentation (simplifiée) de. Monitor PRO

Comment l'assistante peut jouer son rôle au sein d'entreprises de plus en plus nomades. Christine Harache

en 16 différences

Madame, Monsieur, PJ. 1 - Programme de formation 2 - Fiche d'inscription 3 - Présentation de Olivier GOBET

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

B-web V4 MANUEL D UTILISATION. Espace de travail. Clear2Pay Belgium SA B-web V4 Manuel d Utilisation: Espace de travail

Eurateach labellisé par la région et le FAFIEC. Si vous remplissez les conditions suivantes : Votre entreprise compte moins de 250 salariés

Task Server 6.0 Aide

Le projet SIST. Internet et Grilles de calculs en Afrique Agropolis- Montpellier Décembre 2007

Manuel d utilisation du module GiftList Pro par Alize Web

ABC Analytics Manuel succinct

FusionInventory. Guillaume Rousse Journées francophones de Perl 2011

Centre de formation digital et communication : www. Komelya.fr

GStock La gestion commerciale, stock et facturation qui vous correspond. Les apports de GStock pour votre entreprise :

Débuter avec WordPress 1/5

Manuel d utilisation du site web de l ONRN

Manuel d utilisation du module Liste de cadeaux PRO par Alize Web

DOCUMENTATION POINT FACTURE

Ce site intègre des technologies et fonctionnalités à la fois simples et très innovantes pour offrir une interface pratique et performante.

Valoriser vos bases de connaissances avec AMI Help Desk. AMI Enterprise Discovery version 3.9

EUDONET EN 2014 QUI SOMMES NOUS? 800 RÉFÉRENCES CLIENTS ÉDITEUR ET INTÉGRATEUR DE EUDONET + 14 ANS D EXPÉRIENCE

6 rue de la Fosse Chènevière. ZA Derrière Moutier Gueux. Tél Fax Sage Paie & RH V18. Contact : Cédric CZERNICH

Pistache. Dossier de Presse L éducation 2.0 au service de vos enfants. Contact Presse : thomas@pistache-app.com / +33 (0)

L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université

Documentation Honolulu 14 (1)

L aspect de votre logiciel a été modifié et reprend désormais la nouvelle charte graphique Sage.

Ministère des Affaires étrangères et européennes Direction de la politique culturelle et du français Regards VII

Une solution simple vers le succès de vos événements

IFT287 Exploitation de base de données relationnelles et orientées objet. Laboratoire Mon premier programme Java en Eclipse

Installation / Sauvegarde Restauration / Mise à jour

«JE CREE EN RHÔNE-ALPES : Les outils numériques réveillent la création d entreprises!»

Panorama des CMS open sources. Sylvain Ferrand, CMAP École Polytechnique Journées Mathrice, Poitiers, 19 mars 2008

Le travail collaboratif : guide des services

Prise en main d une Cyberclasse

Acrobat XI pour PC/Mac (version Pro) Pour qui, pourquoi et comment fabriquer un PDF?

WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

Référencement dans des bases de données

Mise à jour Apsynet DataCenter

Rapport de Stage Christopher Chedeau 2 au 26 Juin 2009

Pour vous, Que signifie «monter un projet web?...»

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Préconisations Portail clients SIGMA

Chapitre 1 Windows Server

Transcription:

L enseignement et la formation au logiciel R : un retour d expérience Julien Barnier Centre Max Weber julien.barnier@ens-lyon.fr Twitter : @lapply 19 novembre 2015

Présentation

Présentation Utilisateur (irrégulier) de R depuis une quinzaine d années. Initiateur du document Introduction à R et du package questionr. Donne des formations à R depuis 7 ans. Public de chercheurs et de doctorants.

Type de formation

Formations

Formations

Formations Plan d une formation type de 2 jours :

Formations Plan d une formation type de 2 jours : Première demi-journée : présentation de l interface. Familiarisation avec la ligne de commande de manière très progressive, puis utilisation de scripts. Début de travail avec des données.

Formations Plan d une formation type de 2 jours : Première demi-journée : présentation de l interface. Familiarisation avec la ligne de commande de manière très progressive, puis utilisation de scripts. Début de travail avec des données. Deuxième demi-journée : poursuite du travail sur des données, première analyses statistiques simples.

Formations Plan d une formation type de 2 jours : Première demi-journée : présentation de l interface. Familiarisation avec la ligne de commande de manière très progressive, puis utilisation de scripts. Début de travail avec des données. Deuxième demi-journée : poursuite du travail sur des données, première analyses statistiques simples. Troisième demi-journée : notion d indexation et de recodage.

Formations Plan d une formation type de 2 jours : Première demi-journée : présentation de l interface. Familiarisation avec la ligne de commande de manière très progressive, puis utilisation de scripts. Début de travail avec des données. Deuxième demi-journée : poursuite du travail sur des données, première analyses statistiques simples. Troisième demi-journée : notion d indexation et de recodage. Quatrième demi-journée : Approche marketing pour donner envie après la demi-journée précédente souvent difficile : cartographie, graphiques, rmarkdown, TraMineR...

Quel R?

RStudio

RStudio Incontournable aujourd hui : notion de projets (permet d éviter les problèmes de répertoires de travail) interface unifiée quel que soit le système d exploitation séparation de l écran en quatre volets qui aide à comprendre la logique de R coloration syntaxique, auto-complétion, aide intégrée...

R Commander

R Commander Dès le départ, choix de ne pas utiliser R Commander. pas convaincu par l interface trop vite limité on perd en grande partie l avantage de créer des scripts : efficacité, reproductibilité Point de vue : R Commander est adapté si on sait dès le départ qu on pourra se contenter des fonctionnalités proposées par l interface.

Interfaces ponctuelles Aujourd hui plutôt une démarche mixte : On privilégie le code : commandes et scripts dès le départ. En complément ou en support, utilisation ponctuelle d interfaces graphiques appelées depuis R. Principe de base : ces interfaces ne doivent pas exécuter de commande ou modifier les données.

Interfaces ponctuelles Aujourd hui plutôt une démarche mixte : On privilégie le code : commandes et scripts dès le départ. En complément ou en support, utilisation ponctuelle d interfaces graphiques appelées depuis R. Principe de base : ces interfaces ne doivent pas exécuter de commande ou modifier les données. Exemples : irec, iorder, icut du package questionr imca (package en cours de développement) shiny et htmlwidgets facilitent le développement de ces interfaces.

Évolution du code Hier : tmp.h <- hdv2003[hdv2003$sexe == "Homme",] tmp.f <- hdv2003[hdv2003$sexe == "Femme",] par(mfrow=c(2,1), mar=c(3,3,1,1)) boxplot(age ~ qualif, data=tmp.h, ylim=c(0,100)) boxplot(age ~ qualif, data=tmp.f, ylim=c(0,100))

Évolution du code Hier :

Évolution du code Aujourd hui : library(ggplot2) ggplot(data=hdv2003) + geom_boxplot(aes(x = qualif, y = age)) + facet_grid(sexe ~.)

Évolution du code Aujourd hui :

Évolution du code Hier : tmp <- hdv2003[hdv2003$qualif == "Employe", ] tab1 <- aggregate(tmp$age, list(tmp$sexe), mean) names(tab1) <- c("sexe", "age_mean") tab2 <- aggregate(tmp$age, list(tmp$sexe), median) names(tab2) <- c("sexe", "age_median") merge(tab1, tab2) ## sexe age_mean age_median ## 1 Femme 47.05221 45 ## 2 Homme 44.69792 45

Évolution du code Aujourd hui : library(dplyr) hdv2003 %>% filter(qualif == "Employe") %>% group_by(sexe) %>% summarise(age_mean = mean(age), age_median = median(age)) ## Source: local data frame [2 x 3] ## ## sexe age_mean age_median ## (fctr) (dbl) (dbl) ## 1 Homme 44.69792 45 ## 2 Femme 47.05221 45

Quels packages en formation? Jusque là, la formation se contentait de R de base et du package questionr pour des fonctions facilitant des besoins courants. Aujourd hui, et de plus en plus, certains packages semblent incontournables : ggplot2 dplyr, tidyr rmarkdown...

Quels packages en formation? Avantages : fonctionnalités supplémentaires, syntaxe simplifiée et cohérente. affichage de légendes dans des graphiques code avec des pipes, plus lisible documents en Markdown et export multi-formats Inconvénients : complexité supplémentaire, logiques de syntaxe et de code différentes. Biais : difficile de ne pas les introduire quand on les utilise au quotidien et que les réponses aux questions posées nous viennent spontanément avec ces packages.

Quels packages en formation? Question : Quand et comment les introduire? Pas encore de réponse claire. ggplot2 : dans un deuxième temps. dplyr, tidyr : pas intégrés aujourd hui, réflexion en cours. rmarkdown : présentation en bonus.

Accompagnement

Outils et documentation Francophones : La documentation en français d introduction est de plus en plus complète et abondante. Listes de discussion (R-soc, semin-r... ) : peu utilisées. Forum du Cirad : utilisé, mais pas forcément très connu. MOOC Anglophones : StackOverflow plein d autres!

Groupes d utilisateurs Exemple du groupe d utilisateurs de R sur Lyon Exemple de l Espace quanti au Centre Max Weber

Merci de votre attention!

Ressources utiles Document Introduction à R : http://alea.fr.eu.org/pages/intro-r Package questionr : http://alea.fr.eu.org/pages/questionr Site de ggplot2 : http://ggplot2.org/ Package dplyr : https://cran.r-project.org/web/packages/dplyr Package imva et fonction imca (instable, en cours de développement) : https://github.com/juba/imva Package associé scatterd3 permettant des nuages de points interactifs : https://github.com/juba/scatterd3