MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Dimension: px
Commencer à balayer dès la page:

Download "MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R"

Transcription

1 MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R Jeudi 10 octobre 2013 CHAIGNEAU Alicia GAZAN Rozenn DAUFOUY Camille JOURDAN Sandra

2 Introduction 2 Evolution des outils de collecte Big data : volume massif de données «Accumulation continue de tous les types de données atteignant une taille et un niveau de granularité difficile à exploiter» (1) 3 «V» : Volume, Vitesse (fréquence à laquelle les données sont générées), Variété (sources différentes : médias, machines, ) (1) Zouheir Guédri Mars 2012 congrès BigData Paris 2012

3 Introduction 3 Evolution des outils de collecte Big data : volume massif de données «Accumulation continue de tous les types de données atteignant une taille et un niveau de granularité difficile à exploiter» (1) 3 «V» : Volume, Vitesse (fréquence à laquelle les données sont générées), Variété (sources différentes : médias, machines, ) Origine Révolution de l information (diminution des coûts de stockage, nouveaux dispositifs de collecte, utilisation des réseaux sociaux) : 90% des données dans le monde créées les 2 dernières années : (2) Données numériques :1.2 zettaoctects (2010) 40 zettaoctects (2020) (1) Zouheir Guédri Mars 2012 congrès BigData Paris 2012 (2) étude IDC sponsorisée par EMC Gartner

4 Introduction 4 Limites de R R, logiciel gourmand en ressource système (CPU et RAM) Limite d allocation de ressources pour les programmes sous Windows (2Go de Ram) Importation de bigdata entraine une saturation de l espace mémoire Temps de calcul conséquents (pas assez d espace RAM pour exécuter autre chose)

5 Introduction 5 Limites de R R, logiciel gourmand en ressource système (CPU et RAM) Limite d allocation de ressources pour les programmes sous Windows (2Go de Ram) Importation de bigdata entraine une saturation de l espace mémoire Temps de calcul conséquents (pas assez d espace RAM pour exécuter autre chose) La demande de traitement de Bigdata croit de façon exponentielle Quelles sont les solutions à proposer?

6 Introduction 6 Présentation de 3 packages Manipulation de grosses bases de données dplyr Visualisation bigvis acinonyx Objectifs communs : faciliter les analyses sur des bases de données importantes (facilité de manipulation, améliorer la rapidité, visualisation.)

7 I Manipulation des données 7

8 Manipulation des données 8 Présentation du package dplyr Installation du package dplyr Jeu de données hflights Manipulations de données avec dplyr Source : https://github.com/hadley/dplyr

9 Présentation du package dplyr 9 Package dplyr créé par Hadley Wickham (encore en expérimentation) Package dplyr = Amélioration des outils les plus utilisés dans le package plyr (ddply, dlply et ldply) et adaptation à plusieurs format de données Package plyr créé par Hadley Wickham (publié le 06/12/12 sur le CRAN) dplyr supporte les formats de données : data frames, data tables, SQLite, Pour consulter l aide du package dplyr : help(package=dplyr)

10 Installation du package dplyr 10 dplyr nécessite Rtools : pour vérifier que Rtools fonctionne bien : find_rtools() ## affiche TRUE dplyr peut être installé avec : install.packages("devtools") library(devtools) install_github("assertthat") ## affiche DONE install_github("dplyr") ## affiche DONE library(dplyr)

11 Jeu de données hflights 11 Hflights est le jeu de données inclus dans dplyr data(package="dplyr") data(hflights)?hflights ## pour afficher la description du jeu de données Tous les vols qui sont partis des aéroports de Houston IAH (George Bush Intercontinental) and HOU (Houston Hobby) en lignes * 21 colonnes 12 variables quali : DayOfWeek, Origin, Dest, Cancelled, 9 variables quanti : AirTime, ArrDelay, DepDelay, Distance,

12 Manipulations de données avec dplyr 12 Quelques fonctions pratiques! Pour afficher une partie du jeu de données : head(hflights,n) ## affiche les n premières lignes tail(hflights,n) ## affiche les n dernières lignes ## par défaut n=6 print(hflights[150:155,]) ## affiche les 5 lignes demandées group_by () de dplyr : permet de faire des opérations sur des sous-groupes de variables

13 Manipulations de données avec dplyr 13 Fonctions principales Fonctions select() filter() mutate() summarise() arrange() Définitions Sélectionner un sous-groupe de variables Sélectionner un sous-groupe de lignes Ajouter de nouvelles colonnes Pour calculer des statistiques simples sur les variables Réordonner les lignes Pour consulter l aide des 5 fonctions :?manip

14 Manipulations de données avec dplyr 14 Exemple d utilisation de filter() : Cancelled : cancelled indicator: 1 = Yes, 0 = No CancellationCode : reason for cancellation: A = carrier, B = weather, C = national air system, D = security

15 Manipulations de données avec dplyr 15 Exemple d utilisation de summarise() : Exemple d utilisation de group_by() et summarise () :

16 Manipulations de données avec dplyr 16 Exemple d utilisation de la fonction arrange () :

17 Manipulations de données avec dplyr 17 La fonction do() permet d utiliser n importe qu elle autre fonction de R sur les données Comparaison du temps d'exécution de la fonction PCA avec et sans do() grâce à la function system.time () :

18 Bilan sur le package dplyr 18 Avantages Fonctions principales faciles à comprendre et à utiliser Plusieurs formats de données supportés Plus rapide que le package plyr Possibilité d utiliser d autres fonctions (lm, PCA, ) Inconvénients Difficile à installer Peu d informations pour l installation Pas compatible avec plyr pour l instant Gain de temps mais est-il vraiment important? Aide disponible depuis R

19 II 19

20 Transferts des données 20 Présentation du package bigvis Présentation du package acinonyx Comparaison des deux packages de visualisation

21 Package bigvis 21 Informations sur le package Très récent, disponible depuis début 2013 Auteur : Hadley Wickham Encore en expérimentation Description Outils permettant l analyse exploratoire rapide de bigdata Techniques d agrégation et de lissage Source : R-bloggers, Visualize large data sets with the bigvis package

22 Package bigvis 22 Installation du package bigvis Actuellement non disponible sur CRAN Installation Installer Rtools Installer le package devtools Installer le package bigvis install.packages("devtools") find_rtools() Sys.getenv( PATH ) install_github("bigvis") Source : https://github.com/hadley/bigvis

23 Package bigvis 23 Il est également utile d installer le package ggplot2 pour pouvoir utiliser les fonctions de représentations graphiques de bigvis Test avec le jeu de données movies du package bigvis individus (films) x 14 variables (titre, année de sortie, budget, durée, )

24 Package bigvis 24 Fonctions principales bin() et condense() : permettent d avoir un résumé compact des données

25 Package bigvis 25 Fonctions principales bin() et condense() : permettent d avoir un résumé compact des données bin(x, width = find_width(x),origin = find_origin(x, width), name = NULL) Convertit les variables en objet «bin», nécessaire pour les manipuler avec les autres fonctions

26 Package bigvis 26 Fonctions principales bin() et condense() : permettent d avoir un résumé compact des données bin(x, width = find_width(x),origin = find_origin(x, width), name = NULL) Convertit les variables en objet «bin», nécessaire pour les manipuler avec les autres fonctions condense(..., z = NULL, summary = NULL, w = NULL,drop = NULL) Condense des données de type «bin» en agrégeant des individus Ressort la variable condensée et une variable.count par défaut

27 Package bigvis 27 Exemple d utilisation de condense() standardise() : s utilise lorsqu on travaille sur les effectifs (.count), permet de passer aux fréquences standardise(x, margin = integer())

28 Package bigvis 28 smooth() : permet de lisser un data.frame condensé smooth(x, h, var = summary_vars(x)[1], grid = NULL,type = "mean", factor = TRUE) h : argument permettant de jouer sur le niveau de lissage de la courbe

29 Package bigvis 29 autoplot() : permet de créer des graphes sur des données condensées (besoin du package ggplot2 ) autoplot(x,var = last(summary_vars(x)),...) peel() : conserve les proportions spécifiques du jeu de données tout en enlevant les zones de densité faible, augmente la lisibilité des graphes peel() : peel(x, keep = 0.99, central = NULL)

30 Package bigvis 30 Exemples de graphiques obtenus avec autoplot() : peel()

31 Package bigvis 31 Graphique obtenus avec plot() : 3 à 4 secondes pour obtenir le graphe

32 Package bigvis 32 Exemples de graphiques obtenus avec autoplot() : Moins de 1 seconde pour obtenir le graphe

33 Package bigvis 33 Exemples de graphiques obtenus avec autoplot() :

34 Package bigvis 34 Il existe également différentes fonctions permettant de calculer les statistiques descriptives basiques des jeux de données condensés : weighted.median() weighted.quantile() weighted.sd() weighted.var()

35 Package acinonyx 35 Savez-vous d où vient le nom du package?

36 Package acinonyx 36 Savez-vous d où vient le nom du package?

37 Package acinonyx 37 Simon Urbanek Mise à disposition des utilisateurs en septembre 2009 Page officielle sur le CRAN en septembre 2011 Qu est ce que c est? Nouveau système de gestion d interfaces graphiques de haute performance (iplot Extreme), pour visualiser et explorer d importantes bases de données Package de R le plus rapide : gestion des graphiques via une interface de programmation OpenGL Source :

38 Package acinonyx 38 Objectifs expérimentaux Ajouter des modèles statistiques aux graphiques interactifs Amélioration de la gestion sur systèmes d exploitations Windows et Mac Rapidité et extensibilité aux big data

39 Package acinonyx 39 Téléchargement et installation Copier le lien : install.packages( acinonyx','http://www.rforge.net/') Ou téléchargement du fichier zip sur ce même site Chargement library(acinonyx) dans la console R

40 Package acinonyx 40 icontainer : mettre plusieurs graphiques dans une seule fenêtre ibar, ihist, ilines, iplot : graphiques dynamiques avec coloration des points x/y en rouge ihist.default,ilines.default, iplot.default : fonction pour rajouter des options sur le graphique move, move.ivisual : fonctions pour bouger des objets au sein de la fenêtre graphique add.container, add.iplot, : ajout d objets à un objet déjà existant

41 Package acinonyx 41 ibar

42 Package acinonyx 42 ihist Pour passer en spineplot Pour mettre de la couleur

43 Package acinonyx 43 ihist Déplacer le graphique dans sa propre fenêtre (objet, x, y)

44 Package acinonyx 44 icontainer Placer 2 graphiques dans une seule fenêtre

45 Package acinonyx 45 icontainer Position de l objet, vecteur c(x,y,largeur,hauteur) Comportement de l objet lorsque l on modifie la taille de la fenêtre initiale

46 Package acinonyx 46 ipcp Graphique de coordonnées parallèles : chaque ligne correspond à un individu, chaque axe correspond à une variable

47 Package acinonyx 47 ipcp Sélection des variables

48 Comparaison des deux packages 48 Avantages bigvis acinonyx Communs Graphiques esthétiques et lisibles grâce à l utilisation du package ggplot2 Aide disponible depuis R Visualisation des grosses données rapide Téléchargement et installation aisée Facilité d utilisation des fonctions (similaires à iplot ) Outils performants pour avoir une première idée de la structure d un gros jeu de données

49 Comparaison des deux packages 49 Package iplot Temps : 1 min. 30 Sélection des variables

50 Comparaison des deux packages 50 Package acinonyx Temps : 20 sec. Sélection des variables

51 Comparaison des deux packages 51 Inconvénients bigvis acinonyx Commun Difficultés pour installer le package Certaines fonctions ne fonctionnent pas bien (best_h() -> temps de calcul très long!) Plateforme de développement: MacOs. Limite de certaines configurations sur Windows Absence de certains graphiques de base (boite à moustaches, mosaïques) Graphiques simples et peu esthétiques pour des présentations publiques Très peu de documentation (encore en expérimentation)

52 Bilan 52

53 Bilan 53 Utilisation de fonctions standards sur des grosses bases de données possible grâce aux packages présentés Manipulation simple même si les packages sont encore en expérimentation : peu de documents sur l utilisation des différentes fonctions, installation compliquée Beaucoup de nouveautés à explorer

54 Bilan 54 Beaucoup de nouveautés à explorer rmr : analyses statistiques par la méthode de «Hadoop MapReduce» (calculs effectués en parallèles, distribués dans différents clusters) filehash : analyses statistiques en utilisant les fonctions classiques de R sur un jeu de donné stocké sur le disque (et pas en mémoire RAM) ff : idem filehash Bigmemory : pour l importation, la manipulation de bigdata, allocation des données dans une mémoire partagée Revolution Analytic s RevoScaleR : classification sur des bigdata «Programming with BigData in R» (pbdr) : série de packages pour utiliser des bigdata

55 Complément 55

56 Package «bigvis» 56 En combinant les fonctions autoplot(), peel() et standardise() : Tableau length x year -> profils lignes

UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R»

UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R» TP STA-MQGR UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R» Seydou Barro SESSTIM, UMR 912, Aix-Marseille Université golo-seydou.barro@univ-amu.fr 1 INTRODUCTION R est un logiciel libre distribué gratuitement

Plus en détail

«Connais toi toi-même comme l as dit Socrate!»

«Connais toi toi-même comme l as dit Socrate!» «Connais toi toi-même comme l as dit Socrate!» Avant toute chose, il faut savoir pour quel usage, vous désirez acquérir un ordinateur. En effet la configuration de votre ordinateur ne sera pas la même

Plus en détail

Initiation à R, logiciel de Statistiques

Initiation à R, logiciel de Statistiques Initiation à R, logiciel de Statistiques I. Plusieurs façons de travailler ( ou de s enquiquiner) II. R, logiciel de programmation en Statistiques III. Votre premier projet en R, pas à pas 2013-03-05 Initiation

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html 1 R est un langage de programmation. L objet de base est un vecteur de données. C est un «vrai» langage c.-à-d. types

Plus en détail

Introduction au langage R

Introduction au langage R Les bases de la manipulation des objets Centre International d études pédagogiques Cogmaster, 2009. Plan La disponibilité Libre et gratuit Libre, cela signifie que le code est accessible et modifiable.

Plus en détail

INTRODUCTION AU LOGICIEL R. Julien JACQUES http://eric.univ-lyon2.fr/ jjacques/

INTRODUCTION AU LOGICIEL R. Julien JACQUES http://eric.univ-lyon2.fr/ jjacques/ INTRODUCTION AU LOGICIEL R Julien JACQUES http://eric.univ-lyon2.fr/ jjacques/ L objectif de ce document est de présenter une très courte introduction au logiciel R (via l interface RStudio), de sorte

Plus en détail

Traitement informatique d un tableau de données statistiques. Classes de logiciels de statistique.

Traitement informatique d un tableau de données statistiques. Classes de logiciels de statistique. Traitement informatique d un tableau de données statistiques. Classes de logiciels de statistique. B. Govaerts - Institut de Statistique - UCL STAT2430 Traitements de données et classes de logiciels Page

Plus en détail

Optimiser ses graphiques avec R

Optimiser ses graphiques avec R Optimiser ses graphiques avec R Jérôme Sueur MNHN Systématique et Evolution UMR CNRS 7205 OSEB sueur@mnhn.fr 28 Avril 2011 1 Typologie 2 Base 3 ggplot2 4 Références Outline 1 Typologie 2 Base 3 ggplot2

Plus en détail

TP1 Master Finance logiciels Introduction à R

TP1 Master Finance logiciels Introduction à R TP1 Master Finance logiciels Introduction à R Emeline Schmisser, emeline.schmisser@math.univ-lille1.fr, bureau 314 (bâtiment M3). 1 Séquences, Vecteurs, Matrice Tableaux (arrays) Pour obtenir l aide de

Plus en détail

R, Logiciel libre Présentation Importation Manipulation Description graphique Traitements automatiques. Découverte de

R, Logiciel libre Présentation Importation Manipulation Description graphique Traitements automatiques. Découverte de Découverte de David Causeur Laboratoire de Mathématiques Appliquées Agrocampus Ouest IRMAR CNRS UMR 6625 http://www.agrocampus-ouest.fr/math/causeur/ Plan du cours 1 R, Logiciel libre 2 Présentation 3

Plus en détail

Introduction au logiciel R

Introduction au logiciel R Introduction au logiciel R Fabrice Rossi Projet AxIS, INRIA Rocquencourt 2007 F. Rossi (INRIA) Introduction au logiciel R 2007 1 / 34 Plan 1 Manipulations élémentaires Vecteurs et tableaux de données Graphisme

Plus en détail

Programmation parallèle et distribuée

Programmation parallèle et distribuée Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2015) Marc Parizeau, Département de génie électrique et de génie informatique Plan Données massives («big data») Architecture Hadoop distribution

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html 1 Plan de présentation 1. L écosystème Hadoop 2. Principe de programmation MapReduce 3. Programmation des fonctions

Plus en détail

WinReporter Guide de démarrage rapide. Version 4

WinReporter Guide de démarrage rapide. Version 4 WinReporter Guide de démarrage rapide Version 4 Table des Matières 1. Bienvenue dans WinReporter... 3 1.1. Introduction... 3 1.2. Configuration minimale... 3 1.3. Installer WinReporter... 3 2. Votre premier

Plus en détail

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume Studio HERITIER Emmanuelle PERSYN Elodie SCHMUTZ Amandine SCHWEITZER Guillaume Cours R Présentation projet 10/10/2013 Introduction RStudio est une interface créé par JJ Allaire Elle est sortie le 11 Février

Plus en détail

Implémentation et Benchmark. d une régression linéaire en RMR2

Implémentation et Benchmark. d une régression linéaire en RMR2 Add intelligence to data Anne Gayet Directrice Datamining Implémentation et Benchmark d une régression linéaire en RMR2 16 janvier 2014 Rendez-vous SFdS: : Méthodes et logiciels Données massives (big data)

Plus en détail

BIG Data et R: opportunités et perspectives

BIG Data et R: opportunités et perspectives BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,

Plus en détail

Online Help StruxureWare Data Center Expert

Online Help StruxureWare Data Center Expert Online Help StruxureWare Data Center Expert Version 7.2.7 Système virtuel StruxureWare Data Center Expert Le serveur StruxureWare Data Center Expert 7.2 est disponible comme système virtuel pris en charge

Plus en détail

Gestion des données avec R

Gestion des données avec R Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................

Plus en détail

Prise en main du Logiciel R 2 mots sur R R est un logiciel de statistique disponible librement sur internet.

Prise en main du Logiciel R 2 mots sur R R est un logiciel de statistique disponible librement sur internet. Prise en main du Logiciel R 2 mots sur R R est un logiciel de statistique disponible librement sur internet. Vous pouvez le télécharger à http://www.r-project.org/ Il est déjà installé dans ces salles

Plus en détail

R00 Installation du logiciel R sous Windows

R00 Installation du logiciel R sous Windows R00 Installation du logiciel R sous Windows 1. Installation du package de base R est distribué gratuitement à partir du site du CRAN (Comprehensive R Archive Network) : http://www.r-project.org. Pour télécharger

Plus en détail

L analyse de la variance avec R commander

L analyse de la variance avec R commander L analyse de la variance avec R commander 19 mars 2014 1 Installer R Pour installer R, il vous suffit d aller sur le site http://www.r-project.org/. Choisissez un miroir pour le téléchargement. Sélectionner

Plus en détail

Plateforme SAS. Data & Information System

Plateforme SAS. Data & Information System Data & Information System SOMMAIRE Rédacteur : Ref: F.Barthelemy AXIO_1111_V1 PLATEFORME SAS PREREQUIS SAS GUIDE SAS WRS SAS PORTAL SAS MINER Une plateforme unique et modulable capable d exploiter l architecture

Plus en détail

TP 2 : Importation et exportation de données Les outils graphiques de

TP 2 : Importation et exportation de données Les outils graphiques de TP 2 : Importation et exportation de données Les outils graphiques de Consulter les données disponibles sur Consulter les données disponibles sur les packages chargées en mémoire : data( Consulter les

Plus en détail

Graver un CD ou un DVD

Graver un CD ou un DVD Graver un CD ou un DVD 27 janvier 2014 p 1 Graver un CD ou un DVD Ce tutoriel est un complément à notre cours sur la sauvegarde des documents. Car la gravure de documents sur un cd ou un dvd est un moyen

Plus en détail

Logiciel de Télégestion

Logiciel de Télégestion 2 530 Logiciel de Télégestion pour centrales de communication OCI600 ACS600 Logiciel pour la télégestion d'une ou de plusieurs centrales de communication OCI600. Version MS-WINDOWS. Domaines d'application

Plus en détail

Big Data par l exemple

Big Data par l exemple #PARTAGE Big Data par l exemple Alexandre Chauvin Hameau Directeur de la production Malakoff Médéric @achauvin CT BIG DATA 10/12/2015 Soyons pragmatiques BIG DATA beaucoup de bruit pour des choses finalement

Plus en détail

Master EBE Introduction à R et Statistique inférentielle

Master EBE Introduction à R et Statistique inférentielle Master EBE Introduction à R et Statistique inférentielle R est un logiciel de calcul statistique et probabiliste. Il est développé dans le cadre du projet GNU http://www.gnu.org/ ), c est donc un logiciel

Plus en détail

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES 1 DECOUVERTE DE LA VIRTUALISATION... 2 1.1 1.2 CONCEPTS, PRINCIPES...2 UTILISATION...2 1.2.1 Formation...2

Plus en détail

Travaux dirigés. Introduction à R 1

Travaux dirigés. Introduction à R 1 Introduction à R 1 1 Introduction : pourquoi R? R est un logiciel pour l analyse statistique. C est un logiciel libre ; il est disponible gratuitement et tourne sur différents systèmes (PC Linux, PC Windows,

Plus en détail

Programmation parallèle et distribuée

Programmation parallèle et distribuée Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2014) Marc Parizeau, Département de génie électrique et de génie informatique Plan Mégadonnées («big data») Architecture Hadoop distribution

Plus en détail

Tutoriel : Utilisation du serveur de calcul à distance de PSE

Tutoriel : Utilisation du serveur de calcul à distance de PSE Tutoriel : Utilisation du serveur de calcul à distance de PSE David Smadja Camille Terrier Septembre 2013 Table des matières 1 Préambule 1 2 Avertissements 1 3 Pré-requis 1 4 Installation de X2goClient

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html 1 Le type data.frame Le type data.frame est un type spécifique dédié à la manipulation d ensemble de données de type

Plus en détail

1) Toute formation à partir de Microsoft Office 2003

1) Toute formation à partir de Microsoft Office 2003 Erreur de lancement d une vidéo (bouton Leçon ou Solution) Cet article concerne des problèmes généraux rencontrés sur le lancement de vidéos dans le cadre de toute formation MEDIAplus. Lorsque le système

Plus en détail

Allez plus loin avec Windows XP

Allez plus loin avec Windows XP Plus loin avec Windows XP 1 Allez plus loin avec Windows XP Yves Roger CORNIL 13 novembre 2006 1 Quelques rappels Le système d exploitation. L interface graphique. Plus loin avec Windows XP 2 2 Le système

Plus en détail

avec nos solutions spécialisées pour la microfinance et ses institutions coopératives Big Data

avec nos solutions spécialisées pour la microfinance et ses institutions coopératives Big Data avec nos solutions spécialisées pour la microfinance et ses institutions coopératives Big Data Historique de Big data Jusqu à l avènement d Internet et surtout du Web 2.0 il n y avait pas tant de données

Plus en détail

Tropimed Guide d'installation

Tropimed Guide d'installation Tropimed Guide d'installation 1. A propos de ce guide... 2 2. Configurations matérielles et logicielles requises... 2 2.1 Configuration Windows... 2 2.2 Configuration MacOs... 2 2.3 Configuration requise

Plus en détail

La fonction data() :

La fonction data() : La fonction data() : Cette fonction permet de lire des données internes un data.frame ou de lister les data frame existants Exemples: data() # liste de tous les data frame dans le package par défaut «datasets»

Plus en détail

Introduction à Rcommander

Introduction à Rcommander Introduction à Rcommander Pauline Scherdel Septembre 2014 Table des matières 1 Introduction à Rcmdr sous R 2 2 Interagir avec R 3 3 Installer et charger le package Rcmdr sous R 3 4 Importation des données

Plus en détail

Tutorial Ophcrack. I) Ophcrack en API. (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista)

Tutorial Ophcrack. I) Ophcrack en API. (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista) Tutorial Ophcrack (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista) Ophcrack est un utilitaire gratuit permettant de cracker les mots de passe des sessions

Plus en détail

À LA DÉCOUVERTE d Excel 2010

À LA DÉCOUVERTE d Excel 2010 Vous venez d installer Excel 2010 sur votre ordinateur et vous avez eu raison de le faire car vous disposez maintenant d un outil d une puissance redoutable. Avec cette dernière version du tableur, vous

Plus en détail

Monitoring du système de stockage de données du CERN

Monitoring du système de stockage de données du CERN Monitoring du système de stockage de données du CERN Stage réalisé de Mars à Août 2013 Université Lille 1 Spécialisation IAGL Ingénierie et Architecture des Grands Logiciels Manuel SERVAIS Superviseurs

Plus en détail

Présentation du logiciel

Présentation du logiciel Chapitre A Présentation du logiciel R Pré-requis et objectif La lecture du chapitre sur l installation de R dans les Annexes peut se révéler utile. Ce chapitre présente les origines, l objectif et les

Plus en détail

TD : Codage des images

TD : Codage des images TD : Codage des images Les navigateurs Web (Netscape, IE, Mozilla ) prennent en charge les contenus textuels (au format HTML) ainsi que les images fixes (GIF, JPG, PNG) ou animée (GIF animée). Comment

Plus en détail

TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage

TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage est distribué gratuitement à partir du site du CRAN (Comprehensive R Archive Network) : http://www.r-project.org/. Je vous

Plus en détail

Anglais professionnel automobile Guide technique : les utilisations informatiques des modules

Anglais professionnel automobile Guide technique : les utilisations informatiques des modules ( Anglais professionnel automobile ) Guide technique : les utilisations informatiques des modules Préambule Ce document vous présente les différentes utilisations informatiques possibles des modules d

Plus en détail

Introduction. La collection Classroom in a Book. Conditions requises

Introduction. La collection Classroom in a Book. Conditions requises Introduction Adobe Dreamweaver CS4 est le programme de création web phare du marché. Que vous ayez fait profession de créer des sites web ou que vous en conceviez un pour votre entreprise, vous disposerez

Plus en détail

MODULE D INITIATION À INFORMATIQUE LYCEE

MODULE D INITIATION À INFORMATIQUE LYCEE Module I INITIATION A L INFORMATIQUE, SYSTEME D EXPLOITATION ET WINDOWS CONTENU du Programme de formation : INTRODUCTION INFORMATIQUE 1 Notion de matériel Informatique et logiciel Informatique 2 Notion

Plus en détail

Quelques analyses simples avec R en écologie des communautés

Quelques analyses simples avec R en écologie des communautés Jérôme Mathieu janvier 2007 Quelques analyses simples avec R en écologie des communautés 1 Visualisation des données... 2 Aperçu rapide d'un tableau de données... 3 Visualiser les corrélations entre des

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html R est un langage de programmation. L objet de base est un vecteur de données. C est un «vrai» langage c.-à-d. types

Plus en détail

1 Le vocabulaire de l informatique

1 Le vocabulaire de l informatique 1 Le vocabulaire de l informatique I Les systèmes informatiques Les ordinateurs sont omniprésents dans notre environnement quotidien. Conçus pour traiter de manière générale des informations, ils ne se

Plus en détail

SAS Studio SAS pour tous, SAS sur n importe quel périphérique.

SAS Studio SAS pour tous, SAS sur n importe quel périphérique. SAS Studio SAS pour tous, SAS sur n importe quel périphérique. SAS Studio est le dernier né des produits SAS, avec son utilisation, écrire et exécuter du code SAS n aura jamais été aussi simple. Il a pour

Plus en détail

Créer un document PDF (Portable Document Format) au départ d un fichier Word ou Excel

Créer un document PDF (Portable Document Format) au départ d un fichier Word ou Excel Créer un document PDF (Portable Document Format) au départ d un fichier Word ou Excel 1. Le Portable Document Format (communément abrégé PDF) est un format de fichier informatique créé par Adobe Systems.

Plus en détail

Travaux pratiques 1.3.2 Détermination de la capacité de stockage de données

Travaux pratiques 1.3.2 Détermination de la capacité de stockage de données Travaux pratiques 1.3.2 Détermination de la capacité de stockage de données Objectifs Déterminer la quantité de mémoire RAM (en Mo) installée sur un ordinateur Déterminer la taille de l unité de disque

Plus en détail

1. Remarques préalables

1. Remarques préalables Préconisations pour l'informatisation d un CDI avec BCDI 3 en réseau Windows Sommaire 1. Remarques préalables 2. Architecture générale d une installation en réseau 3. Indications techniques 4. Sauvegardes

Plus en détail

Projet individuel d algorithmique-programmation AP1 : groupe 1.1 - complément bibliothèque graphique

Projet individuel d algorithmique-programmation AP1 : groupe 1.1 - complément bibliothèque graphique Projet individuel d algorithmique-programmation AP1 : groupe 1.1 - complément bibliothèque graphique octobre 2010 1 Affichage graphique statique Il en existe trois bibliothèques graphiques en Ocaml : la

Plus en détail

4 Exemples de problèmes MapReduce incrémentaux

4 Exemples de problèmes MapReduce incrémentaux 4 Exemples de problèmes MapReduce incrémentaux 1 / 32 Calcul des plus courtes distances à un noeud d un graphe Calcul des plus courts chemins entre toutes les paires de noeuds d un graphe Algorithme PageRank

Plus en détail

A. Partitionnement, systèmes de fichiers et RAID :

A. Partitionnement, systèmes de fichiers et RAID : Introduction : Ce cours a pour but d expliquer les différentes étapes de la gestion des disques sous Windows 7 Client. Afin d être le plus exhaustif possible, nous avons décidé de commencer par aborder

Plus en détail

Guide d'installation de NovaPoint Réalité Virtuelle 6.0

Guide d'installation de NovaPoint Réalité Virtuelle 6.0 2015/12/31 13:25 1/5 Guide d'installation de NovaPoint Réalité Virtuelle 6.0 Guide d'installation de NovaPoint Réalité Virtuelle 6.0 Novapoint Réalité Virtuelle VS Réalité Virtuelle est un outil permettant

Plus en détail

TP Informatique 1 Présentation prise en main Visual Studio

TP Informatique 1 Présentation prise en main Visual Studio TP Informatique 1 Présentation prise en main Visual Studio But : prise en en main visual studio 1ères notions Variable Informatique : domaine d'activité scientifique, technique et industriel en rapport

Plus en détail

Environnements de développement (intégrés)

Environnements de développement (intégrés) Environnements de développement (intégrés) Plan de travail Patrick Labatut labatut@di.ens.fr http://www.di.ens.fr/~labatut/ Département d informatique École normale supérieure Centre d enseignement et

Plus en détail

Introduction aux fonctions du langage R

Introduction aux fonctions du langage R Introduction aux fonctions du langage R Pierre Legendre Octobre, décembre 2004 Département de sciences biologiques Mai, septembre 2005, janvier 2006 Université de Montréal Août 2006, novembre 2006, février

Plus en détail

Séance du jeudi 6 Octobre 2011 PIT quartier Parmentier

Séance du jeudi 6 Octobre 2011 PIT quartier Parmentier Séance du jeudi 6 Octobre 2011 PIT quartier Parmentier Pour les débutants. Quelques bases. L écran de votre ordinateur contient ce que l on appelle le BUREAU Les petites vignettes ou icônes représentent

Plus en détail

INSTALLATION CONFIGURATION D OWNCLOUD. La réponse informatique

INSTALLATION CONFIGURATION D OWNCLOUD. La réponse informatique INSTALLATION CONFIGURATION D OWNCLOUD La réponse informatique Le but de cette documentation est de vous montrer comment installer le logiciel OWNCLOUD sur votre ordinateur Windows et MAC I- Installation

Plus en détail

1 Configuration requise pour Internet Security

1 Configuration requise pour Internet Security Configuration requise et instructions d installation pour Internet Security Table des matières 1 Configuration requise pour Internet Security...1 2 Guide d installation: installer Internet Security pour

Plus en détail

Numérisation pour les archives filmiques Complications diverses

Numérisation pour les archives filmiques Complications diverses Numérisation pour les archives filmiques Complications diverses Scan Tests standards pour les scanners Il n existe pas de tests ou systèmes standard universels pour les scanners de films, il est donc difficile

Plus en détail

WEBCAM HAUTE DEFINITION Réf. HDCM

WEBCAM HAUTE DEFINITION Réf. HDCM : 0033 (0)169922672 : 0033 (0)169922674 : www.sordalab.com @ : info@sordalab.com WEBCAM HAUTE DEFINITION Réf. HDCM Webcam haute définition Réf. HDCM Page 1 sur 8 I. CARACTERISTIQUES TECHNIQUES Capteur

Plus en détail

Utiliser Gephi avec Tropes

Utiliser Gephi avec Tropes Utiliser Gephi avec Tropes Tropes est un logiciel développé par Pierre Molette et Agnès Landré sur la base des travaux de Rodolphe Ghiglione. www.tropes.fr www.semantic-knowledge.com Gephi est un logiciel

Plus en détail

Plateforme académique de partage de documents - owncloud

Plateforme académique de partage de documents - owncloud Plateforme académique de partage de documents - owncloud 1 - Présentation générale owncloud est un logiciel libre offrant une plateforme de services de stockage et d applications diverses en ligne (cloud

Plus en détail

Clusters for Application Service Providers. T. Monteil, J.M. Garcia P. Pascal, S. Richard

Clusters for Application Service Providers. T. Monteil, J.M. Garcia P. Pascal, S. Richard Clusters for Application Service Providers (www.laas.fr/casp) T. Monteil, J.M. Garcia P. Pascal, S. Richard 1 Généralités Le monde du calcul dans un environnement ASP Les ASP : Application Service Provider

Plus en détail

TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage

TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage est distribué gratuitement à partir du site du CRAN (Comprehensive R Archive Network) : http://www.r-project.org/. Je vous

Plus en détail

Principe de fonctionnement du lanceur d'application "AdisTlsStartCfgLotus"

Principe de fonctionnement du lanceur d'application AdisTlsStartCfgLotus IS00788 Principe de fonctionnement du lanceur d'application Fiche IS00788 Version document : 1.02 Diffusion limitée : Systancia, membres du programme Partenaires AppliDis et clients ou prospects de Systancia

Plus en détail

Semaine 0 :: Installation et présentation de Python

Semaine 0 :: Installation et présentation de Python Semaine 0 :: Installation et présentation de Python Ce document est un complément des vidéos présentes dans le MOOC. 1. Installation de Python L environnement Python est disponible sur de nombreuses plates

Plus en détail

Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long,

Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long, Vous êtes bien à la bonne présentation, c est juste que je trouvais que le titre de cette présentation étais un peu long, en fait ça me faisait penser au nom d un certain projet gouvernemental je me suis

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

Guide utilisateur Guide d utilisation. Connexion à la plateforme Cloud... 3 Utiliser l interface... 4. Structuration de l'interface...

Guide utilisateur Guide d utilisation. Connexion à la plateforme Cloud... 3 Utiliser l interface... 4. Structuration de l'interface... 1 Table des matières Connexion à la plateforme Cloud... 3 Utiliser l interface... 4 Structuration de l'interface... 4 Le tableau de bord (Dashboard)... 5 Les machines virtuelles... 6 Propriétés... 6 Actions...

Plus en détail

Exercices de simulation 1

Exercices de simulation 1 Licence MIA 2ème année Année universitaire 2009-2010 Simulation stochastique C. Léonard Exercices de simulation 1 Les simulations qui suivent sont à effectuer avec Scilab. Le générateur aléatoire de Scilab.

Plus en détail

Calcul haute performance (CHP-HPC). Utilisation des supercalculateurs

Calcul haute performance (CHP-HPC). Utilisation des supercalculateurs Calcul haute performance (CHP-HPC). Utilisation des supercalculateurs Pascal Rochon (UQO-ISFORT) Sommaire 1. Pourquoi utiliser le CHP 2. Définition des termes utilisés 3. Organismes qui chapeautent le

Plus en détail

Le paquet rvle. Utilisation d un simulateur VLE, sous R. Patrick Chabrier, Hélène Raynal, Ronan Trepos 1, Gauthier Quesnel 2

Le paquet rvle. Utilisation d un simulateur VLE, sous R. Patrick Chabrier, Hélène Raynal, Ronan Trepos 1, Gauthier Quesnel 2 Le paquet rvle Utilisation d un simulateur VLE, sous R. Patrick Chabrier, Hélène Raynal, Ronan Trepos 1, Gauthier Quesnel 2 1. Equipe RECORD, U-MIA-T, INRA Toulouse 2. Equipe MAD, U-MIA-T, INRA Toulouse

Plus en détail

Initiation à Windows xp

Initiation à Windows xp Quelques rappels Initiation à Windows xp Le système d exploitation. L interface graphique. Yves Roger CORNIL 1er juillet 2006 Le système d exploitation Le système d exploitation (Operating System, O.S.)

Plus en détail

Comptabilité 7. Banana est une application native pour Windows, Linux et Mac et contient les fonctions pour gérer plusieurs type de comptabilité:

Comptabilité 7. Banana est une application native pour Windows, Linux et Mac et contient les fonctions pour gérer plusieurs type de comptabilité: banana Comptabilité 7 FICHE TECHNI NIQUE Applications et typologie Banana est une application native pour Windows, Linux et Mac et contient les fonctions pour gérer plusieurs type de comptabilité: Comptabilité

Plus en détail

26 Centre de Sécurité et de

26 Centre de Sécurité et de 26 Centre de Sécurité et de Maintenance La fenêtre du Centre de sécurité et de maintenance (CSM) rassemble tous les outils nécessaires au contrôle, à l analyse, à la maintenance, à la sauvegarde et au

Plus en détail

INTRODUCTION A L UTILISATION DE SYSTAT

INTRODUCTION A L UTILISATION DE SYSTAT 1 INTRODUCTION A L UTILISATION DE SYSTAT F. Lyazrhi D. Concordet 2 Systat est un logiciel statistique qui permet de préparer les graphiques et de faire des calculs nécessaires à l analyse des données.

Plus en détail

Livret Professeur. Jeu «Construis ta ligne à grande vitesse» Version Windows/Mac. v1.06 07/04/2015. Jeu édité par. créé par. Avec le soutien de

Livret Professeur. Jeu «Construis ta ligne à grande vitesse» Version Windows/Mac. v1.06 07/04/2015. Jeu édité par. créé par. Avec le soutien de Livret Professeur Jeu «Construis ta ligne à grande vitesse» Version Windows/Mac v1.06 07/04/2015 Jeu édité par créé par Avec le soutien de Page 1 Pre sentation Le Jeu «Construis ta ligne à grande vitesse»

Plus en détail

Les technologies du Big Data

Les technologies du Big Data Les technologies du Big Data PRÉSENTÉ AU 40 E CONGRÈS DE L ASSOCIATION DES ÉCONOMISTES QUÉBÉCOIS PAR TOM LANDRY, CONSEILLER SENIOR LE 20 MAI 2015 WWW.CRIM.CA TECHNOLOGIES: DES DONNÉES JUSQU'À L UTILISATEUR

Plus en détail

Introduction aux statistiques et à l'utilisation du logiciel R

Introduction aux statistiques et à l'utilisation du logiciel R Introduction aux statistiques et à l'utilisation du logiciel R Master 2 GPSA 1 Michel Visalli - michel.visalli@dijon.inra.fr Sommaire Présentation du logiciel... 3 A propos de R?... 3 Installation... 3

Plus en détail

Introduction CHAPITRE 1. 1.1 Caractéristiques R

Introduction CHAPITRE 1. 1.1 Caractéristiques R CHAPITRE 1 Introduction Dans le milieu des années 1970, John Chambers, chercheur à Bell Lab AT&T (devenu par la suite Lucent Technology) développe le langage S pour l analyse statistique et l exploitation

Plus en détail

Sauvegarde des profils de connexion et des options depuis une installation existante Sauvegarde des profils de connexion

Sauvegarde des profils de connexion et des options depuis une installation existante Sauvegarde des profils de connexion DEPLOYER LES PROFILS DE CONNEXION ET LES OPTIONS LORS D UNE NOUVELLE INSTALLATION DE SAS ENTERPRISE GUIDE 5.1 Inclus dans la plate-forme décisionnelle SAS 9.3, SAS Enterprise Guide 5.1 nécessite de définir

Plus en détail

Travaux d Études et de Recherche Rapport Intermédiaire. Julien Henry Nicolas Lacourte-Barbadaux Alexandre Masson Léo Rousseau 14 Janvier 2013

Travaux d Études et de Recherche Rapport Intermédiaire. Julien Henry Nicolas Lacourte-Barbadaux Alexandre Masson Léo Rousseau 14 Janvier 2013 Travaux d Études et de Recherche Rapport Intermédiaire Julien Henry Nicolas Lacourte-Barbadaux Alexandre Masson Léo Rousseau 14 Janvier 2013 1 Table des matières 1 Résumé du projet 3 2 Introduction du

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

1. Vue rapide des logiciels disponibles

1. Vue rapide des logiciels disponibles Voici une revue rapide des progiciels gratuits accessibles [FREE AND SHAREWARE] dans la section SUITES du site KDNUGGETS (http://www.kdnuggets.com/software/suites.html). L étude sera approfondie pour les

Plus en détail

L enseignement et la formation au logiciel R : un retour d expérience

L enseignement et la formation au logiciel R : un retour d expérience L enseignement et la formation au logiciel R : un retour d expérience Julien Barnier Centre Max Weber julien.barnier@ens-lyon.fr Twitter : @lapply 19 novembre 2015 Présentation Présentation Utilisateur

Plus en détail

2nde AMA SÉQUENCE SYSTÈME D EXPLOITATION

2nde AMA SÉQUENCE SYSTÈME D EXPLOITATION 2nde AMA SÉQUENCE SYSTÈME D EXPLOITATION l interface mac osx 2 CE QUE L ON VOIT À L ÉCRAN QU EST-CE QU UN SYSTÈME D EXPLOITATION? Le système est le logiciel qui a été écrit pour faire fonctionner l ordinateur.

Plus en détail

L interface de Windows 7

L interface de Windows 7 chapitre L interface de Windows 7. Utiliser le menu Démarrer et la barre des tâches de Windows 7... 2.2 Profiter de l affichage Aero et de Windows Flip 3D... 30.3 Utiliser les thèmes... 33.4 Modifier la

Plus en détail

Premier accès au logiciel R

Premier accès au logiciel R Fiche TD avec le logiciel : tdr11 Premier accès au logiciel R D. Chessel, A.B. Dufour, J.R. Lobry & S. Penel La fiche donne des indications pratiques très simples pour accéder au logiciel de statistique

Plus en détail

Mes documents Sauvegardés

Mes documents Sauvegardés Mes documents Sauvegardés Guide d installation et Manuel d utilisation du logiciel Edition 13.12 Photos et illustrations : Copyright 2013 NordNet S.A. Tous droits réservés. Toutes les marques commerciales

Plus en détail

Catalogue des Formations

Catalogue des Formations Un ensemble de logiciels de cours adaptés à vos besoins Catalogue des Formations ixias Software propose un ensemble de cours adaptés pour aider les Utilisateurs ainsi que l Equipe SI à bien appréhender

Plus en détail

RAPPORT DE STAGE Calcul parallèle sur GPU

RAPPORT DE STAGE Calcul parallèle sur GPU Université Joseph Fourier Département Licence Sciences & Technologie RAPPORT DE STAGE Calcul parallèle sur GPU D Aguanno Carlotta Laboratoire d accueil : INRIA Directeur du laboratoire : GROS Patrick Responsable

Plus en détail

Introduction. Qu est-ce que Visual Basic 2008?

Introduction. Qu est-ce que Visual Basic 2008? Je suis profondément ravi que vous ayez choisi ce livre pour acquérir les compétences et techniques de programmation avec Microsoft Visual Basic 2008. Si nous nous découvrons mutuellement dans ce paragraphe,

Plus en détail