MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Dimension: px
Commencer à balayer dès la page:

Download "MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R"

Transcription

1 MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R Jeudi 10 octobre 2013 CHAIGNEAU Alicia GAZAN Rozenn DAUFOUY Camille JOURDAN Sandra

2 Introduction 2 Evolution des outils de collecte Big data : volume massif de données «Accumulation continue de tous les types de données atteignant une taille et un niveau de granularité difficile à exploiter» (1) 3 «V» : Volume, Vitesse (fréquence à laquelle les données sont générées), Variété (sources différentes : médias, machines, ) (1) Zouheir Guédri Mars 2012 congrès BigData Paris 2012

3 Introduction 3 Evolution des outils de collecte Big data : volume massif de données «Accumulation continue de tous les types de données atteignant une taille et un niveau de granularité difficile à exploiter» (1) 3 «V» : Volume, Vitesse (fréquence à laquelle les données sont générées), Variété (sources différentes : médias, machines, ) Origine Révolution de l information (diminution des coûts de stockage, nouveaux dispositifs de collecte, utilisation des réseaux sociaux) : 90% des données dans le monde créées les 2 dernières années : (2) Données numériques :1.2 zettaoctects (2010) 40 zettaoctects (2020) (1) Zouheir Guédri Mars 2012 congrès BigData Paris 2012 (2) étude IDC sponsorisée par EMC Gartner

4 Introduction 4 Limites de R R, logiciel gourmand en ressource système (CPU et RAM) Limite d allocation de ressources pour les programmes sous Windows (2Go de Ram) Importation de bigdata entraine une saturation de l espace mémoire Temps de calcul conséquents (pas assez d espace RAM pour exécuter autre chose)

5 Introduction 5 Limites de R R, logiciel gourmand en ressource système (CPU et RAM) Limite d allocation de ressources pour les programmes sous Windows (2Go de Ram) Importation de bigdata entraine une saturation de l espace mémoire Temps de calcul conséquents (pas assez d espace RAM pour exécuter autre chose) La demande de traitement de Bigdata croit de façon exponentielle Quelles sont les solutions à proposer?

6 Introduction 6 Présentation de 3 packages Manipulation de grosses bases de données dplyr Visualisation bigvis acinonyx Objectifs communs : faciliter les analyses sur des bases de données importantes (facilité de manipulation, améliorer la rapidité, visualisation.)

7 I Manipulation des données 7

8 Manipulation des données 8 Présentation du package dplyr Installation du package dplyr Jeu de données hflights Manipulations de données avec dplyr Source : https://github.com/hadley/dplyr

9 Présentation du package dplyr 9 Package dplyr créé par Hadley Wickham (encore en expérimentation) Package dplyr = Amélioration des outils les plus utilisés dans le package plyr (ddply, dlply et ldply) et adaptation à plusieurs format de données Package plyr créé par Hadley Wickham (publié le 06/12/12 sur le CRAN) dplyr supporte les formats de données : data frames, data tables, SQLite, Pour consulter l aide du package dplyr : help(package=dplyr)

10 Installation du package dplyr 10 dplyr nécessite Rtools : pour vérifier que Rtools fonctionne bien : find_rtools() ## affiche TRUE dplyr peut être installé avec : install.packages("devtools") library(devtools) install_github("assertthat") ## affiche DONE install_github("dplyr") ## affiche DONE library(dplyr)

11 Jeu de données hflights 11 Hflights est le jeu de données inclus dans dplyr data(package="dplyr") data(hflights)?hflights ## pour afficher la description du jeu de données Tous les vols qui sont partis des aéroports de Houston IAH (George Bush Intercontinental) and HOU (Houston Hobby) en lignes * 21 colonnes 12 variables quali : DayOfWeek, Origin, Dest, Cancelled, 9 variables quanti : AirTime, ArrDelay, DepDelay, Distance,

12 Manipulations de données avec dplyr 12 Quelques fonctions pratiques! Pour afficher une partie du jeu de données : head(hflights,n) ## affiche les n premières lignes tail(hflights,n) ## affiche les n dernières lignes ## par défaut n=6 print(hflights[150:155,]) ## affiche les 5 lignes demandées group_by () de dplyr : permet de faire des opérations sur des sous-groupes de variables

13 Manipulations de données avec dplyr 13 Fonctions principales Fonctions select() filter() mutate() summarise() arrange() Définitions Sélectionner un sous-groupe de variables Sélectionner un sous-groupe de lignes Ajouter de nouvelles colonnes Pour calculer des statistiques simples sur les variables Réordonner les lignes Pour consulter l aide des 5 fonctions :?manip

14 Manipulations de données avec dplyr 14 Exemple d utilisation de filter() : Cancelled : cancelled indicator: 1 = Yes, 0 = No CancellationCode : reason for cancellation: A = carrier, B = weather, C = national air system, D = security

15 Manipulations de données avec dplyr 15 Exemple d utilisation de summarise() : Exemple d utilisation de group_by() et summarise () :

16 Manipulations de données avec dplyr 16 Exemple d utilisation de la fonction arrange () :

17 Manipulations de données avec dplyr 17 La fonction do() permet d utiliser n importe qu elle autre fonction de R sur les données Comparaison du temps d'exécution de la fonction PCA avec et sans do() grâce à la function system.time () :

18 Bilan sur le package dplyr 18 Avantages Fonctions principales faciles à comprendre et à utiliser Plusieurs formats de données supportés Plus rapide que le package plyr Possibilité d utiliser d autres fonctions (lm, PCA, ) Inconvénients Difficile à installer Peu d informations pour l installation Pas compatible avec plyr pour l instant Gain de temps mais est-il vraiment important? Aide disponible depuis R

19 II 19

20 Transferts des données 20 Présentation du package bigvis Présentation du package acinonyx Comparaison des deux packages de visualisation

21 Package bigvis 21 Informations sur le package Très récent, disponible depuis début 2013 Auteur : Hadley Wickham Encore en expérimentation Description Outils permettant l analyse exploratoire rapide de bigdata Techniques d agrégation et de lissage Source : R-bloggers, Visualize large data sets with the bigvis package

22 Package bigvis 22 Installation du package bigvis Actuellement non disponible sur CRAN Installation Installer Rtools Installer le package devtools Installer le package bigvis install.packages("devtools") find_rtools() Sys.getenv( PATH ) install_github("bigvis") Source : https://github.com/hadley/bigvis

23 Package bigvis 23 Il est également utile d installer le package ggplot2 pour pouvoir utiliser les fonctions de représentations graphiques de bigvis Test avec le jeu de données movies du package bigvis individus (films) x 14 variables (titre, année de sortie, budget, durée, )

24 Package bigvis 24 Fonctions principales bin() et condense() : permettent d avoir un résumé compact des données

25 Package bigvis 25 Fonctions principales bin() et condense() : permettent d avoir un résumé compact des données bin(x, width = find_width(x),origin = find_origin(x, width), name = NULL) Convertit les variables en objet «bin», nécessaire pour les manipuler avec les autres fonctions

26 Package bigvis 26 Fonctions principales bin() et condense() : permettent d avoir un résumé compact des données bin(x, width = find_width(x),origin = find_origin(x, width), name = NULL) Convertit les variables en objet «bin», nécessaire pour les manipuler avec les autres fonctions condense(..., z = NULL, summary = NULL, w = NULL,drop = NULL) Condense des données de type «bin» en agrégeant des individus Ressort la variable condensée et une variable.count par défaut

27 Package bigvis 27 Exemple d utilisation de condense() standardise() : s utilise lorsqu on travaille sur les effectifs (.count), permet de passer aux fréquences standardise(x, margin = integer())

28 Package bigvis 28 smooth() : permet de lisser un data.frame condensé smooth(x, h, var = summary_vars(x)[1], grid = NULL,type = "mean", factor = TRUE) h : argument permettant de jouer sur le niveau de lissage de la courbe

29 Package bigvis 29 autoplot() : permet de créer des graphes sur des données condensées (besoin du package ggplot2 ) autoplot(x,var = last(summary_vars(x)),...) peel() : conserve les proportions spécifiques du jeu de données tout en enlevant les zones de densité faible, augmente la lisibilité des graphes peel() : peel(x, keep = 0.99, central = NULL)

30 Package bigvis 30 Exemples de graphiques obtenus avec autoplot() : peel()

31 Package bigvis 31 Graphique obtenus avec plot() : 3 à 4 secondes pour obtenir le graphe

32 Package bigvis 32 Exemples de graphiques obtenus avec autoplot() : Moins de 1 seconde pour obtenir le graphe

33 Package bigvis 33 Exemples de graphiques obtenus avec autoplot() :

34 Package bigvis 34 Il existe également différentes fonctions permettant de calculer les statistiques descriptives basiques des jeux de données condensés : weighted.median() weighted.quantile() weighted.sd() weighted.var()

35 Package acinonyx 35 Savez-vous d où vient le nom du package?

36 Package acinonyx 36 Savez-vous d où vient le nom du package?

37 Package acinonyx 37 Simon Urbanek Mise à disposition des utilisateurs en septembre 2009 Page officielle sur le CRAN en septembre 2011 Qu est ce que c est? Nouveau système de gestion d interfaces graphiques de haute performance (iplot Extreme), pour visualiser et explorer d importantes bases de données Package de R le plus rapide : gestion des graphiques via une interface de programmation OpenGL Source :

38 Package acinonyx 38 Objectifs expérimentaux Ajouter des modèles statistiques aux graphiques interactifs Amélioration de la gestion sur systèmes d exploitations Windows et Mac Rapidité et extensibilité aux big data

39 Package acinonyx 39 Téléchargement et installation Copier le lien : install.packages( acinonyx','http://www.rforge.net/') Ou téléchargement du fichier zip sur ce même site Chargement library(acinonyx) dans la console R

40 Package acinonyx 40 icontainer : mettre plusieurs graphiques dans une seule fenêtre ibar, ihist, ilines, iplot : graphiques dynamiques avec coloration des points x/y en rouge ihist.default,ilines.default, iplot.default : fonction pour rajouter des options sur le graphique move, move.ivisual : fonctions pour bouger des objets au sein de la fenêtre graphique add.container, add.iplot, : ajout d objets à un objet déjà existant

41 Package acinonyx 41 ibar

42 Package acinonyx 42 ihist Pour passer en spineplot Pour mettre de la couleur

43 Package acinonyx 43 ihist Déplacer le graphique dans sa propre fenêtre (objet, x, y)

44 Package acinonyx 44 icontainer Placer 2 graphiques dans une seule fenêtre

45 Package acinonyx 45 icontainer Position de l objet, vecteur c(x,y,largeur,hauteur) Comportement de l objet lorsque l on modifie la taille de la fenêtre initiale

46 Package acinonyx 46 ipcp Graphique de coordonnées parallèles : chaque ligne correspond à un individu, chaque axe correspond à une variable

47 Package acinonyx 47 ipcp Sélection des variables

48 Comparaison des deux packages 48 Avantages bigvis acinonyx Communs Graphiques esthétiques et lisibles grâce à l utilisation du package ggplot2 Aide disponible depuis R Visualisation des grosses données rapide Téléchargement et installation aisée Facilité d utilisation des fonctions (similaires à iplot ) Outils performants pour avoir une première idée de la structure d un gros jeu de données

49 Comparaison des deux packages 49 Package iplot Temps : 1 min. 30 Sélection des variables

50 Comparaison des deux packages 50 Package acinonyx Temps : 20 sec. Sélection des variables

51 Comparaison des deux packages 51 Inconvénients bigvis acinonyx Commun Difficultés pour installer le package Certaines fonctions ne fonctionnent pas bien (best_h() -> temps de calcul très long!) Plateforme de développement: MacOs. Limite de certaines configurations sur Windows Absence de certains graphiques de base (boite à moustaches, mosaïques) Graphiques simples et peu esthétiques pour des présentations publiques Très peu de documentation (encore en expérimentation)

52 Bilan 52

53 Bilan 53 Utilisation de fonctions standards sur des grosses bases de données possible grâce aux packages présentés Manipulation simple même si les packages sont encore en expérimentation : peu de documents sur l utilisation des différentes fonctions, installation compliquée Beaucoup de nouveautés à explorer

54 Bilan 54 Beaucoup de nouveautés à explorer rmr : analyses statistiques par la méthode de «Hadoop MapReduce» (calculs effectués en parallèles, distribués dans différents clusters) filehash : analyses statistiques en utilisant les fonctions classiques de R sur un jeu de donné stocké sur le disque (et pas en mémoire RAM) ff : idem filehash Bigmemory : pour l importation, la manipulation de bigdata, allocation des données dans une mémoire partagée Revolution Analytic s RevoScaleR : classification sur des bigdata «Programming with BigData in R» (pbdr) : série de packages pour utiliser des bigdata

55 Complément 55

56 Package «bigvis» 56 En combinant les fonctions autoplot(), peel() et standardise() : Tableau length x year -> profils lignes

Optimiser ses graphiques avec R

Optimiser ses graphiques avec R Optimiser ses graphiques avec R Jérôme Sueur MNHN Systématique et Evolution UMR CNRS 7205 OSEB sueur@mnhn.fr 28 Avril 2011 1 Typologie 2 Base 3 ggplot2 4 Références Outline 1 Typologie 2 Base 3 ggplot2

Plus en détail

Initiation à R, logiciel de Statistiques

Initiation à R, logiciel de Statistiques Initiation à R, logiciel de Statistiques I. Plusieurs façons de travailler ( ou de s enquiquiner) II. R, logiciel de programmation en Statistiques III. Votre premier projet en R, pas à pas 2013-03-05 Initiation

Plus en détail

«Connais toi toi-même comme l as dit Socrate!»

«Connais toi toi-même comme l as dit Socrate!» «Connais toi toi-même comme l as dit Socrate!» Avant toute chose, il faut savoir pour quel usage, vous désirez acquérir un ordinateur. En effet la configuration de votre ordinateur ne sera pas la même

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html 1 R est un langage de programmation. L objet de base est un vecteur de données. C est un «vrai» langage c.-à-d. types

Plus en détail

BIG Data et R: opportunités et perspectives

BIG Data et R: opportunités et perspectives BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,

Plus en détail

Programmation parallèle et distribuée

Programmation parallèle et distribuée Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2015) Marc Parizeau, Département de génie électrique et de génie informatique Plan Données massives («big data») Architecture Hadoop distribution

Plus en détail

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume Studio HERITIER Emmanuelle PERSYN Elodie SCHMUTZ Amandine SCHWEITZER Guillaume Cours R Présentation projet 10/10/2013 Introduction RStudio est une interface créé par JJ Allaire Elle est sortie le 11 Février

Plus en détail

Tutoriel : Utilisation du serveur de calcul à distance de PSE

Tutoriel : Utilisation du serveur de calcul à distance de PSE Tutoriel : Utilisation du serveur de calcul à distance de PSE David Smadja Camille Terrier Septembre 2013 Table des matières 1 Préambule 1 2 Avertissements 1 3 Pré-requis 1 4 Installation de X2goClient

Plus en détail

Gestion des données avec R

Gestion des données avec R Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................

Plus en détail

Quelques analyses simples avec R en écologie des communautés

Quelques analyses simples avec R en écologie des communautés Jérôme Mathieu janvier 2007 Quelques analyses simples avec R en écologie des communautés 1 Visualisation des données... 2 Aperçu rapide d'un tableau de données... 3 Visualiser les corrélations entre des

Plus en détail

Travaux pratiques 1.3.2 Détermination de la capacité de stockage de données

Travaux pratiques 1.3.2 Détermination de la capacité de stockage de données Travaux pratiques 1.3.2 Détermination de la capacité de stockage de données Objectifs Déterminer la quantité de mémoire RAM (en Mo) installée sur un ordinateur Déterminer la taille de l unité de disque

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

TD : Codage des images

TD : Codage des images TD : Codage des images Les navigateurs Web (Netscape, IE, Mozilla ) prennent en charge les contenus textuels (au format HTML) ainsi que les images fixes (GIF, JPG, PNG) ou animée (GIF animée). Comment

Plus en détail

Programmation parallèle et distribuée

Programmation parallèle et distribuée Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2014) Marc Parizeau, Département de génie électrique et de génie informatique Plan Mégadonnées («big data») Architecture Hadoop distribution

Plus en détail

Présentation du logiciel

Présentation du logiciel Chapitre A Présentation du logiciel R Pré-requis et objectif La lecture du chapitre sur l installation de R dans les Annexes peut se révéler utile. Ce chapitre présente les origines, l objectif et les

Plus en détail

avec nos solutions spécialisées pour la microfinance et ses institutions coopératives Big Data

avec nos solutions spécialisées pour la microfinance et ses institutions coopératives Big Data avec nos solutions spécialisées pour la microfinance et ses institutions coopératives Big Data Historique de Big data Jusqu à l avènement d Internet et surtout du Web 2.0 il n y avait pas tant de données

Plus en détail

Tropimed Guide d'installation

Tropimed Guide d'installation Tropimed Guide d'installation 1. A propos de ce guide... 2 2. Configurations matérielles et logicielles requises... 2 2.1 Configuration Windows... 2 2.2 Configuration MacOs... 2 2.3 Configuration requise

Plus en détail

Travaux pratiques 1.3.2 Détermination de la capacité de stockage des données

Travaux pratiques 1.3.2 Détermination de la capacité de stockage des données Travaux pratiques 1.3.2 Détermination de la capacité de stockage des données Objectifs Déterminer la quantité de mémoire RAM (en Mo) installée sur un ordinateur Déterminer la taille de l unité de disque

Plus en détail

WinReporter Guide de démarrage rapide. Version 4

WinReporter Guide de démarrage rapide. Version 4 WinReporter Guide de démarrage rapide Version 4 Table des Matières 1. Bienvenue dans WinReporter... 3 1.1. Introduction... 3 1.2. Configuration minimale... 3 1.3. Installer WinReporter... 3 2. Votre premier

Plus en détail

Tutorial Ophcrack. I) Ophcrack en API. (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista)

Tutorial Ophcrack. I) Ophcrack en API. (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista) Tutorial Ophcrack (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista) Ophcrack est un utilitaire gratuit permettant de cracker les mots de passe des sessions

Plus en détail

R00 Installation du logiciel R sous Windows

R00 Installation du logiciel R sous Windows R00 Installation du logiciel R sous Windows 1. Installation du package de base R est distribué gratuitement à partir du site du CRAN (Comprehensive R Archive Network) : http://www.r-project.org. Pour télécharger

Plus en détail

4 Exemples de problèmes MapReduce incrémentaux

4 Exemples de problèmes MapReduce incrémentaux 4 Exemples de problèmes MapReduce incrémentaux 1 / 32 Calcul des plus courtes distances à un noeud d un graphe Calcul des plus courts chemins entre toutes les paires de noeuds d un graphe Algorithme PageRank

Plus en détail

Le gestionnaire des tâches

Le gestionnaire des tâches 43-45 rue CHARLOT 75003 PARIS. Benoît HAMET FRANCE : benoit.hamet@hametbenoit.fr.st Le gestionnaire des tâches......... Le gestionnaire des tâches Sommaire Sommaire...2 Introduction...3 Les onglets et

Plus en détail

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2

Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2 Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html 1 Plan de présentation 1. L écosystème Hadoop 2. Principe de programmation MapReduce 3. Programmation des fonctions

Plus en détail

A. Partitionnement, systèmes de fichiers et RAID :

A. Partitionnement, systèmes de fichiers et RAID : Introduction : Ce cours a pour but d expliquer les différentes étapes de la gestion des disques sous Windows 7 Client. Afin d être le plus exhaustif possible, nous avons décidé de commencer par aborder

Plus en détail

ETREX 30 CARTOEXPLOREUR GOOGLE EARTH

ETREX 30 CARTOEXPLOREUR GOOGLE EARTH ETREX 30 CARTOEXPLOREUR GOOGLE EARTH Tutoriel (niveau utilisateur confirmé) Avertissement Ce tutoriel a pour objectif de vous donner les moyens de maîtriser les échanges entre votre terminal GPS Etrex

Plus en détail

Le stockage en ligne. Ni icloud, ni MegaUpload et consort ne seront traités ici.

Le stockage en ligne. Ni icloud, ni MegaUpload et consort ne seront traités ici. Le stockage en ligne Ni icloud, ni MegaUpload et consort ne seront traités ici. Ni icloud, ni MegaUpload et consort ne seront traités ici....1 Solutions pour tous fichiers...2 Solutions pour fichiers spécifiques...3

Plus en détail

Introduction. Qu est-ce que Visual Basic 2008?

Introduction. Qu est-ce que Visual Basic 2008? Je suis profondément ravi que vous ayez choisi ce livre pour acquérir les compétences et techniques de programmation avec Microsoft Visual Basic 2008. Si nous nous découvrons mutuellement dans ce paragraphe,

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Formation continue. Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist Formation continue Ensae-Ensai Formation Continue (Cepe) CertifiCat de data scientist La demande de data scientists est croissante mais peu de formations existent. Ce certificat

Plus en détail

Analyse des déplacements des objets mobiles : définition de comportements types

Analyse des déplacements des objets mobiles : définition de comportements types Analyse des déplacements des objets mobiles : définition de comportements types Thomas Devogele Université François Rabelais (Tours) thomas.devogele@univ-tours.fr Les déplacements L analyse des déplacements

Plus en détail

Projet individuel d algorithmique-programmation AP1 : groupe 1.1 - complément bibliothèque graphique

Projet individuel d algorithmique-programmation AP1 : groupe 1.1 - complément bibliothèque graphique Projet individuel d algorithmique-programmation AP1 : groupe 1.1 - complément bibliothèque graphique octobre 2010 1 Affichage graphique statique Il en existe trois bibliothèques graphiques en Ocaml : la

Plus en détail

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES 1 DECOUVERTE DE LA VIRTUALISATION... 2 1.1 1.2 CONCEPTS, PRINCIPES...2 UTILISATION...2 1.2.1 Formation...2

Plus en détail

Conférence Big Data Paris

Conférence Big Data Paris Conférence Big Data Paris Zouheir Guédri Directeur Consulting - PwC 20 Mars 2012 Consulting Academy February 2011 Agenda 1. Qu est-ce que la Big Data? 2. Que constatent les entreprises? 3. La Big Data,

Plus en détail

Les technologies du Big Data

Les technologies du Big Data Les technologies du Big Data PRÉSENTÉ AU 40 E CONGRÈS DE L ASSOCIATION DES ÉCONOMISTES QUÉBÉCOIS PAR TOM LANDRY, CONSEILLER SENIOR LE 20 MAI 2015 WWW.CRIM.CA TECHNOLOGIES: DES DONNÉES JUSQU'À L UTILISATEUR

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

26 Centre de Sécurité et de

26 Centre de Sécurité et de 26 Centre de Sécurité et de Maintenance La fenêtre du Centre de sécurité et de maintenance (CSM) rassemble tous les outils nécessaires au contrôle, à l analyse, à la maintenance, à la sauvegarde et au

Plus en détail

Le nouveau visage de la Dataviz dans MicroStrategy 10

Le nouveau visage de la Dataviz dans MicroStrategy 10 Le nouveau visage de la Dataviz dans MicroStrategy 10 Pour la première fois, MicroStrategy 10 offre une plateforme analytique qui combine une expérience utilisateur facile et agréable, et des capacités

Plus en détail

Mise en route avec l'application Web

Mise en route avec l'application Web Mise en route avec l'application Web L'application Web SanDisk +Cloud est une interface vous permettant d'accéder à votre compte et de le gérer. Grâce à l'application Web, vous pouvez écouter de la musique,

Plus en détail

Monitoring du système de stockage de données du CERN

Monitoring du système de stockage de données du CERN Monitoring du système de stockage de données du CERN Stage réalisé de Mars à Août 2013 Université Lille 1 Spécialisation IAGL Ingénierie et Architecture des Grands Logiciels Manuel SERVAIS Superviseurs

Plus en détail

Séance du jeudi 6 Octobre 2011 PIT quartier Parmentier

Séance du jeudi 6 Octobre 2011 PIT quartier Parmentier Séance du jeudi 6 Octobre 2011 PIT quartier Parmentier Pour les débutants. Quelques bases. L écran de votre ordinateur contient ce que l on appelle le BUREAU Les petites vignettes ou icônes représentent

Plus en détail

Online Help StruxureWare Data Center Expert

Online Help StruxureWare Data Center Expert Online Help StruxureWare Data Center Expert Version 7.2.7 Système virtuel StruxureWare Data Center Expert Le serveur StruxureWare Data Center Expert 7.2 est disponible comme système virtuel pris en charge

Plus en détail

UN CHANGEMENT DE PARADIGME DANS LA PRÉPARATION DES DONNÉES

UN CHANGEMENT DE PARADIGME DANS LA PRÉPARATION DES DONNÉES UN CHANGEMENT DE PARADIGME DANS LA PRÉPARATION DES DONNÉES L ANALYSE VISUELLE ET LE BIG DATA Bernard Blais Directeur Principal Analytique Haute Performance CONTENU L ANALYSE VISUELLE ET LE BIG DATA Big

Plus en détail

Mes documents Sauvegardés

Mes documents Sauvegardés Mes documents Sauvegardés Guide d installation et Manuel d utilisation du logiciel Edition 13.12 Photos et illustrations : Copyright 2013 NordNet S.A. Tous droits réservés. Toutes les marques commerciales

Plus en détail

Sommaire. Chapitre 1. Chapitre 2 GUIDE MICROAPP

Sommaire. Chapitre 1. Chapitre 2 GUIDE MICROAPP Sommaire Chapitre 1 Le premier contact avec l ordinateur Démarrer l ordinateur et ouvrir une session locale... 9 Créer d autres utilisateurs... 11 Changer d image... 13 Modifier le nom d un compte... 14

Plus en détail

Allez plus loin avec Windows XP

Allez plus loin avec Windows XP Plus loin avec Windows XP 1 Allez plus loin avec Windows XP Yves Roger CORNIL 13 novembre 2006 1 Quelques rappels Le système d exploitation. L interface graphique. Plus loin avec Windows XP 2 2 Le système

Plus en détail

Étapes pour utiliser une calculatrice à capacité graphique

Étapes pour utiliser une calculatrice à capacité graphique Étapes pour utiliser une calculatrice à capacité graphique Contexte Les bénévoles d une association locale, responsable, de l installation de jeux pour les jeunes dans les parcs de la ville ont récemment

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Organiser le disque dur Dossiers Fichiers

Organiser le disque dur Dossiers Fichiers Ce document contient des éléments empruntés aux pages d aide de Microsoft Organiser le disque dur Dossiers Fichiers Généralités La connaissance de la logique d organisation des données sur le disque dur

Plus en détail

Jean-François Boulicaut & Mohand-Saïd Hacid

Jean-François Boulicaut & Mohand-Saïd Hacid e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205

Plus en détail

KeePass - Mise en œuvre et utilisation

KeePass - Mise en œuvre et utilisation www.rakforgeron.fr 08/04/2015 KeePass - Mise en œuvre et utilisation L'usage de mots de passe est nécessaire pour de nombreux accès ou pour la protection de données personnelles. Il convient d'en utiliser

Plus en détail

Package TestsFaciles

Package TestsFaciles Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26

Plus en détail

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Big data et données géospatiales : Enjeux et défis pour la géomatique Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Événement 25e anniversaire du CRG Université Laval, Qc, Canada 08 mai

Plus en détail

Comptabilité 7. Banana est une application native pour Windows, Linux et Mac et contient les fonctions pour gérer plusieurs type de comptabilité:

Comptabilité 7. Banana est une application native pour Windows, Linux et Mac et contient les fonctions pour gérer plusieurs type de comptabilité: banana Comptabilité 7 FICHE TECHNI NIQUE Applications et typologie Banana est une application native pour Windows, Linux et Mac et contient les fonctions pour gérer plusieurs type de comptabilité: Comptabilité

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Anglais professionnel automobile Guide technique : les utilisations informatiques des modules

Anglais professionnel automobile Guide technique : les utilisations informatiques des modules ( Anglais professionnel automobile ) Guide technique : les utilisations informatiques des modules Préambule Ce document vous présente les différentes utilisations informatiques possibles des modules d

Plus en détail

TechTool Protogo 4. 1- Manuel TechTool Protogo 4

TechTool Protogo 4. 1- Manuel TechTool Protogo 4 TechTool Protogo 4 1- Manuel TechTool Protogo 4 Notes légales 2008-2013 Micromat Incorporated. Tous droits réservés. 2008-2013 TRI-EDRE. Tous droits réservés pour la traduction française du logiciel et

Plus en détail

Accéder à ZeCoffre via FTP

Accéder à ZeCoffre via FTP Accéder à ZeCoffre via FTP Table des matières Introduction... 2 Qu est-ce que FTP... 3 Comment se connecter à ZeCoffre via FTP... 4 Connexion FTP depuis Windows / Linux / Mac OS X... 5 Connexion FTP depuis

Plus en détail

TP Informatique 1 Présentation prise en main Visual Studio

TP Informatique 1 Présentation prise en main Visual Studio TP Informatique 1 Présentation prise en main Visual Studio But : prise en en main visual studio 1ères notions Variable Informatique : domaine d'activité scientifique, technique et industriel en rapport

Plus en détail

Aficio MP2001SP MP2501SP

Aficio MP2001SP MP2501SP Aficio MP2001SP MP2501SP Multifonctions A3 N&B 20 et 25 ppm Conviviaux et simples d utilisation Productifs et compacts Fonctionnalités innovantes des solutions polyvalentes, attractives et performantes

Plus en détail

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Evaluation des performances de programmes parallèles haut niveau à base de squelettes Evaluation des performances de programmes parallèles haut niveau à base de squelettes Enhancing the Performance Predictability of Grid Applications with Patterns and Process Algebras A. Benoit, M. Cole,

Plus en détail

Création et formatage de clé pour serveur de projection

Création et formatage de clé pour serveur de projection Avant de commencer, plusieurs informations importantes : Utilisez une clé USB ou un disque dur exclusivement réservé au transport des DCPs. Si vous vous apprêtez à utiliser une clé ou un disque déjà utilisé

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Les frames ou cadres. Prérequis. Introduction. Avec le soutien de la Commission européenne

Les frames ou cadres. Prérequis. Introduction. Avec le soutien de la Commission européenne ou cadres Dans cette fiche, nous allons vous apprendre à faire des frames ou en français «cadres». Tout et son contraire a été dit à propos des frames. En tout état de cause, tous les navigateurs Internet

Plus en détail

Introduction. La collection Classroom in a Book. Conditions requises

Introduction. La collection Classroom in a Book. Conditions requises Introduction Adobe Dreamweaver CS4 est le programme de création web phare du marché. Que vous ayez fait profession de créer des sites web ou que vous en conceviez un pour votre entreprise, vous disposerez

Plus en détail

ereader compact 9 et reproducteur multimédia portable

ereader compact 9 et reproducteur multimédia portable ereader compact 9 et reproducteur multimédia portable Avec son large écran couleur 9 (environ 23 cm) et son format de poche, l ARCHOS 90 ereader est le compagnon idéal pour la lecture et le divertissement.

Plus en détail

I Un exemple à partir de données anciennes concernant les leucocytes et leur évolution en cas de SIDA. 3 Utilisation des paramètres de fluorescence :

I Un exemple à partir de données anciennes concernant les leucocytes et leur évolution en cas de SIDA. 3 Utilisation des paramètres de fluorescence : Utilisation du logiciel Cytométrie Logiciel libre et gratuit : adresse de téléchargement et notice complète : http://acces.ens-lyon.fr/acces/logiciels/cytometrie/le-logiciel-cytometrie I Un exemple à partir

Plus en détail

Enregistreur de données de température

Enregistreur de données de température Manuel d utilisation Enregistreur de données de température Modèle TH10 Introduction Nous vous félicitons d avoir fait l acquisition de l Enregistreur de données de température. Cet enregistreur de données

Plus en détail

LiveUSB clefisn. Meilland jean claude et Kbida Abdellatif. 16 septembre 2012

LiveUSB clefisn. Meilland jean claude et Kbida Abdellatif. 16 septembre 2012 LiveUSB clefisn Meilland jean claude et Kbida Abdellatif 16 septembre 2012 Table des matières 1 Présentation de la clefisn 2 1.1 liveusb......................................... 2 1.2 Le boot.........................................

Plus en détail

Quelques exemples d utilisation de Lexique avec Awk

Quelques exemples d utilisation de Lexique avec Awk Quelques exemples d utilisation de Lexique avec Awk Christophe Pallier 9 Octobre 2001 (dernière mise à jour: 16 mai 2004) Lexique est une base de données lexicale disponible sur le site www.lexique.org.

Plus en détail

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs

Plus en détail

Compléments de documentation Scilab : affichage de texte et formatage de nombres

Compléments de documentation Scilab : affichage de texte et formatage de nombres Université des Sciences et Technologies de Lille U.F.R. de Mathématiques Pures et Appliquées Agrégation externe Année 2002-2003 Compléments de documentation Scilab : affichage de texte et formatage de

Plus en détail

RAID Logiciel avec Windows XP Pro

RAID Logiciel avec Windows XP Pro RAID Logiciel avec Windows XP Pro Monter un système RAID 1 avec Windows XP (http://www.cooling-masters.com/forum/sujet-3659-0-tuto-creer-les-hdd-en-raid-avec-le-raidlogiciel.html) Pour comment créer les

Plus en détail

Catalogue des stages Ercom 2013

Catalogue des stages Ercom 2013 Catalogue des stages Ercom 2013 Optimisations sur Modem LTE Poste basé à : Caen (14) Analyse et optimisation des performances des traitements réalisés dans un modem LTE. - Profiling et détermination des

Plus en détail

Inkscape : Inkcut Extension pour plotter. Dylan Collaud

Inkscape : Inkcut Extension pour plotter. Dylan Collaud Inkscape : Inkcut Extension pour plotter Dylan Collaud February 2, 2015 Contents 1 Introduction 2 1.1 Inkscape.............................................. 2 1.2 InkCut...............................................

Plus en détail

Itium XP. Guide Utilisateur

Itium XP. Guide Utilisateur Itium XP 06/2007 - Rev. 3 1 Sommaire 1 Sommaire... 2 2 Généralités... 3 3 ItiumSysLock... 4 3.1 Enregistrer l état actuel du système... 4 3.2 Désactiver ItiumSysLock... 5 3.3 Activer ItiumSysLock... 5

Plus en détail

Competence Management System (Système de Gestion de Compétences)

Competence Management System (Système de Gestion de Compétences) Dispositif :... 3 Qu est-ce qu un CMS?... 3 Quels sont les dispositifs intégrés à un CMS... 3 Comment envoyer des emails?... 3 Puis-je envoyer des emails seulement à un groupe de personnes?... 4 Comment

Plus en détail

Découverte de l ordinateur. Explorer l ordinateur et gérer ses fichiers

Découverte de l ordinateur. Explorer l ordinateur et gérer ses fichiers Découverte de l ordinateur Explorer l ordinateur et gérer ses fichiers SOMMAIRE I L ORDINATEUR ET L EXPLORATEUR... 3 1.1 : PRESENTATION ET GENERALITES... 3 1.2 : CONNAÎTRE LES PROPRIETES D UN ELEMENT...

Plus en détail

TimeSeries c'est simple

TimeSeries c'est simple TimeSeries c'est simple Informix IDS Big-Data et Power 8 12-13 Mars au Centre IBM Montpellier J. Rage FRAME TimeSeries : qu'est ce que c'est? Les données TimeSeries sont des séries de mesures prises à

Plus en détail

FEN FICHE EMPLOIS NUISANCES

FEN FICHE EMPLOIS NUISANCES Version 4.8.2 Date mise à jour : 19 Février 2013 Auteur : LAFUMA Gilles Email : glfm02@orange.fr Web : www.procarla.fr/soft Présentation : FEN FICHE EMPLOIS NUISANCES Le Logiciel FEN Fiche emploi nuisance

Plus en détail

Sauvegarder ses données avec Syncback Windows 98, 2000, Me, NT, XP

Sauvegarder ses données avec Syncback Windows 98, 2000, Me, NT, XP Sauvegarder ses données avec Syncback Windows 98, 2000, Me, NT, XP A. Introduction : Contrairement à ce que beaucoup pensent, la sauvegarde de données n'est pas une perte de temps, mais à l'inverse un

Plus en détail

Fonction Memory Viewer

Fonction Memory Viewer Mode d emploi Fonction Memory Viewer Ceci est le mode d emploi de la fonction Memory Viewer. Veuillez lire entièrement ce mode d emploi pour utiliser la fonction Memory Viewer. Tout d abord, lisez le mode

Plus en détail

Logiciel de Télégestion

Logiciel de Télégestion 2 530 Logiciel de Télégestion pour centrales de communication OCI600 ACS600 Logiciel pour la télégestion d'une ou de plusieurs centrales de communication OCI600. Version MS-WINDOWS. Domaines d'application

Plus en détail

VPython : visualisation 3D pour le commun des mortels

VPython : visualisation 3D pour le commun des mortels : visualisation 3D pour le commun des mortels INRIA-Lorraine LORIA Rencontres Mondiales du Logiciel Libre 2005 Plan 1 Présentation de 2 La scène Les objets 3 Contrôle de l animation Les évènements Interfaces

Plus en détail

Windows 7 - Dossiers et fichiers

Windows 7 - Dossiers et fichiers Windows 7 - Dossiers et fichiers Explorez votre PC : dossiers et fichiers Tous les fichiers nécessaires au fonctionnement de votre ordinateur, qu il s agisse de ceux de Windows, des logiciels installés

Plus en détail

BIG DATA et DONNéES SEO

BIG DATA et DONNéES SEO BIG DATA et DONNéES SEO Vincent Heuschling vhe@affini-tech.com @vhe74 2012 Affini-Tech - Diffusion restreinte 1 Agenda Affini-Tech SEO? Application Généralisation 2013 Affini-Tech - Diffusion restreinte

Plus en détail

Ecran programmable. Testez la différence grâce. à sa puissance, sa rapidité. et ses possibilités réseaux

Ecran programmable. Testez la différence grâce. à sa puissance, sa rapidité. et ses possibilités réseaux Ecran programmable Testez la différence grâce à sa puissance, sa rapidité et ses possibilités réseaux Gamme de Produits Compact & hautement fonctionnel Pouces Couleurs Rétro éclairage 3 Ports série Maitre/

Plus en détail

Open Source Professional Training

Open Source Professional Training Excellence in Open Source Training Open Source Professional Training Catalogue des cours Juillet Décembre 2011 Phive Int 1200 Brussels www.opensourcesolutions.be/edu A propos des cours Open Source Acquerez

Plus en détail

Ceci est un Chromebook, ton ordinateur!

Ceci est un Chromebook, ton ordinateur! Ceci est un Chromebook, ton ordinateur! CHROMEBOOK - Dans le royaume des ordinateurs personnels, il n'y a pas beaucoup de choix. Pour schématiser, soit vous avez un PC, soit vous avez un Mac. Et ce depuis

Plus en détail

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012 Livre blanc Solution Hadoop d entreprise d EMC Stockage NAS scale-out Isilon et Greenplum HD Par Julie Lockner et Terri McClure, Analystes seniors Février 2012 Ce livre blanc d ESG, qui a été commandé

Plus en détail

L analyse discriminante

L analyse discriminante L analyse discriminante À Propos de ce document... Introduction... La démarche à suivre sous SPSS... 2. Statistics... 2 2. Classify... 2 Analyse des résultats... 3. Vérification de l existence de différences

Plus en détail

Cassandra et Spark pour gérer la musique On-line

Cassandra et Spark pour gérer la musique On-line Cassandra et Spark pour gérer la musique On-line 16 Juin 2015 @ Paris Hammed RAMDANI Architecte SI 3.0 et BigData mramdani@palo-it.com +33 6 80 22 20 70 Appelez-moi Hammed ;-) (Sidi Mo)Hammed Ramdani @smramdani

Plus en détail

Année universitaire 2015-2016 - 1er semestre

Année universitaire 2015-2016 - 1er semestre Année universitaire 2015-2016 - 1er semestre Université Inter-Âges de Melun Hôtel du Château 23, rue du Château 77000 MELUN Tel : 01.64.52.01.21 E-mail : uia@ville-melun.fr - Condition : être inscrit(e)

Plus en détail

Tutoriel de formation SurveyMonkey

Tutoriel de formation SurveyMonkey Tutoriel de formation SurveyMonkey SurveyMonkey est un service de sondage en ligne. SurveyMonkey vous permet de créer vos sondages rapidement et facilement. SurveyMonkey est disponible à l adresse suivante

Plus en détail

Filtrage - Intégration - Redressement - Lissage

Filtrage - Intégration - Redressement - Lissage PCSI - Stanislas - Electrocinétique - TP N 3 - Filtrage - Intégration - Redressement - Lissage Filtrage - Intégration - Redressement - Lissage Prenez en note tout élément pouvant figurer dans un compte-rendu

Plus en détail

1 Configuration requise pour Internet Security

1 Configuration requise pour Internet Security Configuration requise et instructions d installation pour Internet Security Table des matières 1 Configuration requise pour Internet Security...1 2 Guide d installation: installer Internet Security pour

Plus en détail

Eclipse atelier Java

Eclipse atelier Java Eclipse atelier Java Table des matières 1. Introduction...2 2. Télécharger eclipse...3 3. Installer eclipse...3 4. Premier lancement d eclipse...3 5. Configurer eclipse pour faire du Java...5 6. Développer

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail