Data Visualisation avec R



Documents pareils
Jean-Daniel Fekete Directeur de Recherche, Resp. équipe-projet AVIZ INRIA

Optimiser ses graphiques avec R

La visualisation d information

La Data Visualisation dans les organisations. Par Claude-Henri Meledo

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA

DATA VISUALIZATION. Web In Lorient - 20 Novembre KI Analytics

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Gnuplot. Chapitre Lancer Gnuplot. 3.2 Options des graphes

Analyse exploratoire des données

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Lire ; Compter ; Tester... avec R

Convaincre avec des graphiques efficaces

Cycle de Découverte n 1 VISUALISER Créer la prochaine application innovante

HSCS 6.4 : mieux appréhender la gestion du stockage en environnement VMware et service de fichiers HNAS Laurent Bartoletti Product Marketing Manager

Infolettre #18 : Les graphiques avec Excel 2010

Annexe commune aux séries ES, L et S : boîtes et quantiles

Exemple d application en CFD : Coefficient de traînée d un cylindre

Exemple PLS avec SAS

Logiciel XLSTAT version rue Damrémont PARIS

Instructions Mozilla Thunderbird Page 1

Visualizing Start-up Firm Trajectories on Kohonen Maps

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

Visualiser des données.

Les défis statistiques du Big Data

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

Once the installation is complete, you can delete the temporary Zip files..

Visualisation d information interactive

ANGULAR JS AVEC GDE GOOGLE

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Forthcoming Database

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

APPENDIX 6 BONUS RING FORMAT

5 meilleures pratiques pour créer des tableaux de bord efficaces et 7 erreurs à éviter

Panorama des bonnes pratiques de reporting «corruption»

Note de cours. Introduction à Excel 2007

English Q&A #1 Braille Services Requirement PPTC Q1. Would you like our proposal to be shipped or do you prefer an electronic submission?

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

Leçon n 4. Analyse graphique Techniques de construction de barres et styles de. Fenêtres d analyse graphique. Leçon n 4


Activité 11 : Nuage de points ou diagramme de dispersion

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

WEB page builder and server for SCADA applications usable from a WEB navigator

Introduction à MATLAB R

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

1 Modélisation d être mauvais payeur

Scénarios économiques en assurance

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

INVESTMENT REGULATIONS R In force October 1, RÈGLEMENT SUR LES INVESTISSEMENTS R En vigueur le 1 er octobre 2001

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Package Contents. System Requirements. Before You Begin

lundi 3 août 2009 Choose your language What is Document Connection for Mac? Communautés Numériques L informatique à la portée du Grand Public

Du bon usage de gnuplot

StruxureWare Power Monitoring v7.0. La nouvelle génération en matière de logiciel de gestion complète d énergie

Tammy: Something exceptional happened today. I met somebody legendary. Tex: Qui as-tu rencontré? Tex: Who did you meet?

Université du Québec à Chicoutimi. Département d informatique et de mathématique. Plan de cours. Titre : Élément de programmation.

Big Data et Graphes : Quelques pistes de recherche

Exercices sur SQL server 2000

RAPID Prenez le contrôle sur vos données

Notice Technique / Technical Manual

DOCUMENTATION - FRANCAIS... 2

CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009

Le nouveau visage de la Dataviz dans MicroStrategy 10

Folio Case User s Guide

Comment créer un diagramme de Gantt avec OpenOffice.org

Big Data et Graphes : Quelques pistes de recherche

ERA-Net Call Smart Cities. CREM, Martigny, 4 décembre 2014 Andreas Eckmanns, Responsable de la recherche, Office Fédéral de l énergie OFEN

Le Cloud: Mythe ou Réalité?

Pourquoi utiliser des visuels et des logiciels de présentation?

Title Text. Gestion de données de mobilité Mobility data management

La propriété intellectuelle à Hong Kong: ce qu un canadien doit savoir!

PRACTICE DIRECTION ON THE LENGTH OF BRIEFS AND MOTIONS ON APPEAL

Polar. Nouveautés Polar

1. Vocabulaire : Introduction au tableau élémentaire

L industrie pharmaceutique et la grippe aviaire

Application Form/ Formulaire de demande

«Quelle information aux patients en recherche biomédicale? Quels enseignements en retirer pour la pratique quotidienne?»

Monitoring des classes de neige des calottes polaires par Envisat

Visualisation d information

Qy y a-t-il de nouveau? NetSupport ServiceDesk v3

Algorithmes de recommandation, Cours Master 2, février 2011

112 écrans/132 images Introduction Découverte personnelle Approche historique Le présent Illustrator Les outils Manipulations Personnalisation -

Institut français des sciences et technologies des transports, de l aménagement

Faire un semi variograme et une carte krigée avec surfer

SIG ET ANALYSE EXPLORATOIRE

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Le Product Backlog, qu est ce c est?

Rapport de Mini-Projet en ArcGIS Engine

Etude sur l efficacité marketing des entreprises luxembourgeoises Bilan en demi-teinte

Diligence raisonnable avant l acquisition d une PME américaine lorsqu on est au Québec : Certains aspects juridiques

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

that the child(ren) was/were in need of protection under Part III of the Child and Family Services Act, and the court made an order on

Extraction d informations stratégiques par Analyse en Composantes Principales

TRAVAUX DE RECHERCHE DANS LE

Formulaire d inscription (form also available in English) Mission commerciale en Floride. Coordonnées

Bienvenue au séminaire HP Service Anywhere Mardi 11 février 2014

Dans l Unité 3, nous avons parlé de la

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

Business Intelligence

RULE 5 - SERVICE OF DOCUMENTS RÈGLE 5 SIGNIFICATION DE DOCUMENTS. Rule 5 / Règle 5

5Visualisation. pièges à. éviter... de données : e-book : Visualisation & Ergonomie. Page 1 / 30. Partagez cet e-book :

Transcription:

Data Visualisation avec R E. Matzner-Løber ce cours est basé sur des supports de R. Womack, de nombreuses (très) discussions avec E. Le Pennec, P-A. Cornillon, B. Thieurmel, J. Petit... Aussois 2015

Outline 1 Introduction 2 Historique 3 Les classiques Univarié Représentation multivariée 4 Nouveautés? Cartes Structure hiérarchique Networks Interaction dans R Animation Intéraction Big Data 5 Conclusion

Visualisation avec R Objectifs de cours Représentations standards, Principe de bonnes représentation, Exemples d implémentations avec R Ce n est pas Infographics aspect cognitif de la perception...

Introduction Outline 1 Introduction 2 Historique 3 Les classiques Univarié Représentation multivariée 4 Nouveautés? Cartes Structure hiérarchique Networks Interaction dans R Animation Intéraction Big Data 5 Conclusion

Introduction Data Visualisation? La datavis peut : proposer une réelle compréhension des pattern des données détecter des structures cachées dans les données un résumé simple

Introduction Data Visualisation? La datavis peut : proposer une réelle compréhension des pattern des données détecter des structures cachées dans les données un résumé simple Anscombe s quartet example: 1 2 12 8 4 y 3 4 12 8 4 5 10 15 5 10 15 x

Introduction Mauvaise DataVis Sans commentaire!!!

Introduction Mauvaise DataVis Pas informatif

Introduction Mauvaise DataVis facteur d échelle faux!

Introduction Mauvaise DataVis problème de facteur d échelle

Introduction Mauvaise DataVis

Introduction Mauvaise DataVis inversion!

Introduction Mauvaise DataVis

Introduction Mauvaise DataVis Incidents en fonction de la température Catastrophe, Challenger 1986!

Introduction Mauvaise DataVis

Historique Outline 1 Introduction 2 Historique 3 Les classiques Univarié Représentation multivariée 4 Nouveautés? Cartes Structure hiérarchique Networks Interaction dans R Animation Intéraction Big Data 5 Conclusion

Historique Playfair William Playfair (1759-1823) considéré comme l inventeur des formes communes de graphique pour représenter les données : line plots, bar chart and pie chart

Historique Minard Charles Minard (1781-1870) a fortement contribué au domaine de l information graphique et statistique en particulier avec l utilisation de cartes.

Historique Minard

Historique Nightingale Florence Nightingale (1820-1910) est connue comme étant la mère de la profession d infirmière moderne. Elle a aussi contribué aux représentations graphiques.

Historique Snow John Snow (1813 1858) connu pour avoir tracé (détecté) les sources de Choléra à Londres.

Historique Fisher et Tuckey Ronald Fisher (1890-1962) et John Tukey (1915-2000) : méthodes graphiques avancées pour l analyse des données. Fisher : dessin des données pour comprendre les relations Tukey : promotion de l analyse de données exploratoires, il a créé en particulier le box plot, le stem plot et le leaf plot.

Tous les signaux peuvent être perçus comme SEMBLABLES 4 4 5 3 4 5 2 4 5 7 7 8 4 2 Tous les signaux sont perçus comme DIFFÉRENTS et forment des FAMILLES Tous les signaux sont perçus comme ORDONNÉS Tous les signaux sont perçus PROPORTIONNELS entre aux Historique Bertin NIVEAU DES VARIABLES RÉTINIENNES ASSOCIATION SÉLECTION ORDRE QUANTITÉ O Q TAILLE VALEUR GRAIN COULEUR ORIENTATION FORME Jacques Bertin, "Sémiologie Graphique", 1973. Jacques Bertin (1918-2010): sémiologie graphique! Système de signes pour la transmission de l information.

Historique Tufte Edward Tufte (1942-) a rédigé The Visual Display of Quantitative Information Importance de l aspect mais pas à n importe quel prix!

Historique Tufte Challenger revisité!

Historique Tufte

Historique Tufte

Historique Tufte Tufte a développé et popularisé de nombreux principes : Graphics reveal data - show the data without distorting it - above all else show the data Small multiple - understanding one slice makes understanding others easier Lie factor - effect shown/effect in reality Graphical Integrity - no lies, let data vary, not design Data density - maximize data/ink ratio Sparklines - seems they haven t caught on chartjunk - self-explanatory Powerpoint is responsible for most of the world s sorrows [The Cognitive Style of Powerpoint]

Historique Cleveland William Cleveland s Elements of Graphing Data and Visualizing Data Cleveland est connu pour promouvoir le dot plot comme alternative aux barres, camembert... Le dot plot permet une certaine clarté et une facilité de comparaison des données. Cleveland est aussi un pionnier dans les treillis et les comparaisons de panels.

Historique Wilkinson The Grammar of Graphics de Leland Wilkinson (1945-), a eu une influence importante sur la facon de penser les graphes. Grammaire signifie règles mathématiques et esthétiques Avant on se focalisait surtout sur le coté esthétique d un contenu statique Par opposition, les graphiques dynamiques demandent une réflexion plus importante pour pouvoir zoomer, flouter, lier... La Grammar... s adapte facilement à cette nouvelle approche ggplot2 (B. Wickham) inspiré par ce formalisme!

Historique Wilkinson DATA - weighting, reshaping, counting, bootstrapping VARIABLES - transform, sort, log, ranking, residuals, quantiles ALGEBRA - nesting or blending data SCALES - nominal, ordinal, interval, ratio must be specified STATISTICS - static methods available to all graph types e.g, mean, sd, smoothing GEOMETRY - line, area, etc., along with modifiers like jitter and dodge COORDINATES - refers to the coordinate system of the graph (cartesian, polar, etc.) AESTHETICS - color, texture, size, position, etc. of the data points. Includes using color to classify. FACETS - subgroups, multiway tables GUIDES - legends, axes, color scales, keys

Historique Wilkinson

Historique Wilkinson Data : Les variables à afficher Aesthetics mapping : Les dimensions selon lesquelles les données sont représentées Geometries : Formes utilisées pour représenter les données Facets : Tableau (lignes et colonnes) de graphes Statistics : Modèles ou transformations statistiques des données Coordinates : L espace de représentation (horizontal, vertical, cartésien, polaire) Scales : L échelle des axes (linéaire, logarithmique, à l envers), les couleurs de remplissage Thèmes : Description de l arrière plan

Les classiques Outline 1 Introduction 2 Historique 3 Les classiques Univarié Représentation multivariée 4 Nouveautés? Cartes Structure hiérarchique Networks Interaction dans R Animation Intéraction Big Data 5 Conclusion

Les classiques Camembert ou la tarte à ne pas utiliser!

Les classiques Barres barplot ou plot permet de meilleures comparaison adapté aux variables qualitatives

Les classiques Barres barplot ou plot

Les classiques Les dot plot de Cleveland Less ink, more pleasant...

Les classiques Histogramme et estimateur de la densité facilement interprétable adapté aux variables quantitatives

Les classiques Histogramme et estimateur de la densité lissée