Nouveaux outils pour la visualisation de données F.-X. Jollois Dpt STID IUT Paris Descartes LIPADE UFR Math-Info Université Paris Descartes Rencontre de la SFdS, 2013 F.-X. Jollois (Paris Descartes) SFdS 2013 1 / 27
Plan de l exposé Introduction Nouveaux outils? Données utilisées Outils en ligne Outils complets F.-X. Jollois (Paris Descartes) SFdS 2013 2 / 27
Introduction Visualisation utile pour la description des données Utilisation dans tous les domaines et à tout niveau Ce qui est nouveau : Beaucoup de non-statisticiens utilisateurs ou développeurs Outils usuels : limité nécessitant des compétences spécifiques très souvent statique F.-X. Jollois (Paris Descartes) SFdS 2013 3 / 27
Nouveaux outils Nouveaux outils émergents En ligne Librairies Accessibles en ligne Nombreux disponibles Pas de connaissance spécifique à avoir Possibilité de mettre ses données et de les visualiser directement Librairies, API,... Complets et rapides Intégration simple dans un site web Possibilité grande d interactivité F.-X. Jollois (Paris Descartes) SFdS 2013 4 / 27
Description des données utilisées Exemples d utilisation des outils présentés sur des cas concrets : Candidats en première année du DUT STID Programme Pédagogique National (PPN) du DUT STID version de travail quasi finale Page Facebook STID Paris (officiel) F.-X. Jollois (Paris Descartes) SFdS 2013 5 / 27
Outils en lignes Pourquoi cet intérêt pour les outils en ligne? Accessibilité depuis (presque) n importe quel navigateur web (à jour) Aucune installation requise Fonctionnement sous Windows, Mac, Linux,... Aucune connaissance d un langage de programmation à avoir Utilisation de ses propres données Quelques limites toutefois : Choix des analyses restreint Taille des données souvent limité F.-X. Jollois (Paris Descartes) SFdS 2013 6 / 27
Nuage de mots Exemple F.-X. Jollois (Paris Descartes) SFdS 2013 7 / 27
Nuage de mots Représentation d un texte sur la base des occurences des termes dans le texte Taille et placement en fonction du nombre d occurences (i.e. grande police = mot important) Couleur souvent aléatoire En ligne, de manière simpliste : http://www.wordle.net/ Sinon, package R disponible + différents sites webs + codes disponibles en ligne F.-X. Jollois (Paris Descartes) SFdS 2013 8 / 27
Cartographie Exemple 1 F.-X. Jollois (Paris Descartes) SFdS 2013 9 / 27
Cartographie Exemple 2 F.-X. Jollois (Paris Descartes) SFdS 2013 10 / 27
Cartographie Représentation sur une carte Utilisation de couleurs et/ou de symboles Taille des points ou couleurs en fonction d une variable En ligne, création automatique simple : http://www.drawmeagraph.com/ Autre site web : http://www.cartodb.com Sinon, logiciels de SIG + packages R F.-X. Jollois (Paris Descartes) SFdS 2013 11 / 27
Mind Map Exemple F.-X. Jollois (Paris Descartes) SFdS 2013 12 / 27
Mind Map Organisation d idées sous la forme d un arbre Utilisation de couleurs pour différencier les branches et/ou les niveaux En ligne, création automatique simple : http://www.text2mindmap.com/ Sinon, package R (?) F.-X. Jollois (Paris Descartes) SFdS 2013 13 / 27
Basic Stats Geo IMPRESSIONS (Views of any content) STORIES PEOPLE Virality YEARS OLD (location of fans, by country) FANS over the past 30 days WHO SEES, CLICKS ON, AND TELLS STORIES ABOUT THE CONTENT? ENGAGEMENTS (Any click) STORIES (Deeper engagement: likes, shares, etc.) This ratio can give an idea of how effectively content engages the audience UNIQUE IMPRESSIONS STORYTELLERS And deeply engaging with content? HOW MANY PEOPLE SAW THE CONTENT? These ratios can give a good idea of virality and reach If the numbers in this chart are close together, it can mean that the content was very viral Demographics 49% 51% FRANCE 222 MOROCCO 36 OK cool, but how well is the content PERFORMING? 29 April to 26 May TUNISIA 18 ALGERIA 13 Storytellers VIRAL UNIQUE IMPRESSIONS # of people who saw the content anywhere on facebook # of people telling stories (stories increase content reach) CANADA 4 GREAT BRITAIN SWITZERLAND PERU TOGO AUSTRALIA 2 1 1 1 1 0 0 # of people who saw the content after a friend told a story about it) Infographie sur une page Facebook Exemple STID PARIS (OFFICIEL) 300 FANS 1 MALE 18-24 HERE S WHERE THEY LIVE 41 1 0 WHO IS SPREADING THE WORD? 0 0 NORTH AMERICA? 9 0 3 STID PARIS (OFFICIEL) F.-X. Jollois (Paris Descartes) SFdS 2013 14 / 27
Infographie orientée réseaux sociaux Raconter une histoire à base de statistiques et de graphiques, sur un sujet quelconque Utilisation d outils de statistiques descriptives et de graphiques uni- et bivariés On parle aussi de dataviz, datavisualisation, story telling,... En ligne, création automatique sur des sujets précis (page facebook, compte twitter, site web) : visual.ly/ Sinon, logiciels de statistiques + logiciels de PAO F.-X. Jollois (Paris Descartes) SFdS 2013 15 / 27
Outils (en ligne) complets Outils spécialisés intéressants mais limités Besoin de faire plusieurs types de graphiques mais de manière homogène Vers des outils complets, permettant l intégration de graphiques et de texte, ou de créations de plusieurs graphiques directement à partir d un jeu de données F.-X. Jollois (Paris Descartes) SFdS 2013 16 / 27
Outils complets www.quadrigram.com : création de flux avec possibilité d importation de données, de calculs et sélections, et de graphiques Exemple ci-dessous : le fichier de données doit être chargé de nouveau Possibilité d utilisation sur de nouvelles données (au même format) infogr.am : création assez libre d infographie, avec choix des graphiques et des cartes, ajout de textes, interactivité possible Exemple http://infogr.am/candidats-stid-20/ http://www.tableausoftware.com/fr-fr, Many Eyes (IBM), datahero.com,... F.-X. Jollois (Paris Descartes) SFdS 2013 17 / 27
Quadrigram Exemple F.-X. Jollois (Paris Descartes) SFdS 2013 18 / 27
Librairies, API Les librairies pour faire quoi de plus? Plus grande souplesse Liberté totale dans les choix des graphiques Interaction totale Intégration très facile entre les données et l utilisateur Quelques limites toutefois : Données figées Connaissances informatiques nécessaire F.-X. Jollois (Paris Descartes) SFdS 2013 19 / 27
Quelques noms Graphiques statistiques : Google Charts Tool : https://developers.google.com/chart/ Raphael : http://raphaeljs.com/ D3 (Data-Driven Documents) : http://d3js.org/ Cartographie Google Maps API : https://developers.google.com/maps/ Leaflet : http://leaflet.cloudmade.com/ Polymaps : http://polymaps.org/ F.-X. Jollois (Paris Descartes) SFdS 2013 20 / 27
Google Chart Exemple F.-X. Jollois (Paris Descartes) SFdS 2013 21 / 27
D3 Exemple F.-X. Jollois (Paris Descartes) SFdS 2013 22 / 27
Google Maps Exemple F.-X. Jollois (Paris Descartes) SFdS 2013 23 / 27
Conclusion Deux conceptions différentes de la data-visualisation Outils en ligne Librairies Données Utilisateur Développeur Types de graphiques Pré-définis Développeur (choix limité) Options Pré-définis Développeur (Utilisateur parfois) Variables Utilisateur Utilisateur F.-X. Jollois (Paris Descartes) SFdS 2013 24 / 27
Conclusion : Outils en ligne Avantages : Accessibilité totale (si connexion internet) Pas de contraintes de systèmes d exploitation et/ou d installation de logiciels Gratuité (souvent) et simplicité des outils Inconvénients : Connexion internet indispensable Possibilités assez limitées Pré-traitement souvent nécessaire (calculs d agrégats principalement) Pas de contrôle ni d aide sur la justesse statistique des choix faits Pérennité du service? F.-X. Jollois (Paris Descartes) SFdS 2013 25 / 27
Conclusion : Librairies, API Avantages : Totale liberté sur les graphiques, les couleurs,... Beaucoup de possibilités Intégration très simple Globalement pas de contraintes de systèmes d exploitation Inconvénients : Nécessitant un bagage informatique non négligeable Installation (souvent légère) nécessaire de la librairie F.-X. Jollois (Paris Descartes) SFdS 2013 26 / 27
Conclusion Quel public et quel usage? Journalistes Chargés de communication Statisticiens Analystes décisionnel Composition d une équipe usuelle : Journaliste Programmeur Graphiste Quid de la place des Statisticiens dans la chaîne dataviz? F.-X. Jollois (Paris Descartes) SFdS 2013 27 / 27