Visualisation d information



Documents pareils
Visualisation d information interactive

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA

Jean-Daniel Fekete Directeur de Recherche, Resp. équipe-projet AVIZ INRIA

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu.

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

Visualisation d information

Exemple PLS avec SAS

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

La visualisation d information

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche

Forthcoming Database

Introduction à la B.I. Avec SQL Server 2008

Introduction à Business Objects. J. Akoka I. Wattiau

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Hervé Couturier EVP, SAP Technology Development

Once the installation is complete, you can delete the temporary Zip files..

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

PERFORMANCE BASE DE DONNÉES

2 Serveurs OLAP et introduction au Data Mining

Bases de données multidimensionnelles et mise en œuvre dans Oracle

BI = Business Intelligence Master Data-Science

EN UNE PAGE PLAN STRATÉGIQUE

Analyse des logiciels d application spécialisée pour le courtage en épargne collective

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

La rencontre du Big Data et du Cloud

2014/2015. Rapport 4 REALISE PAR : ISMAIL NAIT ABDELLAH OUALI SOUFIANE HOURRI MOHAMED OUSSAFI ENCADRE PAR : MME L.LAMRINI ANOUAR OUFQIR SMARTSIR

Institut français des sciences et technologies des transports, de l aménagement

Visualizing Start-up Firm Trajectories on Kohonen Maps

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

BIG Data et R: opportunités et perspectives

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Les Entrepôts de Données

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Le nouveau visage de la Dataviz dans MicroStrategy 10

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Synthèse d'images I. Venceslas BIRI IGM Université de Marne La

1 Modélisation d être mauvais payeur

Exemple d application en CFD : Coefficient de traînée d un cylindre

DSL. Domain Specific Language. À l'aide des technologies Eclipse Modeling. Goulwen Le Fur Le 23 novembre 2012

Utilisation d outils de Visual Data Mining pour l exploration d un ensemble de règles d association

Etude comparative de différents motifs utilisés pour le lancé de rayon

Entreprise et Big Data

Planning a Science Fair

Lire ; Compter ; Tester... avec R

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

26th of March 2014, Paris

INSTRUMENTS DE MESURE SOFTWARE. Management software for remote and/or local monitoring networks

A GLOBAL VISION OF INFORMATION SYSTEM

Algorithmes de recommandation, Cours Master 2, février 2011

ESIEA PARIS

Introduction aux outils BI de SQL Server Tutoriel sur SQL Server Integration Services (SSIS)

La boîte à outils InfoVis

EXCEL & XLCubed 10 raisons d en faire l assise de votre Managed Self-Service BI

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

L hypertexte, le multimédia, c est quoi?

RAPID Prenez le contrôle sur vos données

Improving the breakdown of the Central Credit Register data by category of enterprises

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Introduction aux outils BI de SQL Server Création de cubes dans SQL Server Analysis Services (SSAS)

Algebra & Trigonometry High School Level Glossary English / French

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

La place de la Géomatique Décisionnelle dans le processus de décision

Opérations de base sur ImageJ

Editing and managing Systems engineering processes at Snecma

Préconisations pour une gouvernance efficace de la Manche. Pathways for effective governance of the English Channel

Institut d Acclimatation et de Management interculturels Institute of Intercultural Management and Acclimatisation

ISTIA INNOVATION. 62, Ave ND du Lac F Angers

Logiciel XLSTAT version rue Damrémont PARIS

ENGINEER-COMPUTER INTERACTION FOR STRUCTURAL MONITORING

Graphes d attaques Une exemple d usage des graphes d attaques pour l évaluation dynamique des risques en Cyber Sécurité

Création et évaluation d interfaces visuelles interactives à partir de services web

Rapport de Mini-Projet en ArcGIS Engine

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

VISUALISATION DE NUAGES DE POINTS

Eléments de statistique

CONTRACTS APPRAISAL UNDER UNCERTAINTY IN ELECTRICITY MARKETS: A FUZZY AND MULTIPLE CRITERIA APPROACH

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Infolettre #18 : Les graphiques avec Excel 2010

Application de K-means à la définition du nombre de VM optimal dans un cloud

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

et les Systèmes Multidimensionnels

Visualiser des données.

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Encryptions, compression et partitionnement des données

Business Intelligence : Informatique Décisionnelle

Utilisation du Logiciel de statistique SPSS 8.0

Création intuitive des éléments d un paysage

Ingénierie et gestion des connaissances

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Transcription:

Master SIAD 1 année Visualisation d information Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/

Master SIAD 1 année Visualisation d information Chapitre 1.3 Techniques de visualisation avancées ou comment quitter les histogrammes et les camemberts Excell pour entrer dans la 5 dimension

PRINCIPES - Objectifs 1.3.1. Notions 1.3.1.1. Information et incertitude de données 1.3.1.2. Représentation des données multi-dimensionnelles 1.3.1.3. Représentations avancées pour les données hiérarchiques 1.3.2. Pratiques 1.3.2.1. Représentation de l incertitude

UNCERTAINTY REPRESENTATION Uncertainty : multiple sources and causes Source: kind of uncertainty Limited accuracy Missing data Inconsistency Noise Bias Ambiguity Possible cause Limitations of measuring instruments or computational processes Non-representative sample size Conflict between data from several sources Random noise Personal idiosyncrasy, systematic measure error Linguistic data Managing uncertainty Direct influence on data understanding and decision making A complete correction / reduction of uncertainty is impossible Modeling (statistics, probability, fuzzy set ) and reasoning with uncertainty Few works on the visualization of uncertainty needs for : - Seamless integration of information and uncertainty (restricted cognitive load) - Flexible representation of uncertainty : handling easily multiples uncertainty models

UNCERTAINTY MODELS Probability Likehood of an event to occur / a data to be observed Example - Bayesian probability P(StateA ObservationB) Provability Possibility Membership - Descriptive probability P(x = A) Paramétric model : normal distribution (mean, standard deviation) Certitude Facteurs : -1 = surely false, 1 = surely true Belief function : Dempster-Shafer Theory Example : BF(A), BF(B), BF(C), BF({A,C}), BF ({A,B}), etc Alternative matches for an observation Example : range of errors on an measure Fuzzy sets : degree of membership to a specific set Different aims Different semantics Different reasoning Degree of confidence Degree of membership

UNCERTAINTY REPRESENTATION Visualization techniques better adapted to specific uncertainty models Two main approaches : additional information vs. integrated information Additionnal information : extrinsic representation Additional object to represent a specific parameter / data Error bar - represent standard deviation or a range of values (confidence interval). - works with point chart or bar charts

UNCERTAINTY REPRESENTATION Additionnal information : extrinsic representation Boxplot, or box and whisker plot (boite à moustache) to represent visually a distribution (quartile or decile, extreme values) 1st quartile median 3rd quartile Summary plot explicit representation of the distribution (thickness of the line) [Potter and al. 2011]

UNCERTAINTY REPRESENTATION Integrated information : intrinsic representation One visual feature dedicated to uncertainty representation Blur Easy interpretation of the uncertaint nature of the data Impossibility to estimate the degree of uncertainty [Grigoryan, Rheingans 2004] Hue+Texture Hue Blur Hue, luminance, saturation, texture

N-DIMENSIONAL DATA Scatter Plot Matrix (SPLOM) [Heer and al. 2010] Principle use small multiples of scatter plots showing a set of pair-wise relations among variables

DONNEES A N-DIMENSIONS Murs perspectifs

DONNEES A N-DIMENSIONS Parallel coordinates [Heer and al. 2010] Principle Variables are plotted on parallel axes. A poly-line = a row of the DB Interactive visualization You can change the order of the variables correlated variables inverse correlation

DONNEES HIERARCHIQUES Deux propriétés visuelles pour guider la visualisation Connectivité Clôture Connectivité : arbres hiérarchiques Représentation la plus courante Des limitations toutefois [Card et al. 1999] - peu utilisable à mesure que l arbre croît - arbre non équilibré occupation non optimale de l espace - valeurs associées au nœuds : attributs quantitatifs non intégrables Clôture : treemaps Technique de remplissage d espace Treemap : principes généraux [Schneidermann 1992] - relations hiérarchiques représentées par une inclusion d espaces - aire des rectangles proportionnelles aux attributs Intérêt - attributs quantitatifs intégrés en propre - espace consommé indépendant de la profondeur de la hiérarchie

DONNEES HIERARCHIQUES Approche surfacique : Treemaps Partionnement d espace chaque rectangle représente un nœud de taille proportionnelle à sa valeur d attribut. Sous-nœuds : partition du rectangle père. Plusieurs algorithmes de découpage : propriétés différentes Ratio rectangles plus ou moins proche du carré (le plus lisible) Ordre ordre des sous-rectangles proche de celui des données initiales Stabilité stabilité du découpage quand les données changent. Algorithme Ratio Ordre Stabilité Arbre binaire + + ++ Mixed treemap - ++ ++ Ordered + + + Slice & Dice ++ ++ + Squarified - - + Strip + ++ + Critères perceptifs Attention au ratio largeur / longueur (se rapprocher du carré) Stabilité stabilité du découpage quand les données changent.

DONNEES HIERARCHIQUES Approche surfacique : Treemaps Recommandations ergonomiques Ratio longueur / largeur : éviter les zones trop minces Couleurs Pas plus de deux couleurs, la perception devient vite trop dure sinon Adjacences Ne pas utiliser les treemaps si adjacences non interprétables [Schneiderman 1992] SmartMoney (1999)

DONNEES HIERARCHIQUES Ellimaps [Otjacques et al. 2008] Même principe que les squarified treemaps mais avec des ellipses Gestalt : meilleur respect du principe contour et de continuité

DONNEES HIERARCHIQUES Ellimaps :algorithme de construction (version initiale) Adaptation aux ellipses des squarified treemaps Découpage du rectangle inscrit dans l ellipse de ratio φ = a/b Aire des ellipses proportionnelle à la valeur de l attribut Découpage vertical ou horizontal suivant le plus grand côté du rectangle) 2b Evaluation Trois tâches de recherche d information Temps et erreurs 40,00% 150 2a 20,00% TreeMap Ellim ap 100 50 0,00% Err 1 Err 2 Err 3 0 T1 T2 T3

DONNEES HIERARCHIQUES Adjency diagrams [Heer and al. 2010] Partial consideration of the closure principle Represent both hierarchy and adjency

DONNEES MULTI-DIMENSIONNELLES Entrepôts de données et cubes de données Cubes de données: intérêt Cubes de données: ensemble des agrégations réalisables sur les données Pré-calcul réduisant le requêtage OLAP Cubes de données: limitations Exploration fastidieuse des cubes de données du fait de leurs très grandes dimensions Exemple 1 000 000 tuples > 100 000 000 cubes A l heure actuelle, exploration avec des techniques inadaptées (SQL, représentation graphiques simples) ou des requêtes OLAP pré-programmées : aucune interactivité Solution : visualisation de données Techniques de visualisation avancées permettant une réelle exploration interactive

DONNEES MULTI-DIMENSIONNELLES Semi-treillis des valeurs des cuboïdes Graphe acyclique orienté permettant de représenter les attributs Taille des nœuds proportionnelle à la valeur de la variable d agrégation Nom Equipe Poste Count 3 *,*,* Parker 1 Diaw Batum 1 1 Parker,*,* Diaw,*,* Batum,*,* *,Spurs,* Spurs 2 Blazers 1 Parker Spurs Meneur Ailier 1 2 1 Parker, Spurs,* Diaw, Spurs,* Batum, Blazers,* *, Spurs, Ailier. Blazers. Ailier. 1 Parker, Spurs, Ailier.. Batum Blazers Ailier 1 Limitation Visualisation difficile au-delà de 1000 nœuds

DONNEES MULTI-DIMENSIONNELLES Projections multiples Polaris [Stolte et al., 2002] Projection 2D, chaque dimension d affichage correspondant à des agrégations Plusieurs formes de représentation (courbes, histogramme, camemberts) Plusieurs projections affichables simultanément. Limitation Efficace, mais le nombre de projection n est pas infini: exploration orientée par les possibilités d affichage, nécessite une étude préalable fine des besoins

DONNEES MULTI-DIMENSIONNELLES Visualisation orientée pixel VisDB [Keim, Kriegel, 2000] d3viz [Novelli, Auber, 2008] Visualisation très dense de l information : un pixel = une donnée Jeu sur la couleur et la position des pixels pour interpréter l image visuelle présentée Fouille visuelle sans perte de contexte: zooms de type glyphes fish-eye

DONNEES MULTI-DIMENSIONNELLES Visualisation orientée pixel Pipeline de visualisation Données brutes Cubes de données Forme visuelle Image finale Transformation des données Mapping visuel 2D Création vue Visualisation orientée pixel : mapping visuel Principe Interaction utilisateur Associer un pixel à une donnée sur l image, en respectant leur proximité originelle Plusieurs courbes de remplissage d espace envisageables Parker, *,* Diaw,*, * *,*,* Batum, *,* *,Spurs,*

DONNEES MULTI-DIMENSIONNELLES Visualisation orientée pixel : mapping visuel Courbes fractales Peano-Hilbert Morton (ordre Z) Niveaux du semi-treillis non respectés : exploration difficile Courbes en scanline et spirale Niveau 0 Niveau 1 Niveau 2 Niveau 0 Niveau 1 Niveau 2 Exploration - Observation : rotation, zoom de type fisheye etc - Action : recalcul de la vue suivant de nouvelles dimensions

DONNEES MULTI-DIMENSIONNELLES Visualisation orientée pixel Pipeline de visualisation Données brutes Cubes de données Forme visuelle Image finale Transformation des données Mapping visuel 2D Création vue Interaction utilisateur Visualisation orientée pixel : mapping visuel et requêtage Associer un pixel à une donnée Flexibilité d interrogation : pas de filtrage, mais degré de pertinence des données Visualisation : couleur et proximité des données en fonction de leur pertinence Plusieurs courbes de remplissage d espace (spirale...) VisDB

DONNEES MULTI-DIMENSIONNELLES Visualisation orientée pixel : visualisation multi-dimensionelle Une fenêtre pour la visualisation des résultats de la requête (facteur de pertinence) Autres fenêtres pour projection sur différentes dimensions VisDB Visualisation 2D association de 2 dimensions aux axes + remplissage par courbe fractale

DONNEES MULTI-DIMENSIONNELLES Visualisation orientée pixel : interaction 1. L utilisateur définit initialement ses requêtes 2. Possibilité de les modifier interactivement dans l interface au vu des résultats VisDB Visualisation avec projetctions sur 5 dimensions Interaction : modification des requêtes Limitations Filtrage, projection gérées, mais pas de zoom sur les données brutes

RESEARCH Main scientific challenges in current researches Real-Time visualization of huge datasets Virtual or augmented reality for enhanced interaction (immersive displays) Multimodal visualization : interaction in a seamless way (reduced cognitive load) Collaborative visualization HCI : design and ergonomic guidelines for information visualization «Highest priority task» [Zudilova and al. 2009, chapter 1]

BIBLIOGRAPHIE Ressources en ligne : concepts Semiologie graphique Treemap www.sciences-po.fr/cartographie/semio/ www.sc.umd.edu/hcil/treemap/ Ressources en ligne : outils 30 freeware pour la visualisation d information (post en anglais et reprise en français) - www.computerworld.com/s/article/9214755/chart_and_image_gallery_30_free_tools_for_data_visualization_and_analysis - www.lemondeinformatique.fr/actualites/lire-22-outils-gratuits-pour-visualiser-et-analyser-les-donnees-1ere-partie-47241.html Toolkits opérationnels pour découvrir la visualisation interactive - InfoVis http://philogb.github.com/jit/ (freeware) - VTK (Kitware Visualization Toolkit) http://www.vtk.org/ (visualisation 3D) - Prefuse Information Vizualisation Toolkit http://prefuse.org/ (freeware: graphs, trees)

BIBLIOGRAPHIE Ouvrages de référence : concepts et techniques Card S., Mackinlay J., Schneidermann B. (1999) Readings in Information Visualization, using vision to thing. San Francisco, Morgan Kaufmann Publ. Schneiderman B. (1992) Tree vizualisation with tree maps: 2-D space filling approach. ACM Trans. on Computer Graphics. 11(1), 92-99. Ouvrages de référence : recherche & veille technologique Von Landesberger T., Kuijper A., Schreck T., Kohlhammer J., van Wijk J.J., Fekete J.-D., Fellner D.W. (2011) Visual Analysis of Large Graphs: State-of-the-Art and Future Research Challenges. Computer Graphics. 30(6). 1719-1749. Zudlilova-Seintra E., Adriaansen T., van Liere R. (2009) Trends in interactive visualization : state of the art and survey. Springer, London, OK. Advanced Information and Knowledge Processing Series

BIBLIOGRAPHIE Travaux cités Camacho M.J., Steiner B.A., Berson B.L. (1990) Icons versus alphanumerics in pilot-vehicles interfaces. Actes Human Factors and Ergonomics Society Annual Meeting. Grigoryan G., Rheingans P (2004) Point-Based Probabilistic Surfaces to Show Surface Uncertainty, IEEE Transactions on Visualization and Computer Graphics, 10(5), 546 573. Keim D.A., Kriegel H.P. (2000) Designing pixel-oriented visualization techniques: theory and application. IEEE Trans. Viz. Computer Graphics. 6(1), 59-78. Keim D., Andrienko G., Fekete J.-D., Gëorg C., Kohlhammer J., Melançon G. (2008). Visual Analytics: Definition, Process, and Challenges, In. Information Visualization, Lectures Notes in Computer Sciences. LNCS 4950:154-175. Novelli N., Auber D. (2008) Calcul et fouille visuelle orientée-pixel de cubes de données. RSTI-RIA. 22/2008:329-352. Potter K., Kniss J., Riesenfeld R., Johnson C.R. Visualizing Summary Statistics and Uncertainty.CGF 29(3)

BIBLIOGRAPHIE Travaux cités (2) Otjacques B., Collin P., Noirhomme M., Feltz F. (2008) Ellimaps, une technique basée sur la loi d inclusion pour représenter des hiérarchies avec nœuds pondérés. RSTI-RIA. 22/2008:301-327. Pylyshyn Z. (1994) Some primitive of spatial attention. Cognition. 50:363-384. Steim D.A. (2002) Information visualization and visual datamining. IEEE Trans. Visualization and Computer Graphics. 7(1) : 100-107. http://nm.merz-akademie.de/~jasmin.sipahi/drittes/images/keim2002.pdf Stolte C., Tang D., Hanraham P. (2002) Multiscale vizualisation using data cubes. InfoVis 2002, 7-14. Stolte C., Tang D., Hanraham P. (2002) Polaris, a system for query, analysis and vizaulisation of multidimensional relational databases. IEEE Trans. Vis. Computer. Graphics, 8(1), 52-65.. Travaux cités en ligne Heer J., Bostock M., Ogievetsky V. (2010) A tour through the vizualisation zoo. [http://hci.stanford.edu/jheer/files/zoo/ ]