Visualisation de données et de graphes David Auber, LaBRI, Université de Bordeaux.
Recherche Edge Bundling Fuzzy Clustering Visualization DataVis software Coumpound Graph Visualization Large scale heatmaps Treemaps visualization
LaBRI Université Bordeaux LaBRI Université Bordeaux / INRIA Bordeaux sud ouest - 140 Researchers - 150 PhD Student - 22 Administrative
Visualisation d informations Représentation visuelle interactive de données abstraites Aide à la résolution de problèmes. Métaphore visuelle Permet de réduire l utilisation de la mémoire. Comment choisir les bonnes métaphores? Comment interagir avec la représentation?
Précurseurs Minard(1869) : Campagne de Russie de l armée napoléonienne
Précurseurs Dr. John Snow : Épidémie de choléra à Londres (Soho District, 1845)
Précurseurs Robertson & al: «Cone trees: Animated 3D visualization of hierarchical information» (1991)
Pourquoi? Système de perception visuelle de l être humain 70 % des récepteurs 40 % du cortex Tâche simple L être humain est meilleur pour la: «reconnaissance» Que pour la «mémorisation» Ware : Information visualization (2000) / Dix & al : Human computer Interaction (1998)
?
Attributs: Charge cognitive - faible Recherche immédiate indépendante du nombre d éléments. (charge cognitive faible)
?
Attributs: exemple Recherche immédiate indépendante du nombre d éléments. (charge cognitive faible)
?
Charge cognitive Recherche lente dépendante du nombre d éléments. (charge cognitive élevée)
Charge cognitive - faible Cette image représente le suivi de 200.000 connections IP entre 20.000 machines. L œil voit directement que toutes les connections vont vers le même groupe de machine. En regardant plus longuement, on voit 10 clusters et une symétrie entre les clusters. Illustration (Com. IP) présentée à la cité des sciences à la station Montparnasse et au Journal du CNRS (National/International) Copyright Auber et al. 2013
Charge cognitive Recherche immédiate indépendante du nombre d éléments. (charge cognitive faible) Recherche lente dépendante du nombre d éléments. (charge cognitive élevée)
Quoi? L information est composée de : D entités : une entreprise A, une entreprise B, etc De relations : L entreprise A travaille avec l entreprise B. Chaque entité ou relation peut posséder plusieurs attributs. Exemple: L entreprise A a 100 employé etc - Quantitatif : valeur dans R : Superficie - Ordonné : Bijection de V -> N : Résultat du tiercé - Nominatif : tous les autres : Marque de voiture
Comment? Attributs visuels Position Densité Forme Taille Texture Orientation Saturation Courbure Mouvement Texte Teinte
Efficacité attributs quantitatifs Cleveland et McGill
Efficacité Jock Mackinlay
Indépendance Les attributs visuels ne peuvent pas toujours être combinés ensemble. Intégrable Séparable Rouger/Vert Taille X Taille Couleur Couleur Couleur Bleu /Jaune Taille Y Orientation Forme Mouvement Position
Démonstration Attributs visuels Joueur de Poker Nous disposons de l historique des transactions financières entre les joueurs. Nous disposons de statistiques sur les techniques de jeux des joueurs. Chaque joueur est une entité et les mesures sur les joueurs sont des attributs
Comment représenter les relations Principe de reconnaissance de motif «gestalt» = forme en allemand Principes Proximité Similarité Continuité / connections Animation simultanée Taille relative
Relations :Proximité Le système de perception regroupe les entités proches les unes de autres. Il prend aussi en compte la densité.
Relations :Proximité Le système de perception regroupe les entités proches les unes de autres. Il prend aussi en compte la densité.
Relations :Similarité Le système de perception regroupe les entités qui ont une forte similarité. Ici position / forme/ couleur.
Relation: Fermeture
Relations : Continuité Le système de perception dissocie les entité en fonction du contour. Il cherche à prendre les contours continus.
Connections Plus puissant que la proximité, la couleur, la taille, les formes
Relations: Animation simultanée
Démonstration Relation Joueur de Poker Nous disposons de l historique des transactions financières entre les joueurs. Nous disposons de statistiques sur les techniques de jeux des joueurs. Chaque joueur est une entité et les mesures sur les joueurs sont des attributs Les transactions entre les joueurs sont des relations entre joueur.
Pipeline de visualisation Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu
Le mantra Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu «Overview first, zoom and filter then details on demand» Ben Schneiderman «Analyse first, Show the important, Zoom and Filter and analyse Further, details on demand» Keim et al
Visualisation de graphes Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu Sélection des Données Récupération des relations Inférence des relations Mesure sur les graphes Détection de communautés Agrégation d éléments Représentation des graphes Affichage de la relation
Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force
Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force
Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force
Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force
Matrices La représentation matricielle utilise la position pour encoder la relation entre deux entités. L efficacité des vues matricielles dépend de l ordonnancement des lignes et des colonnes des matrices.
Treemaps Utilise le principe de gestalt de contours fermés pour représenter des arbres. Plusieurs variantes existent, notamment: les GosperMaps qui permettent de rapprocher des régions entre elles.
Brushing and linking Une seule métaphore visuelle est rarement suffisante pour découvrir l information cachée dans les données. On utilise en visualisation analytique plusieurs métaphores reliées ensembles.
Démonstration Brushing & Linking Joueur de Poker Nous disposons de l historique des transactions financières entre les joueurs. Nous disposons de statistiques sur les techniques de jeux des joueurs. Chaque joueur est une entité et les mesures sur les joueurs sont des attributs Les transactions entre les joueurs sont des relations entre joueur.
Visualisation de graphes Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu Sélection des Données Récupération des relations Inférence des relations Mesure sur les graphes Détection de communautés Agrégation d éléments Représentation des graphes Affichage de la relation
Paramètres intrinsèques L analyse de la topologie du réseau permet de créer des mesures sur les entités (nœuds) et les relations (arêtes/arcs) d un graphe. Ces mesures permettent de mettre en évidence: - Les entités pivots dans le réseaux - L indépendance des entités vis à vis de leur voisinage. - Leur centralité dans le réseau - Etc.. De plus elles peuvent servir pour la détection de communautés (clustering).
Clustering de graphes Le clustering consiste à agréger des éléments. L agrégation est un élément clé pour l analyse de grands graphes. Une fois l agrégation obtenu on peut réappliquer l opération pour obtenir un clustering multi-échelle. On utilise cette décomposition multiéchelle pour changer la complexité de nos algorithmes ainsi que pour permettre un navigation multi-échelle dans les graphes.
Démonstration Bibliographie Deux personnes sont reliées si elles ont co-signé un article scientifique.
QUESTIONS? David Auber david.auber@labri.fr www.tulip-software.org