Visualisation de données et de graphes. David Auber, LaBRI, Université de Bordeaux.



Documents pareils
Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA

sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu.

Visualisation d information interactive

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

MABioVis. Bio-informatique et la

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche

Utilisation d outils de Visual Data Mining pour l exploration d un ensemble de règles d association

La visualisation d information

Analysis and Visualisation of Edge Entanglement in Multiplex Networks

Comprendre le Big data grâce à la visualisation

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Université de Montréal. par Mohamed Mouine

Segmentation d'images à l'aide d'agents sociaux : applications GPU

DATA ANALYTICS Des données aux connaissances et à la création de valeur

DATA VISUALIZATION. Web In Lorient - 20 Novembre KI Analytics

Rencontre sur la thématique du Calcul Haute Performance - 13 juin Better Match, Faster Innovation

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Simulation centrée individus

Cycle de Découverte n 1 VISUALISER Créer la prochaine application innovante

Création et évaluation d interfaces visuelles interactives à partir de services web

Travailler avec les télécommunications

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Hervé Couturier EVP, SAP Technology Development

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

SAN07 IBM Social Media Analytics:

MatrixExplorer: Un système pour l analyse exploratoire de réseaux sociaux

Travaux pratiques avec RapidMiner

Automatisation de la découverte, de la surveillance et de l analyse des causes premières dans le datacenter virtualisé (VDC) EMC SERVER MANAGER

05/09/2015. M Ponctualité : CM TD TP & Projet Æ En cas d absence : récupérer!!! 3 05/09/2015

Visualisation d information

La Data Visualisation dans les organisations. Par Claude-Henri Meledo

79140 CERIZAY. Collège G. CLEMENCEAU. Page 1 sur 18

Manuel utilisateur Netviewer one2one

WACOM MULTI-TOUCH : UTILISATION TACTILE DES PRODUITS WACOM

Exemple d application en CFD : Coefficient de traînée d un cylindre

Analyze. Command. Record. Surveillance Station. La solution NVR de Synology est conçue pour vous offrir la meilleure expérience de vidéosurveillance

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Tux Paint. 1. Informations générales sur le logiciel. Auteur : Bill Kendrick et l équipe de développement de New Breed Software

LUT QU EST-CE QUE C EST? Version 1.0 Mars 2010

1 Modélisation d être mauvais payeur

Agrégation de traces d exécution pour la visualisation de grands systèmes distribués

IUT BREST UN LOGICIEL SCADA : PC VUE 2010 DEP.GMP

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

Atelier Travailler vos photos Mars 2015

LES OUTILS DE GESTION DE PROJET

SysFera. Benjamin Depardon

Votre outil pour vous démarquer sur le terrain de l interactivité. www. Moteurs de recherche. Médias Sociaux. Web. Mobilité. Assurance automobile

PowerPoint offre trois modes d affichage principaux : le mode Normal, le mode Trieuse de diapositives et le mode Diaporama

Définir la gestion de projets 11. Exploiter les techniques de gestion de projets 11. Planifier un projet 12. Lister les tâches et les jalons 13

Activité 11 : Nuage de points ou diagramme de dispersion

La boîte à outils InfoVis

Etude comparative de différents motifs utilisés pour le lancé de rayon

Présentation... 2 Mise en place Fiche Article... 2 Commande Client... 3 Commande Fournisseur Gestion de la contremarque...

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Développement mobile MIDP 2.0 Mobile 3D Graphics API (M3G) JSR 184. Frédéric BERTIN

1 INFORMATION - INFORMATIQUE. 11 Systèmes d'information gestion des connaissances, knowledge management

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

ils entretiennent entre eux des flux, ils partagent des perceptions sur l environnement

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Enjeux mathématiques et Statistiques du Big Data

Business Intelligence avec SQL Server 2012

Apprendre à résoudre des problèmes numériques. Utiliser le nombre pour résoudre des problèmes

DOCTORAT DE L'UNIVERSITÉ DE TOULOUSE

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Visualisation en Fouille de Données

pcon.planner 6 Préparer et présenter une implantation en toute simplicité

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

WORDPRESS : réaliser un site web

Object Removal by Exemplar-Based Inpainting

Visualisation d information

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

Manuel des bonnes pratiques avec CATIA V.5

Facebook ADS Du ciblage à la conversion

ANALYSE TEXTUELLE DE TRAVAUX DE JEAN-PIERRE BARTHÉLEMY. Marc LE POULIQUEN 1,2

La filière française compte 195 casinos autorisés sur le territoire national pour l exercice 2010/2011 (Source : les casinos.org). Il en existait 155

Base de Connaissances

La perception du mouvement dans la visualisation : le cas des graphes

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Big data et sciences du Vivant L'exemple du séquençage haut débit

PRESENTE LE LA PLUS GRANDE RENCONTRE DE BAD BOYS UNE TOURNEE DE LEGENDE, UN EVENEMENT MYTHIQUE

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB Olivier Augereau Formation UML

Manuel d utilisation TruView 3.0

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Powerbat Portail web de services énergétiques

MEGA ITSM Accelerator. Guide de démarrage

6. PAIEMENT - ÉTAT DE COMPTE

William Pezet

De meilleures prises de décisions pour des produits de meilleure qualité

My Poker Manager Guide Utilisateur. Guide Utilisateur

Chapitre 5 : Flot maximal dans un graphe

Probabilités. I - Expérience aléatoire. II - Evénements

Création intuitive des éléments d un paysage

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

Diagnostic adaptatif d'un flux d'alarmes par méta diagnostic distribué Application à la détection d'intrusions dans un serveur Web

MANUEL TBI - INTERWRITE

Transcription:

Visualisation de données et de graphes David Auber, LaBRI, Université de Bordeaux.

Recherche Edge Bundling Fuzzy Clustering Visualization DataVis software Coumpound Graph Visualization Large scale heatmaps Treemaps visualization

LaBRI Université Bordeaux LaBRI Université Bordeaux / INRIA Bordeaux sud ouest - 140 Researchers - 150 PhD Student - 22 Administrative

Visualisation d informations Représentation visuelle interactive de données abstraites Aide à la résolution de problèmes. Métaphore visuelle Permet de réduire l utilisation de la mémoire. Comment choisir les bonnes métaphores? Comment interagir avec la représentation?

Précurseurs Minard(1869) : Campagne de Russie de l armée napoléonienne

Précurseurs Dr. John Snow : Épidémie de choléra à Londres (Soho District, 1845)

Précurseurs Robertson & al: «Cone trees: Animated 3D visualization of hierarchical information» (1991)

Pourquoi? Système de perception visuelle de l être humain 70 % des récepteurs 40 % du cortex Tâche simple L être humain est meilleur pour la: «reconnaissance» Que pour la «mémorisation» Ware : Information visualization (2000) / Dix & al : Human computer Interaction (1998)

?

Attributs: Charge cognitive - faible Recherche immédiate indépendante du nombre d éléments. (charge cognitive faible)

?

Attributs: exemple Recherche immédiate indépendante du nombre d éléments. (charge cognitive faible)

?

Charge cognitive Recherche lente dépendante du nombre d éléments. (charge cognitive élevée)

Charge cognitive - faible Cette image représente le suivi de 200.000 connections IP entre 20.000 machines. L œil voit directement que toutes les connections vont vers le même groupe de machine. En regardant plus longuement, on voit 10 clusters et une symétrie entre les clusters. Illustration (Com. IP) présentée à la cité des sciences à la station Montparnasse et au Journal du CNRS (National/International) Copyright Auber et al. 2013

Charge cognitive Recherche immédiate indépendante du nombre d éléments. (charge cognitive faible) Recherche lente dépendante du nombre d éléments. (charge cognitive élevée)

Quoi? L information est composée de : D entités : une entreprise A, une entreprise B, etc De relations : L entreprise A travaille avec l entreprise B. Chaque entité ou relation peut posséder plusieurs attributs. Exemple: L entreprise A a 100 employé etc - Quantitatif : valeur dans R : Superficie - Ordonné : Bijection de V -> N : Résultat du tiercé - Nominatif : tous les autres : Marque de voiture

Comment? Attributs visuels Position Densité Forme Taille Texture Orientation Saturation Courbure Mouvement Texte Teinte

Efficacité attributs quantitatifs Cleveland et McGill

Efficacité Jock Mackinlay

Indépendance Les attributs visuels ne peuvent pas toujours être combinés ensemble. Intégrable Séparable Rouger/Vert Taille X Taille Couleur Couleur Couleur Bleu /Jaune Taille Y Orientation Forme Mouvement Position

Démonstration Attributs visuels Joueur de Poker Nous disposons de l historique des transactions financières entre les joueurs. Nous disposons de statistiques sur les techniques de jeux des joueurs. Chaque joueur est une entité et les mesures sur les joueurs sont des attributs

Comment représenter les relations Principe de reconnaissance de motif «gestalt» = forme en allemand Principes Proximité Similarité Continuité / connections Animation simultanée Taille relative

Relations :Proximité Le système de perception regroupe les entités proches les unes de autres. Il prend aussi en compte la densité.

Relations :Proximité Le système de perception regroupe les entités proches les unes de autres. Il prend aussi en compte la densité.

Relations :Similarité Le système de perception regroupe les entités qui ont une forte similarité. Ici position / forme/ couleur.

Relation: Fermeture

Relations : Continuité Le système de perception dissocie les entité en fonction du contour. Il cherche à prendre les contours continus.

Connections Plus puissant que la proximité, la couleur, la taille, les formes

Relations: Animation simultanée

Démonstration Relation Joueur de Poker Nous disposons de l historique des transactions financières entre les joueurs. Nous disposons de statistiques sur les techniques de jeux des joueurs. Chaque joueur est une entité et les mesures sur les joueurs sont des attributs Les transactions entre les joueurs sont des relations entre joueur.

Pipeline de visualisation Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu

Le mantra Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu «Overview first, zoom and filter then details on demand» Ben Schneiderman «Analyse first, Show the important, Zoom and Filter and analyse Further, details on demand» Keim et al

Visualisation de graphes Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu Sélection des Données Récupération des relations Inférence des relations Mesure sur les graphes Détection de communautés Agrégation d éléments Représentation des graphes Affichage de la relation

Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force

Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force

Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force

Diagrammes nœuds/liens La représentation nœud/lien dessine les entités avec des formes et représente les relations en utilisant des connections. On distingue trois grandes classes de représentations nœud lien Hiérarchique Planaire Modèle de force

Matrices La représentation matricielle utilise la position pour encoder la relation entre deux entités. L efficacité des vues matricielles dépend de l ordonnancement des lignes et des colonnes des matrices.

Treemaps Utilise le principe de gestalt de contours fermés pour représenter des arbres. Plusieurs variantes existent, notamment: les GosperMaps qui permettent de rapprocher des régions entre elles.

Brushing and linking Une seule métaphore visuelle est rarement suffisante pour découvrir l information cachée dans les données. On utilise en visualisation analytique plusieurs métaphores reliées ensembles.

Démonstration Brushing & Linking Joueur de Poker Nous disposons de l historique des transactions financières entre les joueurs. Nous disposons de statistiques sur les techniques de jeux des joueurs. Chaque joueur est une entité et les mesures sur les joueurs sont des attributs Les transactions entre les joueurs sont des relations entre joueur.

Visualisation de graphes Utilisateurs Data Base Meta Data Décomposition Métaphores Visuelles Rendu Sélection des Données Récupération des relations Inférence des relations Mesure sur les graphes Détection de communautés Agrégation d éléments Représentation des graphes Affichage de la relation

Paramètres intrinsèques L analyse de la topologie du réseau permet de créer des mesures sur les entités (nœuds) et les relations (arêtes/arcs) d un graphe. Ces mesures permettent de mettre en évidence: - Les entités pivots dans le réseaux - L indépendance des entités vis à vis de leur voisinage. - Leur centralité dans le réseau - Etc.. De plus elles peuvent servir pour la détection de communautés (clustering).

Clustering de graphes Le clustering consiste à agréger des éléments. L agrégation est un élément clé pour l analyse de grands graphes. Une fois l agrégation obtenu on peut réappliquer l opération pour obtenir un clustering multi-échelle. On utilise cette décomposition multiéchelle pour changer la complexité de nos algorithmes ainsi que pour permettre un navigation multi-échelle dans les graphes.

Démonstration Bibliographie Deux personnes sont reliées si elles ont co-signé un article scientifique.

QUESTIONS? David Auber david.auber@labri.fr www.tulip-software.org