Graphes, réseaux et internet



Documents pareils
COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

Analyse empirique et modélisation de la dynamique de la topologie de l Internet

Towards realistic modeling of IP-level topology dynamics

Intégrer mesure, métrologie et analyse pour l étude des graphes de terrain dynamiques

Introduction au datamining

Contributions à l expérimentation sur les systèmes distribués de grande taille

Un radar pour Internet

MABioVis. Bio-informatique et la

Sillage Météo. Notion de sillage

Efficacité énergétique des réseaux de cœur et d accès

Ebauche Rapport finale

Introduction à l approche bootstrap

Sommaire. Couverture de zone de surveillance dans les réseaux de capteurs. De quoi parle-t-on ici (1/2)? Objectif. De quoi parle-t-on ici (2/2)?

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Rétablissement d un réseau cellulaire après un désastre

Big Data et Graphes : Quelques pistes de recherche

Modélisation et simulation des performances de nœuds de routage optique dans les réseaux dorsaux hybrides

Annexe commune aux séries ES, L et S : boîtes et quantiles

Introduction au maillage pour le calcul scientifique

TABLE DES MATIERES. C Exercices complémentaires 42

MERLIN GESTION PATRIMONIALE. Groupe GESTION PATRIMONIALE. Définition d un programme de renouvellement

Cycle de vie du logiciel. Unified Modeling Language UML. UML: définition. Développement Logiciel. Salima Hassas. Unified Modeling Language

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Dimensionnement Introduction

Conception et contrôle des SMA tolérants aux fautes

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

Apprentissage Automatique

données en connaissance et en actions?

Introduction au Data-Mining

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

Introduction à la théorie des files d'attente. Claude Chaudet

Agrégation de liens xdsl sur un réseau radio

Modélisation multi-agents - Agents réactifs

Hypervision et pilotage temps réel des réseaux IP/MPLS

Big Data et Graphes : Quelques pistes de recherche

Parallélisme et Répartition

Partie 1. La structure des réseaux sociaux

La classification automatique de données quantitatives

FACULTE DES SCIENCES ET TECHNIQUES FES SAIS MASTER SYSTEMES INTELLIGENTS ET RESEAUX MST SIR 2014 TP WIFI. Encadré par PR.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Les Difficultés Inhérentes aux Réseaux Sans Fil. Des Solutions aux Scénarios de Problèmes

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

ANALYSE CATIA V5. 14/02/2011 Daniel Geffroy IUT GMP Le Mans

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

FONCTION DE DEMANDE : REVENU ET PRIX

MODELES DE DUREE DE VIE

Modélisation aléatoire en fiabilité des logiciels

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Classe de première L

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

Atelier sur l Analyse des Réseaux Madagascar

Introduction au Data-Mining

Détection en environnement non-gaussien Cas du fouillis de mer et extension aux milieux

NetCrunch 6. Superviser

Sonde de surveillance environnementale gamma

Ordonnancement sous contraintes de Qualité de Service dans les Clouds

La continuité de service

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

Télégestion et logiciels, des auxiliaires pour une gestion patrimoniale performante

Plan du Travail. 2014/2015 Cours TIC - 1ère année MI 30

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Métrologie réseaux GABI LYDIA GORGO GAEL

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Cours des réseaux Informatiques ( )

Principe d un test statistique

Transmission d informations sur le réseau électrique

Ordonnancement robuste et décision dans l'incertain

SIMULATION HYBRIDE EN TEMPOREL D UNE CHAMBRE REVERBERANTE

Chaînes de Markov au lycée

Architecture de réseau de senseurs : monitoring environnemental et écosystèmes forestiers

TSTI 2D CH X : Exemples de lois à densité 1

FaceBook aime les Maths!

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Chapitre 5 : Flot maximal dans un graphe

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

ACCESSNET -T IP Technique système TETRA d Hytera.

Métrologie et gestion d incidents!

Dossier justificatif des travaux de R&D déclarés au titre du CIR

ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE

NON-LINEARITE ET RESEAUX NEURONAUX

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

INDUSTRIALISATION ET RATIONALISATION

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Extraction d informations stratégiques par Analyse en Composantes Principales

Texte Agrégation limitée par diffusion interne

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Modélisation et simulation

Processus aléatoires avec application en finance

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Transcription:

Graphes, réseaux et internet Clémence Magnien clemence.magnien@lip6.fr LIP6 CNRS et Université Pierre et Marie Curie (UPMC Paris 6) avec Matthieu Latapy, Frédéric Ouédraogo, Guillaume Valadon, Assia Hamzaoui,... 1/49 Clémence Magnien Graphes, réseaux et internet 1/49

Outline 1 Graphes de terrain Notions de graphes Graphes de terrain Problématiques Dynamique 2 3 Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation 2/49 Clémence Magnien Graphes, réseaux et internet 2/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain informatique : internet, web, pair-à-pair, usages, etc sciences sociales : collaboration, amitié, contacts sexuels, échanges, économie, etc biologie : cerveau, gènes, protéines, écosystèmes, etc linguistique : synonymie, co-occurrence, etc transport : routier, aérien, électrique, etc etc, etc réseaux de relations contextes très différents 3/49 Clémence Magnien Graphes, réseaux et internet 3/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes graphe = n nœuds, m liens capture la structure, la topologie pas de meilleur dessin 4/49 Clémence Magnien Graphes, réseaux et internet 4/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes graphe = n nœuds, m liens capture la structure, la topologie Graphe dessin : un graphe, plusieurs dessins G = a, b, c, d ; a b, a c, a d, b c, b d, c d pas de meilleur dessin 4/49 Clémence Magnien Graphes, réseaux et internet 4/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes densité du graphe, δ = probabilité d existence de tout lien = à quel point tout le monde est lié δ = 2m n(n 1) 5/49 Clémence Magnien Graphes, réseaux et internet 5/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes densité du graphe, δ = probabilité d existence de tout lien = à quel point tout le monde est lié δ = 2m n(n 1) n = 4, m = 4, δ = 8 12 = 0.66.. 5/49 Clémence Magnien Graphes, réseaux et internet 5/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes degré d un nœud v, d o (v) = nombre de liens de v degré moyen d o = 2m n 6/49 Clémence Magnien Graphes, réseaux et internet 6/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes degré d un nœud v, d o (v) = nombre de liens de v degré moyen d o = 2m n degrés : 2, 2, 3, 1 ; degré moyen 2 6/49 Clémence Magnien Graphes, réseaux et internet 6/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes degré d un nœud v, d o (v) = nombre de liens de v degré moyen d o = 2m n degrés : 2, 2, 3, 1 ; degré moyen 2 distribution : 1 1, 2 2, 3 1 6/49 Clémence Magnien Graphes, réseaux et internet 6/49

Notions de graphes Graphes de terrain Problématiques Dynamique Un mot sur les distributions deux grandes catégories log décroissance exponentielle vs décroissance polynômiale Poisson, Gaussienne,... vs Zipf, loi de puissance,... homogène vs hétérogène tailles vs salaires moyennne vs exposant log des conséquences importantes 7/49 Clémence Magnien Graphes, réseaux et internet 7/49

Notions de graphes Graphes de terrain Problématiques Dynamique Un mot sur les distributions deux grandes catégories log décroissance exponentielle vs décroissance polynômiale Poisson, Gaussienne,... vs Zipf, loi de puissance,... homogène vs hétérogène tailles vs salaires moyennne vs exposant log des conséquences importantes 7/49 Clémence Magnien Graphes, réseaux et internet 7/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes chemin de u à v = suite de liens u...v un chemin de longueur 3 8/49 Clémence Magnien Graphes, réseaux et internet 8/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes chemin de u à v = suite de liens u...v distance d(u, v) = longueur d un plus court chemin un plus court chemin ; longueur 2 distance = 2 8/49 Clémence Magnien Graphes, réseaux et internet 8/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes chemin de u à v = suite de liens u...v distance d(u, v) = longueur d un plus court chemin diamètre = plus grande distance diamètre = 2 8/49 Clémence Magnien Graphes, réseaux et internet 8/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes coefficient de clustering cc(v) = probabilité que deux voisins de v soient reliés = densité locale 9/49 Clémence Magnien Graphes, réseaux et internet 9/49

Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes coefficient de clustering cc(v) = probabilité que deux voisins de v soient reliés = densité locale coefficients de clustering : 1, 1, 1 3, indéfini 9/49 Clémence Magnien Graphes, réseaux et internet 9/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) non-trivial? 10/49 Clémence Magnien Graphes, réseaux et internet 10/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) non-trivial? 10/49 Clémence Magnien Graphes, réseaux et internet 10/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) non-trivial? 10/49 Clémence Magnien Graphes, réseaux et internet 10/49

Notions de graphes Graphes de terrain Problématiques Dynamique Comparaison à l aléatoire graphe aléatoire (Erdös, Rényi) = choisi uniformément dans l ensemble graphe type, représentatif des propriétés significatives, d autres moins 11/49 Clémence Magnien Graphes, réseaux et internet 11/49

Notions de graphes Graphes de terrain Problématiques Dynamique Comparaison à l aléatoire graphe aléatoire (Erdös, Rényi) = choisi uniformément dans l ensemble graphe type, représentatif de terrain aléatoire densité faible faible distances faibles faibles degrés hétérogènes homogènes clustering fort faible des propriétés significatives, d autres moins 11/49 Clémence Magnien Graphes, réseaux et internet 11/49

Notions de graphes Graphes de terrain Problématiques Dynamique Comparaison à l aléatoire graphe aléatoire (Erdös, Rényi) = choisi uniformément dans l ensemble graphe type, représentatif de terrain aléatoire degrés prescrits densité faible faible faible distances faibles faibles faibles degrés hétérogènes homogènes hétérogènes clustering fort faible faible des propriétés significatives, d autres moins 11/49 Clémence Magnien Graphes, réseaux et internet 11/49

Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). 1 1 1 0 0,2 0,4 0 0,2 0,4 0 0,1 0,2 aléatoire loi de puissance Internet 12/49 Clémence Magnien Graphes, réseaux et internet 12/49

Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). 1 1 1 0 0,2 0,4 0 0,2 0,4 0 0,1 aléatoire loi de puissance Internet 0,2 12/49 Clémence Magnien Graphes, réseaux et internet 12/49

Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). ALEATOIRE panne attaque attaque SCALE FREE panne 12/49 Clémence Magnien Graphes, réseaux et internet 12/49

Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). Très résistant aux pannes. Sensible aux attaques. Importance de la topologie sous-jacente. 12/49 lémence Magnien Graphes, réseaux et internet 12/49

Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : communautés zones denses faiblement interconnectées structure hiérarchique recouvrements calcul? 13/49 Clémence Magnien Graphes, réseaux et internet 13/49

Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : communautés zones denses faiblement interconnectées structure hiérarchique recouvrements calcul? 13/49 Clémence Magnien Graphes, réseaux et internet 13/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) et des problématiques communes mesure et métrologie analyse modélisation algorithmique 14/49 Clémence Magnien Graphes, réseaux et internet 14/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) et des problématiques communes mesure et métrologie analyse modélisation algorithmique 14/49 Clémence Magnien Graphes, réseaux et internet 14/49

Notions de graphes Graphes de terrain Problématiques Dynamique Mesure graphe réel opération de mesure vue obtenue que peut on dire sur l objet réel à partir de la mesure? impact sur les propriétés observées? impact des propriétés sur la vue? mesures ciblant certaines propriétés?... 15/49 lémence Magnien Graphes, réseaux et internet 15/49

Notions de graphes Graphes de terrain Problématiques Dynamique Mesure et Métrologie? inférence graphe réel opération de mesure vue obtenue que peut on dire sur l objet réel à partir de la mesure? impact sur les propriétés observées? impact des propriétés sur la vue? mesures ciblant certaines propriétés?... 15/49 lémence Magnien Graphes, réseaux et internet 15/49

Notions de graphes Graphes de terrain Problématiques Dynamique Analyse décrire extraire de l information pertinente statistiques structure densité degrés densité locale corrélations... encore beaucoup de manques 16/49 Clémence Magnien Graphes, réseaux et internet 16/49

Notions de graphes Graphes de terrain Problématiques Dynamique Analyse décrire extraire de l information pertinente statistiques structure densité degrés densité locale corrélations... encore beaucoup de manques 16/49 Clémence Magnien Graphes, réseaux et internet 16/49

Notions de graphes Graphes de terrain Problématiques Dynamique Modélisation génération de graphes réalistes (i.e. ayant les propriétés observées) motivations : approches formelles, simulation, explication état de l art : taille, densité, distances : facile degrés : consensus, modèles bien maîtrisés densité locale : pas de consensus 17/49 Clémence Magnien Graphes, réseaux et internet 17/49

Notions de graphes Graphes de terrain Problématiques Dynamique Modélisation génération de graphes réalistes (i.e. ayant les propriétés observées) motivations : approches formelles, simulation, explication état de l art : taille, densité, distances : facile degrés : consensus, modèles bien maîtrisés densité locale : pas de consensus 17/49 Clémence Magnien Graphes, réseaux et internet 17/49

Notions de graphes Graphes de terrain Problématiques Dynamique Algorithmique problèmes spécifiques problèmes classiques à revisiter restrictions en espace tirer parti des propriétés observées résultats approchés souvent suffisants algorithmique empirique / expérimentale renouveau algorithmique 18/49 Clémence Magnien Graphes, réseaux et internet 18/49

Notions de graphes Graphes de terrain Problématiques Dynamique Algorithmique problèmes spécifiques problèmes classiques à revisiter restrictions en espace tirer parti des propriétés observées résultats approchés souvent suffisants algorithmique empirique / expérimentale renouveau algorithmique 18/49 Clémence Magnien Graphes, réseaux et internet 18/49

Notions de graphes Graphes de terrain Problématiques Dynamique Et la dynamique? (Tous) les graphes de terrain sont dynamiques Ajout et suppression au fil du temps de nœuds de liens 19/49 Clémence Magnien Graphes, réseaux et internet 19/49

Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain informatique : internet, web, pair-à-pair, usages, etc sciences sociales : collaboration, amitié, contacts sexuels, échanges, économie, etc biologie : cerveau, gènes, protéines, écosystèmes, etc linguistique : synonymie, co-occurrence, etc transport : routier, aérien, électrique, etc etc, etc 20/49 Clémence Magnien Graphes, réseaux et internet 20/49

Notions de graphes Graphes de terrain Problématiques Dynamique Prise en compte de la dynamique Problématiques pour les graphes de terrain Mesure Analyse Modélisation Algorithmique 21/49 Clémence Magnien Graphes, réseaux et internet 21/49

Notions de graphes Graphes de terrain Problématiques Dynamique Prise en compte de la dynamique Problématiques pour les graphes de terrain Mesure Analyse Modélisation Algorithmique Dynamique nouvelles questions 21/49 Clémence Magnien Graphes, réseaux et internet 21/49

Notions de graphes Graphes de terrain Problématiques Dynamique But du cours Illustrer les questions liées à l étude de la dynamique Pas encore de réponses! S appuyer sur deux cas concrets : topologie de l internet trafic sur l internet 22/49 Clémence Magnien Graphes, réseaux et internet 22/49

Topologie physique de l Internet Routeurs Câbles 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Topologie physique de l Internet Plus d informations Multiplier Les destinations ( 1 million) Les sources ( quelques dizaines) Processus coûteux et long Dynamique? 23/49 Clémence Magnien Graphes, réseaux et internet 23/49

Notre approche Vue égo-centrée Chemins entre un moniteur et des destinations Mesures périodiques 100 passes / jour plusieurs mois de mesure 24/49 Clémence Magnien Graphes, réseaux et internet 24/49

Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49

Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49

Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49

Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49

Trafic sur l internet Nos mesures Routeur à la sortie d un campus Une semaine de mesure 25/49 Clémence Magnien Graphes, réseaux et internet 25/49

Différence entre les deux cas Internet : suite de graphes Trafic : suite d événements t1 noeud1 noeud2 t2 noeud1 noeud2 t3 noeud1 noeud2 t4 noeud1 noeud2... tn noeud1 noeud2 26/49 Clémence Magnien Graphes, réseaux et internet 26/49

Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F Agréger une fenêtre temporelle 27/49 Clémence Magnien Graphes, réseaux et internet 27/49

Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F A C B E D Agréger une fenêtre temporelle 27/49 Clémence Magnien Graphes, réseaux et internet 27/49

Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F Agréger une fenêtre temporelle 27/49 Clémence Magnien Graphes, réseaux et internet 27/49

Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F A C B E D Agréger une fenêtre temporelle Taille de la fenêtre? 27/49 Clémence Magnien Graphes, réseaux et internet 27/49

Choix de la granularité? Taille de la fenêtre : trop grande : perte d informations trop petite : graphes trops petits 28/49 Clémence Magnien Graphes, réseaux et internet 28/49

Choix de la granularité? Choisir la plus petite période qui donne une régularité? Marche (?) dans certains cas : 90 80 70 60 50 40 30 20 10 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 250 160 140 120 100 80 60 40 20 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 700 200 150 600 500 400 100 300 200 50 100 0 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 0 500 1000 1500 2000 2500 3000 3500 4000 4500 28/49 Clémence Magnien Graphes, réseaux et internet 28/49

Choix de la granularité? Choisir la plus petite période qui donne une régularité? Pas dans d autres (trafic internet) 70000 70000 60000 60000 50000 50000 Nb nodes 40000 30000 Nb nodes 40000 30000 20000 20000 10000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 80000 80000 70000 70000 60000 60000 Nb nodes 50000 40000 30000 Nb nodes 50000 40000 30000 20000 20000 10000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 28/49 Clémence Magnien Graphes, réseaux et internet 28/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Analyse de la dynamique But : Comprendre, décrire Détection d événements 29/49 Clémence Magnien Graphes, réseaux et internet 29/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques Première approche : Évolution de propriétés statiques au fil du temps nombre de nœuds nombre de liens degré moyen densité clustering... 30/49 Clémence Magnien Graphes, réseaux et internet 30/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques 70000 60000 50000 Trafic internet, nombre de nœuds Nb nodes 40000 30000 20000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 30/49 Clémence Magnien Graphes, réseaux et internet 30/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques 3.5 Trafic internet, degré moyen 3 Avg deg 2.5 2 1.5 1 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 30/49 Clémence Magnien Graphes, réseaux et internet 30/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques Topologie internet, nombre de nœuds 14000 12000 10000 Nb IP 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 30/49 Clémence Magnien Graphes, réseaux et internet 30/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques Observations Des comportements différents selon les graphes Détection de certaines tendances (effet jour/nuit) Événements (?) Traitement du signal? 30/49 Clémence Magnien Graphes, réseaux et internet 30/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Autres propriétés? Distribution des degrés? Communautés? Distribution des degrés n signaux? K-S test? Communautés? 31/49 Clémence Magnien Graphes, réseaux et internet 31/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Graphes statiques : mauvaise approche? Évolution de paramètres statiques : peu d informations sur l évolution du graphe. Ex : nombre de nœuds et liens constant? 32/49 Clémence Magnien Graphes, réseaux et internet 32/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet Distribution du nombre de présences Tous les nœuds vus pendant la mesure ( 29 000) Pour chaque nœud : nombre d étapes où on l a vu Distribution 33/49 Clémence Magnien Graphes, réseaux et internet 33/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 3500 2 mois 6000 étapes 3000 2500 Nb IP 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000 Nb times seen 33/49 Clémence Magnien Graphes, réseaux et internet 33/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 2500 1 mois 3000 étapes 2000 Nb IP 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000 Nb times seen 33/49 Clémence Magnien Graphes, réseaux et internet 33/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 2 mois 6000 étapes Échelle log-log 10000 1000 Nb IP 100 10 1 1 10 100 1000 10000 Nb times seen hétérogène pas de valeur typique 33/49 Clémence Magnien Graphes, réseaux et internet 33/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 1 mois 3000 étapes Échelle log-log 10000 1000 Nb IP 100 10 1 1 10 100 1000 10000 Nb times seen hétérogène pas de valeur typique 33/49 Clémence Magnien Graphes, réseaux et internet 33/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Trafic internet 12000 10000 8000 Nb nodes 6000 4000 2000 0 0 1000 2000 3000 4000 5000 6000 7000 8000 Nb steps Similarité avec le cas précédent 34/49 Clémence Magnien Graphes, réseaux et internet 34/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Dynamique : stabilisation? Nb distinct IP Nombre de nœuds distincts observés depuis le début Topologie de l internet 30000 28000 26000 24000 22000 20000 18000 16000 14000 12000 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date nouveaux nœuds observés en permanence 35/49 Clémence Magnien Graphes, réseaux et internet 35/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Disparitions Nb distinct IP Nombre de nœuds distincts qu on ne verra plus jamais Topologie de l internet 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date Renouvellement continu des nœuds observés 36/49 Clémence Magnien Graphes, réseaux et internet 36/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 >= 2 26000 24000 22000 20000 18000 16000 14000 12000 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 >= 50 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 >= 50 >= 200 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 >= 50 >= 200 >= 1000 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence 38/49 Clémence Magnien Graphes, réseaux et internet 38/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence Triangle : Nb apparitions max(nb présences, nb absences) 38/49 Clémence Magnien Graphes, réseaux et internet 38/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence Parabole : Nombre d apparitions attendues en moyenne pour ce nombre de présences x(1 x) 38/49 Clémence Magnien Graphes, réseaux et internet 38/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence Trois classes de nœuds clignotent aléatoires majorité de stables 38/49 Clémence Magnien Graphes, réseaux et internet 38/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Évolution de l ensemble des nœuds Conclusion Intuition (renouvellement, présence,... ) Notion de comportements des nœuds Questions restantes Durée de vie,... Autres graphes comportements généraux? Comparaison à des modèles aléatoires simples? 39/49 Clémence Magnien Graphes, réseaux et internet 39/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Attachement préférentiel Idée : les nouveaux liens s attachent à des nœuds existants étudier les degrés de ces nœuds Motivation : modèle d Albert et Barábasi un nouveau nœud par étape relié à un nœud existant choisi proportionnellement à son degré Idée : les nœuds de fort degré gagnent de plus en plus de liens. 40/49 Clémence Magnien Graphes, réseaux et internet 40/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Attachement préférentiel Comparer : Les degrés dans le graphe Les degrés des extrémités des nouveaux liens 0.1 0.1 0.01 0.01 0.001 0.001 0.0001 1e 05 0.0001 1e 06 1 10 100 1000 10000 1e 05 1 10 100 1000 10000 40/49 Clémence Magnien Graphes, réseaux et internet 40/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion sur l attachement préférentiel Comportements différents de l aléatoire Avec un biais vers les forts degrés Formaliser? 41/49 Clémence Magnien Graphes, réseaux et internet 41/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Clustering dans la dynamique Idée : les nouveaux liens relient des sommets regarder si ce sont des sommets proches d 42/49 Clémence Magnien Graphes, réseaux et internet 42/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Clustering dans la dynamique Interprétation? 30000 d d moy 25000 20000 15000 10000 5000 0 0 1 2 3 4 5 42/49 Clémence Magnien Graphes, réseaux et internet 42/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion sur le clustering dans la dynamique les nouveaux liens relient des nœuds déjà proches densité locale, clustering mais de temps en temps des nœuds éloignés événement? moyen de les identifier formellement? 43/49 Clémence Magnien Graphes, réseaux et internet 43/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion sur le clustering dans la dynamique les nouveaux liens relient des nœuds déjà proches densité locale, clustering mais de temps en temps des nœuds éloignés événement? moyen de les identifier formellement? 43/49 Clémence Magnien Graphes, réseaux et internet 43/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Détection d événements Topologie de l internet Nombre de nœud par étape / par union de 5 étapes 14000 12000 10000 Nb IP 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 44/49 Clémence Magnien Graphes, réseaux et internet 44/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Détection d événements Topologie de l internet Nombre de nœud par étape / par union de 5 étapes 14000 12000 10000 Nb IP 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date pics identification d événements 44/49 Clémence Magnien Graphes, réseaux et internet 44/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? Pic valeur significativement plus grande que les autres. Moyen de les identifier formellement? 45/49 Clémence Magnien Graphes, réseaux et internet 45/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? 35 Distribution des valeurs observées Nombre de nœud par étape 30 Nb passses avec x IP 25 20 15 10 5 0 0 2000 4000 6000 8000 10000 12000 Nb IP 45/49 Clémence Magnien Graphes, réseaux et internet 45/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? 6000 Distribution cumulative des valeurs observées Nombre de nœud par étape Nb passses avec <= x IP 5000 4000 3000 2000 1000 0 0 2000 4000 6000 8000 10000 12000 Nb IP 45/49 Clémence Magnien Graphes, réseaux et internet 45/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? Distribution cumulative des valeurs observées Nombre de nœuds dans 5 étapes consécutives 6000 Nb passses avec <= x IP 5000 4000 3000 2000 1000 0 0 2000 4000 6000 8000 10000 12000 14000 Nb IP Valeurs hautes atypiques 45/49 Clémence Magnien Graphes, réseaux et internet 45/49

Graphes de terrain Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Visualisation d un événement 46/49 Clémence Magnien Graphes, réseaux et internet 46/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Événements Résumé Technique pour détécter des événements. Très dépendante Du graphe étudié De la façon de mesurer Pas adapté pour le trafic IP 47/49 Clémence Magnien Graphes, réseaux et internet 47/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Événements Résumé 80000 70000 60000 Nb nodes 50000 40000 30000 20000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 47/49 Clémence Magnien Graphes, réseaux et internet 47/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Visualisation Exemple de graphe statique Joli mais... On ne comprend rien Animer? 48/49 Clémence Magnien Graphes, réseaux et internet 48/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Visualisation Fichiers externes 48/49 Clémence Magnien Graphes, réseaux et internet 48/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion Quelques pistes, nombreuses questions Échelle de temps Évolution de l ensemble des nœuds Comportements des nœuds Détection d événements Communautés Modélisation Questions spécifiques aux applications... 49/49 Clémence Magnien Graphes, réseaux et internet 49/49

Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion Équilibrer L étude de questions spécifiques L étude de graphes spécifiques Collaborations pluridisciplinaires 49/49 Clémence Magnien Graphes, réseaux et internet 49/49