Graphes, réseaux et internet Clémence Magnien clemence.magnien@lip6.fr LIP6 CNRS et Université Pierre et Marie Curie (UPMC Paris 6) avec Matthieu Latapy, Frédéric Ouédraogo, Guillaume Valadon, Assia Hamzaoui,... 1/49 Clémence Magnien Graphes, réseaux et internet 1/49
Outline 1 Graphes de terrain Notions de graphes Graphes de terrain Problématiques Dynamique 2 3 Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation 2/49 Clémence Magnien Graphes, réseaux et internet 2/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain informatique : internet, web, pair-à-pair, usages, etc sciences sociales : collaboration, amitié, contacts sexuels, échanges, économie, etc biologie : cerveau, gènes, protéines, écosystèmes, etc linguistique : synonymie, co-occurrence, etc transport : routier, aérien, électrique, etc etc, etc réseaux de relations contextes très différents 3/49 Clémence Magnien Graphes, réseaux et internet 3/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes graphe = n nœuds, m liens capture la structure, la topologie pas de meilleur dessin 4/49 Clémence Magnien Graphes, réseaux et internet 4/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes graphe = n nœuds, m liens capture la structure, la topologie Graphe dessin : un graphe, plusieurs dessins G = a, b, c, d ; a b, a c, a d, b c, b d, c d pas de meilleur dessin 4/49 Clémence Magnien Graphes, réseaux et internet 4/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes densité du graphe, δ = probabilité d existence de tout lien = à quel point tout le monde est lié δ = 2m n(n 1) 5/49 Clémence Magnien Graphes, réseaux et internet 5/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes densité du graphe, δ = probabilité d existence de tout lien = à quel point tout le monde est lié δ = 2m n(n 1) n = 4, m = 4, δ = 8 12 = 0.66.. 5/49 Clémence Magnien Graphes, réseaux et internet 5/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes degré d un nœud v, d o (v) = nombre de liens de v degré moyen d o = 2m n 6/49 Clémence Magnien Graphes, réseaux et internet 6/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes degré d un nœud v, d o (v) = nombre de liens de v degré moyen d o = 2m n degrés : 2, 2, 3, 1 ; degré moyen 2 6/49 Clémence Magnien Graphes, réseaux et internet 6/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes degré d un nœud v, d o (v) = nombre de liens de v degré moyen d o = 2m n degrés : 2, 2, 3, 1 ; degré moyen 2 distribution : 1 1, 2 2, 3 1 6/49 Clémence Magnien Graphes, réseaux et internet 6/49
Notions de graphes Graphes de terrain Problématiques Dynamique Un mot sur les distributions deux grandes catégories log décroissance exponentielle vs décroissance polynômiale Poisson, Gaussienne,... vs Zipf, loi de puissance,... homogène vs hétérogène tailles vs salaires moyennne vs exposant log des conséquences importantes 7/49 Clémence Magnien Graphes, réseaux et internet 7/49
Notions de graphes Graphes de terrain Problématiques Dynamique Un mot sur les distributions deux grandes catégories log décroissance exponentielle vs décroissance polynômiale Poisson, Gaussienne,... vs Zipf, loi de puissance,... homogène vs hétérogène tailles vs salaires moyennne vs exposant log des conséquences importantes 7/49 Clémence Magnien Graphes, réseaux et internet 7/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes chemin de u à v = suite de liens u...v un chemin de longueur 3 8/49 Clémence Magnien Graphes, réseaux et internet 8/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes chemin de u à v = suite de liens u...v distance d(u, v) = longueur d un plus court chemin un plus court chemin ; longueur 2 distance = 2 8/49 Clémence Magnien Graphes, réseaux et internet 8/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes chemin de u à v = suite de liens u...v distance d(u, v) = longueur d un plus court chemin diamètre = plus grande distance diamètre = 2 8/49 Clémence Magnien Graphes, réseaux et internet 8/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes coefficient de clustering cc(v) = probabilité que deux voisins de v soient reliés = densité locale 9/49 Clémence Magnien Graphes, réseaux et internet 9/49
Notions de graphes Graphes de terrain Problématiques Dynamique Propriétés de graphes coefficient de clustering cc(v) = probabilité que deux voisins de v soient reliés = densité locale coefficients de clustering : 1, 1, 1 3, indéfini 9/49 Clémence Magnien Graphes, réseaux et internet 9/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) non-trivial? 10/49 Clémence Magnien Graphes, réseaux et internet 10/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) non-trivial? 10/49 Clémence Magnien Graphes, réseaux et internet 10/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) non-trivial? 10/49 Clémence Magnien Graphes, réseaux et internet 10/49
Notions de graphes Graphes de terrain Problématiques Dynamique Comparaison à l aléatoire graphe aléatoire (Erdös, Rényi) = choisi uniformément dans l ensemble graphe type, représentatif des propriétés significatives, d autres moins 11/49 Clémence Magnien Graphes, réseaux et internet 11/49
Notions de graphes Graphes de terrain Problématiques Dynamique Comparaison à l aléatoire graphe aléatoire (Erdös, Rényi) = choisi uniformément dans l ensemble graphe type, représentatif de terrain aléatoire densité faible faible distances faibles faibles degrés hétérogènes homogènes clustering fort faible des propriétés significatives, d autres moins 11/49 Clémence Magnien Graphes, réseaux et internet 11/49
Notions de graphes Graphes de terrain Problématiques Dynamique Comparaison à l aléatoire graphe aléatoire (Erdös, Rényi) = choisi uniformément dans l ensemble graphe type, représentatif de terrain aléatoire degrés prescrits densité faible faible faible distances faibles faibles faibles degrés hétérogènes homogènes hétérogènes clustering fort faible faible des propriétés significatives, d autres moins 11/49 Clémence Magnien Graphes, réseaux et internet 11/49
Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). 1 1 1 0 0,2 0,4 0 0,2 0,4 0 0,1 0,2 aléatoire loi de puissance Internet 12/49 Clémence Magnien Graphes, réseaux et internet 12/49
Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). 1 1 1 0 0,2 0,4 0 0,2 0,4 0 0,1 aléatoire loi de puissance Internet 0,2 12/49 Clémence Magnien Graphes, réseaux et internet 12/49
Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). ALEATOIRE panne attaque attaque SCALE FREE panne 12/49 Clémence Magnien Graphes, réseaux et internet 12/49
Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : robustesse pannes = suppression de nœuds au hasard. attaque = suppression de nœuds choisis (stratégie). Très résistant aux pannes. Sensible aux attaques. Importance de la topologie sous-jacente. 12/49 lémence Magnien Graphes, réseaux et internet 12/49
Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : communautés zones denses faiblement interconnectées structure hiérarchique recouvrements calcul? 13/49 Clémence Magnien Graphes, réseaux et internet 13/49
Notions de graphes Graphes de terrain Problématiques Dynamique Conséquence : communautés zones denses faiblement interconnectées structure hiérarchique recouvrements calcul? 13/49 Clémence Magnien Graphes, réseaux et internet 13/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) et des problématiques communes mesure et métrologie analyse modélisation algorithmique 14/49 Clémence Magnien Graphes, réseaux et internet 14/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain la plupart des graphes de terrain ont des propriétés non-triviales en commun [WS98] propriétés en commun : distance moyenne et diamètre faibles (petit-monde) degrés hétérogènes (loi de puissance, scale-free) densité globale faible vs densité locale forte (clustering) et des problématiques communes mesure et métrologie analyse modélisation algorithmique 14/49 Clémence Magnien Graphes, réseaux et internet 14/49
Notions de graphes Graphes de terrain Problématiques Dynamique Mesure graphe réel opération de mesure vue obtenue que peut on dire sur l objet réel à partir de la mesure? impact sur les propriétés observées? impact des propriétés sur la vue? mesures ciblant certaines propriétés?... 15/49 lémence Magnien Graphes, réseaux et internet 15/49
Notions de graphes Graphes de terrain Problématiques Dynamique Mesure et Métrologie? inférence graphe réel opération de mesure vue obtenue que peut on dire sur l objet réel à partir de la mesure? impact sur les propriétés observées? impact des propriétés sur la vue? mesures ciblant certaines propriétés?... 15/49 lémence Magnien Graphes, réseaux et internet 15/49
Notions de graphes Graphes de terrain Problématiques Dynamique Analyse décrire extraire de l information pertinente statistiques structure densité degrés densité locale corrélations... encore beaucoup de manques 16/49 Clémence Magnien Graphes, réseaux et internet 16/49
Notions de graphes Graphes de terrain Problématiques Dynamique Analyse décrire extraire de l information pertinente statistiques structure densité degrés densité locale corrélations... encore beaucoup de manques 16/49 Clémence Magnien Graphes, réseaux et internet 16/49
Notions de graphes Graphes de terrain Problématiques Dynamique Modélisation génération de graphes réalistes (i.e. ayant les propriétés observées) motivations : approches formelles, simulation, explication état de l art : taille, densité, distances : facile degrés : consensus, modèles bien maîtrisés densité locale : pas de consensus 17/49 Clémence Magnien Graphes, réseaux et internet 17/49
Notions de graphes Graphes de terrain Problématiques Dynamique Modélisation génération de graphes réalistes (i.e. ayant les propriétés observées) motivations : approches formelles, simulation, explication état de l art : taille, densité, distances : facile degrés : consensus, modèles bien maîtrisés densité locale : pas de consensus 17/49 Clémence Magnien Graphes, réseaux et internet 17/49
Notions de graphes Graphes de terrain Problématiques Dynamique Algorithmique problèmes spécifiques problèmes classiques à revisiter restrictions en espace tirer parti des propriétés observées résultats approchés souvent suffisants algorithmique empirique / expérimentale renouveau algorithmique 18/49 Clémence Magnien Graphes, réseaux et internet 18/49
Notions de graphes Graphes de terrain Problématiques Dynamique Algorithmique problèmes spécifiques problèmes classiques à revisiter restrictions en espace tirer parti des propriétés observées résultats approchés souvent suffisants algorithmique empirique / expérimentale renouveau algorithmique 18/49 Clémence Magnien Graphes, réseaux et internet 18/49
Notions de graphes Graphes de terrain Problématiques Dynamique Et la dynamique? (Tous) les graphes de terrain sont dynamiques Ajout et suppression au fil du temps de nœuds de liens 19/49 Clémence Magnien Graphes, réseaux et internet 19/49
Notions de graphes Graphes de terrain Problématiques Dynamique Graphes de terrain informatique : internet, web, pair-à-pair, usages, etc sciences sociales : collaboration, amitié, contacts sexuels, échanges, économie, etc biologie : cerveau, gènes, protéines, écosystèmes, etc linguistique : synonymie, co-occurrence, etc transport : routier, aérien, électrique, etc etc, etc 20/49 Clémence Magnien Graphes, réseaux et internet 20/49
Notions de graphes Graphes de terrain Problématiques Dynamique Prise en compte de la dynamique Problématiques pour les graphes de terrain Mesure Analyse Modélisation Algorithmique 21/49 Clémence Magnien Graphes, réseaux et internet 21/49
Notions de graphes Graphes de terrain Problématiques Dynamique Prise en compte de la dynamique Problématiques pour les graphes de terrain Mesure Analyse Modélisation Algorithmique Dynamique nouvelles questions 21/49 Clémence Magnien Graphes, réseaux et internet 21/49
Notions de graphes Graphes de terrain Problématiques Dynamique But du cours Illustrer les questions liées à l étude de la dynamique Pas encore de réponses! S appuyer sur deux cas concrets : topologie de l internet trafic sur l internet 22/49 Clémence Magnien Graphes, réseaux et internet 22/49
Topologie physique de l Internet Routeurs Câbles 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Topologie physique de l Internet Mesure : Agrégation de chemins 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Topologie physique de l Internet Plus d informations Multiplier Les destinations ( 1 million) Les sources ( quelques dizaines) Processus coûteux et long Dynamique? 23/49 Clémence Magnien Graphes, réseaux et internet 23/49
Notre approche Vue égo-centrée Chemins entre un moniteur et des destinations Mesures périodiques 100 passes / jour plusieurs mois de mesure 24/49 Clémence Magnien Graphes, réseaux et internet 24/49
Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49
Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49
Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49
Trafic sur l internet Qui communique avec qui? quelles machines Capture sur un routeur 25/49 Clémence Magnien Graphes, réseaux et internet 25/49
Trafic sur l internet Nos mesures Routeur à la sortie d un campus Une semaine de mesure 25/49 Clémence Magnien Graphes, réseaux et internet 25/49
Différence entre les deux cas Internet : suite de graphes Trafic : suite d événements t1 noeud1 noeud2 t2 noeud1 noeud2 t3 noeud1 noeud2 t4 noeud1 noeud2... tn noeud1 noeud2 26/49 Clémence Magnien Graphes, réseaux et internet 26/49
Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F Agréger une fenêtre temporelle 27/49 Clémence Magnien Graphes, réseaux et internet 27/49
Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F A C B E D Agréger une fenêtre temporelle 27/49 Clémence Magnien Graphes, réseaux et internet 27/49
Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F Agréger une fenêtre temporelle 27/49 Clémence Magnien Graphes, réseaux et internet 27/49
Événements : comment construire un graphe? 1 A B 2 B C 2 D E 3 A E 4 A B.... n X F A C B E D Agréger une fenêtre temporelle Taille de la fenêtre? 27/49 Clémence Magnien Graphes, réseaux et internet 27/49
Choix de la granularité? Taille de la fenêtre : trop grande : perte d informations trop petite : graphes trops petits 28/49 Clémence Magnien Graphes, réseaux et internet 28/49
Choix de la granularité? Choisir la plus petite période qui donne une régularité? Marche (?) dans certains cas : 90 80 70 60 50 40 30 20 10 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 250 160 140 120 100 80 60 40 20 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 700 200 150 600 500 400 100 300 200 50 100 0 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 0 500 1000 1500 2000 2500 3000 3500 4000 4500 28/49 Clémence Magnien Graphes, réseaux et internet 28/49
Choix de la granularité? Choisir la plus petite période qui donne une régularité? Pas dans d autres (trafic internet) 70000 70000 60000 60000 50000 50000 Nb nodes 40000 30000 Nb nodes 40000 30000 20000 20000 10000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 80000 80000 70000 70000 60000 60000 Nb nodes 50000 40000 30000 Nb nodes 50000 40000 30000 20000 20000 10000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 28/49 Clémence Magnien Graphes, réseaux et internet 28/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Analyse de la dynamique But : Comprendre, décrire Détection d événements 29/49 Clémence Magnien Graphes, réseaux et internet 29/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques Première approche : Évolution de propriétés statiques au fil du temps nombre de nœuds nombre de liens degré moyen densité clustering... 30/49 Clémence Magnien Graphes, réseaux et internet 30/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques 70000 60000 50000 Trafic internet, nombre de nœuds Nb nodes 40000 30000 20000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 30/49 Clémence Magnien Graphes, réseaux et internet 30/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques 3.5 Trafic internet, degré moyen 3 Avg deg 2.5 2 1.5 1 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 30/49 Clémence Magnien Graphes, réseaux et internet 30/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques Topologie internet, nombre de nœuds 14000 12000 10000 Nb IP 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 30/49 Clémence Magnien Graphes, réseaux et internet 30/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Paramètres pour les graphes statiques Observations Des comportements différents selon les graphes Détection de certaines tendances (effet jour/nuit) Événements (?) Traitement du signal? 30/49 Clémence Magnien Graphes, réseaux et internet 30/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Autres propriétés? Distribution des degrés? Communautés? Distribution des degrés n signaux? K-S test? Communautés? 31/49 Clémence Magnien Graphes, réseaux et internet 31/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Graphes statiques : mauvaise approche? Évolution de paramètres statiques : peu d informations sur l évolution du graphe. Ex : nombre de nœuds et liens constant? 32/49 Clémence Magnien Graphes, réseaux et internet 32/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet Distribution du nombre de présences Tous les nœuds vus pendant la mesure ( 29 000) Pour chaque nœud : nombre d étapes où on l a vu Distribution 33/49 Clémence Magnien Graphes, réseaux et internet 33/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 3500 2 mois 6000 étapes 3000 2500 Nb IP 2000 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000 Nb times seen 33/49 Clémence Magnien Graphes, réseaux et internet 33/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 2500 1 mois 3000 étapes 2000 Nb IP 1500 1000 500 0 0 1000 2000 3000 4000 5000 6000 Nb times seen 33/49 Clémence Magnien Graphes, réseaux et internet 33/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 2 mois 6000 étapes Échelle log-log 10000 1000 Nb IP 100 10 1 1 10 100 1000 10000 Nb times seen hétérogène pas de valeur typique 33/49 Clémence Magnien Graphes, réseaux et internet 33/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Topologie de l internet 1 mois 3000 étapes Échelle log-log 10000 1000 Nb IP 100 10 1 1 10 100 1000 10000 Nb times seen hétérogène pas de valeur typique 33/49 Clémence Magnien Graphes, réseaux et internet 33/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présence des nœuds Trafic internet 12000 10000 8000 Nb nodes 6000 4000 2000 0 0 1000 2000 3000 4000 5000 6000 7000 8000 Nb steps Similarité avec le cas précédent 34/49 Clémence Magnien Graphes, réseaux et internet 34/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Dynamique : stabilisation? Nb distinct IP Nombre de nœuds distincts observés depuis le début Topologie de l internet 30000 28000 26000 24000 22000 20000 18000 16000 14000 12000 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date nouveaux nœuds observés en permanence 35/49 Clémence Magnien Graphes, réseaux et internet 35/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Disparitions Nb distinct IP Nombre de nœuds distincts qu on ne verra plus jamais Topologie de l internet 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date Renouvellement continu des nœuds observés 36/49 Clémence Magnien Graphes, réseaux et internet 36/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 >= 2 26000 24000 22000 20000 18000 16000 14000 12000 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 >= 50 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 >= 50 >= 200 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Influence des nœuds vus une seule fois? Nb distinct IP 28000 26000 24000 22000 20000 18000 16000 14000 12000 >= 2 >= 10 >= 50 >= 200 >= 1000 10000 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 37/49 Clémence Magnien Graphes, réseaux et internet 37/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence 38/49 Clémence Magnien Graphes, réseaux et internet 38/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence Triangle : Nb apparitions max(nb présences, nb absences) 38/49 Clémence Magnien Graphes, réseaux et internet 38/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence Parabole : Nombre d apparitions attendues en moyenne pour ce nombre de présences x(1 x) 38/49 Clémence Magnien Graphes, réseaux et internet 38/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Présences vs apparitions 2500 2000 Nb apparitions 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Nb passes presence Trois classes de nœuds clignotent aléatoires majorité de stables 38/49 Clémence Magnien Graphes, réseaux et internet 38/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Évolution de l ensemble des nœuds Conclusion Intuition (renouvellement, présence,... ) Notion de comportements des nœuds Questions restantes Durée de vie,... Autres graphes comportements généraux? Comparaison à des modèles aléatoires simples? 39/49 Clémence Magnien Graphes, réseaux et internet 39/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Attachement préférentiel Idée : les nouveaux liens s attachent à des nœuds existants étudier les degrés de ces nœuds Motivation : modèle d Albert et Barábasi un nouveau nœud par étape relié à un nœud existant choisi proportionnellement à son degré Idée : les nœuds de fort degré gagnent de plus en plus de liens. 40/49 Clémence Magnien Graphes, réseaux et internet 40/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Attachement préférentiel Comparer : Les degrés dans le graphe Les degrés des extrémités des nouveaux liens 0.1 0.1 0.01 0.01 0.001 0.001 0.0001 1e 05 0.0001 1e 06 1 10 100 1000 10000 1e 05 1 10 100 1000 10000 40/49 Clémence Magnien Graphes, réseaux et internet 40/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion sur l attachement préférentiel Comportements différents de l aléatoire Avec un biais vers les forts degrés Formaliser? 41/49 Clémence Magnien Graphes, réseaux et internet 41/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Clustering dans la dynamique Idée : les nouveaux liens relient des sommets regarder si ce sont des sommets proches d 42/49 Clémence Magnien Graphes, réseaux et internet 42/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Clustering dans la dynamique Interprétation? 30000 d d moy 25000 20000 15000 10000 5000 0 0 1 2 3 4 5 42/49 Clémence Magnien Graphes, réseaux et internet 42/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion sur le clustering dans la dynamique les nouveaux liens relient des nœuds déjà proches densité locale, clustering mais de temps en temps des nœuds éloignés événement? moyen de les identifier formellement? 43/49 Clémence Magnien Graphes, réseaux et internet 43/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion sur le clustering dans la dynamique les nouveaux liens relient des nœuds déjà proches densité locale, clustering mais de temps en temps des nœuds éloignés événement? moyen de les identifier formellement? 43/49 Clémence Magnien Graphes, réseaux et internet 43/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Détection d événements Topologie de l internet Nombre de nœud par étape / par union de 5 étapes 14000 12000 10000 Nb IP 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date 44/49 Clémence Magnien Graphes, réseaux et internet 44/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Détection d événements Topologie de l internet Nombre de nœud par étape / par union de 5 étapes 14000 12000 10000 Nb IP 8000 6000 4000 2000 0 26/05 02/06 09/06 16/06 23/06 30/06 07/07 14/07 21/07 28/07 04/08 Date pics identification d événements 44/49 Clémence Magnien Graphes, réseaux et internet 44/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? Pic valeur significativement plus grande que les autres. Moyen de les identifier formellement? 45/49 Clémence Magnien Graphes, réseaux et internet 45/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? 35 Distribution des valeurs observées Nombre de nœud par étape 30 Nb passses avec x IP 25 20 15 10 5 0 0 2000 4000 6000 8000 10000 12000 Nb IP 45/49 Clémence Magnien Graphes, réseaux et internet 45/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? 6000 Distribution cumulative des valeurs observées Nombre de nœud par étape Nb passses avec <= x IP 5000 4000 3000 2000 1000 0 0 2000 4000 6000 8000 10000 12000 Nb IP 45/49 Clémence Magnien Graphes, réseaux et internet 45/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Identificiation formelle des pics? Distribution cumulative des valeurs observées Nombre de nœuds dans 5 étapes consécutives 6000 Nb passses avec <= x IP 5000 4000 3000 2000 1000 0 0 2000 4000 6000 8000 10000 12000 14000 Nb IP Valeurs hautes atypiques 45/49 Clémence Magnien Graphes, réseaux et internet 45/49
Graphes de terrain Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Visualisation d un événement 46/49 Clémence Magnien Graphes, réseaux et internet 46/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Événements Résumé Technique pour détécter des événements. Très dépendante Du graphe étudié De la façon de mesurer Pas adapté pour le trafic IP 47/49 Clémence Magnien Graphes, réseaux et internet 47/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Événements Résumé 80000 70000 60000 Nb nodes 50000 40000 30000 20000 10000 0 16/10 17/10 18/10 19/10 20/10 Date 21/10 22/10 23/10 24/10 47/49 Clémence Magnien Graphes, réseaux et internet 47/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Visualisation Exemple de graphe statique Joli mais... On ne comprend rien Animer? 48/49 Clémence Magnien Graphes, réseaux et internet 48/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Visualisation Fichiers externes 48/49 Clémence Magnien Graphes, réseaux et internet 48/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion Quelques pistes, nombreuses questions Échelle de temps Évolution de l ensemble des nœuds Comportements des nœuds Détection d événements Communautés Modélisation Questions spécifiques aux applications... 49/49 Clémence Magnien Graphes, réseaux et internet 49/49
Analyse de graphes statiques Nouvelles propriétés Détection d événements Visualisation Conclusion Équilibrer L étude de questions spécifiques L étude de graphes spécifiques Collaborations pluridisciplinaires 49/49 Clémence Magnien Graphes, réseaux et internet 49/49