Analyse empirique et modélisation de la dynamique de la topologie de l Internet Sergey Kirgizov Directrice de thèse: Clémence Magnien Complex Networks, LIP6, (UPMC, CNRS) Paris, 12 décembre 2014
Plan 1 Introduction 2 Mesures égo-centrées 3 Modèle 4 Caractérisation de la dynamique 5 Taille du sous-graphe observable 6 Dynamique réelle et dynamique observée 7 Conclusion et perspectives 2
Introduction : l Internet, étude de la topologie de l Internet
Carte de l Internet // Barrett Lyon, 2003
Topologie au niveau IP paris.fr lip6.fr Mon ordinateur Nœuds : ordinateurs Liens : connections IP 4
Petite note historique temps 1960s ARPANET 1980s Internet 1993 Dynamics of internet routing information [Chinoy] 1997 Measurements and Analysis of End-to-End Internet Dynamics [Paxon] 1998 On routes and multicast trees in the Internet [Pansiot et Grad] 2000s de nombreux travaux sur la topologie (et la dynamique) de l Internet à grande échelle seulement quelques œuvres considèrent l échelle fine 5
Étude de la topologie de l Internet Pas de carte officielle de l Internet Une carte statique? Mesures longues et coûteuses; Biais sur la structure observée. } = Pas de carte fiable Étude de la dynamique? Tous les problèmes statiques; Répéter les mesures } = Pas si facile 6
Mesures égo-centrées : Routes entre un moniteur et plusieurs destinations fixes [Latapy, Magnien, Ouédraogo, 2011]
Vues ego-centrées d 1 d 2 m Carte complète 7
Vues ego-centrées d 1 d 2 m Routes entre un moniteur et des destinations 7
Vues ego-centrées d 1 d 2 m Une mesure par l outil tracetree [Latapy, Magnien, Ouédraogo, 2011] 7
Vues ego-centrées d 1 d 2 m Une autre mesure par l outil tracetree 7
Vues ego-centrées d 1 d 2 m Une autre mesure par l outil tracetree 7
Dynamique des vues ego-centrées d1 d2 d1 d2 d1 d2 m m m Temp Mesures périodiques rapides = étude de la dynamique 8
Caractérisation de la dynamique Mesures : M 1, M 2,..., M i,... Nombre de liens vus depuis le début : t M i i [0,t] # liens Nombre de liens IP 220000 200000 180000 160000 140000 120000 100000 80000 dernière 207 782 60000 40000 2 ème 11 149 liens 20000 1 ère 9 938 liens 0 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct Date 3000 destinations une mesure toutes les 15 minutes pendant 1 an découverte en permanence de nouveaux liens IP à une vitesse élevée 9
Causes de la dynamique observée Causes Load-balancing M L D M D Évolution du routage 10
Load-balancing vs évolution du routage Nombre de liens IP 220000 200000 180000 160000 140000 120000 100000 80000 60000 40000 pas d'évolution du routage 20000 0 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct Date 11
Load-balancing vs évolution du routage Nombre de liens IP 220000 200000 180000 160000 140000 120000 100000 80000 60000 40000 20000 0 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct Date 12
Load-balancing vs évolution du routage Nombre de liens IP 220000 200000 180000 160000 140000 120000 100000 load-balancing + évolution dynamique du structurelle routage dynamique évolution structurelle du routage + load-balancing pente 80000 60000 40000 20000 0 Sep Oct Nov Dec J an Feb Mar Apr May J un J ul Aug Sep Oct Date 13
Modèle : Load-balancing + évolution du routage
Modélisation Topologie : Graphe aléatoire (Erdős-Rényi ou configuration model) Un nœud aléatoire moniteur d nœuds aléatoires destinations Mesure : plus courts chemins (aléatoires) M L Evolution du routage : échange de liens 14
Load-balancing vs évolution du routage Nombre de liens distincts vus depuis le début de la mesure 7000 6000 load-balancing + évolution du routage Nombre de liens 5000 4000 3000 évolution du routage + load-balancing pente 2000 1000 0 500 1000 1500 2000 2500 3000 Nombre de passes 15
Caractérisation de la dynamique : la pente d évolution [Magnien, Medem, Kirgizov et Tarissan, 2013]
La pente 70000 60000 Nombre de liens 50000 40000 30000 20000 10000 y = α x + β 0 Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Date α est la pente de la partie linéaire 16
α = f (paramètres du modèle) nombre total de liens 80000 70000 m = 200 000 m = 800 000 m = 1200 000 60000 # liens 50000 40000 30000 20000 10000 0 0 500 1000 1500 2000 2500 3000 # rounds Impact du nombre total de liens Graphes Erdős Rényi (n = 100 000, d = 100, sw = 100) 17
α = f (paramètres du modèle) nombre total de destinations 120000 100000 d = 500 d = 300 d = 100 80000 # liens 60000 40000 20000 0 0 500 1000 1500 2000 2500 3000 # rounds Impact du nombre de destinations Graphes Erdős Rényi (n = 100 000, m = 200 000, sw = 100) 18
α = f (paramètres du modèle) 1 0.9 0.8 0.7 0.6 500 200 100 d Un graphe aléatoire G(n, m) avec n nœuds et m liens α 0.5 0.4 0.3 d nœuds comme destinations 0.2 0.1 0 200000 400000 600000 800000 1e+06 m 19
La taille du sous-graphe des plus courts chemins cette taille augmente avec le nombre de destinations α sous-graphe graphe = S l m 20
Impact de la taille du sous-graphe des plus courts chemins 1 0.9 0.8 500 200 100 d Un graphe aléatoire G(n, m) avec n nœuds et m liens α 0.7 0.6 0.5 0.4 0.3 0.2 0.1 d nœuds aléatoires comme destinations α K S l m 0 200000 400000 600000 800000 1e+06 m 21
Impact de la taille du sous-graphe des plus courts chemins 0.00025 0.0002 Un graphe aléatoire G(n, m) avec n nœuds et m liens α Sl 0.00015 0.0001 d nœuds aléatoires comme destinations 5e-05 0 200000 400000 600000 800000 1e+06 m α K S l m 21
Caractérisation de la dynamique Conclusion Erdős Rényi : α K S l m Power-law : α K S l m Prévoir la pente sans exécuter les simulations coûteuses Quelques comportements non linéaires et non-monotones Comparison aux mesures réelles Probabilité d un changement à la place de la pente 22
La taille du sous-graphe des plus courts chemins : 1 moniteur, 1 destination [Kirgizov et Magnien, soumis]
Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n 1)/2 arêtes est présente avec probabilité p. 1951 1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins 23
Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n 1)/2 arêtes est présente avec probabilité p. 1951 1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins u v 23
Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n 1)/2 arêtes est présente avec probabilité p. 1951 1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins u v 23
Graphes aléatoires G(n, p) est un graphe aléatoire à n sommets. Chacune des n(n 1)/2 arêtes est présente avec probabilité p. 1951 1952 Solomonoff et Rapoport 1959 Gilbert, Erdős et Rényi SPS : sous-graphe des plus courts chemins S : taille du sous-graphe des plus courts chemins u v 23
Proportion des liens qui se trouvent sur les plus courts chemins Graphe Erdős-Rényi (n = 1000). Proportion des liens sur les plus courts chemins. Tous les noeuds sont les destinations. [Guillaume et Latapy, 2005] [Blondel, Guillaume, Hendrickx et Jungers, 2007] 24
Taille moyenne de SPS dans des graphes aléatoires Fixons n p E[S] E [S] 2 20 40 60 80 0.0 0.2 0.4 0.6 0.8 1.0 p 25
Moyenne et tailles réelles de SPS Fixons n p {S} S 2 200 400 0.0 0.2 0.4 0.6 0.8 1.0 p 26
Moyenne et tailles réelles de SPS Fixons n p {S} 2 200 400 S??? Un trou? 0.0 0.2 0.4 0.6 0.8 1.0 p 26
Graphe complet : K n p = 1 K n SPS(u, v) = u v S(u, v) = 2 27
Graphe quasi-complet : K n ab p = 1 ε a K n 2 b S(u, v) = { n si {u, v} = {a, b}, 2 sinon. Si n > 3, alors il y a un trou. S 2 200 400 ici 0.0 0.2 0.4 0.6 0.8 1.0 p 28
Taille du SPS dans des graphes aléatoires S 2 200 400 0.0 0.2 0.4 0.6 0.8 1.0 p 29
Taille du SPS dans des graphes aléatoires S 2 200 400 dist=3 dist=4 dist=2 dist=1 0.0 0.2 0.4 0.6 0.8 1.0 p Y :nombre de nœuds qui sont directement liés à la fois à u et v Y B(n 2, p 2 ) 29
Taille du SPS dans des graphes aléatoires échelle logarithmique dist=2 S 2 5 10 20 50 100 500 dist=3 dist=1 1e 04 1e 03 1e 02 1e 01 1e+00 p 30
Conclusion Prévoir la taille du sous-graphe observable sans exécuter les simulations coûteuses Oscillations ont été expliquées dist(u,v) = 2 : la loi exacte dist(u,v) > 2 : une approximation de la taille attendue 31
Dynamique réelle et dynamique observée : [Kirgizov, Magnien, Tarissan, Liu, 2013] [Kirgizov et Queyroi, preprint, 2014]
α = f ( ) 70000 60000 Nombre de liens 50000 40000 30000 20000 10000 1 = 1m 25s 2 = 2m 50s 0 Sep Oct Nov Dec Jan Feb Mar Apr May Jun Jul Aug Sep Oct Date α = f ( ), où est le délai entre les mesures α( 1 ) > α( 2 ) 32
α = f ( ) Nombre de liens 70000 60000 50000 40000 30000 20000 10000 0 1 = 1m 25s 2 = 2m 50s Date Réalité A... B... C 1 A B C 2 A C A C A B C 1 2 α( 1 ) α( 2 ) 33
Situation attendue α m α m α m est la pente maximale possible 34
Autre approche. Estimation du taux de changements Changements X : Observations Y : changement pas de changement Question : estimer le taux des changements réels Poisson paramétré par λ λ X? Y 35
Estimateur ˆλ = 1 log W N, où taille de l intervalle de temps entre les observations ; W nombre d intervalles sans changement ; N nombre total d intervalles. ] E [ˆλ λ 1 2N ] lim [ˆλ E N ( ) e λ 1 = λ 36
λ estimée en fonction de ˆλ 0.04 0.06 0.08 ˆλ 0.04 0.06 0.08 0 2 4 6 8 0 2 4 6 8 Processus de Poisson Modèle avec un graphe sous-jacent Erdős-Rényi, SPS est mesurée à chaque round. 37
ˆλ d1 d2 ˆλ d1 d2 λ estimée en fonction de 0.00 0.02 0.04 0.06 0.08 0.00 0.02 0.04 0.06 0.08 0.0 0.5 1.0 1.5 2.0 ˆλ 0 50 100 150 200 250 300 Erdős-Rényi 0 50 100 150 200 250 300 Power-law 0 20 40 60 80 100 Mesures réelles ˆλ pour SPT ( m ) et SPS ( m ) séquences. 38
Estimation de λ Conclusion Processus de Poisson = estimation possible Les autres cas ouvrent des directions de la recherche future. 39
Conclusion Modèle de la dynamique de l Internet Relations entre les paramètres du modèle et les caractéristiques de la dynamique La taille du sous-graphe des plus courts chemins Estimation du taux de changements 40
Perspectives Améliorer le modèle Etude plus approfondie de la taille du sous-graphe observable Appliquer les méthodes développées à d autres réseaux 41
Merci beaucoup http://kirgizov.complexnetworks.fr/