Cédric Foruny 1/5 Esimaion des marices de rafics Cedric FORTUNY Direceur(s) de hèse : Jean Marie GARCIA e Olivier BRUN Laboraoire d accueil : LAAS & QoSDesign 7, av du Colonel Roche 31077 TOULOUSE Cedex 4 Eablissemen d inscripion : Universié Paul Sabaier 118, roue de narbonne 31062 TOULOUSE Cedex 9 Résumé La marice de rafic es la donnée de base de oue acivié d ingénierie de rafic ou de planificaion d un réseau IP. Pouran, elle es en général inconnue e sa mesure direce avec NeFlow a un coû prohibiif pour des réseaux d opéraeurs. L esimaion de cee marice de rafic à parir de mesures sur la charge des liens apparaî alors comme une alernaive inéressane. Les ravaux les plus récens sur ce suje considèren ous qu une informaion a priori sur le rafic ne perme pas d obenir une esimaion suffisammen précise, e qu il fau donc calibrer les modèles à parir de mesures NeFlow. Nous monrons ici que l on peu obenir des aux d erreur similaires à ceux de ces méhodes, sans surcoû supplémenaire. Mos-clés SNMP, marice de rafic, inférence, crière quadraique 1 Inroducion Dans le conexe concurreniel acuel, les opéraeurs de élécommunicaions se doiven d adaper régulièremen leurs infrasrucures IP pour faire face à la croissance du rafic, aux nouvelles exigences de qualié de service e aux impéraifs de sécurisaion. La donnée de base de l ensemble des aciviés sous-jacenes - ingéniérie de rafic, simulaion e planificaion de réseaux - es la marice de rafic du réseau, qui décri le volume de rafic enre chaque couple origine-desinaion (OD). Malheureusemen, la mesure direce de cee marice de rafic, à l aide d ouils els que NeFlow de Cisco, a un coû prohibiif pour des réseaux d opéraeurs dû à la fore consommaion CPU sur les roueurs e à un rafic de reporing imporan. Une alernaive inéressane consise alors à inférer cee marice de rafic à parir de mesures sur la charge des liens du réseau. Ces mesures son en effe facilemen disponibles, à inervalles de 5mn, à l aide du proocole SNMP. Soi L le nombre de liens, N le nombre de noeuds edges e c = N(N 1) le nombre de couples OD. Nous noerons Y = [y l ] le veceur de charge des liens, X = [x i ] le veceur des rafics OD e A = [a l,i ] L c la marice de rouage. Le veceur Y e la marice A éan connus, le problème consise à déerminer le veceur des rafics OD X el que Y = A.X i.e. y l = a l,i x i l = 1... L i=1 cforuny@laas.fr
Cédric Foruny 2/5 Malheureusemen, ce problème ne peu êre résolu el quel car il es foremen sousconrain : le nombre de liens L es en général rès inférieur au nombre de couples OD c. Il exise donc une infinié de soluions, l espace des soluions pouvan êre décri par des echniques de décomposiion en valeurs singulières. Pour esimer la marice de rafic du réseau, il fau donc inroduire de l informaion supplémenaire pour lever l indéerminaion. Cee informaion peu se présener sous la forme de corrélaions a priori : corrélaions spaiales pour la méhode de omogravié ou corrélaions emporelles pour la méhode roue change. Il semble néanmoins largemen admis que des corrélaions a priori ne permeen pas d obenir une esimaion suffisammen précise pour êre exploiée par un opéraeur. L idée exploiée par les méhodes les plus récenes consise alors à effecuer des mesures NeFlow pendan 24h sur le réseau, pour en déduire des corrélaions spaio-emporelles a poseriori enre les couples OD, corrélaions qui peuven ensuie êre exploiées les jours suivans pour esimer la marice de rafic par des echniques efficaces comme le filre de Kalman [1, 2]. Si ces echniques permeen bien de réduire considérablemen l erreur d esimaion, elles nécessien l uilisaion de NeFlow pendan4h, ce qui ne semble pas accepable à l heure acuelle pour un opéraeur. Pour un éa de l ar déaillé, on pourra consuler [1]. L objecif de ce papier es de monrer que l on peu, en exploian une invariance emporelle dans la répariion des rafics, obenir des aux d erreur similaires à ces méhodes de dernière généraion, sans surcoû supplémenaire lié à NeFlow. 2 Approche proposée Nore approche se base sur une observaion faie dans [2]. Ce aricle considère plusieurs mesures SNMP Y = [yl ] consécuives obenues à des insans = 1... T. La mesure à l insan es reliée aux rafics OD à ce insan par la relaion Y = A X. Les aueurs éudien la répariion du rafic soran d un noeud origine i au cours du emps. Cee répariion, appelée fanou, es représenée par un veceur Pi = [p ij ] j=1...n pour la mesure obenue à l insan. Le erme p ij représene la proporion de rafic soran du noeud i desiné au noeud j à l insan. Considérons alors une demande OD k e noons s(k) le noeud origine, d(k) le noeud desinaion e Es(k) le rafic oal enran au noeud s(k) sur la période (connu par des mesures SNMP). On a alors la relaion suivane : x k = p s(k),d(k) E s(k) k = 1... c La première observaion faie dans [2] es que les fanous on un profil journalier qui se reprodui rès régulièremen d un jour sur l aure. [2] exploie cee observaion en mesuran avec NeFlow les fanous sur 24 heures, pour prédire ensuie les jours suivans la marice de rafic à parir des seules mesures SNMP du rafic E i en enrée de chaque noeud i. La deuxième observaion faie dans [2], mais qui n a pas éé exploiée jusqu ici, es que ces fanous varien rès faiblemen au cours d une heure, beaucoup plus faiblemen que les rafics OD. En effe, la variaion de la demande d un couple OD d une mesure à l aure provien majoriairemen de la variaion du rafic enran au noeud origine pluô que de celle de la répariion de ce rafic enre les noeuds desinaions. Nore approche consise à exploier cee faible variaion des fanous en cherchan leurs valeurs moyennes inerprean au mieux la série de mesures sur la charge des liens. Plus précisémen, l objecif es de déerminer les paramères p i,j minimisan l erreur quadraique moyenne d esimaion Γ(p i,j ), Minimiser Γ(p i,j ) = Sous les conraines : p i,j 0 i, j e T L =1 l=1 (1 y l y l N j=1 p ij = 1 ) 2 où y l = a l,k p s(k),d(k) Es(k) i k=1 (1)
Cédric Foruny 3/5 Ce problème es convexe. Il peu êre résolu par des echniques génériques de programmaion non-linéaire : gradien projeé, méhode de Gauss-Newon ou de Levenberg-Marquard. En praique, nous avons observé une convergence rès lene de ces méhodes, y compris loin de l opimum, probablemen due à la srucure pariculière des conraines. Nous proposons dans la suie un algorihme original pour résoudre ce problème plus efficacemen. 3 Algorihme Développé La echnique développée es un algorihme d approximaions successives qui, paran d une soluion iniiale P 0, génère une suie de soluions P k qui converge vers l opimum global du problème. La soluion P 0 peu êre obenue par exemple par une iniialisaion de ype gravié [1]. Pour une iniialisaion encore plus efficace, nous avons uilisé un algorihme de ype mille-feuille, que nous ne déaillons pas ici par manque de place. Soi δ < 1. Nous définissons le voisinage de la soluion P k à l iéraion k par, p k P V (P k ij ) ssi! (u, v, w) q ij = 1..c p ij = p k ij + δ p k ij δ si ij uv e ij uw si ij = uw si ij = uv Auremen di, un voisin de la soluion P k es obenu en déplaçan du rafic d un couple OD (u, v) vers un couple OD (u, w). Ce voisinage conien N(N 1)(N 2) soluions. La soluion P k+1 à l iéraion k + 1 es obenue en minimisan le coû dans le voisinage de P k, P k+1 = argmin P V (P k )Γ(P ) La soluion P k+1 n es générée que s il exise une soluion permean de faire décroîre le coû dans le voisinage de P k. Sinon, la valeur de δ es divisée par 2. Un poin criique de ce algorihme es le calcul du coû d une soluion voisine. Il peu êre fai efficacemen en calculan la variaion de coû résulane de la variaion de δ u,v = +/ δ du paramère p u,v associé à un couple OD k, T Γ u,v = yk,l =1 l L uv yl [ ] 2(yl y l ) + yk,l avec, l L uv y k,l = δ uv a l,k E u où L uv es l ensemble des liens l emprunés par le couple OD k, i.e. els que a l,k 0. L algorihme s arrêe si le crière n évolue plus (à 10 6 près), si δ devien rop faible ( < 1e 4 N 1 ), ou si l écar relaif maximum enre les charges mesurées e les charges esimées es inférieur à 1%. 4 Résulas Plusieurs opologies, consruies e configurées avec l ouil NEST IP-MPLS de QoS Design, on éé uilisées pour valider nore approche. Nous n en considérons ici que deux : Topo1, avec N = 15 noeuds edges e L = 80 liens, e Topo2, avec N = 10 e L = 50. Pour chacune de ces opologies, nous consruisons une marice de rafic iniiale à = 0 en iran aléaoiremen les rafics OD x 0 k, k = 1... c, suivan une disribuion mulimodale p 1 N(m 1, v 1 ) + p 2 N(m 2, v 2 ) + p 3 N(m 3, v 3 ). Les valeurs uilisées son : p 1 =30%, p 2 =20%, p 3 =50% e m 1 =50000 Kbps, m 2 =10000 Kbps e m 3 =500 Kbps. Il y a donc un faceur 100 enre les gros rafics (30%) e les peis (50%). Les marices de rafic pour les insans
Cédric Foruny 4/5 = 1... T son alors générées suivan Xuv = PuvE u en uilisan des disribuions gaussiennes : Ei = N(E0 i, 0.1 E0 i ) e P uv = N(Puv, 0 pf an Puv), 0 où pf an représene le coefficien de variaion des fanous au cours des mesures. La propagaion des rafics perme évidemmen d obenir la charge des liens yl à chaque insan. Pour évaluer nore approche, nous uilisons l erreur relaive moyenne sur la marice moyenne esimée (errm), l erreur spaiale pour un rafic uv (errs uv ) e l erreur emporelle pour une mesure (errt ). errm porera sur les gros rafics qui represene plus de 80% du rafic oal, errs e errt ne iendron compe que des rafics les plus fors represenan 95% du rafic oal. errm = T =1 uv=1 (X 0 uv P uv E u ) T c errs uv = T =1 Xuv P uv Euv T =1 Xuv errt = ij=1 Xij P ij Eij Le ableau (a) de Tab.4 expose les erreurs moyennes obenues pour différens ess. On observe que si les fanous varien peu (pf an < 3%), les erreurs moyennes sur les gros rafics son souven inférieures à 10% e oujours inférieures à 15%. Quand pf an augmene, les erreurs monen jusqu à 30% car il es plus difficile de relier oues les mesures à un seul fanou moyen. Une éude plus précise des résulas sur Topo1 pour 10 mesures (cf figure (b) e (c) de Tab. 4) monre les variaions des erreurs spaiales e emporelles pour différenes valeurs de pf an. Les erreurs son bien enendues croissanes par rappor à pf an mais elles resen dans le même cadre de valeur des erreurs obenues par la echnique des fanou calibrés par NeFlow ([2]). (a) errm (%) sur les gros rafics (plus de 80% du oal) pvar(%) Topo1,T=10 Topo1,T=15 Topo1,T=20 1 6.5 4.8 3.9 2 11 8.7 6.7 3 14.5 12.1 9.6 4 18.7 15.3 12.4 5 26.9 26.5 33 pvar(%) Topo2,T=8 Topo2, T=10 Topo2, T=12 1 5.1 4.6 5 2 7.5 6.4 6.7 3 9.5 7.8 8.1 4 12.5 9.5 9.8 5 30.3 13.7 23.2 ij=1 Xij (b) Spaial Error (c) Temporal Error Topo 1 wih N = 10 edges, L = 50 links, and T = 10 mesures Topo1 wih N = 10 edges, L = 50 links, and T = 10 mesures 0.8 0.7 pvar 2% pvar 3% pvar 4% 0.16 0.15 pvar 2% pvar 3% pvar 4% 0.6 0.14 0.5 0.13 Spaial Error 0.4 0.3 Temporal Error 0.12 0.11 0.1 0.2 0.09 0.1 0.08 0 0 5 10 15 20 25 30 35 40 0.07 1 2 3 4 5 6 7 8 9 10 OD (from he bigges o he smalles) Time Inerval of mesure
Cédric Foruny 5/5 5 Conclusion e perspecives L avanage principal de l approche proposée ien dans l esimaion direce des fanous e des rafics sans aucune phase de calibrage à l aide de l ouil NeFlow. Nous monrons que cee echnique donne de bons résulas ou en évian de lourdes mesures sur le réseau. Si elle doi encore êre validée sur données réelles, elle apparaî comme une alernaive inéressane pour les opéraeurs an qu aucun ouil léger e efficace de mesure direce des rafics n exisera pas. De plus, les emps de calcul de ce algorihme (20 min pour Topo1 e T=10 e min pour Topo2 e T = 12) permeen évenuellemen un raiemen à la volée des informaions. Une perspecive à éudier es bien sûr la combinaison de nore approche avec quelques mesures NeFlow (seulemen pour un pei nombre d OD). Cee associaion pourrai donner d excellens résulas ou en évian des mesures exhausives. Références [1] Augusin Soule e Anukool Lakhina e Nina Taf e Konsanina Papagiannaki e Kave Salamaian e Anonio Nucci e Mark Crovella e Chrisophe Dio. «Traffic marices : balancing measuremens, inference and modeling». SIGMETRICS Perform. Eval. Rev., 33(1) :362 373, 2005. [2] Konsanina Papagiannaki e Nina Taf e Anukool Lakhina. «A disribued approach o measure IP raffic marices». in Inerne Measuremen Conference, p. 161 174, 2004.