Soutenance de Thèse Analyses statistiques des communications sur puce Antoine Scherrer LIP - ENS Lyon Equipe Compsys 11 décembre 26 A. Scherrer - Analyses statistiques des communications sur puce 1 / 4
Problématiques Modélisation et synthèse de trafic Trafic Internet (Partie 1) Paquets 2 1 2 4 6 8 1 Temps (s) Trafic sur puce (Partie 2) Octets 5 5 1 15 2 25 3 35 4 Temps (miliers de cycles) Outil commun Processus stochastiques A. Scherrer - Analyses statistiques des communications sur puce 2 / 4
Motivations Modélisation Synthèse Applications Conclusion Partie 1 Analyse et synthèse de trafic Internet A. Scherrer - Analyses statistiques des communications sur puce 3 / 4
Motivations Modélisation Synthèse Applications Conclusion Plan de la première partie Motivations Modèle de trafic Internet Synthèse de processus LRD non-gaussiens Applications Conclusion A. Scherrer - Analyses statistiques des communications sur puce 4 / 4
Motivations Modélisation Synthèse Applications Conclusion Motivations 7 6 5 Modélisation de trafic Caractériser la variabilité du trafic Évaluation de performance Synthèse de trafic Simulations de trafic réalistes Outil : Processus stochastiques Distribution marginale Covariance (longue-mémoire) P(X=x) Paquets log 2 S j 4 3 2 1.2.4.6.8 1 Temps (s).12.1.8.6.4.2 1 2 3 4 x 12 1 8 6 4 2 1 5 1 15 j A. Scherrer - Analyses statistiques des communications sur puce 5 / 4
Motivations Modélisation Synthèse Applications Conclusion Longue mémoire (LRD) Décroissance lente de la fonction de covariance Rafale à toute les échelles Impact important sur les performances des réseaux Pas de LRD (H =.5) LRD (H =.8) 5 5 5 5 1 15 5 5 1 15 =1 5 5 5 5 1 15 5 5 1 15 =16 5 5 5 5 1 15 5 5 1 15 =64 A. Scherrer - Analyses statistiques des communications sur puce 6 / 4
Motivations Modélisation Synthèse Applications Conclusion Plan Motivations Modèle de trafic Internet Synthèse de processus LRD non-gaussiens Applications Conclusion A. Scherrer - Analyses statistiques des communications sur puce 7 / 4
Motivations Modélisation Synthèse Applications Conclusion Trafic Internet Séries temporelles de débit agrégé Exemple : Trace Auckland IV Paquets Paquets Paquets 2 1 2 4 6 8 1 Temps (s) 2 1 2 4 6 8 1 Temps (s) 2 1 2 4 6 8 1 Temps (s) = 1ms = 5ms = 5ms A. Scherrer - Analyses statistiques des communications sur puce 8 / 4
Motivations Modélisation Synthèse Applications Conclusion Propriétés statistiques de ces traces Stationnarité Pas de changement abrupte dans la trace Marginales non-gaussiennes.25 Longue mémoire 12.2 1 P(D=x).15.1 log 2 S j 8 6.5 4 5 1 15 2 x 2 5 1 15 2 j A. Scherrer - Analyses statistiques des communications sur puce 9 / 4
Motivations Modélisation Synthèse Applications Conclusion Modèle proposé Marginales : loi Gamma Variables aléatoires positives Γ α,β + Γ α,β = Γ α+α,β cγ α,β = Γ α,β Adapté à l agrégation Covariance : FARIMA Dépendances courtes : Φ et Θ Longue mémoire : d = H 1/2 Adapté aux données P(X=x) 1.8.6.4.2 5 1 15 2 x S j 12 1 8 6 4 2 2 4 2 4 6 8 1 j A. Scherrer - Analyses statistiques des communications sur puce 1 / 4
Motivations Modélisation Synthèse Applications Conclusion Trace Auckland IV-d1 (WAN) = 1ms = 1ms = 4ms.12.25.1 P(X=x).1.8.6.4.2 P(X=x).2.15.1.5 P(X=x).8.6.4.2 1 2 3 4 x 12 5 1 15 2 x Distribution de probabilités 12 12 1 2 3 4 5 6 7 x 1 1 1 log 2 S j 8 6 log 2 S j 8 6 log 2 S j 8 6 4 4 4 2 1 5 1 15 j 2 1 5 1 15 j Covariance 2 1 5 1 15 j A. Scherrer - Analyses statistiques des communications sur puce 11 / 4
Motivations Modélisation Synthèse Applications Conclusion Plan Motivations Modèle de trafic Internet Synthèse de processus LRD non-gaussiens Applications Conclusion A. Scherrer - Analyses statistiques des communications sur puce 12 / 4
Motivations Modélisation Synthèse Applications Conclusion Définition du problème Objectif Obtenir des traces de trafic synthétiques Que sait-on faire? Synthétiser un processus Gaussien ayant une covariance donnée Obtenir un processus Y suivant différentes lois à partir de processus gaussiens X i : Y = F (X i ) Que veut-on obtenir? Un processus Y suivant une distribution marginale et une covariance données A. Scherrer - Analyses statistiques des communications sur puce 13 / 4
Motivations Modélisation Synthèse Applications Conclusion Méthode proposée 1 La relation Y = F (X i ) nous permet d établir une relation entre γ X et γ Y γ X (k) = g ( γ Y (k) ) γ Γ (k) Exemple pour la loi gamma (Γ) : γ X (k) = αβ 2 2 On peut alors synthétiser des processus indépendants gaussiens X i de covariance γ X (k) 3 L application de la fonction F donnera le processus Y recherché Distributions implémentées Gamma, exponentielle, χ 2, pareto, lognormale et uniforme A. Scherrer - Analyses statistiques des communications sur puce 14 / 4
Motivations Modélisation Synthèse Applications Conclusion Résultats = 1ms = 1ms = 4ms P(X=x).12.1.8.6.4.2 P(X=x).25.2.15.1.5 P(X=x) 9 x 1 3 8 7 6 5 4 3 2 1 1 2 3 4 x 12 5 1 15 2 25 x Distribution de probabilités 12 1 2 3 4 5 6 x 12 1 1 1 log 2 (S j ) 8 6 log 2 (S j ) 8 6 log 2 (S j ) 8 6 4 4 4 2 1 5 1 15 j 2 1 5 1 15 j Covariance 2 1 5 1 15 j A. Scherrer - Analyses statistiques des communications sur puce 15 / 4
Motivations Modélisation Synthèse Applications Conclusion Plan Motivations Modèle de trafic Internet Synthèse de processus LRD non-gaussiens Applications Conclusion A. Scherrer - Analyses statistiques des communications sur puce 16 / 4
Motivations Modélisation Synthèse Applications Conclusion Détection d anomalie Objectif Détecter une anomalie dans le trafic Proposition Modèle multi-résolution Estimation par blocs Détection des changements Résultats + Détection des attaques mais pas des variations légitimes Niveau d agrégation initial faible α 5 15 4 1 5 3 2 1 1 2 3 4 5 2 4 6 8 log ( ) 2 A. Scherrer - Analyses statistiques des communications sur puce 17 / 4
Motivations Modélisation Synthèse Applications Conclusion Plan Motivations Modèle de trafic Internet Synthèse de processus LRD non-gaussiens Applications Conclusion A. Scherrer - Analyses statistiques des communications sur puce 18 / 4
Motivations Modélisation Synthèse Applications Conclusion Conclusion de la première partie Contributions Modèle de trafic Internet (Gamma-Farima) Procédure de synthèse de processus à longue mémoire non-gaussiens Technique de détection d anomalie Papier de synthèse à paraître dans IEEE TDSC Collaborations Laboratoire de physique de l ENS de Lyon (équipe SISYPHE) Laboratoire LAAS (Toulouse) Projet MetroSec Perspectives Extension de la méthode de synthèse Utilisation du générateur de trafic A. Scherrer - Analyses statistiques des communications sur puce 19 / 4
Partie 2 Analyse et synthèse des communications sur puce A. Scherrer - Analyses statistiques des communications sur puce 2 / 4
Contexte Système sur puce (SoC) Assemblage de composants sur une même puce de silicium Complexité croissante Temps de simulation très long Environnement SocLib GPP GPP ASIP ASIC Interconnexion I/O A. Scherrer - Analyses statistiques des communications sur puce 21 / 4
Réseaux sur puce (NoC) Pourquoi des réseaux sur puce? Pour satisfaire les demandes des IPs Pour diminuer la consommation électrique Passage en commutation de paquets GPP GPP ASIP ASIC GPP GPP ASIP Liens Arbitre Bus partagé I/O Commutateurs I/O ASIC ASIC Notre objectif : Évaluation et prototypage du NoC A. Scherrer - Analyses statistiques des communications sur puce 22 / 4
Plan Introduction Génération de trafic sur puce Génération de TG Segmentation Autres résultats Conclusion A. Scherrer - Analyses statistiques des communications sur puce 23 / 4
Plan Introduction Génération de trafic sur puce Génération de TG Segmentation Autres résultats Conclusion A. Scherrer - Analyses statistiques des communications sur puce 24 / 4
Génération de trafic sur puce Notre approche : remplacer les composants par des générateurs de trafic (TG) MIPS MIPS TG TG TTY TTY Pourquoi? Évaluation flexible des performances Composant non-disponible Gain de temps de simulation A. Scherrer - Analyses statistiques des communications sur puce 25 / 4
Différents types de TG Ad-hoc - Écrit par un concepteur + Très précis Pas adapté aux processeurs TG déterministe - Rejeu (Loghi 24, Mahadevan 25) + Précis Limité par la trace de référence TG stochastique (Wiklund 24, Lahiri 21) + Modélisation Précis en moyenne Notre approche + Multi-phase + Stochastique avec LRD + CABA A. Scherrer - Analyses statistiques des communications sur puce 26 / 4
Plan Introduction Génération de trafic sur puce Génération de TG Segmentation Autres résultats Conclusion A. Scherrer - Analyses statistiques des communications sur puce 27 / 4
Flot de génération (1) Obtention de la trace de référence Simulation rapide Extraction au trafic intrinsèque d un composant Méthodologie Plateforme SocLib Application Processor IP MIPS r3 Simulation sans interconnexion VCI Cache Point de mesure Trace A. Scherrer - Analyses statistiques des communications sur puce 28 / 4
Flot de génération (2) Configuration semi-automatique du générateur de trafic Nombreux développements open-source Analyse Compression Ajustement Trace TG Config MPTG Config Trace Segmentation Parser Sélection du modèle A. Scherrer - Analyses statistiques des communications sur puce 29 / 4
Flot de génération (3) Évaluation de performances Validation du flot Dimensionnement des FIFOs Méthodologie Plateforme SocLib MPTG IP SystemC Plateforme TG TG SocGen Validation Simulation Exploration architecturale Evaluation Performance TTY A. Scherrer - Analyses statistiques des communications sur puce 3 / 4
Flot complet Simulation de référence Configuration MPTG Evaluation de performance Application Trace Processor IP Simulation sans interconnexion Compression Analyse Ajustement Segmentation Sélection du modèle Parser Trace TG Config MPTG Config MPTG Simulation IP SystemC SocGen Exploration architecturale Plateforme Evaluation Performance Environnement complet pour le prototypage de NoC Intègre l état de l art Ajoute de nouvelles approches A. Scherrer - Analyses statistiques des communications sur puce 31 / 4
Plan Introduction Génération de trafic sur puce Génération de TG Segmentation Autres résultats Conclusion A. Scherrer - Analyses statistiques des communications sur puce 32 / 4
Principe Objectif Identifier des phases de trafic stationnaires Octets 5 5 1 15 2 25 3 35 4 Temps (miliers de cycles) Approche inspirée par les travaux de Calder et al. Évaluation de performance des architectures de processeur Notre algorithme [CODES 26] 1 Découper la trace en blocs 2 Calculer des statistiques sur chaque bloc 3 Partitionner ces points en k ensembles (k-means) Les blocs ayant un comportement statistique proche forment une phase A. Scherrer - Analyses statistiques des communications sur puce 33 / 4
Exemple : MP3 Trace 3 phases 4 phases 5 phases A. Scherrer - Analyses statistiques des communications sur puce 34 / 4
Plan Introduction Génération de trafic sur puce Génération de TG Segmentation Autres résultats Conclusion A. Scherrer - Analyses statistiques des communications sur puce 35 / 4
Simulations effectuées Applications multimédia Images : M-JPEG (Multi-thread), JPEG, JPEG 2 Audio : MP3 Vidéo : MPEG-2 Plateformes Collecte Validation MIPS TG TG TTY A. Scherrer - Analyses statistiques des communications sur puce 36 / 4
Résultats Temps de simulation [ASAP 26] Le gain n est pas important (x2) La valeur ajoutée est dans la souplesse de l outil Validation [ASAP 26] Génération multi-phase stochastique Longue-mémoire [NOC 27 (en cours de relecture)] Pas de présence systématique Impact sur le NoC fonction du protocole de bas niveau A. Scherrer - Analyses statistiques des communications sur puce 37 / 4
Plan Introduction Génération de trafic sur puce Génération de TG Segmentation Autres résultats Conclusion A. Scherrer - Analyses statistiques des communications sur puce 38 / 4
Conclusion Contributions Mise au point et développement d un environnement intégré de génération de trafic sur puce Algorithme de découpage en phase Validation de l approche par des simulations dans SocLib Évaluation de l impact de la longue mémoire sur les NoC Perspectives Étudier le trafic issue d une IP dédiée Intégrer le flot dans le projet SocLib Étude de cas de dimensionnement de NoC A. Scherrer - Analyses statistiques des communications sur puce 39 / 4
Conclusion générale Idée principale défendue Modélisation aléatoire de traces de trafic Méthodologie Allez-retour constant entre théorie et pratique Perspectives en cours Utilisation du générateur de trafic Internet au LAAS Intégration du flot MPTG dans SocLib Modélisation de la mobilité des individus (ARES) A. Scherrer - Analyses statistiques des communications sur puce 4 / 4
A. Scherrer - Analyses statistiques des communications sur puce