Introduction à la Recherche en Laboratoire



Documents pareils
Rapport d activité. Mathieu Souchaud Juin 2007

Ordonnancement sous contraintes de Qualité de Service dans les Clouds

IRL : Simulation distribuée pour les systèmes embarqués

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

Architecture distribuée

Djawida DIB Master informatique, spécialité Recherche en informatique Établissement: IFSIC, Université de Rennes 1

Efficient Object Versioning for Object- Oriented Languages From Model to Language Integration

Limitations of the Playstation 3 for High Performance Cluster Computing

Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes.

Description des UE s du M2

Laboratoire 4 Développement d un système intelligent

Dimensionnement Introduction

Implémentation Matérielle des Services d un RTOS sur Circuit Reconfigurable

DG-ADAJ: Une plateforme Desktop Grid

Change the game with smart innovation

Introduction aux applications réparties

Maîtrise énergétique des centres de données

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

Iyad Alshabani SysCom - CReSTIC Université de Reims 17/02/2011 1

VISUALISATION DE NUAGES DE POINTS

Prototype de canal caché dans le DNS

Cloud computing et sécurité

Communications performantes par passage de message entre machines virtuelles co-hébergées

GRIDKIT: Pluggable Overlay Networks for Grid Computing

Administration autonome d applications réparties sur grilles

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services


Cisco Certified Network Associate

Simulation de graphes de tâches

Prise en compte des ressources dans les composants logiciels parallèles

Le e s tocka k ge g DAS,NAS,SAN

Architecture d un service de partage de données modifiables sur une infrastructure pair-à-pair

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Mesure et modélisation de l énergie logicielle

CORBA haute performance

Journée Scientifique Onera

Équilibrage Dynamique de Charge pour des Calculs Parallèles sur Cluster Linux - Une Évaluation de l Environnement AMPI.

Ordonnancement contrôlé de migrations à chaud

Journée Scientifique Onera

TOPOLOGIES des RESEAUX D ADMINISTRATION

Liste de conférences et revues Thème Com A

Quantification d incertitude et Tendances en HPC

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

Runtime. Gestion de la réactivité des communications réseau. François Trahay Runtime, LaBRI sous la direction d'alexandre Denis Université Bordeaux I

Programmation parallèle et distribuée

LICENCE : INFORMATIQUE GENERALE

Sécuristation du Cloud

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Revue d article : Dynamic Replica Placement for Scalable Content Delivery

High Performance by Exploiting Information Locality through Reverse Computing. Mouad Bahi

Programmation parallèle et distribuée (Master 1 Info )

La sécurité dans les grilles

Rencontre sur la thématique du Calcul Haute Performance - 13 juin Better Match, Faster Innovation

Installation de Joomla avec Filezilla

Le Cloud Open-Mind! Emilien Macchi

Laboratoire de Haute Sécurité. Télescope réseau et sécurité des réseaux

INF6500 : Structures des ordinateurs. Sylvain Martel - INF6500 1

Hypervision et pilotage temps réel des réseaux IP/MPLS

Mobile OGSI.NET: Grid Computing on Mobile Devices

ViSaGe. Virtualisation du Stockage dans les Grilles. Informatiques. RenPar 16, 6-8 Avril 2005 Thiebolt François

Développements algorithmiques au LIAMA et àamap en vue de l'analyse d'une scène forestière

Conception des systèmes répartis

Détection d'intrusions en environnement haute performance

Introduction à la Programmation Parallèle: MPI

Évaluation des logiciels et autres réalisations

Ebauche Rapport finale

Les environnements de calcul distribué

L art d ordonnancer. avec JobScheduler. François BAYART

Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Smart Metering et réseaux intelligents

Modélisation aléatoire en fiabilité des logiciels

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Version de novembre 2012, valable jusqu en avril 2013

Projet IGGI. Infrastructure pour Grappe, Grille et Intranet. Fabrice Dupros. CASCIMODOT - Novembre Systèmes et Technologies de l Information

Chapitre 5 : Flot maximal dans un graphe

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription

Tests de montée en charge & Haute disponibilité

Multiprogrammation parallèle générique des méthodes de décomposition de domaine

D2.2 Définition des mécanismes minimaux d un runtime tolérant aux pannes dans les infrastructures Petascale

L INRIA, institut français des STIC. (en Île-de-France) 24 septembre 2009

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Efficacité énergétique des réseaux de cœur et d accès

Figure 1a. Réseau intranet avec pare feu et NAT.

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016

Téléinformatique et télématique. Revenons aux définitions

J2SE Threads, 1ère partie Principe Cycle de vie Création Synchronisation

FAMILLE EMC RECOVERPOINT

Modules du DUT Informatique proposés pour des DCCE en 2014/2015

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Métriques de performance pour les algorithmes et programmes parallèles

Génération de code binaire pour application multimedia : une approche au vol

ARCHEOVISION. Centre de Ressources Numériques 3D. UMR 5607 du CNRS. R. Vergnieux IR-CNRS

ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE

DéSIT Démarche d ingénierie pour les Systèmes d Information Transport ambiants, sécurisés et personnalisables

Systèmes répartis. Fabrice Rossi Université Paris-IX Dauphine. Systèmes répartis p.1/49

Travaux pratiques : dépannage de la configuration et du placement des listes de contrôle d'accès Topologie

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit.

Transcription:

Introduction à la Recherche en Laboratoire Transferts de données pour le vol de travail Tristan Darricau tristan.darricau@ensimag.grenoble-inp.fr 26 mai 2014 Grenoble INP - ENSIMAG Ecadrement Frédéric Wagner Structure d accueil Equipe MOAIS Laboratoire INRIA

Introduction Plateformes de calcul De nos jours les plateformes de calcul gagnent en importance et en puissance mais sont de plus en plus hétérogènes telles que Grid 5000 1 Plusieurs approches pour la parallélisation Utilisation de bibliothèque de communication telles que MPI 2 Programmation par dataflow, comme implémenté dans Kaapi[3] 1. https ://www.grid5000.fr 2. http ://www.mcs.anl.gov/research/projects/mpi 2 / 14

1 Première partie Contexte : Vol de travail 1. Définition d un programme 2. Vol de travail 3. Problème posé

Définition d un programme Donnée Représente un élément en mémoire à un instant donné Tâche Représente un calcul Peut dépendre de données Peut produire de nouvelles données Figure: Représentation d un graphe de taches simple 4 / 14

Vol de travail[1] Principe d ordonnancement Pile locale de tâches à exécuter par processus Demande à un processus distant quand la pile est vide Figure: Illustration d un vol de travail 5 / 14

Problème posé Problème : Absence de communications globales A la différence de MPI et des autres bibliothèque de communication, l algorithme de vol de travail ne permet pas d effectuer des communication globale (broadcast), ce qui l empêche d exploiter le réseau au maximum. Objectif Pallier à cette absence de la manière la plus performante possible. 6 / 14

2 Deuxième partie Algorithme proposé 4. Principe 5. Architecture 6. Expérimentations

Principe : Découpage des données Objectif Paralléliser la récupération des données sur plusieurs hôtes distants afin d effectuer un broadcast transparent et d en approcher les performances au maximum. Découpage des données en blocs Demandes de blocs de donnée (au lieu de demander la donnée entière) 8 / 14

Architecture Les données sont liés à un hôte et non à un processus Chaque hôte exécute 2 types de processus. Des processus de calcul Ils possèdent tous une pile locale de tâches à exécuter. Ils effectuent les calculs. Un processus de communication Il effectue toutes les communications réseau et se charge donc de récupérer les tâches et données à la demande des processus de calcul. 9 / 14

Protocole de communication Figure: Exemple de communication 10 / 14

Conditions Implémentation : Utilisation de Simgrid 3, un simulateur à évènements discrets. Environnement d exécution simulé : 5 machines ayant une puissance de 1.0Gf 2 threads de calcul par machine Pas de limitations sur les liens réseau Programme simulé : Graphe de type fork and join [2] de profondeur 4 contenant environ 600 tâches et 600 données. Demande à 2 hôtes distants sélectionnés au hasard Variable : Nombre de blocs Indicateur : Temps total d exécution de la simulation. Présentation de la moyenne des temps observés sur 10 simulations. 3. http ://simgrid.gforge.inria.fr 11 / 14

Résultats Figure: Durée moyenne de la simulation en fonction du nombre de blocs 12 / 14

Conclusion Travail réalisé Simulation d une évolution de l algorithme de vol de travail Montre une réduction du temps total d exécution Perspectives Étudier l impact sur d autres indicateurs Temps de communication Volume de communication Temps de communication par tâche/donnée... Étudier l impact d autres paramètres Topologie du réseau Taille des données... 13 / 14

Bibliographie Nimar S. Arora, Robert D. Blumofe, and C. Greg Plaxton. Thread scheduling for multiprogrammed multiprocessors. In Proceedings of the Tenth Annual ACM Symposium on Parallel Algorithms and Architectures, SPAA 98, pages 119 129, New York, NY, USA, 1998. ACM. François Baccelli, William A. Massey, and Don Towsley. Acyclic fork-join queuing networks. J. ACM, 36(3) :615 642, July 1989. Thierry Gautier, Xavier Besseron, and Laurent Pigeon. Kaapi : A thread scheduling runtime system for data flow computations on cluster of multi-processors. In Proceedings of the 2007 International Workshop on Parallel Symbolic Computation, PASCO 07, pages 15 23, New York, NY, USA, 2007. ACM. 14 / 14