Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012. Better Match, Faster Innovation



Documents pareils
Rapport d activité. Mathieu Souchaud Juin 2007

La Forge INRIA : bilan et perspectives. Hervé MATHIEU - 11 mai 2010

Communications performantes par passage de message entre machines virtuelles co-hébergées

Aspects théoriques et algorithmiques du calcul réparti L agglomération

Journée Scientifique Onera

Journée Scientifique Onera

Figure 3.1- Lancement du Gambit

Multiprogrammation parallèle générique des méthodes de décomposition de domaine

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab

Masses de données et calcul : à l IRIT. 8 octobre 2013

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

Processus d Informatisation

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

Limitations of the Playstation 3 for High Performance Cluster Computing

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

Résolution de systèmes linéaires par des méthodes directes

CORBA haute performance

libérez votre innovation avec l extreme computing CEA/Philippe Stroppa

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Qu est-ce que ArcGIS?

Initiation au HPC - Généralités

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Perspectives pour l entreprise. Desktop Cloud. JC Devos IBM IT Architect jdevos@fr.ibm.com IBM Corporation

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

Architecture matérielle des systèmes informatiques

4.2 Unités d enseignement du M1

Happy birthday ZSet High performance computing dans ZSet

Quantification d incertitude et Tendances en HPC

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

UNIFIED D TA. architecture nouvelle génération pour une restauration garantie (assured recovery ) que les données soient sur site ou dans le cloud

Programmes des classes préparatoires aux Grandes Ecoles

Arrêt sur image. La simulation numérique au programme de l industrie

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

TRAVAUX DE RECHERCHE DANS LE

Hétérogénéité pour atteindre une consommation énergétique proportionnelle dans les clouds

Rapport de stage Master 2

Technologie SDS (Software-Defined Storage) de DataCore

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

100% Swiss Cloud Computing

Métriques de performance pour les algorithmes et programmes parallèles

CloudBees AnyCloud : Valeur, Architecture et Technologie cloud pour l entreprise

Présentation de la Grille EGEE

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

agility made possible

Virtualisation sous Linux L'age de raison. Daniel Veillard

Garantir une meilleure prestation de services et une expérience utilisateur optimale

Informatique. Les réponses doivent être données en cochant les cases sur la dernière feuille du sujet, intitulée feuille de réponse

Arcserve unifié UNE SOLUTION UNIQUE

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

Dynamic Computing Services solution de backup. White Paper Stefan Ruckstuhl

UNIVERSITÉ D ORLÉANS ÉCOLE DOCTORALE MIPTIS MATHÉMATIQUES, INFORMATIQUE, PHYSIQUE THÉORIQUE ET INGÉNIEURIE DES SYSTÈMES. THÈSE présentée par :

MABioVis. Bio-informatique et la

Exercices Active Directory (Correction)

DOSSIER SOLUTION Amélioration de la planification de la capacité à l aide de la gestion des performances applicatives

SQL Server 2012 et SQL Server 2014

W4 - Workflow La base des applications agiles

Architecture des ordinateurs

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Asynchronisme : Cadres continu et discret

Jean-François Boulicaut & Mohand-Saïd Hacid

Les apports de l informatique. Aux autres disciplines

PLM Software. Les 10 raisons d opter pour FEMAP. Des réponses pour l industrie. Velocity Series

BIG DATA en Sciences et Industries de l Environnement

Fiche Technique. Cisco Security Agent

Hébergement MMI SEMESTRE 4

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

Livre blanc. La sécurité de nouvelle génération pour les datacenters virtualisés

CESI Bases de données

Logiciel Libre Cours 3 Fondements: Génie Logiciel

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Solution de gestion des journaux pour le Big Data

Leçon 1 : Les principaux composants d un ordinateur

Symantec Endpoint Protection Fiche technique

Mettre en place une infrastructure Web nouvelle génération avec Drupal et Acquia

Chapitre 2 : Abstraction et Virtualisation

PHP et le Cloud. All rights reserved. Zend Technologies, Inc.

Runtime. Gestion de la réactivité des communications réseau. François Trahay Runtime, LaBRI sous la direction d'alexandre Denis Université Bordeaux I

Topologie du web - Valentin Bourgoin - Méthodes agiles & SCRUM

Brochure Datacenter. Novell Cloud Manager. Création et gestion d un cloud privé. (Faire du cloud une réalité)

Eric Bertrand 08/11/06 Maître de conférence 1

Utilisation du Cloud StratusLab dans le cadre d application astroparticule à l APC

Infrastructures Parallèles de Calcul

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Évaluation et implémentation des langages

Efficacité énergétique des réseaux de cœur et d accès

UNIFIED. Nouvelle génération d'architecture unifiée pour la protection des données D TA. dans des environnements virtuels et physiques PROTECTION

Regard sur l informatique en nuage

Programmation Linéaire - Cours 1

LA RECONNAISSANCE VOCALE INTEGREE

Tests de SlipStream sur les plateformes et : vers la. Vers la fédération du Cloud computing

Transcription:

Better Match, Faster Innovation Rencontre sur la thématique du Calcul Haute Performance - 13 juin 2012 Meeting on the theme of High Performance Computing

TABLE DES MATIÈRES Qu est ce qu un imatch? STI (Service Tranfert et Innovation) Partitionner et distribuer les données Les solveurs numériques Les solveurs directs Les solveurs hybrides Optimiser le temps et les ressources Notes personnelles p 3 p 4 p 5 p 8 p 9 p 13 p 15 p 21 2

imatch Que signifie imatch? Inria Match Making Technologies Quels objectifs pour les imatch? Les imatch ont pour but de favoriser des rencontres ciblées entre nos équipes de recherche et le monde industriel. À partir d une thématique choisie, ces manifestations permettent d apporter de la visibilité aux offres technologiques portées par ces équipes afin de «matcher» ces offres avec des usages et des applications potentiels au travers de rendez-vous privés. À l issue de ces rendez-vous, des actions de collaboration ou de transfert peuvent ainsi être initiées. 3

STI Inria Bordeaux - Sud-Ouest Que signifie STI? Service Transfert et Innovation du Centre de Recherche Inria Bordeaux - Sud-Ouest Quelles missions pour le STI? Le transfert des compétences et des résultats de la recherche vers l industrie est l une des missions fondamentales d Inria. Par conséquent l institut encourage et soutient les projets de transfert issus de ses équipes. Pour cela Inria a mis en place une organisation et des outils pour stimuler le transfert et accompagner les porteurs de projet. Contacts : Responsable des partenariats et des projets d innovation : Salvatore Spinello - 05.24.57.40.07 salvatore.spinello@inria.fr Chargée des partenariats et des projets d innovation Transfert : Marianne Lamour - 05.24.57.41.23 marianne.lamour@inria.fr Chargée des projets européens : Alison Piastri - 05.24.57.41.29 alison.piastri@inria.fr 4

PARTITIONNER ET DISTRIBUER LES DONNÉES Les problèmes numériques à traiter sont de plus en plus grands et atteignent maintenant plusieurs dizaines de millions d inconnues. Avec l évolution des machines, les architectures sont désormais devenues trop complexes pour se passer d outils de partitionnement génériques. Il est également très important de pouvoir partitionner le graphe de manière équilibrée. Des logiciels dédiés au partitionnement des problèmes numériques et à la distribution des calculs en parallèle sur l ensemble des moyens disponibles dans les machines se sont donc développés. Quelles technologies proposons-nous? SCOTCH Software package for graph and mesh/ hypergraph partitioning, graph clustering, and sparse matrix ordering PT-SCOTCH A tool for efficient parallel graph ordering PaMPA Parallel Mesh Partitioning and Adaptation 5

SCOTCH PT-SCOTCH Que signifie SCOTCH? «Software package for graph and mesh/ hypergraph partitioning, graph clustering, and sparse matrix ordering» Que signifie PT-SCOTCH? «A tool for efficient parallel graph ordering» À quoi servent SCOTCH et PT-SCOTCH? Scotch est un partitionneur de graphes. Il permet d optimiser le découpage d un problème, modélisé par un graphe, en un ensemble de sous-problèmes les plus indépendants possibles et de tailles équivalentes. Ces sous-problèmes peuvent ensuite être résolus en parallèle. Scotch calcule des partitionnements sur machine séquentielle. PT-Scotch calcule des partitionnements sur machine parallèle. Contact : François Pellegrini Équipe-projet BACCHUS Inria, CNRS, Université de Bordeaux 6

PaMPA Que signifie PaMPA? «Parallel Mesh Partitioning and Adaptation» À quoi sert PaMPA? PaMPA est une bibliothèque logicielle offrant des fonctions de haut niveau pour manipuler des maillages en parallèle. Il facilite et rend transparentes les tâches de repartitionnement des maillages, de redistribution des données, de calcul des recouvrements entre sous-domaines, et de mise à jour entre sous-domaines des valeurs du maillage. PaMPA gère la redistribution de maillages en parallèle en s interfaçant avec le logiciel de partitionnement parallèle PT-Scotch. Contacts : François Pellegrini, Cecile Dobrzynski Équipe-projet BACCHUS Inria, CNRS, Université de Bordeaux 7

LES SOLVEURS NUMÉRIQUES La modélisation de phénomènes physiques ou biologiques et leur simulation numérique se traduisent mathématiquement par des algorithmes et des systèmes d équations complexes, linéaires ou non linéaires. On peut par exemple modéliser les turbulences autour de l aile d un avion, le comportement de vagues face à un modèle de côte, mais aussi l évolution de maladies comme des tumeurs cancéreuses, en prenant en compte une multitude de paramètres différents. Ces systèmes d équations peuvent être visualisés sous forme de matrices, dont les typologies sont variables et caractéristiques des types de problèmes adressés : ils comportent plus ou moins d éléments nuls. Qu est-ce qu un solveur? Un solveur numérique permet de résoudre numériquement des problèmes d algèbre linéaires ou non linéaires plus ou moins complexes et avec un plus ou moins grand nombre de données. Quels types de problèmes résolvent-ils? Les problèmes peuvent être creux (ils contiennent beaucoup d éléments nuls ou denses (la complexité du problème est intrinsèque et liée uniquement au nombre d inconnues). Des problèmes «creux» peuvent également être qualifiés de plus ou moins difficiles selon la nature du problème adressé. 8

Les solveurs directs Les solveurs peuvent être directs : ils résolvent tout le problème avec une méthode dite «exacte». On utilisera préférentiellement un solveur direct pour résoudre des problèmes linéaires. Un solveur direct aura l avantage d effectuer des calculs réputés pour leur robustesse. Quelles technologies proposons-nous? PaStiX Parallel Sparse matrix package MUMPS MUltifrontal Massively Parallel sparse direct Solver EIGEN C++ template library for linear algebra : matrices, vectors, numerical solvers, and related algorithms 9

PaStiX Que signifie PaStiX? «Parallel Sparse matrix package» À quoi sert PaStiX? PaStiX est un solveur direct qui s utilise pour résoudre des systèmes numériquement difficiles, en parallèle. En gardant les qualités intrinsèques d une méthode directe (robustesse), il met l accent sur la réduction des ressources mémoires. Ceci lui permet de résoudre des problèmes de très grande taille. Il résout ainsi un point bloquant qui est le surcoût mémoire lié au parallélisme. PaStiX s adapte aux différentes architectures : ses algorithmes lui permettent par exemple de s affranchir du problème des hétérogénéités des clusters/grappes. Très évolutif, PaStiX est particulièrement bien adapté aux serveurs multicœurs, et dans des travaux récents avec l équipe qui développe StarPU, il permet d utiliser les processeurs des cartes graphiques (GPU). Contact : Pierre Ramet Équipe-projet BACCHUS Inria, CNRS, Université de Bordeaux 10

MUMPS Que signifie MUMPS? «a MUltifrontal Massively Parallel sparse direct Solver» À quoi sert MUMPS? MUMPS est un solveur direct développé au sein d Inria, le CERFACS, le CNRS, l ENS- Lyon, l INPT et l université de Bordeaux. Il s agit d un solveur pour plates-formes de calcul parallèle à mémoire distribuée ou non. Il est caractérisé par un grand nombre de fonctionnalités (résolution multi-second membre, out-of-core, calcul de noyau...). De plus, Il est reconnu pour sa très grande robustesse numérique due à la combinaison de mécanismes de pivotage partiel et d algorithmes de prétraitements numériques sophistiques. Cet ensemble de fonctionnalités le rend assez unique. Contacts : Abdou Guermouche - Université de Bordeaux Jean-Yves L Excellent - Équipe-projet ROMA Inria, ENS Lyon, Université Claude Bernard (Lyon 1), CNRS, CITI 11

EIGEN Que signifie EIGEN? «C++ template library for linear algebra : matrices, vectors, numerical solvers, and related algorithms» À quoi sert EIGEN? Eigen est une bibliothèque C++ générique pour le calcul matriciel dont le but est de fournir une suite d outils mathématiques portables, et faciles d utilisation et de diffusion. Eigen est optimisée à la fois pour les matrices de petites dimensions (robotique, graphisme, vision), et pour les matrices denses et creuses de grandes tailles. L API fournie permet une prise en main et un développement rapide, tandis que l absence de dépendances à des bibliothèques tierces facilite l installation et la distribution des logiciels basés sur Eigen. Eigen offre donc une solution intermédiaire entre des logiciels comme MatLab qui sont limités au prototypage, et les bibliothèques spécialisées issues du monde du HPC destinées aux experts et super-calculateurs. En outre, Eigen offre la possibilité aux utilisateurs experts d exploiter de manière transparente des bibliothèques tierces telles que Intel MKL, PaStiX, SuiteSparse, etc. Contact : Gael Guennebaud Équipe-projet MANAO Inria, CNRS, Université de Bordeaux 12

Les solveurs hybrides Les solveurs peuvent être itératifs : ils résolvent le problème de manière approchée, ou hybrides (ils résolvent le problème en décomposant le problème global en une multitude de petits sous-problèmes qui peuvent être résolus par des solveurs directs). On utilisera préférentiellement des solveurs hybrides pour des problèmes non linéaires. Les solveurs hybrides permettent de contrôler la précision de résolution du problème en fonction de celle des données fournies en entrée. Quelle technologie proposons-nous? HIPS Hierarchical Iterative Parallel Solver 13

HIPS Que signifie HIPS? «Hierarchical Iterative Parallel Solver» À quoi sert HIPS? Hips est un solveur hybride «à la carte» qui permet de résoudre des systèmes d équations linéaires creux avec le degré de précision et l engagement en temps/ mémoire nécessaire et souhaité par l utilisateur. Hips est la solution adéquate pour résoudre des systèmes qui combinent plusieurs difficultés : très gros n (nombre d équations dans le système >1M), maillage en 3D et grande complexité. Il est hybride : selon les besoins du problème, Hips fait appel à des méthodes de résolution directes ou itératives. Contact : Pierre Ramet Équipe-projet BACCHUS Inria, CNRS, Université de Bordeaux 14

OPTIMISER LE TEMPS ET LES RESSOURCES Ces dernières années, l évolution du matériel a été telle que chaque machine est maintenant dotée d architectures qui permettent au calcul de s exécuter en parallèle sur plusieurs composants. Quelles sont les possibilités? Utiliser une grappe d ordinateurs, un cloud... Utiliser les multiples cœurs de sa machine. Utiliser les accélérateurs (ex GPU). Quelle sont les problématiques?. Utiliser les ressources proposées par un cloud au meilleur rapport performance/ coût en fonction du problème adressé.. Connaître et optimiser l architecture de sa machine pour réaliser un calcul plus rapidement ou de manière plus robuste.. Analyser le comportement des usages du web. Quelles technologies proposons-nous? HWLOC Portable HardWare LOCality StarPU A runtime system for heterogeneous parallel machines OPTOCLOUD Optimisation des coûts dans les clouds SPONGE Simulation de Propagation d ONdes en GÉophysique WUB-Analyst Web User Behavior Analyst 15

HWLOC Que signifie HWLOC? «portable HardWare LOCality» À quoi sert HWLOC? HWLOC découvre la topologie de vos ordinateurs et la représente de manière hiérarchique et portable (quel que soit le système d exploitation, sa version, ou l architecture matérielle). L utilisateur peut visualiser la topologie dans une interface graphique et la manipuler logiciellement pour consulter le nombre de processeurs et de cœurs, la quantité de mémoire ou de mémoire cache, les périphériques (GPUs, cartes infiniband, carte réseau,...), ainsi que leurs localités respectives, leurs interconnexions, et les ressources qu ils partagent. L objectif principal d HWLOC est d aider les applications à obtenir des informations facilement compréhensibles sur l architecture des machines modernes de calcul afin de les exploiter de manière plus adaptée et efficace. Contact : Brice Goglin - Équipe-projet RUNTIME Inria, CNRS, Université de Bordeaux 16

StarPU Que signifie StarPU? «A runtime system for heterogeneous parallel machines» À quoi sert StarPU? StarPU est un support d exécution qui fonctionne sur machine hétérogène. Il abstrait la machine pour la rendre plus facile à programmer, quel que soit son nombre de CPUs et GPUs (lieux où peuvent s exécuter les calculs sur la machine). Avant d utiliser StarPU, une application doit être parallélisée sous forme de tâches. Les dépendances et besoins en communication entre tâches doivent être décrits. La topologie de la machine est décrite automatiquement grâce à HWLOC. StarPU va pouvoir décider où positionner les tâches et dans quel ordre afin d optimiser le temps de calcul, en exploitant en même temps tous les CPUs et tous les GPUs. Contact : Samuel Thibault - Équipe-projet RUNTIME Inria, CNRS, Université de Bordeaux 17

OPTOCLOUD Que signifie OPTOCLOUD? «Optimisation des coûts dans les clouds» À quoi sert OPTOCLOUD? Avec l apparition des clouds et leur exploitation par des sociétés dédiées, des offres de service différentes et difficilement comparables - hormis par les prix - sont disponibles pour les entreprises qui souhaitent délocaliser leurs calculs. OPTOCLOUD permet d optimiser le ratio coût/efficacité des moyens à la fois pour les fournisseurs et leurs clients. Pour les fournisseurs : le fournisseur s engage sur une qualité de service. Il doit gérer une marge de ressources disponibles : le nombre de machines disponibles ainsi que celles à allumer pour réaliser un calcul. Nous leur proposons de les accompagner pour améliorer la gestion de cette marge et l optimisation du coût «ressources utilisées» par rapport à la productivité. Pour les utilisateurs : dans le contexte des clouds, dans le cas où plusieurs implémentations sont disponibles (ayant des exigences en mémoire, calcul, disque, bande passante différentes), notre expertise en optimisation combinatoire permet à l utilisateur de choisir la meilleure solution parmi les offres des fournisseurs de clouds. Contact : Olivier Beaumont - Équipe-projet CEPAGE Inria, CNRS, Université de Bordeaux 18

WUB-Analyst Que signifie WUB-Analyst? «Web User Behavior Analyst» À quoi sert WUB-Analyst? Les enregistrements de comportements d utilisateurs se présentent sous la forme de fichiers comportant de gros volumes de données : chaque site web visité et la fréquence avec laquelle ils sont visités peuvent être enregistrés. La technologie WUB-Analyst permet de fournir des résumés du comportement des utilisateurs. Contact : Sofian Maabout - Équipe-projet CEPAGE Inria, CNRS, Université de Bordeaux 19

SPONGE Que signifie SPONGE? «Simulation de Propagation d ONdes en GÉophysique» À quoi sert SPONGE? Les méthodes d imagerie sismiques reposent généralement sur de nombreuses simulations de propagations d ondes dans des milieux très hétérogènes. La taille du domaine de calcul ainsi que les hétérogénéités nécessitent l utilisation de maillages comportant plusieurs millions de degrés de liberté. Il est donc crucial d optimiser les méthodes de simulation. Pour simuler la propagation des ondes dans des milieux géophysiques complexes, il faut résoudre un très grand système linéaire à chaque pas de temps. Pour diminuer au maximum les coûts de stockage et de calcul, l équipe de recherche Magique 3D développe des méthodes numériques qui permettent d obtenir des systèmes facilement inversibles et de calculer très rapidement les produits matrices-vecteurs. Contacts : Julien Diaz, Hélène Barucq Équipe-projet MAGIQUE 3D Inria, CNRS, Université de Pau 20

NOTES PERSONNELLES 21

www.imatch.bordeaux.inria.fr