GPU, processeurs multi-coeurs et bio-informatique

Documents pareils

Initiation au HPC - Généralités

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Calcul intensif pour la biologie

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

État de l art des simulations multi-agents sur GPU

Quantification d incertitude et Tendances en HPC

Retour d expérience, portage de code Promes dans le cadre de l appel à projets CAPS-GENCI

Architecture des ordinateurs

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

Outil d aide au choix Serveurs Lot 4 Marché Groupement de Recherche

Rapport de stage Master 2

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Les environnements de calcul distribué

High Performance by Exploiting Information Locality through Reverse Computing. Mouad Bahi

Synthèse d'images I. Venceslas BIRI IGM Université de Marne La

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Systèmes Multi-Agents et GPGPU : état des lieux et directions pour l avenir

Contribution à la conception à base de composants logiciels d applications scientifiques parallèles.

Limitations of the Playstation 3 for High Performance Cluster Computing

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Infrastructures Parallèles de Calcul

Infrastructure de calcul du CRRI

Une bibliothèque de templates pour CUDA

Architecture des calculateurs

Exposé de Pérennisation Comission de la Recherche 26 juin 2014

Change the game with smart innovation

Hiérarchie matériel dans le monde informatique. Architecture d ordinateur : introduction. Hiérarchie matériel dans le monde informatique

Chapitre 4: Introduction au Cloud computing

Rapport d activité. Mathieu Souchaud Juin 2007

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Introduction à CUDA.

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

libérez votre innovation avec l extreme computing CEA/Philippe Stroppa

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Portage d applications sur le Cloud IaaS Portage d application

Masters informatique et MIAGE

Grid 5000 : Administration d une infrastructure distribuée et développement d outils de déploiement et d isolation réseau

Évaluation et implémentation des langages

Potentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Génération de code binaire pour application multimedia : une approche au vol

Hétérogénéité pour atteindre une consommation énergétique proportionnelle dans les clouds

Chapitre 2 : Abstraction et Virtualisation

Les mésocentres HPC àportée de clic des utilisateurs industriels

Eléments d architecture des machines parallèles et distribuées

Université Libre de Tunis

Comment rendre un site d e-commerce intelligent

Cloud Computing Enjeux stratégiques & transformationnels. Franck Besnard, Principal / Strategist, VMware

Masses de données et calcul : à l IRIT. 8 octobre 2013

Méthodologie de conception pour la virtualisation et le déploiement d applications parallèles sur plateforme reconfigurable matériellement

Aspects théoriques et algorithmiques du calcul réparti L agglomération

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1

Le cloud computing au service des applications cartographiques à haute disponibilité

Master (filière Réseau) Parcours Recherche: Systèmes Informatiques et Réseaux (RTS)

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Programmation C. Apprendre à développer des programmes simples dans le langage C

Windows 7 - Installation du client

Iyad Alshabani SysCom - CReSTIC Université de Reims 17/02/2011 1

Anticiper et prédire les sinistres avec une approche Big Data

SysFera. Benjamin Depardon

Rencontre sur la thématique du Calcul Haute Performance - 13 juin Better Match, Faster Innovation

Java à Murex: un retour d'expérience. Jean-Pierre DACHER & Craig MORRISON

Cloud Computing et Calcul Haute Performance (HPC High Performance C

Architecture de la grille

POP-Java : Parallélisme et distribution orienté objet

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La plate forme VMware vsphere 4 utilise la puissance de la virtualisation pour transformer les infrastructures de Datacenters en Cloud Computing.

Liste de conférences et revues Thème Com A

Tout savoir sur le matériel informatique

Plan du cours. Incarnations/applications du Grid Computing. Super-calcul virtuel

Retours d expériences et perspectives sur les aspects énergétiques

Introduction au calcul parallèle avec OpenCL

Elasticité logicielle pour optimiser l empreinte énergétique

Relever les défis des véhicules autonomes

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

LA MISSION D'AMD 2 L'HISTOIRE D'AMD 2014

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

Informatique. Les réponses doivent être données en cochant les cases sur la dernière feuille du sujet, intitulée feuille de réponse

TVTools Cloud Edition

Utilisation du Cloud StratusLab dans le cadre d application astroparticule à l APC

Intel Corporation Nicolas Biguet Business Development Manager Intel France

Optimisation for Cloud Computing and Big Data

Contexte et motivations Les techniques envisagées Evolution des processus Conclusion

: l IDRIS a vingt ans!

Choisir le bon ordinateur. et la bonne imprimante en avec. Les prix bas, la confiance en plus

Séminaire RGE REIMS 17 février 2011

SIGAMM/CRIMSON COMMISSION UTILISATEUR du 05/12/2014

Passage à l échelle d applications java distribuées auto-adaptatives

Master Sciences, Technologies, Santé Mention Ingénierie Mathématique Spécialité Calcul Scientifique

Perspectives en matière de portails géographiques et de 3D

Entraînement au concours ACM-ICPC

Architecture des Ordinateurs. Partie II:

Contributions à l expérimentation sur les systèmes distribués de grande taille

Transcription:

GPU, processeurs multi-coeurs et bio-informatique Jean-Stéphane Varré jean-stephane.varre@lifl.fr Equipe BONSAI Université Lille 1 - LIFL -INRIA

Qu est-ce que c est?

Le processeur (CPU)

La carte graphique Le processeur (CPU)

GPU = Graphics Processing Unit architecture dessinnée pour traiter des pixels en parallèle amélioré au fur et à mesure des années sous l impulsion de l industrie du jeu vidéo

GPU = Graphics Processing Unit un processeur dédié au traitement des images : architecture dessinnée pour traiter des pixels en parallèle amélioré au fur et à mesure des années sous l impulsion de l industrie du jeu vidéo

Particularités du GPU vis-à-vis du CPU très nombreux coeurs 240 plusieurs coeurs 2,4,8 "le GPU est au CPU ce que le supertanker est au hors-bord" Jen-Hsun Huang, Nvidia

Mais quel est le rapport entre calculer une image et ma problématique de traitement de données?

Mais quel est le rapport entre calculer une image et ma problématique de traitement de données? le point commun : exécuter le même traitement sur des données différentes

Mais quel est le rapport entre calculer une image et ma problématique de traitement de données? le point commun : exécuter le même traitement sur des données différentes GPGPU : le calcul par le GPU General Purpose GPU utiliser le processeur graphique (GPU) pour exécuter des tâches de calcul polyvalentes de science et d ingénierie

Une carte graphique...... sans sortie graphique!!!

1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8

T1 T2 T3 T4 T5 T6 T7 T8 1 2 3 4 5 6 7 8 + + + + + + + + 1 2 3 4 5 6 7 8

1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8

T1 T1 T1 T1 T2 T2 T2 T2 1 2 3 4 5 6 7 8 + + 1 2 3 4 5 6 7 8

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 + 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 + 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Vers une uniformisation des processeurs projet Intel Larabee : un CPU avec un grand nombre de coeurs a single-chip cloud computer

Que puis-je en attendre?

Evolution de la puissance GFLOPS = nombre de milliards d opérations à la seconde

chaque processeur va moins vite qu un CPU dispose de moins de mémoire mais accélération grâce au traitement en parallèle

chaque processeur va moins vite qu un CPU dispose de moins de mémoire mais accélération grâce au traitement en parallèle on peut espérer accélérer jusqu à 100 fois les traitements

avantages du GPU : la carte peut être insérée dans une machine de bureau pas besoin d infrastructure particulière coût faible désavantages du GPU : nécessite un programme adapté nécessite une machine capable de recevoir la carte

Programmer un GPU, c est facile?

Programmer un GPU, c est facile? CUDA (2006) NVidia basé sur le langage C plus aisé qu avant! OpenCL (2009) tout processeur à plusieurs coeurs nécessite un compilateur spécifique au matériel

Programmer un GPU, c est facile? plus aisé qu avant! CUDA (2006) NVidia basé sur le langage C PyCUDA/PyOpenCL OpenCL (2009) tout processeur à plusieurs coeurs nécessite un compilateur spécifique au matériel

En CUDA En OpenCL

En CUDA En OpenCL

En réalité, pas si facile... nécessite une bonne expertise en programmation nécessite une programmation proche du matériel nécessite de revisiter l algorithme difficile d obtenir un gain important

En réalité, pas si facile... nécessite une bonne expertise en programmation nécessite une programmation proche du matériel nécessite de revisiter l algorithme difficile d obtenir un gain important mais ce ne sont que les prémisses

Grille un programme déjà existant que je distribue sur différentes machines des instances du programme sont exécutées en parallèle

GPU les opérations d un programme que je distribue sur les différents coeurs du processeur Grille un programme déjà existant que je distribue sur différentes machines les instructions du programme sont exécutées en parallèle des instances du programme sont exécutées en parallèle

Grille + GPU : un mariage d avenir un programme utilisant la puissance d un GPU + distribution du programme sur différentes données sur les noeuds d une grille de GPU = doublement gagnant sur le parallélisme gain maximal

Et la bio-informatique?

GPU et bio-informatique 2005 : première application, phylogénie aujourd hui : une vingtaine d applications dans différents domaines des applications phares déjà portées : GPU-HMMER CUDA-Blast MummerGPU GPU-ClustalW Manycore high-performance computing in bioinformatics. J.-S. Varré, B. Schmidt, S. Janot and M. Giraud. 2011.

GPU-ClustalW Liu W, Schmidt B, Voss G, and Mu ller-wittig W. 2006. GPU-ClustalW: Using Graphics Hardware to Accelerate Multiple Sequence Alignment. Pages 363 374 of: IEEE International Conference on High Performance Computing (HiPC 2006)

GPU-ClustalW Liu W, Schmidt B, Voss G, and Mu ller-wittig W. 2006. GPU-ClustalW: Using Graphics Hardware to Accelerate Multiple Sequence Alignment. Pages 363 374 of: IEEE International Conference on High Performance Computing (HiPC 2006)

GPU-ClustalW Liu W, Schmidt B, Voss G, and Mu ller-wittig W. 2006. GPU-ClustalW: Using Graphics Hardware to Accelerate Multiple Sequence Alignment. Pages 363 374 of: IEEE International Conference on High Performance Computing (HiPC 2006)

GPU-ClustalW Liu W, Schmidt B, Voss G, and Mu ller-wittig W. 2006. GPU-ClustalW: Using Graphics Hardware to Accelerate Multiple Sequence Alignment. Pages 363 374 of: IEEE International Conference on High Performance Computing (HiPC 2006)

TFM-CUDA Giraud M, and Varré JS. 2009. Parallel Position Weight Matrices Algorithms. In: International Symposium on Parallel and Distributed Computing (ISPDC 2009). recherche des occurrences de sites de fixation de facteurs de transcriptions

TFM-CUDA Giraud M, and Varré JS. 2009. Parallel Position Weight Matrices Algorithms. In: International Symposium on Parallel and Distributed Computing (ISPDC 2009). recherche des occurrences de sites de fixation de facteurs de transcriptions

"CUDASW++: optimizing Smith-Waterman sequence database searches for CUDA-enabled graphics processing units, Y. Liu, D. Maskell, B. Schmidt: BMC Research Notes 2009, 2:73

Je suis convaincu, j en veux un!

BQR Université Lille 1 - Calcul intensif sur GPU Laboratoires LIFL et Painlevé a permis l achat de GPUs : des cartes dans des machines de bureau (ATI et NVidia disponibles) des GPU dans Grid5000 envie de faire un essai? venez nous voir!

plutôt bio-informaticien une formation OpenCL? plutôt bio-informaticien installation d un outil GPU? intégration dans un pipeline d analyse? plutôt bio-informaticien un logiciel à paralléliser? jean-stephane.varre@lifl.fr

plutôt bio-informaticien une formation OpenCL? plutôt bio-informaticien installation d un outil GPU? intégration dans un pipeline d analyse? plutôt bio-informaticien un logiciel à paralléliser? jean-stephane.varre@lifl.fr