Parallélisme et bioinformatique



Documents pareils
Parallélisme et bioinformatique

Systèmes et traitement parallèles

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

Les environnements de calcul distribué

Eléments d architecture des machines parallèles et distribuées

Initiation au HPC - Généralités

Les mésocentres HPC àportée de clic des utilisateurs industriels

Infrastructures Parallèles de Calcul

Evolution des technologies et émergence du cloud computing Drissa HOUATRA, Orange Labs Issy

AMBASSADE DE FRANCE EN ALLEMAGNE SERVICE POUR LA SCIENCE ET LA TECHNOLOGIE

Cloud Computing : Généralités & Concepts de base

SysFera. Benjamin Depardon

MODULE I1. Plan. Introduction. Introduction. Historique. Historique avant R&T 1ère année. Sylvain MERCHEZ

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

HPC by OVH.COM. Le bon calcul pour l innovation OVH.COM

Plan du cours. Incarnations/applications du Grid Computing. Super-calcul virtuel

Cycle Innovation & Connaissance 12 petit déjeuner Mardi 15 mai Cloud Computing & Green IT : nuages ou éclaircies?

Rapport 2014 et demande pour Portage de Méso-NH sur Machines Massivement Parallèles du GENCI Projet 2015 : GENCI GEN1605 & CALMIP-P0121

Le Cloud Computing L informatique de demain?

Les lières. MSc in Electronics and Information Technology Engineering. Ingénieur civil. en informatique. MSc in Architectural Engineering

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Bigdata et Web sémantique. les données + l intelligence= la solution

Hébergement MMI SEMESTRE 4

Informatique UE 102. Jean-Yves Antoine. Architecture des ordinateurs et Algorithmique de base. UFR Sciences et Techniques Licence S&T 1ère année

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Entrez dans l ère du Numérique Très Haut Débit

Masses de données et calcul : à l IRIT. 8 octobre 2013

Chapitre 4: Introduction au Cloud computing

Architecture des ordinateurs

Accès aux données Sentinelles

LES SOLUTIONS OPEN SOURCE RED HAT

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

3 ème journée des utilisateurs de l archivage

Calcul intensif pour la biologie

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Le GRAND CONSEIL de la République et canton de Genève décrète ce qui suit :

CA ARCserve r16 devance Symantec Backup Exec 2012

Infrastructure de calcul du CRRI

Un exemple de cloud au LUPM : Stratuslab

Le calcul intensif chez PSA Peugeot Citroën. TERATEC 28 juin 2011

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

L'écosystème du calcul intensif et des données : la vision du CNRS. M. Daydé. Directeur du Comité d Orientation pour le Calcul Intensif au CNRS

LES APPROCHES CONCRÈTES POUR LE DÉPLOIEMENT D INFRASTRUCTURES CLOUD AVEC HDS & VMWARE

INITIATIVE HPC-PME Calcul haute performance pour les PME

PACKZ System Requirements. Version: Version: Copyright 2015, PACKZ Software GmbH. 1

Assemblée générale Aristote

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud

Tutoriel Cloud IFB - Initiation -

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

L Internet des objets

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Ecole Mohammadia d Ingénieurs Systèmes Répartis Pr. Slimane Bah, ing. PhD G. Informatique Semaine 24

Cours 13. RAID et SAN. 2004, Marc-André Léger

Services à la recherche: Data Management et HPC *

Contributions à l expérimentation sur les systèmes distribués de grande taille

Retours d expériences et perspectives sur les aspects énergétiques

La tête dans les nuages

KIT DE DÉMARRAGE SHAREPOINT DANS MICROSOFT AZURE

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

Big Data et la santé

Le supercalculateur Tera 100 Premier supercalculateur pétaflopique européen

Détection d'intrusions en environnement haute performance

ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Les générations d'ordinateurs de 1945 à nos jours

CH.3 SYSTÈMES D'EXPLOITATION

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Tout savoir sur le matériel informatique

Master (filière Réseau) Parcours Recherche: Systèmes Informatiques et Réseaux (RTS)

Tout bénéfice! Marier CAO et Intranet pour le meilleur de la performance à moindre coût. Andreas Blaszczyk, Harsh Karandikar, Giovanni Palli

CA ARCserve r16 devance Veeam Backup and Replication 6.5 dans le domaine de la protection virtuelle

Plan de la conférence. Virtualization. Définition. Historique. Technique. Abstraction matérielle

Université Paris Saclay De quoi parle t-on?

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

Grid Technology. ActiveMQ pour le grand collisionneur de hadrons (LHC) Lionel Cons Grid Technology Group Information Technology Department

Creation de Contenus Numériques pour

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Contrôle Non Destructif : Implantation d'algorithmes sur GPU et multi-coeurs. Gilles Rougeron CEA/LIST Département Imagerie Simulation et Contrôle

Proposition d une architecture pour ebay, en mettant l accent sur les notions de scalabilité, de résilience, et de tolérance aux pannes.

libérez votre innovation avec l extreme computing CEA/Philippe Stroppa

Perspectives en matière de portails géographiques et de 3D

Windows Server Chapitre 1: Découvrir Windows Server 2008

Présentation Internet

Quantification d incertitude et Tendances en HPC

Architectures informatiques dans les nuages

Introduction aux systèmes temps réel

& collaborative workspace. the new multitouch CONNECT & SHARE COLLABORATE BETTER & DECIDE FASTER CREATE & INNOVATE SAVE & TAKE THE DATA WITH YOU

L expertise en sécurité pour toutes les entreprises! Passez à la vitesse supérieure. Kaspersky. avec. Open Space Security

Open-cloud, où en est-on?

Les défis statistiques du Big Data

VMware : De la Virtualisation. au Cloud Computing

SUGARCRM Sugar Open Source Guide d Installation de French SugarCRM Open Source Version 4.2

La gestion du poste de travail en 2011 : Panorama des technologies

Cloud Computing et Calcul Haute Performance (HPC High Performance C

Parallels Transporter Lisez-moi

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

ELO Office / Pro Les avantages : Archivage et gestion documentaire

Transcription:

Master EGOIST - Rouen

Plan Généralités

Plan Généralités 1 Généralités 2

Généralités

La science informatique n est pas plus la science des ordinateurs que l astronomie n est celle des télescopes (ou la biologie celle des séquenceurs)

informatique : science des modèles computables

Pourquoi le parallélisme? Principe effectuer à plusieurs ce qu un seul aurait du mal à faire comprendre et analyser le travail à effectuer, connaître et analyser les ressources disponibles, diviser le travail en tâches, répartir ces tâches entre les ressources de manière adéquate.

Pourquoi le parallélisme? Objectif : calculer, traiter les données... plus vite, plus gros et différemment Calculs numériques. Vérification/validation de modèles. Simulations.

Qui utilise le parallélisme? milieux de la recherche académique et industrielle milieux économiques et industriels société civile, services publics vous!

Milieux de la recherche et du développement Infrastructure à plusieurs niveaux : internationale : Globus, BOINC (Berkeley Open Infrastructure for Network Computing), etc. nationale : centre de calcul CINES, IDRIS, CEA, etc. régionale : CALMIP, CICG, CRIHAN, etc. locale : laboratoires, réseaux de stations, grappes de PCs (ID-IMAG). Applications : physique nucléaire, mécanique céleste, biologie moléculaire, chimie de synthèse, mathématiques, informatique, télécommunications, histoire, géographie, sociologie...

Physique des particules Large Hadron Collider principe : générer des collisions entre particules (événements) enregistrer puis traiter ces informations, volumes extraordinaires : 15 Petaoctets par an, utilisation de 10000 machines réparties dans la monde entier

Milieux économiques et industriels industrie pharmaceutique, industrie automobile, bâtiment et habitat, transport et logistique, banque et marchés financiers, assurance, aéronautique, secteur agroalimentaire, secteur médical, cinéma, etc.

Industrie aéronautique et spatiale vérification des procédures de fonctionnement (Ariane) étude des turbulences, calculs de profils d ailes. Onera : image des interactions entre les tourbillons en bout d aile et les turbulences résultant de la propulsion. Calcul réalisé sur NEC SX5 et NEC-SX6 :

Industrie automobile Généralités crash-tests virtuels chez un constructeur automobile :

Industrie automobile Généralités Principe : définition des caractéristiques mécaniques du véhicule modélisation en 3D (maillage) modélisation mathématique/mécanique des processus de déformation simulation de la dynamique de déformation des éléments

Industrie automobile Généralités

Industrie pétrolière Généralités conception d outils de forage pour l industrie pétrolière et minière : l outil (trépan carottier) doit répondre au mieux aux exigences des compagnies pétrolières. code de simulation hydraulique parallèle réduit la durée de simulation de 20 à 7 jours et augmente la vitesse d avancement des outils étudiés (d environ 40 %).

Secteur du bâtiment, de l habitat vente par internet : conception/aménagement en ligne et visualisation de décors 3D principe : le calcul est déporté sur un environnement parallèle et le résultat sous forme d image est renvoyé au client

Industrie du jeu et secteur des loisirs Production d images de synthèse pour films et jeux vidéos. 1993 : premières images de synthèse intégrées dans des vues réelles (Jurassic Park) 1995 : Toy Story premier film entièrement en images de synthèse.

Industrie du jeu et secteur des loisirs District 9 Imagine Engine Design Inc. de Vancouver, Canada, a géré les effets spéciaux de District 9, qui intègre une course d extraterrestres dans un documentaire naturaliste qui se déroule à Johannesbourg, en Afrique du Sud. La société a déployé près de 100 cartes graphiques professionnelles NVIDIA Quadro dans ses stations Linux pour produire chaque plan d extraterrestre du film. [www.nvidia.com]

Services publics : énergies gestion et production d énergie : EDF : gestion du réseau, fonctionnement de certains éléments des centrales nucléaires... prévisions météorologiques :

Services publics : Météo France Modèle opérationnel Arpège (1998), nombre de variables à traiter est Nv = 2,3.10 7 quatre variables à trois dimensions x 31 niveaux x 600 x 300 points sur l horizontale et une variable à deux dimensions x 600 x 300 points sur l horizontale, le nombre de calculs à effectuer pour une variable est Nc = 7.103 le nombre de pas de temps pour réaliser une prévision à 24 heures d échéance est Nt = 96 (pas de temps de 15 minutes).

Météo France Généralités Les calculs étant effectués sur l ordinateur Fujitsu VPP700 crédité d une vitesse de calcul R atteignant 20 gigaflops (20 milliards d opérations flottantes par seconde) le temps T nécessaire pour obtenir une prévision à 24 heures d échéance est un peu inférieur à un quart d heure.

Qui utilise le parallélisme? Météo France Météo-France a acheté en 2008 un NEC SX-8R qui délivre une puissance crête de 35.2 Tflops.

Qui utilise le parallélisme? Calculer plus vite : en théorie, le même calcul : 1 seconde Calculer plus gros : nouveau modèle Arome passage d une maille de 10km à une maille de 2.5 km Calculer différemment : possibilité de calculer des événements plus localisés et ponctuels : pluies torrentielles, orages violents, brouillard, etc. [http ://www.generation-nt.com/supercalculateur-meteo-france-actualite-41587.html]

Société civile : aménagement du territoire simulation pour réaménagement d un centre ville, construction d une ligne de tramway

Vous? Généralités Au coeur de vos ordinateurs : pour le calcule : utilisation de processeurs dits multi-coeurs : multicore (x10) pour la visuation : en plus du CPU, les ordinateurs sont équipés de GPU Graphics Processing Unit : manycores (x100), de véritables machines parallèles sur un circuit

Généralités 1950 1970 : les pionniers 1970 1990 : explosion des architectures 1990 2000 : extinction massive 2000 2010 : l ère des géants 2010 : les hybrides

Les pionniers (1950s-70s) Difficulté première, la mise en oeuvre du matériel. Challenge : augmenter le ratio fonctionnement/maintenance. ILLIAC IV : quelques heures de calcul/quelques semaines de maintenance. Les premiers grands noms du parallélisme apparaissent et avec eux, les premiers grands principes : vectorisation, techniques de pipeline, temps partagé, multiprogrammation... Amdahl : IBM 701, 704, 709. Seymour Cray : Control Data Corporation.

Les machines Généralités CDC6600 (1964) : unités de calcul en parallèle, 10MHz, 2Mo, 9 MFlops CDC7600 (1969) : équivalent à 10 CDC6600 : 40 MFlops

Ces années-là Généralités transistor sur base de silicium (Texas Instrument - 1955) premier disque dur (1957) premier compilateur fortran (1957) algol (1958-60 - 68). Algorithmic language - récursivité. Voici un langage très en avance de son temps, il n a pas seulement été une amélioration de ses prédécesseurs mais aussi une amélioration de presque tous ses successeurs. Bull : Gamma 60. Première machine multiprocesseurs française. interface RS-232 (1966) technologie CMOS (Texas Instrument - 1967) ARPANET (ancêtre d Internet - 1969) Unix (1970)

Le temps de l exubérance (1970s-80s) Premiers succès commerciaux. Apparition de multiples constructeurs : Thinking Machine Corporation ( ), Sequent ( ), Telmat ( ), Archipel ( ), Parsytec ( ), Kendall Square Research ( ), Meiko ( ), BBN ( ), Digital ( ), IBM, Intel, CRAY ( ), MasPar ( ), Silicon Graphics ( ), Sun, Fujitsu, Nec. Offre importante et exotique : Connection Machine 1 : hypercube de 65535 processeurs. Problèmes majeurs : l offre logicielle et le prix. étape suivante : machines abordables et utilisables.

Les machines Généralités Cray-1 (1975), Cray X-MP (1982) : 2 à 4 processeurs, Cray-2 (1983) : 8 processeurs, Cray Y-MP (1989). Hitachi S-810/820. Fujitsu VP200/VP400. Convex C-1. Nec SX-1/2. Connection Machine 1. 65536 processeurs. Topologie : hypercube. Intel ipsc/1 128 processeurs. Topologie : grille.

Les machines Généralités Illiac IV (Burrough - 1973 CRAY-1. 1975. 80 MHz, 8 Mo, 160 MFlops

Les machines Généralités

Ces années-là Généralités Langage pascal (Wirth - 1972) Ray-Tomlinson : premier email (1972) 10000 composants sur 1 cm 2 (1975). premier réseau local : Datapoint système ARC (1976). fibre optique (1977). Support d Ethernet par les principaux constructeurs (1979). Paterson - Hennessy : concept des processeurs RISC (1980) Tim Berners-Lee : projet World Wide Web au CERN (1989).

Environnements (1990s) Difficultés bien identifiées : routage, ordonnancement... parallélisme automatique très limité conception d outils d aide à la parallélisation : Hypertool, Pyrros, ParaRex, Adam, Apache... Autre problème : ratio prix/durée de vie d une machine parallèle extrêmement élevé. solution apportée par PVM : utiliser des réseaux locaux de stations de travail pour faire du calcul parallèle. Constructeurs machines parallèles réseaux de stations de travail intégrés.

Les machines Généralités Nec SX-3 (1991). Fujitsu VP-2600 (1991). CM-5 (1992). Topologie : fat-tree. Cray T3D (1993). Jusqu à 512 processeurs. Topologie : tore 3D. ASCI Red, et Blue (1997-1999).

Les machines Généralités

Ces années-là Généralités Microsoft Windows 3.0 (1990), Windows 95, Windows 98 PVM (1991). premier site web au CERN (1991) Altavista (premier moteur de recherche) 15 millions de pages web (1995) création de Linux par Linus Torvald création de Yahoo! (1995) annonce officielle de java (1995) Netscape à partir de NCSA Mosaic (1994). IBM Deep Blue bat Gary Kasparov (1997) mise en ligne du moteur google (1997) premier GPU (Nvidia GeForce 256) (1999) passage à l euro

L ère des Géants : les Grilles Depuis les milieu des années 90. Constat : les matériels sont la plupart du temps peu et sous-utilisés. Idée : utiliser ces matériels dont le nombre est énorme, Principe : des milliards de calculs indépendants effectués sur les PCs de volontaires. Précurseur : le projet Seti@Home

L ère des Géants : les Grilles Grilles de calcul. meta-computing. Principe de base : offrir un service tel qu il est offert par les producteurs d énergie : Electric Power Grid Computational Grid Objectif : brancher le cable réseau du PC pour utiliser de la puissance de calcul comme on branche une prise de courant pour utiliser de l électricité. Grille de calcul = capacités de calcul + capacités de stockage + disponibilité + interactions

L ère des Géants : les Grilles Eléments fondamentaux : partage de ressources (calcul + stockage) existence d un réseau d interconnexion mondial (Internet) calcul distribué/parallèle Contraintes : confidentialité : accès sécurisé gestion : partage de ressources performance : équilibrage de charge

L ère des Géants : les Grilles Grille Ressources de calcul et de stockage Réseaux Applications Intergiciel : coordination de l ensemble : authentification et confidentialité, stockage, répartition de charge, maintenance, etc. Cloud Computing évolution du grid computing portail unique Google, Amazon, IBM Blue Cloud, Intel+HP+Yahoo, etc.

L ère des Géants : les Grappes Depuis les milieu des années 90. Idée des grilles de calcul intéressante mais... Constat : les communications pénalisent une bonne utilisation. Remède : construire des réseaux locaux de grandes dimensions. Grappes de machines (clusters of machines).

L ère des Géants : les machines 1 BlueGene/L. IBM. US. 280 TFlops. 131072 processeurs. 2 Red Storm. Cray Inc. US. 101 TFlops. 26544 processeurs. 3 Blue Gene. IBM. US. 91 TFlops. 40960 processeurs. 4 ASC Purple. IBM. US. 91 TFlops. 75 TFlops. 12208 processeurs. 5 BladeCenter. IBM. Espagne. 62 TFlops. 10240 processeurs. 6 Thunderbird. Dell. US. 53 TFlops. 9024 processeurs. 7 Tera-10. Bull SA. CEA France. 52 TFlops. 9952 processeurs.

Généralités L ère des Géants : les machines

Les hybrides Généralités Depuis le milieu des années 2000. Constat : le parallélisme a été bien maîtrisé, passons à l intégration à grande échelle Idée : intégré le parallélisme au sein des unités de calcul (processeurs multicores) et graphiques (GPU et GPGPU) Extension : construisons des environnements parallèles qui utilisent ces technologies

Les machines Généralités

Puissance 2007 Généralités 1 BlueGene/L. IBM. US. 280 TFlops. 131072 processeurs. 2 Red Storm. Cray Inc. US. 101 TFlops. 26544 processeurs. 3 Blue Gene. IBM. US. 91 TFlops. 40960 processeurs. 4 ASC Purple. IBM. US. 91 TFlops. 75 TFlops. 12208 processeurs. 5 BladeCenter. IBM. Espagne. 62 TFlops. 10240 processeurs. 6 Thunderbird. Dell. US. 53 TFlops. 9024 processeurs. 7 Tera-10. Bull SA. CEA France. 52 TFlops. 9952 processeurs.

Puissance 2008 Généralités 1 Roadrunner IBM. Los Alamos DOE US. 1105 TFlops. 129600 processeurs. Nucléaire, armement, sécurité. 2 Jaguar Cray Inc. DOE US. 1059 TFlops. 150152 processeurs. 3 Pléïades SGI. NASA US. 487 TFlops. 51200 processeurs. 4 BlueGene/L. IBM. US. 478 TFlops. 212992 processeurs. 5 (9) Red Storm. Cray Inc. US. 204 TFlops. 38208 processeurs. 6 (14) Jade SGI CINES FRANCE 128 TFlops. 12288 processeurs. 7 (54) Tera-10. Bull SA. CEA France. 52 TFlops. 9952 processeurs.

Puissance 2012 Généralités 1 K Computer Fujitsu (Japon). 10.5 PFlops. Sparc64. 705024 cores. Linux 2 Tianhe 1A NUDT (Chine). 2.5 PFlops. Xeon+NVidia. 186368 cores. Linux 3 Jaguar CRAY XT5 (USA). 1.75 PFlops. AMD Opteron. 224161 cores. Linux 4 Nebulae Dawning TC3600 (Chine). 1.27 PFlops. Xeon+NVidia. 120640 cores. Linux 5 Tsubame (NEC/HP). 1.2 PFlops. Xeon+NVidia. 73278 cores. Linux

Les systèmes Généralités Système % (2007) % (2011) Linux 75 91.4 Unix 15 6 Mixed 6.40 2.2 BSD Based 3 0.2 Mac OS 0.60 0 Windows 0 0.2

Bilan? Généralités Toujours plus l augmentation de puissance ne connait pas de répit machines parallèles processeurs et GPU machines parallèles nombre de coeurs explose mobilité augmente : le terminal devient une interface mais... consommation électrique de plus en plus importante confidentialité/données personnelles : enjeu critique

Le parallélisme dans le domaine de la biologie

et parallélisme Motivations bioinformatique : collecte, stockage, classification, traitement et analyse des données biologiques biologie génère des volumes énormes de données problèmes modélisés sont difficiles (solutions approchées) approches gourmandes en calcul (simulations)

Sciences de la vie : applications domaine médical et pharmaceutique distinguer les processus entre états (santé/maladie) dépister/comprendre les maladies génétiques (SNPs) découvrir/conception et développer de nouveaux médicaments

Sciences de la vie : applications Prédiction de structures de protéines à partir de séquences ou de séquences à partir de données structurelles. Interactions protéine-protéine, protéine-adn, etc. Site d interaction entre la protéase et son inhibiteur Carte des potentiels. En bleu le minimum

: quelques problèmes Assemblage, annotation du génome. Imagerie médicales. Simulations cellulaires. Analyses transcriptomes. Simulation de réseaux d interactions.

Apport essentiel du HPC seuils de réalisme en deça desquels les résultats de simulation perdent de leur pertinence détails permettent de capturer la dynamique des systèmes étudiés et simulés Simulations peuvent reproduire des phénomènes inexpliqués et prédire des résultats à confirmer par des expérimentations

Apport essentiel du HPC Protein Folding Brooks et al. ont découvert une faible portion de structures hélicoïdales (en dessous des limites de détection expérimentale) qui apparaîtraient dans la dynamique des protéines non encore repliées, mais qui serviraient de germe de départ pour le repliement. http ://www.psc.edu/science/brooks96/brooks96.html

Quelles entreprises? Celera Genomics A propos d un partenariat avec Compaq en 2001 : Celera s current resource is a massively parallel Compaq Alpha processor farm of approximatly 1000 processors that was heavily used for assembling the human genome. However, annotating these genomes is expected to require even greater resources, and the post-genomic problem of proteomics is anticipated to be up to 1000-fold more computationally demanding.

Quelles entreprises? GeneBio éditeur de logiciels de bioinformatique (Genève)). A propos de la conception de son outil Phenyx en 2006 : "Phenyx was designed for industrial use and massive scalability, and thus can accommodate both small and large cluster environments. Incyte Genomics Toronto, 2002. Incyte Genomics will use Platform LSF and Platform Analyzer to manage its 1200 CPU Linux and Unix compute farm.

Quelles entreprises? Hopitaux Cedars-Sinai Medical Center, one of the largest academic medical centres in the Western United States, has been recognized for having one of the 500 most powerful computers in the world. Cedars-Sinai s supercomputer is designed to analyse blood proteins from cancer cells and provide information that will allow researchers to more accurately predict how cancer patients will respond to specific treatments.

Quels futurs? Généralités Simulation. Challenges Comprendre le fonctionnement des réseaux d interactions. Modéliser puis simuler le fonctionnement de la cellule. Quotidiennement utilisation industrielle de l outil HPC pour les besoins quotidiens de biologistes : Analyse d images (électrophorèse 2D) Alignement multiple (clustalw) Blast, fasta...

Grilles et biologie GenoGrid : grille expérimentale pour la génomique. Rugbi : Réalisation et Utilisation d une Grille pour la Bio-Informatique. Grille d exploitation pour les sociétés de bio-technologies. EGEE : enabling grids for e-science. 10000 CPU et 10 Po d espace de stockage. Volet applications médicales (essentiellement docking et images). BioGrid (volet bioinfo du projet EuroGrid). HealthGrid. http ://www.healthgrid.org

Grilles et biologie TeraGrid : plusieurs passerelles (gateways) ont un rapport direct avec la biologie. Parmi les projets traités Molecular phylogeny and microbial genome annotation. SHARCNET - Shared Hierarchical Academic Research Computing Network consisting of 14 academic institutions in South Central Ontario. Total CPU performance of 5423 gflops. European DataGrid - Funded by European Union. At its largest was comprised of 25 sites in Europe, Russia and Taiwan with over 1000 processors. Concluded March 2004. Grid 5000

Références le livre de Ian Foster en ligne www.top500.org quelques ouvrages de bioinformatique parallèle