Développement d une architecture de type GRID pour l analyse des données d expression biologiques



Documents pareils
CHAPITRE 3 LA SYNTHESE DES PROTEINES

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Introduc)on à Ensembl/ Biomart : Par)e pra)que

DATASET / NETREPORT, propose une offre complète de solutions dans les domaines suivants:

Développement d applications Internet et réseaux avec LabVIEW. Alexandre STANURSKI National Instruments France

MABioVis. Bio-informatique et la

ViSaGe. Virtualisation du Stockage dans les Grilles. Informatiques. RenPar 16, 6-8 Avril 2005 Thiebolt François

Catalogue des stages Ercom 2013

Limitations of the Playstation 3 for High Performance Cluster Computing

Univers Vivant Révision. Notions STE

RETOUR D EXPÉRIENCE SUR L INTERNET DES OBJETS

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

L universalité et la variabilité de l ADN

LES REFERENCES BIBLIOGRAPHIQUES guide à l usage des étudiants. sources : éléments :

Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

Retour d exprience sur le cluster du CDS

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Les tests génétiques à des fins médicales

Quoi de neuf en contrôle/commande et systèmes embarqués (RIO, WSN...)?

Processus d Informatisation

2 Comment fonctionne un ordinateur, dans les grandes lignes

PERFORMANCE ET DISPONIBILITÉ DES SI

Linux embarqué: une alternative à Windows CE?

Gènes Diffusion - EPIC 2010

Bureau N301 (Nautile)

Chapitre 4: Introduction au Cloud computing

CATALOGUE DES PRESTATIONS DE LA

Spécifications Techniques Générales. Techno Pole Internet. Lycée Djignabo / Ziguinchor

Algorithmique et langages du Web

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Magnum vous présente ses nouvelles gammes d'armoires électriques. Gamme Auto de 125A à 400A

Contribution à la conception par la simulation en électronique de puissance : application à l onduleur basse tension

Version de novembre 2012, valable jusqu en avril 2013

Dr YAO Kouassi Patrick

Réseaux Locaux. Objectif du module. Plan du Cours #3. Réseaux Informatiques. Acquérir un... Réseaux Informatiques. Savoir.

Servodrives et solutions motion centric, le futur de l automation!

LA TRANSMISSION DES CARACTÈRES

Le but de la radioprotection est d empêcher ou de réduire les LES PRINCIPES DE LA RADIOPROTECTION

VI- Expression du génome


Emerson montre aux centres de données comment réduire ses coûts énergétiques

La recherche d'indices par fluorescence

neotechpro catalogue neotechpro NeoTechPro International

Moderniser. le système d information et le portefeuille applicatif.

Segmentation d'images à l'aide d'agents sociaux : applications GPU

Spécificités, Applications et Outils

Le calcul intensif chez PSA Peugeot Citroën. TERATEC 28 juin 2011

IFT3913 Qualité du logiciel et métriques. Chapitre 2 Modèles de processus du développement du logiciel. Plan du cours

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

SEQUENÇAGE LI-COR DNA 4200

Cellules procaryotes Service histologie Pr.k.mebarek

CATALOGUE DES OFFRES O2i INGÉNIERIE POUR LES PLATEFORMES ÉDITORIALES

Surveiller et contrôler vos applications à travers le Web

Console de supervision en temps réel du réseau de capteurs sans fil Beanair

Information génétique

Les bases de données transcriptionnelles en ligne

Appliances et logiciels Security

Démêler la complexité

Masses de données et calcul : à l IRIT. 8 octobre 2013

L ART TRANSGÉNIQUE EDUARDO KAC ART BIOLOGIQUE

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

Pour un usage plus sûr du téléphone portable

Architectures d implémentation de Click&DECiDE NSI

CASA SPERM CLASS ANALYZER

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr

DRIVE-TECHNOLOGY INKOMA - GROUP. Actionneur pour panneaux solaires - ASN ALBERT

Licence professionnelle Réseaux et Sécurité Projets tutorés

Les apports de l informatique. Aux autres disciplines

La plateforme Cloud Supply Chain. Présentation de GT Nexus

Windows serveur 2008 installer hyperv

Enterprise Intégration

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Eric Bertrand 08/11/06 Maître de conférence 1

Hypervision et pilotage temps réel des réseaux IP/MPLS

Notice d utilisation M Epigenomics AG, Berlin, Allemangne

MapCenter : un modèle ouvert pour la découverte, la supervision et la visualisation des environnements distribués à large échelle

Architectures informatiques dans les nuages

Biomarqueurs en Cancérologie

SERVICES DE SEQUENÇAGE

White Paper - Livre Blanc

La surveillance biologique des salariés Surveiller pour prévenir

Architectures d'intégration de données

Sécurité des réseaux IPSec

INVESTISSEMENTS D AVENIR

ASTER et ses modules

LE CLOUD COMPUTINGI des établissements d enseignement supérieur et de recherche en région Ile-de-France

Qu est-ce qu un test génétique?

Algoba Systems valoriser et partager leur patrimoine numérique Orphea Studio

Vers l'orchestration de grilles de PC par les mécanismes de publicationsouscription

Protect 5.31 Sortie monophasée 10kVA 120kVA Protect 5.33 Sortie triphasée 25kVA 120kVA. Alimentations Statique Sans Interruption

Appliances et logiciels Security

11 Février 2014 Paris nidays.fr

Le très haut débit sur le territoire du Parc des Monts d'ardèche

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Big data et sciences du Vivant L'exemple du séquençage haut débit

VIPE CNAM 6 mars Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Transcription:

Développement d une architecture de type GRID pour l analyse des données d expression biologiques O. Delemar, T. Vermat, F. Paillier & M. Deleeuw GENOME express FuturVIEW 2

ntexte biologique : nome et ADN Séquençage AGCTTCGACGTCATACGTCCATGGGCATAATGCATCC Les chromosomes : support de l information génétique L ADN : molécule linéaire formée de 4 bases : l Adénine, la Cytosine, la Guanine et la Thymine On représente l ADN par une chaîne dans un alphabet de 4 lettres : A, C, G et T Chez l homme : 23 paires de chromosomes pour 3 milliards de bases

ntexte biologique : gène à la protéine Activation mosome nnées originales messager (transcrit) pie de travail Gène Transcription Traduction 1 n 1 Protéine n

ntexte biologique : xpression des gènes t 12 (tissu sain) malade) Gène A Gène B Gène C Gène D blème : Identifier un grand nombre de transcrits hez l homme, plusieurs milliers de gènes exprimés tude de 15000 transcrits A B C D État 1 x1 x2 x3 x6 État x1 x6 x3 x6

CS scriminative Analysis of Clone Signatures équençage d ADN : connaître la succession exacte des bases association d une molécule fluorescente à chaque base 1 tube = 1 séquence ACS identifier un transcrit séquençage d une seule base 1 tube = 4 signatures

CS alyse d expression Matrice de distances N N(N-1) 2 N 15000 signatures 49 995 000 comparaisons

CS mparaison de signatures Corrélogramme Score

e architecture de type GRID

e architecture de type GRID

GRID oix technologique Multi plateforme Traitement de signal LabVIEW Prototypage rapide Communications

GRID héma de communication plication RID

GRID héma de communication plication RID Création Annonce

GRID héma de communication plication FTP RID Load

GRID héma de communication plication RID

GRID héma de communication plication RID

GRID e globale plication RID

GRID e globale plication RID

ID nonces Annonce

sultats 34 s, 1500 signatures 12 heures de calcul 2 semaines sur un seul processeur Encore insuffisant 10 fois plus de signatures => 100 fois plus de comparaisons Capacité totale : 64 processeurs Optimiser la partie «atomique» du calcul

ID ntrôles plication LOG file LOG file RID LOG file

nclusion Prototype Faisabilité du projet Exploitation de la puissance de calcul Améliorations Optimisation des comparaisons de signatures Souplesse et robustesse du GRID

Worke turversion plication 1 GRID M TCP Worke plication 2 TCP Worke

turlabview A quand un GRID Developers Toolkit pour LabVIEW?