La recherche en biologie computationnelle



Documents pareils
Assemblage adaptatif de génomes et de méta-génomes par passage de messages

Big data et sciences du Vivant L'exemple du séquençage haut débit

Assemblage adaptatif de génomes et de méta-génomes par passage de messages

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Ingénieur R&D en bio-informatique

MABioVis. Bio-informatique et la

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

SERVICES DE SEQUENÇAGE

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

Domaine : Sciences, Technologies et Santé Mention : Nutrition, Sciences des aliments, Agroalimentaire

Université Paris Saclay De quoi parle t-on?

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB / 16

Faculté des Sciences d ORSAY

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

À L AUBE D UN NOUVEAU DÉPART. Service d orientation Cité des Jeunes A.-M.-Sormany Septembre 2014

RESUME DESCRIPTIF DE LA CERTIFICATION (FICHE OPERATIONNELLE METIERS)

Professeur Rémi Quirion, Scientifique en chef

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Gènes Diffusion - EPIC 2010

Big Data et Graphes : Quelques pistes de recherche

Calcul intensif pour la biologie

Site : contact@dys35.fr - Tél Conférence - Débat

Les technologies du Big Data

FORMATIONS STAGES INSERTION PROFESSIONNELLE. UFR Sciences Orsay. Isabelle DEMACHY

Eco-système calcul et données

L informatique comme discipline au gymnase. Renato Renner Institut für Theoretische Physik ETH Zürich

SysFera. Benjamin Depardon

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

MASTER (LMD) MODELISATION, OPTIMISATION, COMBINATOIRE ET ALGORITHME

F-7a-v3 1 / Bourses de mobilité / Mobility Fellowships Formulaire de demande de bourse / Fellowship Application Form

Big Data et Graphes : Quelques pistes de recherche

Informatique et mathématiques

Charte d'utilisation des infrastructures de la plate-forme bioinformatique Genotoul

Génération de code binaire pour application multimedia : une approche au vol

RÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition

: l IDRIS a vingt ans!

Les Parcours Scientifiques et les Ecoles Doctorales

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

POP-Java : Parallélisme et distribution orienté objet

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

Big Data et la santé

L intégration des TIC chez les futurs enseignants : votre point de vue

Environmental Research and Innovation ( ERIN )

Marc-Olivier Cavanagh" New Richmond Centre de formation professionnelle Bonaventure-Paspébiac

En suivant l'initiative d'amanda Wagener sur iwanttolearnruby.com, j'ai créé et anime jeveuxapprendreruby.fr.

LICENCE : INFORMATIQUE GENERALE

Je suis très dynamique et extrêmement motivé car j'aime beaucoup acquérir de nouvelles connaissances et

Offre de bourses doctorales Programme interuniversitaire de formation en recherche en santé mondiale (Santé Cap)

Innovation Francophonie Imagination

DUT. Informatique, orientation Imagerie Numérique. Domaine : Sciences, Technologies, Santé. Mention : Informatique

Évaluation et implémentation des langages

Programme international de formation

Introduction aux bases de données: application en biologie

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

Filière MMIS. Modélisation Mathématique, Images et Simulation. Responsables : Stefanie Hahmann, Valérie Perrier, Zoltan Szigeti

UNE NOUVELLE APPLI EST NEE :

Identification de nouveaux membres dans des familles d'interleukines

Gestionnaire de réseaux Linux et Windows

Comment rédiger une bibliographie. Bibliothèque Collège François-Xavier-Garneau Tiré à part du Guide de l étudiant

Merci beaucoup de votre collaboration

Stages - le calendrier

LA ROBOTIQUE Formations et professions

Bienvenue à l UCL, dans une

MATHEMATIQUES ET SCIENCES POUR L INGENIEUR

Mon métier, mon parcours

Logiciel Libre Cours 3 Fondements: Génie Logiciel

Plus courts chemins, programmation dynamique

Laboratoire 4 Développement d un système intelligent

Liste des CD/DVD/VIDÉOS en orientation et information scolaire. Formation professionnelle

Master Développement et Immunologie

LA GOUVERNANCE, OU COMMENT RAPPROCHER LES ÉQUIPES DE DÉVELOPPEMENT ET D INFRASTRUCTURE

Lundi Mardi Mercredi Jeudi Vendredi Samedi Dimanche. Camp des Cactus Stanstead 16:30 18:30 FOOTBALL CADET D2

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Statistiques et traitement des données

Master Information et communication spécialité Produits et services multimédia

MÉMOIRE. 1 Mémoire 2013/2014 UVic

Panorama des solutions analytiques existantes

Catalogue des stages Ercom 2013

Etudier l informatique

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

Master UP 6. Mention Santé Publique et Management de la Santé. Spécialité Pharmacologie Clinique. Construire une carrière dans l industrie

Procédure d inscription pour une recherche personnelle de stage

CATALOGUE FORMATION 2015

Z i e d Z a i e r ( )

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

FOG : Free Open-Source Ghost. Solution libre de clonage et de déploiement de systèmes d'exploitation.

Recherche et Formation dans un environnement de pointe. Contact:

Détection et prise en charge de la résistance aux antirétroviraux

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

La littératie numérique est-elle vraiment une littératie? Pour quelle raison se soucie-t-on de la définition de la littératie numérique?

Informatique & Systèmes de Communication. Stages de 12 à 16 semaines aux Etats-Unis

Simulation de graphes de tâches

Transcription:

La recherche en biologie computationnelle par Sébastien Boisvert http://boisvert.info BIF-1000 La profession de bioinformatien Mercredi le 19 octobre 2011 Local PLT-2510 30 minutes 1

Questions * Quand as-tu décidé de faire de la bioinformatique et pourquoi? Qu'as-tu retiré personnellement et professionnellement de ta formation universitaire en bio-informatique? Quel genre de défis rencontres-tu en tant que bio-informaticien en général et au jour le jour? Que vois-tu comme avenir pour toi et pour la bio-informatique en général? * Questions pertinentes selon Élénie Godzaridis, collègue (bio-) informaticienne 2

Question 1 Quand as-tu décidé de faire de la bioinformatique et pourquoi? 3

31 mars 1998: StarCraft Secondaire 1 Programmation 4

31 mars 1998: The Matrix Un monde de machines qui cultivent les humains pour obtenir de l'énergie. Les humains vivent dans la matrice, un monde virtuel créé par les machines. 5

1998: TI-80 Texas Instrument Processor proprietary Frequency 980 khz User Memory 7 KB of RAM Programmable en BASIC 6

1999: Cours introduction à l'internet Secondaire 3 Appris le HTML et le CSS http://www.w3schools.com/ 7

2001: Cours de chimie Secondaire 5 Prof: Chau Ly-Hai Il a dit que la biotechnologie est l'avenir. 8

2002-2005: cégep DEC en techniques de laboratoire Spécialisation en biotechnologies 9 Cégep de Lévis-Lauzon

31 mars 2003: Red Hat Linux 9 10

Mai juin 2005: stage au CHUL Cancer du sein Séquençage de l'adn J'ai vu que l'informatique était très important en génétique 11

Réponse à la question Quand as-tu décidé de faire de la bioinformatique et pourquoi? Quand: au cégep Pourquoi: parce que la biotechnologie est l'avenir et que l'informatique est omni-présente dans notre société 12

Question 2 Qu'as-tu retiré personnellement et professionnellement de ta formation universitaire en bio-informatique? 13

Pour répondre à la question Description de mon cheminement universitaire 14

2005-2008: baccalauréat Biotechnologie Concentration en bio-informatique Université de Sherbrooke 1/3 informatique 2/3 biologie 0.001% bio-informatique 15

Mai août 2006: stage 1 Centre de recherche en infectiologie de l'université Laval Biopuces, biostatistiques Développement web Le parasite Leishmania Langages: ANSI C, ISO C++, Perl, Ruby, R, HTML, CSS GNU, Linux, subversion, Ruby on Rails 16

Janvier avril 2007: stage 2 Centre de recherche en infectiologie de l'université Laval Biopuces, biostatistiques Entrepôts de données, services web, interfaces Virus respiratoires Langages: ANSI C, ISO C++, R, Ruby, HTML, CSS Ruby on Rails 17

Sept. décembre 2007: stage 3 Groupe de recherche en apprentissage automatique de l'université Laval Virus de l'immuno-déficience humaine Technologies: Noyaux, Machines à vecteurs de support Langages: ISO C++, Ruby 18

Mai juillet 2008: stage à McGill Stage au Centre d'innovation de l'université McGill et Génome Québec Développement d'outils génomiques Génome de Leishmania tarentolae Technologie de séquençage 454 19

2008-2009: maîtrise Université Laval Directeur: Jacques Corbeil (médecine) Codirecteur: Mario Marchand (informatique) Jacques Corbeil Mario Marchand 20

2008-2009: articles Sébastien Boisvert, Mario Marchand, François Laviolette, and Jacques Corbeil. HIV-1 coreceptor usage prediction without multiple alignments: an application of string kernels. Retrovirology 2008 Dec 4;5:110. http://boisvert.info/publications.html 21

2009: Financement Frederick Banting and Charles Best Canada Graduate Scholarship - Master s Award, Canadian Institutes of Health Research (CIHR) 17500 $ pour 1 année 22

2010: début d'un doctorat Directeur: Jacques Corbeil (médecine) Codirecteur: François Laviolette (informatique) Frederick Banting and Charles Best Canada Graduate Scholarship - Doctoral Award Canadian Institutes of Health Research (CIHR) 105 000 $ pour 3 années François Laviolette 23

Réponse à la question Qu'as-tu retiré personnellement et professionnellement de ta formation universitaire en bio-informatique? Personnellement: j'aime concevoir et implémenter des logiciels utiles pour les biologistes et les gens en général, partager ma passion pour les logiciels libres et Linux Professionnellement: grand réseau de contact à travers le Canada, expertise dans des domaines de pointe de l'informatique et dans la génétique, profil interdisciplinaire 24

Question 3 Quel genre de défis rencontres-tu en tant que bio-informaticien en général et au jour le jour? 25

Défi 0 Parler deux langages pour les biologistes (1) et pour les informaticiens (2) 26

Défi 1 Comprendre la biologie derrière les données 27

2010: Illumina HiSeq 2000 Séquençeur d'adn Flow Cell v3 8 lignes 11 jours > 6 000 000 000 séquences de 101 nucléotides 28

Juillet août 2011: stage à Toronto Ontario Institute for Cancer Research Super-ordinateur à l'interne ~4000 coeurs Plusieurs séquençeurs Illumina HiSeq 2000 Plusieurs peta-octets de disques 29

Défi 2 Concevoir et implémenter des logiciels libres 30

Architecture d'un jeu vidéo (C++) Jeu multi-joueur: calcul sur plusieurs ordinateurs while(lejeuroule()){ recevoirdesinformationsduréseau(); recevoirdesentréesduclavieretdelasouris(); avanceretatdujeu(); envoyerdesinformationssurleréseau(); dessinerlejeusurecran(); jouerlessons(); } 31

Architecture de Ray (C++) Ray: logiciel que je développe Calcul distribué: calcul sur plusieurs ordinateurs while(leprogrammeroule()){ recevoirdesmessagesduréseau(); traiterlesmessagesreçus(); avanceretatducalcul(); envoyerdesmessagessurleréseau(); } 32

Défi 3 Utiliser des infrastructures informatiques de prochaine génération 33

2010: le colosse À l'université Laval 7680 coeurs de calcul Réseau Infiniband (latence de 10 us) 500 tera-octets de disques 34

Défi 4 Comprendre des concepts abstraits pour les améliorer 35

Graphe de Bruijn Un entier k, disons k=3 Un alphabet fini, disons {A,T,C,G} Les sommets: tous les mots de longueur k possibles avec {A,T,C,G} Arcs entre u et v si les k-1 dernières lettres de u sont les k-1 premières de v Exemple: ATG -> TGC 36

Séquences et chemins x = ATACGGCAT Sous-séquences de longueur 3 de x: {ATA,TAC,ACG,CGG,GGC,GCA,CAT} x est un chemin dans le graphe de Bruijn pour k=3 avec l'alphabet {A,T,C,G} ATA -> TAC -> ACG -> CGG -> GGC -> GCA -> CAT 37

Défi 5 Partager les découvertes 38

2010: première publication sur Ray Assembleur de novo ISO C++ 1998 Massivement distribué Standard MPI (Message-Passing Interface) http://denovoassembler.sourceforge.net Journal of Computational Biology, November 2010, 17(11): 1519-1533. 39

Réponse à la question Quel genre de défis rencontres-tu en tant que bio-informaticien en général et au jour le jour? En général: communication, algorithmes, planification Au jour le jour: trouver le bug X qui cause un problème 40

Question 4 Que vois-tu comme avenir pour toi et pour la bio-informatique en général? 41

Réponse à la question Que vois-tu comme avenir pour toi et pour la bioinformatique en général? Avoir une composante informatique dans une formation permet d'avoir des compétences ré-utilisables Pour toi: post-doctorats, professeur-chercheur en bioinformatique, consultant/conseiller en calcul à haute performance, consultant/conseiller en logiciels libres Pour la bio-informatique: je me base sur l'opinions des géants de la bio-informatique 42

Créer demain avec les géants d'hier 43

Eugene W. Myers E. Myers (1986). "An O(ND) Difference Algorithm and Its Variations". Algorithmica 1 (2): 251 266 algorithme pour obtenir la différence entre deux fichiers Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990). "Basic local alignment search tool". J Mol Biol 215 (3): 403 410. outil de recherche blast Myers EW et al. (2000) "A whole-genome assembly of Drosophila." Science. 24;287(5461):2196-204 preuve de concept du shotgun sequencing & assembly L'avenir: créer des algorithmes qui aident les biologistes 44

Pavel A. Pevzner Pevzner PA, Tang H, Waterman MS. (2001) "An Eulerian path approach to DNA fragment assembly" PNAS 14;98(17 ):9748-53. approche complètement différence pour assembler les génomes L'avenir: utiliser la combinatoire pour comprendre le vivant 45

Steven L. Salzberg The knight of open access and open source in bioinformatics Algorithmes en bioinformatique (MUMmer, bowtie, GLIMMER, et beaucoup d'autres) L'avenir: un monde bio-informatique ouvert, libre et honnête qui fait la promotion de l'innovation ouverte pour accélérer le progrès 46

George Church Le présent: on peut lire l'adn L'avenir: pouvoir écrire l'adn pour permettre le traitement de maladies génétiques et pour créer des énergies vertes 47

Jean-Philippe Vert Saigo H, Vert JP, Ueda N, Akutsu T. Protein homology detection using string alignment kernels. Bioinformatics. 22;20(11):1682-9. L'avenir: prédire le cancer avec l'intelligence artificielle 48

Pour en savoir plus Tweets Http://twitter.com/sebhtml Site web Http://boisvert.info Blogue http://dskernel.blogspot.com 49