BIN 1002: INTÉGRATION BIOSCIENCES/INFORMATIQUE Plan de Cours Automne 2015 Professeurs: Sylvie Hamel, Département d Informatique et de Recherche Opérationnelle Guillaume Lettre, Institut de Cardiologie de Montréal Courriels: sylvie.hamel@umontreal.ca, guillaume.lettre@mhi-humangenetics.org Page web du cours: http://esilbac1.esi.umontreal.ca/ dbin1002/ Démonstrateur: Robin Milosz, miloszro@iro.umontreal.ca Objectifs: Le cours BIN1002 vise à introduire l étudiant au domaine de la bioinformatique en y survolant plusieurs thèmes importants. Contenu: Structure et prédiction de gènes, séquençage de deuxième génération, alignement local et global et recherche de similarités, structures secondaires d ARN, médecine personnalisée. Références: - D. Gusfiled, Algorithms on Strings, Trees and Sequences - Computer Science and Computational Biology, Cambridge University Press, 1997. - D.W. Mount, Bioinformatics: Sequence and Genome Analysis, Second Edition, Cold Spring Harbor Laboratory Press, 2004. - M. Pop, S.L. Salzberg et M. Shumway, Genome Sequence Analysis: Algorithms and Issues, IEEE, 2002. Évaluation: L évaluation du cours sera constituée de: - 2 devoirs (fait en partie pendant les travaux pratiques) : 2 10% - Un examen intra: 20% - Présentation d un sujet bioinformatique non couvert au cours (voir à la fin de ce document pour les sujets d exposés et les modalités: 30% - Un test récapitulatif: 30%
Plan des séances - BIN 1002 - Automne 2015: - 2 septembre, local Z-255, 10h30-12h30 2h: Présentation du cours (SH & GL) Présentation des professeurs et du plan de cours Présentation et choix des thèmes de présentations - Travaux Pratiques: 4 septembre, local M-625, 11h30-13h30 Environnement informatique Unix Introduction à la programmation en Perl - 9 septembre, local Z-255, 10h30-12h30 1h: Structure des gènes (GL) Promoteur, transcription, épissage, traduction Séquences caractéristiques de ces différents processus 1h: Prédiction de gènes (SH) Cadre de lecture ouvert (Open Reading Frame:ORF) Survol d autres méthodes de prédiction (HMM, réseaux de neurones, etc..) - Travaux pratiques: 11 septembre, local M-625, 11h30-13h30 Test de remise - 16 septembre, local Z-255, 10h30-12h30 1h: Génomique comparative, concept d homologie (GL) 1h: Introduction aux alignements (SH) Problèmatique, matrice de points Distance d édition et calcul d un alignement optimal - Travaux pratiques: 18 septembre, local M-625, 11h30-13h30 Introduction aux outils et ressources web de bioinformatique Énoncé du devoir 1-23 septembre, local Z-255, 10h30-12h30 1h: Alignements local et global et recherche de similarités (SH) Alignement global vs local Distance vs similarité Alignements avec trous 2
- Travaux pratiques : 24 septembre, local M-625, 11h30-13h30 Logiciels d alignements - 30 septembre, local Z-255, 10h30-12h30 2h: Introduction au séquançage de deuxième génération (Next-generation sequencing) (GL) - Travaux pratiques: 2 octobre, local M-625, 11h30-13h30 BLAST Travail sur devoir 1-7 octobre, local Z-255, 10h30-12h30 2h: BLAST et FASTA (SH) Pourquoi des heuristiques d alignements? Matrice PAM et BLOSUM Heuristiques FASTA et BLAST et évaluation statistique des résultats - Travaux pratiques: 9 octobre, local M-625, 11h30-13h30 Fichier fasta Travail sur devoir 1 Remise devoir 1-14 octobre, local G-815, 10h30-12h30 2h: Examen Intra - Travaux pratiques: 16 octobre, local M-625, 11h30-13h30 Introduction à l analyse de données de sequençage 2e gen. Énoncé du devoir 2 - du 19 au 23 octobre: Semaine de relâche - 28 octobre, local Z-255, 10h30-12h30 2h: Transcriptomique (Sébastien Lemieux) - Travaux pratiques: 30 octobre, local M-625, 11h30-13h30 Paired reads 3
Fichiers format sam Travail sur le devoir 2-4 novembre local Z-255, 10h30-12h30 2h: Médecine personnalisée: maladies génétiques complexes et dossiers électroniques (GL) - Travaux pratiques: 6 novembre, local M-625, 11h30-13h30 Travail sur le devoir 2 Remise devoir 2-11 novembre local Z-255, 10h30-12h30 2h: Révision des plans d exposés avec les professeurs (10 minutes par équipe) (SH et GL) - Travaux pratiques: 13 novembre, local M-625, 11h30-13h30 Fin programmation en Perl Transeq et BackTranseq Aide à la préparation des exposés (priorité aux équipes présentant le 18 novembre) - 18 novembre local Z-255, 10h30-12h30 2h: Exposés des équipes du groupe 1 (SH et GL) - Travaux pratiques: 20 novembre, local M-625, 11h30-13h30 Gène homologues Alignements multiples Aide à la préparation des exposés (priorite aux équipes du groupe 2, présentant le 25 novembre). - 25 novembre local Z-255, 10h30-12h30 2h: Exposés des équipes du groupe 2 (SH et GL) - Travaux pratiques: 27 novembre, local M-625, 11h30-13h30 Amorces ADN, outils web Aide à la préparation des exposés (priorite aux équipes du groupe 3, présentant le 2 décembre). - 2 décembre local Z-255, 10h30-12h30 2h: Exposés des équipes du groupe 3 (SH et GL) 4
- Travaux pratiques: 4 décembre, local M-625, 11h30-13h30 PDB Visualisation de protéines Révision pour l examen final - 16 décembre, local AA1360, 10h30-12h30 2h: Test récapitulatif Thèmes des exposés, références et format de la présentation: Voici différents thèmes possibles pour les exposés (les références seront sur la page web): 1. Algorithmes d alignement pour les courtes séquences de NGS (Guillaume Lettre) 2. Algorithmes didentification disoformes à partir de données RNAseq (Guillaume Lettre) 3. Bio-informatique et le nuage (cloud computing) (Guillaume Lettre) 4. Calcul moléculaire (Sylvie Hamel) 5. Dynamique moléculaire (Sylvie Hamel) 6. Génomique comparative (Sylvie Hamel) 7. microarn et détection d ARN non codants (Sylvie Hamel) 8. Outils de recherche et d annotation du génome humain: UCSC Genome Browser ou ENSEMBL (Guillaume Lettre) 9. Phylogénie: méthodes de construction d arbres (Sylvie Hamel) 10. Pubmed: votre meilleur ami! (Guillaume Lettre) 11. Tout autre sujet qui vous intéresse et qui n est pas couvert dans le cours (sous réserve de l approbation de SH ou GL) Format et évaluation de la présentation: L évaluation de la présentation comprend trois parties: - Un résumé de 2 pages + une page de bibliographie est à remettre le 16 octobre. Ce résumé comptera pour 10%. - Un plan d exposé (ppt, ps ou pdf) est à remettre le 9 novembre. Ce document comptera pour 5%. 5
- La présentation comme telle doit durer 20 minutes. L exposé sera suivi d une dizaine de minutes de questions. La présentation comptera pour 15%. Il est important de préparer un exposé qui couvrera l aspect biologique, la définition des concepts, les problèmes les plus intéressants liés au sujet que vous avez choisi et l apport de la bioinformatique. Préparation: 1. Lecture des articles ou chapitres de livres conseillés sur la page web du cours 2. Recherche d informations supplémentaires (WEB : www.google.ca, http://www.ncbi.nlm.nih.gov/entrez/) 3. Discussion avec le parrain (entre parenthèse ci-haut) 4. Faire la présentation à l aide de PowerPoint ou d Acroread. Demander conseil à votre démonstrateur quant à la mise en forme des diapositives. 5. Un étudiant devra emprunter un portable à la DGTIC la journée de la présentation. 6