Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller
NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que
Exercice 1 1.a. Quelle est la version de l assemblage du génome humain disponible sur la dernière version du site d Ensembl? 1.b. Quelle est la taille du génome du panda? Regarder le Base Pairs Regarder le Golden Path Length 1.c. Quelle est la taille du génome humain? Regarder le Base Pairs Regarder le Golden Path Length 3 Naviga)on dans Ensembl : Pra)que
Réponse à la ques)on 1.a GRCh37 4
Réponse à la ques)on 1.b 5
Réponse à la ques)on 1.c Taille du génome humain 6
Exercice 2 Quelle est la version du génome du rat- taupe nu? (Heterocephalus glaber) Combien de gènes ont été prédits par Genscan? 7 Naviga)on dans Ensembl : Pra)que
Réponse à la ques)on 2 8
Ques)on 3 Retrouver la taille du chromosome 4 dans le génome humain assemblage hg19 9 Naviga)on dans Ensembl : Pra)que
Réponse 3 10
Exercice 4 4.a - Combien de transcrits alterna)fs possède le gène BBS5 (chez l Homme) 4.b - Combien d exons possède le transcript BBS5-003 4.c - Combien d exons sont codants? Remarque - Comparer les couleurs d affichages de transcrits BBS5-001 et BBS5-201 11 Naviga)on dans Ensembl : Pra)que
Réponse 4.a 7 transcrits alterna)fs 12
Réponse 4.b 4 exons 13
Réponse 4.b.c 0 exon codant 14
Exercice 5 Retrouver ce`e page 15 Naviga)on dans Ensembl : Pra)que
Réponse 5 16
Exercice 6 Retrouver ce`e page 17 Naviga)on dans Ensembl : Pra)que
Réponse 6 18
Exercice 7 Déterminer le nombre total de varia)ons dans le gène BRCA1 19 Naviga)on dans Ensembl : Pra)que
Réponse 7 20
Exercice 8 Afficher dans le navigateur de génome les données d expression (RNAseq) dans deux )ssus (breast, skeletal muscle) au niveau du gène BRCA1 21 Naviga)on dans Ensembl : Pra)que
Réponse 8 22
Exercice 9 Afficher les termes GO associés aux transcrits BRCA1-001 23 Naviga)on dans Ensembl : Pra)que
Réponse 9 24
Exercice 10 Mener l enquête pour retrouver le nouvel iden)fiant Ensembl (gène) pour le gène : ENSG00000164012 25
Réponse 10
Exercice 11 Visualiser le fichier unique_crn- 107.bam dans Ensembl Adresse : jp://jp- igbmc.u- strasbg.fr/pub/ slegras/dudijon/unique_crn- 107_11.bam Aller voir le gène BBS1
Réponse 11
OUTILS : PARTIE PRATIQUE
Exercice BLAST Quel est la localisa)on génomique de BBS1? Séquence protéique: Recherche de la séquence protéique BBS1 dans les archives du génome humain août 2010. h`p://www- bio3d- igbmc.u- strasbg.fr/~jmuller/enseignement.html h`p://www.ensembl.org/info/website/archives/index.html TBLASTN sur le génome humain
PlateForMe
Est- ce que le chromosome 9 est la bonne localisaeon?
Exercice BLAST
Exercice BLAST
Exercice BLAST
Exercice BLAST LocalisaEon sur le chromosome 11
Alignement vs génome Plusieurs HSP 100% ID E- value plus élevée car calculée sur le chromosome en en)er 1 ou 2 HSP >80% ID E- value plus faible car alignement en un seul bloc
Exercice BLAST Est- ce bien le gène BBS1?
Exercice BLAST
BIOMART : PARTIE PRATIQUE 40 Naviga)on dans Ensembl : Pra)que
Exercice 1 Retrouver les iden)fiants Ensembl du gène et de tous les transcrits du gène BBS1 chez l Homme En entrée : Gène BBS1 (Gene Symbol) En sor)e : Ensembl Gene ID Ensembl Transcript ID Associated Gene Name 41 BioMart
Réponse 1 42
Exercice 2 Extraire toutes les séquences de tous les exons du gène BRCA1 Dans les entêtes, il devra y avoir : Associated gene name Ensembl Transcript ID Ensembl Exon ID 43
Résultat 2
Exercice 3 Extraire les séquences codantes des transcrits du gène BRCA1 (iden)fiant Ensembl : ENSG00000012048) Dans les entêtes, il devra y avoir : Ensembl Transcript ID Ensembl Exon ID
Résultat 3
Exercice 4 A par)r des coordonnées chromosomiques suivantes : chr1 5923274 5923514 chr15 72978593 73002040 Répondez aux ques)ons suivantes : Dans quel(s) gènes(s) se trouve- t- on? Si l on est dans un gène, récupérer les termes GO associés aux gènes Combien de variants germinaux con)ennent les régions
Réponse 4
Remarques Coordonnées commencent à 1 (a`en)on dans UCSC, les coordonnées commencent à 0) A`en)on pas de prefix chr devant les noms des chromosomes A`en)on chromosome Mitochondrial = MT dans Ensembl alors qu il est M dans UCSC Lié à Galaxy 49 Ensembl : fonc)onnement