Informatique et biologie moléculaire

Documents pareils
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

Bases de données et outils bioinformatiques utiles en génétique

Base de données bibliographiques Pubmed-Medline

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

CATALOGUE DES PRESTATIONS DE LA

GMIN206 Info. Biologique et Outils bioinformatiques. Elodie Cassan

Introduc)on à Ensembl/ Biomart : Par)e pra)que

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

MABioVis. Bio-informatique et la

Éditeur Elsevier Langue(s) Multilingue

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Recherche et veille documentaire scientifique

Introduction aux bases de données: application en biologie

Biomarqueurs en Cancérologie

Big data et sciences du Vivant L'exemple du séquençage haut débit

présentée DEVANT L UNIVERSITÉ DE RENNES 1 pour obtenir le grade de : DOCTEUR DE L UNIVERSITÉ DE RENNES 1 PAR Emilie GUÉRIN TITRE DE LA THÈSE :

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Génétique et génomique Pierre Martin

MEDLINE BANQUE DE DONNÉES EN MÉDECINE INTERFACE PUBMED INITIATION

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Recherche documentaire et autoformation. Lecture critique d un article médical. Recommandations pour la pratique. Les maladies orphelines

PUBMED. Vous pouvez rentrer l adresse de ce support dans vos favoris :

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Mise en place d'une démarche qualité et maintien de la certification ISO 9001:2008 dans un système d'information

MYRIAD. l ADN isolé n est à présent plus brevetable!

TD de Biochimie 4 : Coloration.

Recherche bibliographique avec PubMed/MedLine

Bibliographie Introduction à la bioinformatique

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

Guide d utilisation de BMJ Journals. journals.bmj.com

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Méthodologie documentaire spécifique au repérage d actions de terrain

findit.lu Les guides d utilisation Leçon 17

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Identification de nouveaux membres dans des familles d'interleukines

Génomique Comparative et intégrative

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

Importation automatique de notice d article de Pubmed dans EndNote

Zotero est une extension du navigateur Firefox. Il est possible de télécharger Firefox gratuitement sur le site:

TUTORIEL D INSTALLATION D ORACLE ET DE SQL DEVELOPPER TUTORIEL D INSTALLATION D ORACLE...1 ET DE SQL DEVELOPPER...1

Science Direct - Cell Press

Gènes Diffusion - EPIC 2010

Extraction d information des bases de séquences biologiques avec R

Comment interroger PubMed pour accéder aux revues en ligne AP-HP sur Intranet

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Catalogue des formations Médecine et paramédical

Guide utilisateur i-milo >> Décisionnel

SERVICES DE SEQUENÇAGE

Solutions en ligne Guide de l utilisateur

Introduction à la Génomique Fonctionnelle

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

1. Présentation de la base de données

ZOTERO Un outil gratuit de gestion de bibliographies

Les Parcours Scientifiques et les Ecoles Doctorales

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

La PCR quantitative (qpcr) et le guide de bonnes pratiques MIQE : adaptation et pertinence dans le contexte de la biologie clinique

Recherche bibliographique

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

MENER UNE RECHERCHE D INFORMATION

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

Journée SIG Propreté. Mieux répondre aux enjeux des métiers de la Propreté avec les solutions SIG d Esri. 18 Juin 2013 Yann Le Yhuelic

Domaine : Sciences, Technologies et Santé Mention : Nutrition, Sciences des aliments, Agroalimentaire

EndNote Web. Quick Reference Card THOMSON SCIENTIFIC

Bases de données des mutations

Guide de démarrage rapide

Perl Orienté Objet BioPerl There is more than one way to do it

PRÉSENTÉ PAR : NOVEMBRE 2007

COMMENT CREER SIMPLEMENT UN TABLEAU DE BORD AVEC SAS BI DASHBOARD 4.3?

Gestion de références bibliographiques

Analyse des données de séquençage massif par des méthodes phylogénétiques

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

I) INTRODUCTION... 3 II) ENREGISTREMENT DE SON TYROS

HOWTO INSTALLATION DB2 et NSE (sous RedHat)

Création d un site Internet

La surveillance biologique des salariés Surveiller pour prévenir

Introduction à Eclipse

Éditeur Koninklijke Brill Langue(s) Multilingue

Création d'un site dynamique en PHP avec Dreamweaver et MySQL

ET REGISTRE DE PRESENCE

SEQUENÇAGE LI-COR DNA 4200

DataCar CRM V2.5 Release Notes. DataCar CRM v2.5. Release Notes

Univers Vivant Révision. Notions STE

Hépatite chronique B Moyens thérapeutiques

EndNote : outil de gestion bibliographique

OPPassessment Guide d utilisateur

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

Retour table des matières

AA-SO5 KIDA/GSOV/VAMDC

Cartographie Informatique Eclairage Public

Business Intelligence avec SQL Server 2012

Access 2007 FF Access FR FR Base

Portail : mode d emploi

ESPACE COLLABORATIF. L Espace Collaboratif : votre espace de partage entre acteurs régionaux

Les tests de génétique moléculaire pour l accès aux thérapies ciblées en France en 2011

Transcription:

UE 1B-biomolécules, génome, bioénergétique, métabolisme, méthodes d étude et analyse du génome II-le génome : sa structure, son expression Organisation, évolution et fonction du génome humain Approches pan-génomiques Bio-informatique PACES 2015-2016 Pr Nicolas SEVENET Informatique et biologie moléculaire Avertissement Utilisation par le biologiste de l outil informatique Bases/banques de données Définition Développement des outils informatiques (science de l information) Permettant d extraire une signification biologique de résultats expérimentaux (science du vivant) Paradoxe Avec le développement des techniques pan-génomiques, le biologiste n est plus capable d interpréter seul le résultat de ses expériences (microarrays, NGS) 1

Les 2 sites de bioinformatique les plus importants au monde EBI (EMBL) European Bioinformatics Institute Cambridge, UK http://www.ebi.ac.uk/information/ab out_ebi/about_ebi.html NCBI National Center for Biotechnology Information, National Library of medicine, National Institutes of Health Bethesda, MD, USA http://www.ncbi.nlm.nih.gov/ Trier l information Masse de l information Retrouver des informations stockées en banque de données (interrogation (requête), soumission, maintenance) Dry lab (biologie sèche) Les banques de données en ligne les compilateurs de bases de données (méta-moteur; méta-banques de données) Entrez NCBI Genecards Genome Browser Le site de recherche bibliographique PubMed Les sites de données spécialisés Séquences des gènes (Refseq, GenBank) Variations polymorphes de l ADN (dbsnp) Séquences et fonctions des protéines (UniProt) 2

Listing des banques de données http://www.oxfordjournals.org/nar/database/c/ Pendant ce cours Générer l information : bio-informatique liée au NGS Analyses Fichiers de sortie Interprétation des résultats Stocker l information : Banques de données Diverses Objectif et utilisation respectifs Exemples Utiliser une information Trouver une séquence de référence Connaître la structure intron-exon d un gène Dessiner des oligonucléotides de PCR (amorces/primers) 3

Générer l information BIOINFORMATIQUE LIÉE AU NGS Enchaînement des étapes Item Analyse primaire Analyse secondaire Analyse tertiaire Visualisation PGM Ion torrent Life technologies Fichiers sortie de run.dat.cel Fichiers de séquence (base calling + Phred score) Alignement sur le génome de référence (par exemple BWA Picard tools) Détection des variants (par rapport au génome de référence) Annotation des variants SFF Fastq MiSeq Illumina Fastq Sam (Sequence Alignment/map) puis bam (format compressé binaire du précédent) Vcf (variant call format) Par exemple VEP (Variant Effect Predictor) ANNOVAR Par exemple IGV (Integrative Genome Viewer) Alamut (Interactive Biosoftware) 4

Stocker l information MÉTA-BANQUES DE DONNÉES Gène Le fil rouge du cours : RB1 RB1 : RetinoBlastoma 1 Code une protéine impliquée dans le contrôle du cycle cellulaire (entrée en phase S après la phase G1) Retrouvé muté dans les rétinoblastomes (tumeurs oculaires de l enfant) certains sarcomes 5

Diapo 40 cours UE2 JB Corcuff contrôle moléculaire du cycle cellulaire, contrôle de la transition G1/S Entrez NCBI http://www.ncbi.nlm.nih.gov/entrez/ 6

Contenu Les banques de données universelles en génétique Génome Gène, localisation chromosomique, séquence génomique Transcrits Protéine description localisation Anticorps Fonctions, voies fonctionnelles, classification «ontologique» Dysfonction, pathologies Références bibliographiques Genecards http://www.genecards.org/ 7

UCSC Genome Browser Outil de cartographie du génome http://genome.ucsc.edu/cgi-bin/hggateway Rentrer RB1 dans cette fenêtre UCSC Genome Browser Fenêtre de localisation du gène demandé (RB1) Exons 8

BIBLIOGRAPHIE PubMed http://www.ncbi.nlm.nih.gov/pubmed/ 9

Les publications sont classées en ordre décroissant de leur date de sortie (les plus récentes en premier (haut de liste)) SITES SPÉCIALISÉS 10

Nucléotides Banques de données primaires 3 dans le monde DDBJ (Japon) European Nucleotide Archive (Europe) GenBank (NCBI, USA) Banque de données spécialisées RefSeq (NCBI) fournir, à une position nucléotidique couverte par plusieurs séquences primaires, un identifiant unique Genatlas (France) structure intron-exon d un gène European Nucleotide Archive http://www.ebi.ac.uk/ena/ 11

dbsnp Banque de données de polymorphismes Polymorphisme définition Le polymorphisme correspond à une variation d une à quelques bases de l ADN sans retentissement sur la structure, la fonction ou l expression de la protéine Définit un allèle (version alternative d un gène) Polymorphisme simple de nucléotide (Single Nucleotide Polymorphism) Seul un nucléotide varie à une position donnée Exon 4 gène RB1 http://www.ncbi.nlm.nih.gov/projects/snp/ Rentrer RB1 dans cette fenêtre 12

Résultats SNP RB1 Protéines - UniProt Rentrer RB1 dans cette fenêtre 13

RB1 Uniprot Quelle protéine de référence choisir? retour à genecards 14

Genecards permet de choisir la bonne référence protéique Fiche Uniprot RB1 15

Objectif : Banques de dépôt Déposer le résultat d expériences D autres équipes peuvent alors les télécharger et traiter avec leurs outils ce résultat partage Partage de données et comparaison validation in silico 2 bases essentiellement GEO (Gene Expression Omnibus) Array-express http://www.ncbi.nlm.nih.gov/geo/ Rentrer RB1 dans cette fenêtre 16

Résultat requête RB1 La plateforme où a été faite l expérimentation (biopuce) Le code de la série expérimentale pour le sujet donné (biopuces) Les résultats de chaque manip d hybridation Utiliser l information APPLICATIONS PRATIQUES 17

ADN Que faire? Trouver une séquence de référence RefSeq Connaître la structure intron-exon d un gène Genatlas Dessiner des amorces de PCR Primer 3 Pathologies Savoir si un gène est muté dans certaines pathologies COSMIC : Catalogue Of Somatic Mutation in Cancer OMIM : Online Mendelian Inheritance in Men Savoir qui, en France, peut prendre en charge une pathologie rare, ou le diagnostic mutationnel d un gène? Orphanet : portail des maladies orphelines Trouver la séquence de référence d un gène? Etape 1 : RefSeq (NCBI) http://www.ncbi.nlm.nih.gov/refseq/key.html#query Etape 2 Search : NUCLEOTIDE et nom du gène 959 résultats! 18

Trouver la séquence de référence d un gène? Restreindre à - Homo Sapiens (167) - Refseq (227) - 37 séquences Tri par accession number Contigs : ensemble de séquences assemblées, localisées sur le chromosome, qui ont servir à déduire la RefSeq RefSeq génomique Gènes comprenant RB1 dans leur titre mais n ayant rien à voir avec RB1 RefSeq ARN messager 19

Connaître l organisation intron/exon d un gène?? Geneatlas http://genatlas.medecine.univ-paris5.fr/ Puis Rentrer RB1 dans Symbol Name 20

Cliquer sur see the exons Codage des RefSeq et longueur des fragments des RefSeq Intron-exons : L ADN intronique est en bleu et minuscules, la séquence exonique en noir et majuscules (noir caractères gras = séquence codante) 21

Trouver des amorces de PCR??? Objectif : cribler et/ou séquencer un gène (un exon) à la recherche de mutations ponctuelles délétères (diagnostic mutationnel/biologique) Rechercher des amorces déjà publiées PubMed avec comme mot d entrée, le nom du gène http://www.ncbi.nlm.nih.gov/pubmed/ Créer de nouvelles amorces in silico Primer3 http://frodo.wi.mit.edu/primer3/ Les primers créés sont-ils spécifiques? Alignement de séquences (Blast) Permet de voir si les séquences retrouvées par Blast après alignement des primers sont réellement spécifiques Matrice + Thermocycleur 22

Départ 1 copie de l exon 1 du gène b Après 1 cycle 5 3 3 5 2 copies (2 1 ) Après 2 cycles 4 copies (2 2 ) zone amplifiée Après 3 cycles Après n cycles 8 copies (2 3 ) 2 n copies http://frodo.wi.mit.edu/primer3/ 23

Exemple primer 3 On copie la séquence de l exon 4 avec les séquences introniques adjacentes Des symboles <> sont placés de part et d autre de la séquence exonique (en majuscule) pour interdire que les primers soient dans cette zone (qu on voudra analyser après PCR) Résultats primer 3 Primer forward La séquence qui avait été encadrée de <> est marquée de X symbolisant une zone d exclusion de choix de primers Primer reverse 24

Alamut La représentation du gène dans sa totalité La séquence nucléotidique avec le dénombrement des nucléotides depuis le A de l ATG (base 1) RB1 exon 4 La traduction protéique avec le dénombrement des codons (AA) depuis le 1 er (ATG = Met) Les polymorphismes connus Les mutations délétères rapportées dans les bases de données La conservation phylogénétique 25

Les séquences introniques encadrant l exon 4 de RB1 Intron 3 Intron 4 Blast Vérification Comparaison de séquences Principe Exemple d utilisation Aligner la séquence de chacun des primers afin de voir si la bonne séquence nucléotidique est retrouvée. Adresse du site internet 26

http://www.ncbi.nlm.nih.gov/blast/blast.cgi? On copie la séquence du primer forward dans la fenêtre de requête Blast en cours 27

Résultat 1 ère requête Blast Code couleur des scores d alignement Le classement se fait par ordre décroissant de similarité (score d alignement) Suite résultats Blast 28

Blast primer reverse GenBank RB1 Primer forward Primer reverse 29

Catalogue des mutations du gène RB1 http://www.sanger.ac.uk /genetics/cgp/cosmic/ Rentrer RB1 dans cette fenêtre Résultat requête RB1 Cliquer sur RB1 30

Résultat requête RB1 La répartition des mutations le long de la séquence codante de RB1 Répartition des mutations RB1 dans les cancers humains Quelles sont les mutations contenues dans l exon 4 de RB1? Comme on connaît les AA de l exon 4 fenêtre de recherche limitée aux AA 127 à 167 inclus 31

Pathologies liées à RB1 Online Mendelian Inheritance in Men (OMIM) http://www.ncbi.nlm.nih.gov/omim Rentrer RB1 dans cette fenêtre 32

Résultat requête RB1 Cliquer sur RB1 TEXT Cloning Gene structure Mapping Gene Function Evolution Molecular Genetics Retinoblastoma Small Cell Lung cancer Allelic variants (28) Rapporte certaines mutations remarquables References (80) Contributors Creation date Edit history (de la fiche!) 33

Trouver une consultation en Europe concernant le rétinoblastome http://www.orpha.net/ consor4.01/www/cgibin/index.php?lng=fr Rentrer RB1 dans cette fenêtre 34

Trouver une consultation en Europe concernant le rétinoblastome http://www.orpha.net/ consor4.01/www/cgibin/index.php?lng=fr Rentrer Rétinoblastome dans cette fenêtre Cliquer sur Rétinoblastome 35

Cliquer sur «centres experts», sélectionner «France» puis «consultations et conseil génétique» Aquitaine - rétinoblastome Pas de consultation spécialisée, mais 5 consultations de conseil génétique 36

Que retenir du cours? Les grandes voies de recherche d information Bibliographie ADN protéines Applications pratiques quel site permet de trouver quelle information? Les principes sous-jacents des banques lorsqu ils sont énoncés Les noms généraux des sites (ex : Pubmed, OMIM,.) Ne pas retenir les détails Pour chaque site internet concernant la requête précise RB1 Les adresses internet! 37