INTRODUCTION TO NEXT GENERATION SEQUENCING

Documents pareils
SÉQUENÇAGE DE TYPE RAD-SEQ, PRÉSENTATION ET TRAITEMENT ANALYTIQUE

CATALOGUE DES PRESTATIONS DE LA

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Introduction à la Génomique Fonctionnelle

Exemple PLS avec SAS

Biomarqueurs en Cancérologie

Editing and managing Systems engineering processes at Snecma

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

Isolement automatisé d ADN génomique à partir de culots de cellules sanguines à l aide de l appareil Tecan Freedom EVO -HSM Workstation

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

Big data et sciences du Vivant L'exemple du séquençage haut débit

ETABLISSEMENT D ENSEIGNEMENT OU ORGANISME DE FORMATION / UNIVERSITY OR COLLEGE:

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Sagemcom EDI with Suppliers

Rapport Scientifique Seine-Aval 3

UML : Unified Modeling Language

COPYRIGHT Danish Standards. NOT FOR COMMERCIAL USE OR REPRODUCTION. DS/EN 61303:1997

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

INSERTION TECHNIQUES FOR JOB SHOP SCHEDULING

Logitech Tablet Keyboard for Windows 8, Windows RT and Android 3.0+ Setup Guide Guide d installation

génomique - protéomique acides nucléiques protéines microbiologie instrumentation

Stratégie DataCenters Société Générale Enjeux, objectifs et rôle d un partenaire comme Data4

Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

Fiche produit ifinance v4

L OBSERVATOIRE DE LA BIOLOGIE DE SYNTHESE SYNTHETIC BIOLOGY OBSERVATORY

sur le réseau de distribution

Calcul intensif pour la biologie

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

Outils d'analyse de la sécurité des réseaux. HADJALI Anis VESA Vlad

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

PANDORA database: a compilation of indoor air pollutant emissions

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

GAME CONTENTS CONTENU DU JEU OBJECT OF THE GAME BUT DU JEU

Instructions Mozilla Thunderbird Page 1

RAPID Prenez le contrôle sur vos données

CONVENTION DE STAGE TYPE STANDART TRAINING CONTRACT

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

LE PLAN SAUMON DE LOIRE- ALLIER THE LOIRE-ALLIER. Nicolas FORRAY Dreal Centre, Dreal de bassin Loire-Bretagne

Nouveautés printemps 2013

SERVICES DE SEQUENÇAGE

Les contraintes de financement des PME en Afrique : le rôle des registres de crédit

Nouvelle approche de validation Novo Nordisk

Lesson Plan Physical Descriptions. belle vieille grande petite grosse laide mignonne jolie. beau vieux grand petit gros laid mignon

Spécialiste en biologie moléculaire, votre partenaire de l extraction à l amplification

Improving the breakdown of the Central Credit Register data by category of enterprises

TD de Biochimie 4 : Coloration.

Dans une agence de location immobilière...

Diagnostic et suivi virologique des hépatites virales B et C. Marie-Laure Chaix Virologie Necker

RISK-BASED TRANSPORTATION PLANNING PRACTICE: OVERALL METIIODOLOGY AND A CASE EXAMPLE"' RESUME

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

Photoactivatable Probes for Protein Labeling

Université de Montréal. Développement d outils pour l analyse de données de ChIP-seq et l identification des facteurs de transcription

Exercices sur SQL server 2000

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Afin de valider votre inscription merci de bien veiller à :

Enjeux et défis en assurance habitation Marc-Olivier Faulkner 18 novembre 2011

Le NFC : une technologie victime de son écosystème 04/06/2014

Étude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux?

Technologies quantiques & information quantique

Data issues in species monitoring: where are the traps?

Hépatite chronique B Moyens thérapeutiques

La PCR quantitative (qpcr) et le guide de bonnes pratiques MIQE : adaptation et pertinence dans le contexte de la biologie clinique

Forthcoming Database

Contrôle de l'expression génétique :

Y a-t-il une place pour un vaccin thérapeutique contre l hépatite B? H. Fontaine, Unité d Hépatologie Médicale, Hôpital Cochin

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

NORME INTERNATIONALE INTERNATIONAL STANDARD. Dispositifs à semiconducteurs Dispositifs discrets. Semiconductor devices Discrete devices

WINTER BOAT STORAGE SYSTEM SYSTÈME DE REMISAGE HIVERNAL POUR BATEAU

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

Détection et prise en charge de la résistance aux antirétroviraux

Tammy: Something exceptional happened today. I met somebody legendary. Tex: Qui as-tu rencontré? Tex: Who did you meet?

Tier 1 / Tier 2 relations: Are the roles changing?

FOURTH SESSION : "MRP & CRP"

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

Logiciel Libre & qualité. Présentation

Stratégie de réduc-on des déchets Waste Reduc-on Strategy: Contrat 2016 Contract

INSTRUMENTS DE MESURE SOFTWARE. Management software for remote and/or local monitoring networks

Règlement sur le télémarketing et les centres d'appel. Call Centres Telemarketing Sales Regulation

Nicolas Géraud CXO dasein interactions. Extraits de l intervention de

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Revision of hen1317-5: Technical improvements

The impacts of m-payment on financial services Novembre 2011

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

TP11 - Administration/Tuning

ASSEMBLY INSTRUCTIONS DIRECTIVES POUR L'ASSEMBLAGE ombre pendant lamp lampe suspendue à tons dégradés, chocolat

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

BNP Paribas Personal Finance

Introduction aux bases de données: application en biologie

Transcription:

ECOLE DE BIOINFORMATIQUE INITIATION AU TRAITEMENT DES DONNÉES DE GÉNOMIQUE OBTENUES PAR SÉQUENÇAGE À HAUT DÉBIT 05-10 OCTOBRE 2014 - STATION BIOLOGIQUE - ROSCOFF INTRODUCTION TO NEXT GENERATION SEQUENCING Claude Thermes Genome analysis Centre de Génétique Moléculaire Gif-sur-Yvette 06/10/2014

Step 1: sample preparation Step 2: sequencing (Illumina) Step 3: data analysis (with permission of ABIMS)

Situation in 2009 1-5 µg genomic DNA Genome sequencing 10 ng DNA 10 µg total RNA 10 µg total RNA Adapted from Science 306:636-640, 2004

Situation today 1-5 µg genomic DNA 50 ng Genome sequencing 10 ng DNA 10 µg total RNA 1-2 ng 1 µg 10 µg total RNA 1ng Adapted from Science 306:636-640, 2004

Libraries from DNA samples

DNA-seq Libraries Illumina TruSeq technology Genomic DNA Sonication Size selection Adaptors ligation PCR

DNA-seq Libraries Illumina TruSeq technology Genomic DNA Sonication Size selection? Adaptors ligation PCR

Ligate Y-adaptors PCR Primer 1: complementary to R Primer 2: equivalent to R

DNA-seq Libraries Nextera tagmentation Tagment Enzyme fragments DNA and attaches junction adapters (blue and green) to both ends of the tagmented molecule Transposomes / Tagment Enzyme Tagmentation Dual barcode approach up to 96 indexed samples rapid ( 2 hours) and requires small quan33es (50 ng)

Paired end sequencing 1 rst read 2 d read

Comparison of single read versus paired end sequencing Single read density??? Paired end density

Single read density??? Paired end density Paired end density Paired end sequencing : improves genome assembly but requires a good control of DNA fragmenta3on (purifying gels/columns) 3me consuming and requires large quan33es (1-5 µg)

BUT : Paired end fragments are too short for assembling large genomes with many repeated elements mate pair libraries

Classical Illumina mate pair library several kilobases Problems : low coverage few fragments, over- amplified

A new method : Nextera Mate Pair Tagment Enzyme fragments DNA and attaches a biotinylated junction adapter (green) to both ends of the tagmented molecule circularization Fragmentation enrichment via the biotin tag adapters ligation at both ends

A new method : Nextera Mate Pair Tagment Enzyme fragments DNA and attaches a biotinylated junction adapter (green) to both ends of the tagmented molecule circularization Fragmentation enrichment via the biotin tag rapid ( few hours) and requires small quan33es (50 ng) adapters ligation at both ends

Quelques remarques Protocole Illumina Truseq Ligations d adaptateurs Nextera Tagmentation Matériel de départ Avantages inconvénients Fragments d ADN (dble brin) Génomique ou ChIP 1-1000ng Peu sensible à qualité du matériel Très versatile, contrôle précis de la taille (purif sur gel ) Protocole préféré si on veut des tailles homogènes, ou grandes pour du paired end 2x250 Fonctionne également sans PCR si quantité de matériel suffisante (>100ng) Protocole long : 1-2 journées dimères possibles, fragmentation nécessaire ADN génomique, 50 ng (grands génomes) Très rapide (4h) Très sensible à qualité de l ADN de départ (intégrité, pureté) Difficile de contrôler la taille des inserts qui sont trop petits pour paired end 2X250 PCR obligatoire Remarques Très adaptable, on peut ajuster le nombre de cycles PCR à la quantité de matériel de départ Si petites quantités : utiliser des billes la taille des fragments de départ déterminera la taille finale des fragments Possibilité de double tag (96 index) Non miltiplexable avec Truseq (primers différents de Truseq)

Some examples of libraries prepared from DNA samples Exome sequencing Hi-C Long-range interactions Rad-seq Re-sequencing Indels, SNP, CNV DNA replication origins De novo sequencing Adapted from Science 306:636-640, 2004

Re-sequencing : identification of SNP, indels Mutations specific to forward strand

Mutations due to mono-directional sequence effect Nakamura et al. NAR (2011) Partial blockage of DNA synthesis

Dephasing due to partial blockage of DNA synthesis

Dephasing due to partial blockage of DNA synthesis

Mutations due to bi-directional sequence effect

Libraries from RNA samples

RNA-seq Libraries

Quelques remarques Tous les protocoles sont directionnels Protocole TruSeq small RNA (Illumina) ScriptSeq (Epicentre) TotalScript (Epicentre, Nextera) Matériel de départ ARN déplété ou polya 25-100 ng ARN déplété ou polya 0,5-50 ng ARN total (ou polya) 1-5ng ARN NON DEGRADÉ (tagmentation) Principe fragmentation Ligation sur ARN RT & PCR RT par random priming PCR RT par oligo dt PCR++ Avantages inconvénients Remarques Taille des fragments bien contrôlée Adapté pour paired end 2X250 Aberrations si trop petites quantités 2-3 jours de manip non automatisable Petites quantités Possible même si dégradé (FFPE) Rapide, automatisable Sensible à contamination par gdna Fragmentation non contrôlée (200-800nt) Semble donner pas mal de duplicats quand les quantités sont dans la gamme basse RNA-seq possible même si très petites quantités d ARN total L ARN doit être peu dégradé Non adapté pour paired end 2X250 Non multiplexable avec TruSeq (index Nextera)

Comparison of two RNA fragmenta3on protocols : SOLiD (Transcriptome Analysis kit) : RNase III fragmenta.on and Illumina (Direc3onal mrna- Seq kit) : Zinc fragmenta.on

SOLiD TM Whole Transcriptome Analysis Kit: RNase III fragmentation RiboMinus RNA fragmented RNA RNaseIII Hybridiza6on with adapters, liga6on 5 3 N NNNNNN Reverse transcrip6on Size selec6on PCR amplifica6on

Illumina directional mrna-seq Library: Zinc fragmentation RiboMinus RNA fragmented RNA Zinc Hybridiza6on with adapters, liga6on 5 3 N NNNNNN Reverse transcrip6on Size selec6on PCR amplifica6on

Sequencing Illumina (Zinc) and Solid (Rnase III) libraries intron YBR078W Zinc Same number of reads RNase III

Examples of libraries from RNA samples mirna-seq Identification mrna 5 ends of Ribo-seq Long non-coding RNAs Pol II FRT-seq CLIP-seq NET-seq

NET-seq : Native Elongating Transcript sequencing Churchman and Weissman, 2011 sequencing of 3 ends of nascent RNAs still associated with RNA polymerase distribution of transcribing polymerases along the genome in a strand specific manner allows studies of transcription termination Pol II Pol II Cells in desired condition Pol II Pol II Pol II RNA polymerase II immunoprecipitation Recovery of nascent transcripts Associated with the polymerase RNA-seq and mapping on the genome

FRT-seq: amplification-free, strand-specific transcriptome sequencing Mamanova et al. Nature Methods (2010) The reverse transcription reaction takes place on the flowcell No PCR amplification, so PCR biases and duplicates are avoided Because the template is poly(a) + RNA rather than cdna, the resulting sequences are necessarily strand-specific The method is compatible with paired- or single-end sequencing RT on the flowcell Cluster generation

Some problems

Libraries prepared from very small amounts of DNA or RNA (<< 1ng) ChIP- seq with very small amounts of immuno- precipitated material RNA from small amounts of 3ssue (laser dissec3on) Typical problem : accumula3on of dimers of the two adaptors adaptor dimers are amplified more rapidly than other fragments and invade the libraries they cons3tute the majority of sequenced reads rare fragments then tend to be non homogenously amplified

Sequencing of very small amounts of genome fragments (<< 1ng) 13 kb Small in put DNA 43 kb Increasing input DNA

New direc3ons with single- cell sequencing FLUIDIGM C 1 System : allows measurement of gene expression in 96 single-cells MALBAC Multiple Annealing and Looping-based Amplification Cycles Allows sequencing the genome of a unique cell (Zong C. et al. Science, 2012) Many other systems are in development : larger cell numbers, single-cell ChIP-seq, etc.