TECHNOLOGIES DE SÉQUENÇAGE M2BI Benjamin Noel bnoel@genoscope.cns.fr http://www.genoscope.cns.fr/rdbioseq 18 OCTOBRE 2016
TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano
TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano
INTRODUCTION Séquençage Définition de l enchainement des bases contenues dans une molécule d ADN Waterston et al., On the sequencing of the human genome. Proc Natl Acad Sci U S A. 2002 Mar 19; 99(6): 3712 3716.
INTRODUCTION Couverture homogène des NGS Fragment d ADN Reads Répartition de la couverture sur une séquence chromosomique Sanger 454 Illumina Couverture = Nombre de fois qu une base est séquencée
INTRODUCTION Changements apportés par les NGS Diminutions du nombre d étapes et du temps nécessaires à la préparation des échantillons Augmentation du volume de données générées Diminution du coût de séquençage Par rapport à la 1 ère génération de séquenceur: Diminution de la taille des lectures Augmentation (acceptable) du taux d erreurs compensé par la capacité de séquençage 454 : erreurs type insertion/deletion Illumina : erreur type missmatch
INTRODUCTION
L INSTITUT DE GÉNOMIQUE CEA : Commissariat à l énergie atomique et aux énergies alternatives Direction de la Recherche Fondamentale Institut de Génomique http://www.genoscope.cns.fr CNS = Genoscope (Centre National de Séquençage) CNG = Centre National de Génotypage http://www.cng.fr/ Among the largest sequencing center in Europe Part of the CEA Institut de Génomique since 05/2007 Provide high-throughput sequencing data to the French Academic community, and carry out in-house genomic projects
CAPACITÉ DE SÉQUENÇAGE DE L INSTITUT Illumina 2+1 HiSeq4000 2+3 HiSeq2500 4+8 HiSeq 2000 5 HiSeq X 2+2 MiSeq 1 NextSeq Oxford Nanopore 6+1 MinIon Mk1 10X Genomics 1 Chromium Irys Systems
TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano
ILLUMINA SEQUENCING HiSeq MiSeq
ILLUMINA SEQUENCING http://www.illumina.com/ Library preparation Cluster generation Sequencing
ILLUMINA SEQUENCING Library preparation Préparation des échantillons spécifiques à la technologie de séquençage Différents types de banque : Paired End : séquençage de fragments de 300 à 1000pb Paired End chevauchante : séquençage de fragments de taille précise (exemple : autour de 315pb) Mate Pair : séquençage des extrémités de grands fragments (entre 3 et 10Kb) Moleculo : séquençage de fragments 300-600pb conduisant à la production de pseudo molécules de grandes tailles (autour de 10Kb) RNAseq Eucaryote : séquençage d ARN fragmentés RNAseq Procaryote : séquençage d ARN fragmentés Library preparation Cluster generation Sequencing
ILLUMINA SEQUENCING Résultat du séquençage Fragment d ADN Reads GAP (taille?) Taille connue
ILLUMINA SEQUENCING Construction de banques pour le séquençage Plusieurs types de banques variant selon protocole d obtention Distance entre les lectures connues pour les banques PE et MP
ILLUMINA SEQUENCING Banque Mate pair (Illumina) L objectif est d obtenir les séquences des extrémités de fragments de grandes tailles (3,5,10 kb) Fragmentation (5kb par Covaris, 10kb par hydroshear) Ajout d une biotine aux extrémités Circularisation Utile pour l assemblage des séquences ~ 5-10 Kb Fragmentation de l ADN circulaire (~ 200-1000 pb) et sélection des fragments biotinilés Ligation des adaptateurs Solexa Sequençage en paired end Read 1 Read 2
ILLUMINA SEQUENCING RNAseq Eucaryote SMARTER Kit http://bitesizebio.com/13542/what-everyone-should-know-about-rna-seq/ http://www.clontech.com/it/thats_good_science/translational_research/products/rna-seq
ILLUMINA SEQUENCING RNAseq Procaryote ARN totaux Déplétion rrna avec kit RiboZero Bacteria (EPICENTRE)
ILLUMINA SEQUENCING RNAseq: protocoles non orienté vs orienté Non orienté Orienté
ILLUMINA SEQUENCING Cluster generation Patterned Flow Cell http://www.illumina.com/systems/hiseq-3000-4000.html Library preparation Cluster generation Sequencing
http://www.illumina.com/
ILLUMINA SEQUENCING http://www.illumina.com/ Library preparation Cluster generation Sequencing
Performances ILLUMINA SEQUENCING
TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano
LONGUEUR DES LECTURES L importance de la taille des fragments
OXFORD NANOPORE TECHNOLOGY https://nanoporetech.com/how-it-works https://www.nanoporetech.com/
OXFORD NANOPORE TECHNOLOGY Portable device, plugs into a computer using a USB interface Low-cost device : 1000$ with 2 flowcells Doesn t require DNA synthesis : low-cost Produces reads up to 100 kb Error rates around 10% Early access in 2014 https://www.nanoporetech.com/
OXFORD NANOPORE TECHNOLOGY https://www.nanoporetech.com/
OXFORD NANOPORE TECHNOLOGY Nanopore sequencing at Genoscope 1 Bench 6 Laptops 6 MinIONs At least 1 technician
OXFORD NANOPORE TECHNOLOGY Une technologie évoluant (très) rapidement 2014 : R6 / MAP4 5 Mb > 80% d identité (run 48h) 2015 : R7.3 / MKI 100 Mb > 80% d identité (run 48h) 2016 : R9 / Fast Mode / basecall RRN 525 Mb > 80%, 175Mb > 90% (run 24h) https://www.nanoporetech.com/
OXFORD NANOPORE TECHNOLOGY Taux d exactitude Lectures 1D de qualité supérieure aux lectures 2D avant R9 Pics à 90% pour les lectures 1D et 95% pour les lectures 2D Médiane à 85% pour les lectures 1D et 91% pour les lectures 2D
OXFORD NANOPORE TECHNOLOGY Méthode de correction des erreurs de séquences DAY 1 DAY 3 3-6H 48H 15H 5H Library prep MinION sequencing NaS workflow Perfect and Long Reads Genome Assembly Perfect Genome Library prep Illumina MiSeq sequencing http://www.genoscope.cns.fr/nas/
STRATÉGIE DE SÉQUENÇAGE AU GENOSCOPE Lectures courtes (150 pb) Taux d erreur très faible (<0,1%) Coût à la base faible Lectures longues (>100 Kbp) Taux d erreur élevé pour le moment (~15%) Coût à la base faible https://www.nanoporetech.com/
OXFORD NANOPORE TECHNOLOGY PromethION https://www.nanoporetech.com/
TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano
PACIFIC BIOSCIENCES http://www.pacificbiosciences.com/
PACIFIC BIOSCIENCES PacBio RSII metrics RSII Output Range 5-10 Gb / SMRT cell Number of reads ~50k Average read length 8kb 12kb Max. read length >20kb Average run time >2h Number of SMRT cell / run 1 16 http://www.pacificbiosciences.com/
TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques BioNano
CARTES OPTIQUES BioNano (Irys) http://www.bionanogenomics.com/technology/irys-technology/
Irys workflow CARTES OPTIQUES
CARTES OPTIQUES Irys sytem: DNA Linearization in Nanochannel Arrays 75 kbp