TECHNOLOGIES DE SÉQUENÇAGE. M2BI Benjamin Noel

Documents pareils
Big data et sciences du Vivant L'exemple du séquençage haut débit

Une habitude quotidienne

CATALOGUE DES PRESTATIONS DE LA

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

Galaxy Training days. Liste des sessions disponibles : Les formateurs :

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Analyse des données de séquençage massif par des méthodes phylogénétiques

Lean approach on production lines Oct 9, 2014

Big Data et la santé

Package Contents. System Requirements. Before You Begin

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Cartographie des solutions BigData

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

SensOrLabs. a protocol validation platform for the IoT. Dominique Barthel, Quentin Lampin IMT/OLPS/BIZZ/MIS Apr 7th 2014, ST, CEA, LIG

The impacts of m-payment on financial services Novembre 2011

Usine Numérique Intégration Produit Production

SysFera. Benjamin Depardon

La gestion des flux de trafic aérien en Europe : état de l art, problèmes et perspectives

Application Form/ Formulaire de demande

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Exemple PLS avec SAS

Les liaisons SPI et I2C

COUNCIL OF THE EUROPEAN UNION. Brussels, 18 September 2008 (19.09) (OR. fr) 13156/08 LIMITE PI 53

RFC 791 (Jon Postel 1981)

Procédure d utilisation du Beckman CEQ 2000 XL pour la réalisation de programmes de séquençage ou de génotypage.

Instructions pour mettre à jour un HFFv2 v1.x.yy v2.0.00

Kick Off SCC EMC l offre EXTREMIO. fmarti@fr.scc.com Philippe.rolland@emc.com. Vers de nouveaux horizons

Galaxy est une plateforme de traitements (bio)informatiques accessible depuis l'url : (en précisant votre login et mot de passe LDAP «genotoul»).

Spécial Catégorie 6 Patch Cords

physicien diplômé EPFZ originaire de France présentée acceptée sur proposition Thèse no. 7178

Project 1 Experimenting with Simple Network Management Tools. ping, traceout, and Wireshark (formerly Ethereal)

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Les mésocentres HPC àportée de clic des utilisateurs industriels

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Chapitre 7 : Structure de la cellule Le noyau cellulaire

MANUEL MARKETING ET SURVIE PDF

Spécifications détaillées

INSTRUMENTS DE MESURE SOFTWARE. Management software for remote and/or local monitoring networks

USB 598. Quick Start Guide (Windows) Guide de démarrage rapide (Windows) USB Modem. Modem USB.

Convergence entre Sécurité et Conformité par l approche Software as a Service Présentation en avant-première de QualysGuard Policy Compliance

HAUTE DISPONIBILITÉ DE MACHINE VIRTUELLE AVEC HYPER-V 2012 R2 PARTIE CONFIGURATION OPENVPN SUR PFSENSE

Potentiels de la technologie FPGA dans la conception des systèmes. Avantages des FPGAs pour la conception de systèmes optimisés

Guide d'installation rapide TFM-560X YO.13

SCHOLARSHIP ANSTO FRENCH EMBASSY (SAFE) PROGRAM APPLICATION FORM

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Le Micro Trading comme Profession

SÉQUENÇAGE DE TYPE RAD-SEQ, PRÉSENTATION ET TRAITEMENT ANALYTIQUE

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

StruxureWare Power Monitoring Expert v7.2

Nicolas Géraud CXO dasein interactions. Extraits de l intervention de

Don't put socks on the Hippopotamus. Bill BELT Emmanuel DE RYCKEL

National Research Council Canada

Guide du système NextSeq MD 500

Caractéristiques principales:

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

Italiano - English - Français

CEPF FINAL PROJECT COMPLETION REPORT

Assemblage adaptatif de génomes et de méta-génomes par passage de messages

Paxton. ins Net2 desktop reader USB

Pierre-Louis Théron Nikolay Rodionov Axel Delmas

Le socle de sécurité nouvelle génération Consolider, virtualiser et simplifier les architectures sécurisées

La Poste choisit l'erp Open Source Compiere

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

The UNITECH Advantage. Copyright UNITECH International Society All rights reserved. Page 1

Introduction à la Génomique Fonctionnelle

CONTEC CO., LTD. Novembre 2010

Introduc)on à Ensembl/ Biomart : Par)e pra)que

«Quick-Check Asset Management»

Comment la ville de Westmount a automatisé la préparation de ses réunions du conseil :

La physique médicale au service du patient: le rôle de l agence internationale de l énergie atomique

Master Développement Durable et Organisations Master s degree in Sustainable Development and Organizations Dossier de candidature Application Form

Les Biolangages. Thierry Lecroq. Université de Rouen FRANCE. university-logo. Thierry Lecroq (Univ. Rouen) MB / 16

SERVICES DE SEQUENÇAGE

Indiscrétions et «zones constructeurs» «Redécouvrons nos disques durs»

Plateforme Technologique Innovante. Innovation Center for equipment& materials

Défis de l interdisciplinarité. Professeur Roderick J. Lawrence Université de Genève

PROJET DE LOI. An Act to Amend the Employment Standards Act. Loi modifiant la Loi sur les normes d emploi

domovea tébis La maison sous contrôle

LES MÉMOIRES FLASH : ENTRE MÉMOIRE VIVE ET MÉMOIRE DE STOCKAGE. Etienne Nowak 12 mars Etienne Nowak - 12 mars GIS-SPADON

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

XtremWeb-HEP Interconnecting jobs over DG. Virtualization over DG. Oleg Lodygensky Laboratoire de l Accélérateur Linéaire

COPYRIGHT 2014 ALCATEL-LUCENT. ALL RIGHTS RESERVED.

!" #$$%& Disque dur 2.5 pouces Firewire Apple MacOS FR V2.4 - Page 1/17

Caractéristiques principals:

Calcul intensif pour la biologie

Approche Hybride de la Diffusion OTT. Julien Privé / Senior Solutions Engineer

Le très haut débit sur le territoire du Parc des Monts d'ardèche

Support Orders and Support Provisions (Banks and Authorized Foreign Banks) Regulations

Bitdefender GravityZone

Moteur DC: Comment faire varier sa vitesse?

EN UNE PAGE PLAN STRATÉGIQUE

Mise en place d un système de cabotage maritime au sud ouest de l Ocean Indien. 10 Septembre 2012

The assessment of professional/vocational skills Le bilan de compétences professionnelles

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

WiFi Security Camera Quick Start Guide. Guide de départ rapide Caméra de surveillance Wi-Fi (P5)

NEC Virtual PC Center

Transcription:

TECHNOLOGIES DE SÉQUENÇAGE M2BI Benjamin Noel bnoel@genoscope.cns.fr http://www.genoscope.cns.fr/rdbioseq 18 OCTOBRE 2016

TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano

TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano

INTRODUCTION Séquençage Définition de l enchainement des bases contenues dans une molécule d ADN Waterston et al., On the sequencing of the human genome. Proc Natl Acad Sci U S A. 2002 Mar 19; 99(6): 3712 3716.

INTRODUCTION Couverture homogène des NGS Fragment d ADN Reads Répartition de la couverture sur une séquence chromosomique Sanger 454 Illumina Couverture = Nombre de fois qu une base est séquencée

INTRODUCTION Changements apportés par les NGS Diminutions du nombre d étapes et du temps nécessaires à la préparation des échantillons Augmentation du volume de données générées Diminution du coût de séquençage Par rapport à la 1 ère génération de séquenceur: Diminution de la taille des lectures Augmentation (acceptable) du taux d erreurs compensé par la capacité de séquençage 454 : erreurs type insertion/deletion Illumina : erreur type missmatch

INTRODUCTION

L INSTITUT DE GÉNOMIQUE CEA : Commissariat à l énergie atomique et aux énergies alternatives Direction de la Recherche Fondamentale Institut de Génomique http://www.genoscope.cns.fr CNS = Genoscope (Centre National de Séquençage) CNG = Centre National de Génotypage http://www.cng.fr/ Among the largest sequencing center in Europe Part of the CEA Institut de Génomique since 05/2007 Provide high-throughput sequencing data to the French Academic community, and carry out in-house genomic projects

CAPACITÉ DE SÉQUENÇAGE DE L INSTITUT Illumina 2+1 HiSeq4000 2+3 HiSeq2500 4+8 HiSeq 2000 5 HiSeq X 2+2 MiSeq 1 NextSeq Oxford Nanopore 6+1 MinIon Mk1 10X Genomics 1 Chromium Irys Systems

TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano

ILLUMINA SEQUENCING HiSeq MiSeq

ILLUMINA SEQUENCING http://www.illumina.com/ Library preparation Cluster generation Sequencing

ILLUMINA SEQUENCING Library preparation Préparation des échantillons spécifiques à la technologie de séquençage Différents types de banque : Paired End : séquençage de fragments de 300 à 1000pb Paired End chevauchante : séquençage de fragments de taille précise (exemple : autour de 315pb) Mate Pair : séquençage des extrémités de grands fragments (entre 3 et 10Kb) Moleculo : séquençage de fragments 300-600pb conduisant à la production de pseudo molécules de grandes tailles (autour de 10Kb) RNAseq Eucaryote : séquençage d ARN fragmentés RNAseq Procaryote : séquençage d ARN fragmentés Library preparation Cluster generation Sequencing

ILLUMINA SEQUENCING Résultat du séquençage Fragment d ADN Reads GAP (taille?) Taille connue

ILLUMINA SEQUENCING Construction de banques pour le séquençage Plusieurs types de banques variant selon protocole d obtention Distance entre les lectures connues pour les banques PE et MP

ILLUMINA SEQUENCING Banque Mate pair (Illumina) L objectif est d obtenir les séquences des extrémités de fragments de grandes tailles (3,5,10 kb) Fragmentation (5kb par Covaris, 10kb par hydroshear) Ajout d une biotine aux extrémités Circularisation Utile pour l assemblage des séquences ~ 5-10 Kb Fragmentation de l ADN circulaire (~ 200-1000 pb) et sélection des fragments biotinilés Ligation des adaptateurs Solexa Sequençage en paired end Read 1 Read 2

ILLUMINA SEQUENCING RNAseq Eucaryote SMARTER Kit http://bitesizebio.com/13542/what-everyone-should-know-about-rna-seq/ http://www.clontech.com/it/thats_good_science/translational_research/products/rna-seq

ILLUMINA SEQUENCING RNAseq Procaryote ARN totaux Déplétion rrna avec kit RiboZero Bacteria (EPICENTRE)

ILLUMINA SEQUENCING RNAseq: protocoles non orienté vs orienté Non orienté Orienté

ILLUMINA SEQUENCING Cluster generation Patterned Flow Cell http://www.illumina.com/systems/hiseq-3000-4000.html Library preparation Cluster generation Sequencing

http://www.illumina.com/

ILLUMINA SEQUENCING http://www.illumina.com/ Library preparation Cluster generation Sequencing

Performances ILLUMINA SEQUENCING

TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano

LONGUEUR DES LECTURES L importance de la taille des fragments

OXFORD NANOPORE TECHNOLOGY https://nanoporetech.com/how-it-works https://www.nanoporetech.com/

OXFORD NANOPORE TECHNOLOGY Portable device, plugs into a computer using a USB interface Low-cost device : 1000$ with 2 flowcells Doesn t require DNA synthesis : low-cost Produces reads up to 100 kb Error rates around 10% Early access in 2014 https://www.nanoporetech.com/

OXFORD NANOPORE TECHNOLOGY https://www.nanoporetech.com/

OXFORD NANOPORE TECHNOLOGY Nanopore sequencing at Genoscope 1 Bench 6 Laptops 6 MinIONs At least 1 technician

OXFORD NANOPORE TECHNOLOGY Une technologie évoluant (très) rapidement 2014 : R6 / MAP4 5 Mb > 80% d identité (run 48h) 2015 : R7.3 / MKI 100 Mb > 80% d identité (run 48h) 2016 : R9 / Fast Mode / basecall RRN 525 Mb > 80%, 175Mb > 90% (run 24h) https://www.nanoporetech.com/

OXFORD NANOPORE TECHNOLOGY Taux d exactitude Lectures 1D de qualité supérieure aux lectures 2D avant R9 Pics à 90% pour les lectures 1D et 95% pour les lectures 2D Médiane à 85% pour les lectures 1D et 91% pour les lectures 2D

OXFORD NANOPORE TECHNOLOGY Méthode de correction des erreurs de séquences DAY 1 DAY 3 3-6H 48H 15H 5H Library prep MinION sequencing NaS workflow Perfect and Long Reads Genome Assembly Perfect Genome Library prep Illumina MiSeq sequencing http://www.genoscope.cns.fr/nas/

STRATÉGIE DE SÉQUENÇAGE AU GENOSCOPE Lectures courtes (150 pb) Taux d erreur très faible (<0,1%) Coût à la base faible Lectures longues (>100 Kbp) Taux d erreur élevé pour le moment (~15%) Coût à la base faible https://www.nanoporetech.com/

OXFORD NANOPORE TECHNOLOGY PromethION https://www.nanoporetech.com/

TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques Bionano

PACIFIC BIOSCIENCES http://www.pacificbiosciences.com/

PACIFIC BIOSCIENCES PacBio RSII metrics RSII Output Range 5-10 Gb / SMRT cell Number of reads ~50k Average read length 8kb 12kb Max. read length >20kb Average run time >2h Number of SMRT cell / run 1 16 http://www.pacificbiosciences.com/

TECHNOLOGIES DE SÉQUENÇAGE Introduction Différentes technologies de séquençage Illumina Oxford Nanopore Technology Pacific Biosciences Cartes optiques BioNano

CARTES OPTIQUES BioNano (Irys) http://www.bionanogenomics.com/technology/irys-technology/

Irys workflow CARTES OPTIQUES

CARTES OPTIQUES Irys sytem: DNA Linearization in Nanochannel Arrays 75 kbp