DNA-seqciblé : principales méthodes d'enrichissement DU de séquençage haut-débit Module 1 : Séquençage nouvelle génération - Technologies & applications 17 octobre 2013 Amélie PITON piton@igbmc.fr 1
Introduction Rappel sur la préparation de l ADN pour séquençage de génome: ADN génomique Construction de la librairie Séquençage Hybridation sur puce séquençage
fragmentation Construction de librairie de séquençage Réparation des extrémités A A Ajout d un A libre A A A A A A A A Vérification qualité ADN Ligation d adaptateurs Sélection de taille Amplification PCR tag 3
Introduction Rappel sur la préparation de l ADN pour séquençage de génome: Sonicateur ADN génomique Construction de la librairie Robot préparation librairies Machine PCR Séquençage Hybridation sur puce séquençage Analyseur qualité ADN
Une séquence = une read Notion de profondeur de couverture Profondeur de couverture: nombre de readschevauchante à une région donnée (en X) 13X 5
Introduction Limitations du séquençage de génomes entiers: - Profondeur de couverture faible - Stockage et conservation des données - Analyses bioinformatiques complexes Enrichissement ciblé de l ADN avant séquençage 6
Introduction Enrichissement ciblé Enrichissement ciblé ADN génomique Construction de la librairie Enrichissement ciblé Séquençage Hybridation sur puce séquençage 7
Enrichissement ciblé But : Etape d enrichissement de l ADN de manière à séquencer majoritairement une/des région(s) d intérêt Intérêt vs génome : - augmentation importante de la couverture - diminution du coût (pooling de plusieurs ADN) -analyses largement simplifiées Désavantage vs génome : - régions non ciblées - régions difficiles à enrichir 8
Utilisation Types de régions à enrichir: -exons de tous les gènes : exomeentier ( >30Mb) - région contigüe (toute séquence génomique) - plusieurs gènes (exons seulement, + ou UTR et/ou introns) Applications: -Identification de nouveaux gènes de maladies génétique (exomes, régions de liaison ou d association) - Diagnostic de maladies génétiquement hétérogènes (exomes, gènes particuliers) 9
Techniques d enrichissement Plusieurs techniques, qui varient en terme de: - sensitivité: % de bases cibles représentées par au moins une séquence/read - couverture: profondeur de couverture totale - spécificité: % séquences correspondant aux régions cibles - uniformité: variabilité de couverture entre régions cibles - reproductibilité: entre différentes séries d enrichissement - coût: réactifs, préparation librairies, pooling sur séquenceur - facilité d utilisation / temps - quantité d ADN nécessaire au départ 10
Techniques d enrichissement 1) Enrichissement par PCR : Amplification des régions d intérêt par PCR et construction de la librairie sur ADN amplifié. 2) Enrichissement par circularisation de fragments d ADN : les fragments d ADNg sont enrichis via une sonde constituée d une séquence universelle flanquée aux extrémités de séquences spécifiques de la région cible. 3) Enrichissement par capture d hybrides/hybridation : Capture de l ADN fragmenté par hybridation des sondes correspondant aux régions cibles 11
3) capture d hybrides 2) circularisationde fragments d ADN 1) PCR d après Mertes et al., 2011 12
1.1. PCR «long-range» Région à couvrir - théoriquement jusque 20-30 kb -pratiquement jusque ~ 10 kb Pour exome: 6 000 PCR de 5kb! 30 ng/pcr 180µg!! 13
PCR uniplex long range 1.1. PCR «long-range» LPPR4 (épilepsie) Knierim E et al., PlosOne, 2011 Pooling équimolaire Fragmentation Préparation de la librairies (ajout d extrémités A, ligationd adaptateurs, PCR avec ajouts des séquences pour le séquençage) PCR avant séquençage 14
1.2. PCR multiplexes -«design» maison Problème du multiplexage: 1) amplification non spécifique 2) interaction entre primers 3) les plus difficiles n amplifient pas -Compagnies qui proposent des design (personnalisés ou panels) pour améliorer PCR multiplexes: 15
1.2. PCR multiplexes 16
17
1.2. PCR multiplexes 18
1.3. PCR en micro-gouttes- principe Ex: RainDance: Une réaction de PCR par microgoutte: 1 paire de primers + 1 échantillon d ADN + réactifs - plus de problèmes liés au multiplexage - possibilité de faire plusieurs milliers de PCR en parallèle 19
1.3. PCR en micro-gouttes- techniques 20
1.3. PCR en micro-gouttes Preuves de concept 21
1.3. PCR en micro-gouttes Preuves de concept Sensitivité 22
Spécificité 23
Uniformité PCR microgouttes PCR classiques 24
25
Reproductibilité 26
Détection de variants Moins de 2,5% non detectés 22 loci génotypes discordants / 2 390 27
Quantité d ADN 7,5 µg 4,5 µg au total Taille région cible 1 er test sur 172,2 kb (457 amplicons) sur 6 individus HapMap 2 ème test sur plus grande région: 1,49Mb (3 976 amplicons) sur 1 individu HapMap
1.3.PCR en micro-gouttes Applications 29
1.3.PCR en micro-gouttes Utilisation Faire son propre «design»: Il faut la machine! Utiliser des panels déjà validés: ASDSeq Panel Cancer Hotspot Panel ADMESeq Panel HLASeq Panel ONCOSeq Panel XSeq Panel 30
1.4. Avantages/désavantages PCR - - - multiplex - problème amplification taille limitante(<3mb) - - quantité ADN Long-range uniplex - taille limitante car uniplex(<500kb) quantité ADN Microgouttes - prix important: machine (+ kit) 31
2. Capture par circularisation Principe: les régions d intérêt sont circularisées, puis l ADN non circularisé est éliminé 1) L ADN se circularise: (Ex: Haloplex) 2) La sonde se circularise et réplique l ADN: Molecular Inversion Probe 32
2.1. Capture par circularisationd ADN (Haloplex, Agilent) 1) Digestion de l ADN (16 enzymes de restriction) 2) Hybridation de la sonde biotinylée 33
2.1. Capture par circularisationd ADN (Haloplex, Agilent) 1) Digestion de l ADN (16 enzymes de restriction) 2) Hybridation de la sonde biotinylée 3) Purification sur billes magnétiques streptavidine 4) Ligation de l ADN 5) PCR sur ADN circulaire http://www.youtube.com/watch?v=ikqxnc89zbw 34
2.2. Capture par circularisation(mip) - Principes MIP (Molecular Inversion probe) Initialement développé pour le génotypage de SNPs Méthode basée sur la circularisation de la sonde Oligonucléotidescontenant une séquence commune flanquée de séquences spécifiques Partie commune (30bp) Pas de fragmentation de l ADNg Séquences spécifiques (2 x 20bp) 35
2.2. Capture par circularisation(mip) - Etapes 1) Hybrider la sonde 2) Polymérisation 3) Digestion de l ADN non circulaire 4) Ligation 5) Relargage de l ADN 6) Amplification 7) Séquençage Séquences adaptatrices puce séquençage Séquences adaptatrices puce séquençage 36
2.2. Capture par circularisation(mip) - Preuves de concept 1Mb 750ng ADN 37
2.2. Capture par circularisation(mip) - Preuves de concept 38
2.2. Capture par circularisation(mip) - Preuves de concept 39
2.2. Capture par circularisation(mip) - Applications Autisme (0,6-2% enfants) communication Interactions sociales comportements stéréotypés Exome ~200 autistes Mutations de novo Etude de réplication: 2 446 autistes 44 gènes = 2 069 sondes MIP 27 mutations de novo dans 16 gènes 40
2.2. Capture par circularisation(mip) - Applications 41 O Roak et al., Science, 2012
2.2. Capture par circularisation(mip) - Applications - sondes chevauchantes à 50% (insert) - sondes alternées (brin) - prédit haute performance -pas de SNP dans parties hybridées - pas de régions répétées O Roak et al., Science, 2012 42
2.2. Capture par circularisation(mip) - Applications 100 ng -Balance des MIP: nouveaux pools avec moins bons MIP ratio mauvais/bons 50:1 O Roak et al., Science, 2012 43
2.2. Capture par circularisation(mip) - Applications 44
2.2. Capture par circularisation(mip) - Applications ASD1: premier set de MIP pour 6 gènes Sensibilité Spécificité ASD2: deuxième set de MIP pour 38 gènes
2.2. Capture par circularisation(mip) - Applications Sensibilité uniformité 46
2.2. Capture par circularisation(mip) - Applications 47 O Roak et al., Science, 2012
2.2. Capture par circularisation + + Etape de construction de librairies incluses (coût, temps) Spécificité et sensibilité importante - - Problème d uniformité -> besoin de rebalançage MIP: Coût élevé par oligonucléotides(rentable si large cohorte) Application idéale: Région ciblée: 0-50 gènes & Cohorte: grande à très grande 48
Capture par circularisation(mip) - - - - 49
3. Capture par hybridation Principe: Hybridation de l ADN à des sondes couvrant la région cible, lavage de l ADN non hybridé Les sondes peuvent être: -sousformesolide(surpuce) -sousformeliquide(en solution) 50
3. Capture par hybridation Etapes: fragmentation Séquençage Apmplification PCR tag Réparation des extrémités/ sélection de taille Construction de librairie A A Ajout d un A libre A A A A A A Ligation d adaptateurs A A Sélection de l ADN hybridé Hybridation avec sondes Amplification par PCR 51
3.1. Capture par hybridation_ support solide 10-15µg Nimblegen 52
3.1. Capture par hybridation_ support solide Nimblegen 53
3.2. Capture par hybridation - en solution 1.Préparer librairie ADN génomique 2. Hybriderlibrairieà 65 C avec les sondes biotinylées 3. Récupérer les hybrides avec billes magnétiques/streptavidine 4. Lavage 5. Amplifier par PCR qqcycles 6. Séquencer SeqCap EZ, Roche NimbleGen 54
3.2. Capture par hybridation - en solution 3µg 1.Préparer librairie ADN génomique Sondes ARN 2. Hybriderlibrairie24-48h à 65 C avec les sondes biotinylées 3. Récupérer les hybrides avec billes magnétiques/streptavidine. Lavage 4. Dégrader les sondes ARN (RNase) 5. Amplifier par PCR qqcycles 6. Séquencer SureSelect, Agilent 55
3.2. Capture par hybridation - en solution - Applications 30 gènes (+ UTR) 189 kb 571 régions Syndrome de Bardet-Biedl: -1/100 000 - transmission autosomale recessive - Hétérogénéité génétique: 16 gènes BBS + 52 patients BBS (3µg ADN) Polydactyly Retinopathy Capture par hybridation en solution (Sureselect, Agilent) Renal anomalies Hypogonadism Cognitive defects Obesity 56
3.2. Capture par hybridation - en solution - Applications Pool (tag après capture) 2. 1. tag Pool (tag avant capture) 57
3.2. Capture par hybridation - en solution - Applications sensibilité spécificité après 2. après 2. avant 1. 14 patients avec mutations connues(validation méthode) 38 patients sans diagnostic. Mutations détectées dans 71% (27/38) des patients 58
3.3. Capture par hybridation - comparaison 59
3.3. Capture par hybridation - comparaison Mamanova et al., 2010 60
3.4. Avantages/désavantages -Capture par hybridation + + + + Région cible: 100kb à plusieurs Mb Sensibilité Uniformité Reproductibilité - - - - ADN 15 µg 3µg Temps important:pas de grand nombre d échantillons Station d hybridation Spécificité moins élevée 61
4. Comparaison des différentes méthodes - - - - - - - Mamanova et al., 2010 62
4. Comparaison des différentes méthodes d après Mertes et al., 2011 63
4. Comparaison des différentes méthodes PCR Enrichissement Enrichissement ciblé ciblé Circularisation ADN génomique Construction de la librairie Enrichissement ciblé Hybridation Séquençage Hybridation sur puce séquençage 64
4. Comparaison des différentes méthodes Difficulté de comparer les différentes méthodes: -dépend de la taille de la région cible et de la cohorte - qualité des résultats dépend aussi de la suite (séquençage, annotation, etc) -les études ne comparent pas toutes les méthodes en même temps 65
4. Comparaison des différentes méthodes 66
4. Comparaison des différentes méthodes 67
MIP SHS MGS 68
9 gènes (100 kb) -8 patients pour tester PCR microgouttes Hybridation en solution Hybridation en solution (exome entier) 69
Couverture <20X 70
5. Conclusions Beaucoup de paramètres à prendre en compte lors du design de l étude Paramètres majeurs: -la taille de la région cible -le nombre d ADN à séquencer Mamanova et al., 2010 71
5. Conclusions Beaucoup de paramètres à prendre en compte lors du design de l étude Paramètres majeurs: -la taille de la région cible -le nombre d ADN à séquencer - application (recherche vs diagnostic) Diagnostic: - haute sensitivité (~100%) - grande couverture (>100-200X) - uniformité - reproductibilité -rapide - peu couteuse - équipement de séquençage disponible Le séquençage ciblé ne vivra peut-être qu un temps L avenir est dans le génome? 72
6. Références Mamanova et al., Nature methods, 2010 7:2 Bodi et al., Journal of Biomolecular Techniques, 2013 24:2 Mertes et al., Briefings in functional genomics, 201110:6 374-386 Teer et al., Genome research, 2010 20:1420-1431 Tewhey et al., Nature Biotechnology, 2009 27:11 Turner et al., Nature Methods, 2009 Moens L et al., PlosOne, 2011 6:8 Wooderchak-Donahue et al., BMC medical genomics, 2012 5:50 73