Stratégies de séquençage à haut débit en oncologie



Documents pareils
Biomarqueurs en Cancérologie

Les plateformes de génétique

Programme AcSé. Accès Sécurisé aux Innovations Thérapeutiques Deux études pilotes : AcSé - crizotinib et AcSé - vémurafenib

Big data et sciences du Vivant L'exemple du séquençage haut débit

Développer l accès précoce pour tous les patients, aux thérapie ciblées en France. Pr. Fabien Calvo Institut National du Cancer

Les tests de génétique moléculaire pour l accès aux thérapies ciblées en France en 2011

DÉFIS DU SÉQUENÇAGE NOUVELLE GÉNÉRATION

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Les renseignements suivants sont destinés uniquement aux personnes qui ont reçu un diagnostic de cancer

Bases de données des mutations

CATALOGUE DES PRESTATIONS DE LA

Gènes Diffusion - EPIC 2010

L axe 5 du Cancéropole Nord Ouest

Détection et prise en charge de la résistance aux antirétroviraux

MABioVis. Bio-informatique et la

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

CANCERS ET RAYONNEMENTS IONISANTS Fortes doses: seconds cancers après radiothérapie

Médicaments du futur : Tendances et enjeux. Nicolas PY, Debiopharm International forumofac.14 26/09/2014

ALK et cancers broncho-pulmonaires. Laurence Bigay-Gamé Unité d oncologie thoracique Hôpital Larrey, Toulouse

Charges virales basses sous traitement: définition impact virologique. Laurence Bocket Virologie CHRU de Lille

Thérapies ciblées en Onco-Hématologie

Les tests de génétique moléculaire pour l accès aux thérapies ciblées en France en 2010

Les différents types de cancers et leurs stades. Dr Richard V Oncologie MédicaleM RHMS Baudour et Erasme La Hulpe 1/12/07

Hémochromatose génétique non liée à HFE-1 : quand et comment la rechercher? Cécilia Landman 11 décembre 2010

Contrôle de l'expression génétique :

Hépatite chronique B Moyens thérapeutiques

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Statistiques Canadiennes sur le Cancer, et HMR sur le poumon

BIG DATA une évolution, une révolution, une promesse pour le diagnostic

cytogénétiques , 12, 13, ainsi qu à des travaux moléculaires 14, 15 16, les questions posées par l équipe

Peut-on ne pas reprendre des marges «insuffisantes» en cas de Carcinome canalaire infiltrant

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

Evaluation de critères res de substitution de la survie globale dans les cancers bronchiques localement avancés

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Transgene accorde une option de licence exclusive pour le développement et la commercialisation de son produit d immunothérapie TG4010

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

Quel apport de l imagerie dans les traitements anti-angiogéniques?

Les tests génétiques à des fins médicales

Etat des lieux de l accès aux plateformes de génétique moléculaire

Bases de données et outils bioinformatiques utiles en génétique

Cancer bronchique primitif: données épidémiologiques récentes

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

RNV3P Recherche de pathologies émergentes

Résistance du VIH-1 aux antirétroviraux dans les compartiments anatomiques et cellulaires

Les grandes voies de transmission du signal en cancérologie : où en sommes-nous?

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Introduc)on à Ensembl/ Biomart : Par)e pra)que

Génétique et génomique Pierre Martin

Analyse des données de séquençage massif par des méthodes phylogénétiques

Intérêt de la TEP-FDG dans les cancers de l ovaire

Principe d un test statistique

DIAPOSITIVE 1 Cette présentation a trait à la réglementation sur les thérapies cellulaires.

DON DE SANG. Label Don de Soi

Sujets présentés par le Professeur Olivier CUSSENOT

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

SERVICES DE SEQUENÇAGE

Thérapies ciblées des cancers :

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Actualités s cancérologiques : pneumologie

EXERCICES : MECANISMES DE L IMMUNITE : pages

Big Data et la santé

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Introduction aux bases de données: application en biologie

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Caisse Nationale de l'assurance Maladie des Travailleurs Salariés Sécurité Sociale

Pemetrexed, pionnier de la chimiothérapie histoguidée. Dr Olivier CASTELNAU Institut Arnault TZANCK ST Laurent du Var

ANEMIE ET THROMBOPENIE CHEZ LES PATIENTS ATTEINTS D UN CANCER

Métastase unique d un NPC: Une question singulière? Jean Louis Pujol - Xavier Quantin Mohammad Chakra Fabrice Barlési

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Anormalies moléculaires et ciblage thérapeutique des cancers broncho-pulmonaires non à petites cellules

Le titrage de l AgHBs: un témoin du statut du patient et de la réponse au traitement. Denis Ouzan Institut Arnault Tzanck, Saint-Laurent-du-Var

CONTROVERSE : IDR OU QUANTIFERON LORS D'UN CONTAGE EN EHPAD?

Pierre OLIVIER - Médecine Nucléaire

Introduction générale

Bases moléculaires des mutations Marc Jeanpierre

Appel à Projets. Constitution de bases clinicobiologiques multicentriques à visée nationale en cancérologie. Action 3.1 et 23.2

PLACE DE L IRM DANS LE BILAN D EXTENSION DU CANCER DU RECTUM. Professeur Paul LEGMANN Radiologie A - Cochin Paris

Protéomique Séance 1 Introduction aux données de protéomique et aux outils de recherche

Leucémies de l enfant et de l adolescent

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Service d Hématologie clinique et Thérapie cellulaire Bâtiment Médico-Chirurgical - 3 ème et 4 ème étages

Validation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS Lyon

Les sciences de l ingénieur appliquées à la prise en charge du

THERANOSTIC. Pr. C. BOHUON Conférence CORATA Namur 08 juin 2011

Les réseaux cellulaires

Les OGM. 5 décembre Nicole Mounier

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

INF6304 Interfaces Intelligentes

Études épidémiologiques analytiques et biais

UE2 CANCEROLOGIE Place de la Médecine Nucléaire

Point sur la stratégie

Chaine de transmission

Le don de moelle osseuse :

Les charges virales basses: constat et gestion

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Transcription:

Master bioinformatique, Université de Rouen Sylvain Mareschal [@etu.univ-rouen.fr] Stratégies de séquençage à haut débit en oncologie

Introduction Stratégies de séquençage à haut débit en oncologie Continuité du cours de Gaël Nicolas Génétique somatique constitutionnelle Cellularité, clonalité VAF faibles Polymorphismes à différencier des événements somatiques Recherche d'événements récurrents Mécanismes biologiques qui puissent expliquer les symptomes Identifier des cibles thérapeutiques Identifier des sous-types tumoraux Identifier des bio-marqueurs Plan du cours (1h) - Introduction - Un cas d'école : BRAF & HCL - Quelle technique? - Quelle profondeur? - Combien de patients? - Conclusion

1. Un cas d'école : BRAF & HCL Hairy-Cell Leukemia Forme rare de leucémie Accumulation de «tricholeucocytes» (lymphocytes B) 0,2 cas pour 100 000 personnes / an (USA) Bien prise en charge Analogues des purines DFS 10 ans ~ 70% Quelles causes génétiques? Whole-Exome Sequencing (WES) Cellules normales et tumorales d'un patient CD19 : marqueur des lymphocytes B (normaux ou tumoraux) Tri cellulaire du sang périphérique - CD19+ avant traitement : tumeur ++ - CD19 après traitement : normal ++ Séquençages indépendants Capture de 38 Mb d'exons (Agilent SureSelect V1) Séquençage paired-ends Illumina GAIIx 2x108 pb, 70x Alignement au génome de référence hg18 Détection des variants somatiques Calling séparés Élimination (drastique) des variants : - synonymes - également détectés dans les cellules normales (FDR < 10-6 ) - présents dans moins de 25% des reads 5 variants somatiques retenus BRAF, CSMD3, SLC5A1, CNTN6 et OR8J1 Sanger : présents dans la tumeur, absents du normal Focus sur BRAF Bon candidat a priori Hotspot connu dans les mélanomes et cancers thyroïdiens Implication dans la voie MAPK, connue dans les HCL Séquençage Sanger de 47 patients Séquençage ADN limité à l'exon 15 de BRAF 47/47 présentent la mutation V600E 10/10 ADN normaux appariés en sont exempts Extension à 195 leucémies diverses Aucune autre V600E retrouvée Dont 38 leucémies à présentation similaire

2. Quelle technique utiliser? Whole Genome Sequencing (WGS) Séquençage direct d'adng fragmenté + couverture homogène + données exhaustives (translocations comprises)... trop exhaustives (intergénique, introns...) cible étendue (3.2 Gb, profondeur ou coûts élevés...) Et bien d'autres CHIP-seq Capture des régions qui interagissent avec une protéine donnée ATAC-seq Capture de l'adn libre (euchromatine, empreinte des protéines) RNA-sequencing Capture des ARN (sondes poly-t) Filtration et normalisation éventuelles + données complémentaires (expression, jonctions d'exons) ~ données biaisées (ARN poly-a) ~ cible raisonnable (50 Mb, ~ WGS / 64) couverture très hétérogène (tributaire du niveau d'expression) Whole Exome Sequencing (WES) Fragmentation de l'adng + capture (puce, billes...) ~ données biaisées (exons répertoriés dans les banques) ~ cible raisonnable (50 Mb, ~ WGS / 64) couverture hétérogène (biais de %GC...) Targeted resequencing Fragmentation + capture Amplification multiplexe + cible réduite (<100 kb, possibilité de multiplexer) couverture hétérogène (biais de capture ou d'amplification) données réduites (sélection a priori, découvertes limitées)... Un choix à faire selon ses objectifs Caractérisation d'un génome rare Le WGS reste le plus exhaustif et le moins biaisé Recherche de mutations codantes sans a priori Le WES offre un bon rapport quantité / prix Analyse conjointe des mutations et CNV WGS reste moins biaisé que WES en terme de CNVs Considérer aussi WES + acgh, coûts similaires Analyse conjointe des mutations et expressions Vu le coût actuel des puces transcriptomiques, WES + puce peut s'avérer plus complet qu'un RNA-seq Analyse de l'épissage alternatif RNA-seq reste la seule solution, bien que limitée Confirmation de récurrence Application clinique Recherche de variant rare (intra/inter génome) Reséquençage ciblé pour minimiser les coûts Dans tous les cas Séquencer aussi l'adn normal!!! Seul moyen fiable de distinguer somatique et constit. Double le nombre d'échantillons, les coûts

3. Quelles analyses en aval? Détecter un variant somatique Exemple : Koboldt et al, Genome Res 2012 (VarScan2) Approche heuristique, basée sur le test exact de Fisher Reconnu comme l'un des plus sensibles, paramétrage délicat Wang et al, Genome Medicine 2013 Stead et al, Human Mutation 2013 1. Pré-filtration des positions génomiques - profondeur minimale (8x) - MAF minimale (8%) - minimum de reads non-reférence (2x) - minimum de qualité (q base > 20, q map > 1) 2. Attribution indépendante des génotypes - <8% = wild-type - >75 % = homozygote - sinon = hétérozygote 3. Tests de Fisher Tumoral RR RV VV RR reference somatic somatic Normal RV LOH germline LOH VV?!!?!! germline Normal = Tumoral Comparaison du total de reads variants aux erreurs de séquençage attendues (0,1%) R V Normal + Tumoral 1423 6 0,1% d'erreurs 1428 1 p = 0,12 Normal Tumoral Comparaison des nombres de reads référence et variants entre normal et tumoral R V Normal 31 3 Tumoral 18 14 p = 0,0017 Mutations récurrentes Filtration fonctionnelle Annotation automatisée (VEP, ANNOVAR...) faux / non sens, algorithmes de prédiction (SIFT, PolyPhen...) Recherche de récurrence entre patients - A la même position génomique - A la même position protéique (attention aux isoformes...) - Au sein d'un même domaine protéique - Au sein d'un même gène Études d'enrichissement Recherche de récurrence au sein d'un pathway Y a-t-il un enrichissement en gènes mutés (une fois ou plus) au sein de ce groupe de gènes (voie métabolique, annotation GO...)? - Tests de Fisher + correction des tests multiples - Music PathScan Wendel et al, Bioinformatics 2011 Probabilité par gène d'être muté en fonction de sa taille et du BMR Combinaison au sein du pathway, par patient puis dans la série -... dans ce pathway non oui gène muté 419 12 gène non muté 19420 43 Et bien d'autres p = 1,7e-9 Recherche de CNV Recherche de translocations Ebauchés dans les cours précédents x 10 3 pathways

4. A quelle profondeur séquencer? Stead et al, Hum Mutat 2013 Comparaison de variant callers VarScan2, MuTect, BCFtools, GATK UG, LoFreq, SNVer, Atlas2 Différents jeux de données - Données synthétiques (Q37 + 1% d'erreurs) - Données Illumina simulées (simngs) - Données réelles (dilution d'une lignée mutée par un ADN normal) Variant 50 % 25 % 10 % 5 % 2,5 % 1 % normal 1 BAM + tumoral 30x 60x > 100x > 250x 100x - 250x 500x > 750x Génomique constit. Génomique somatique Attention, profondeur minimale moyenne Shallow sequencing Exemple : Scheinin et al, Genome Res. 2014 Séquençage Illumina HiSeq2000, 1x50 bp, génome entier Multiplexage ~20 échantillons / piste coût / patient inférieur à une puce CGH profondeur finale = 0,1x Analyse Nombre de reads / bin (15kb ~ puce CGH 180k) Correction LOESS 2D (%GC, mappability) Exclusion des régions difficiles (répétitions...) Segmentation CBS Deep sequencing Exemple : Abdelhamid E et al, Am J Hematol. 2013 Séquençage Life PGM 1x100 bp, 1 amplicon de 81 bp Un échantillon par puce 314 (600 000 reads espérés) Ratio des reads mutés / totaux profondeur finale = 600 000 x Comparaison à un test de biologie moléculaire Sensibilité jusqu'à 1e-3 (mutaquant ) Corrélation fréquence d'allèles mutés > 0,95 Mesure dans un échantillon dilué ADN muté dilué dans un ADN normal Corrélation jusqu'à une fréquence de 1e-5

5. Combien de patients séquencer? Lawrence et al, Nature 2014 Collecte de données d'exomes 21 sous-types de cancers 4742 WES normal + tumoral ~2000 issues de The Cancer Genome Atlas Etude conjointe Pipeline identique (Broad institute) 3e6 SNV, 77e3 indels, 30e3 block substitutions Taux de mutation de 0,03 à 7000 mutations / Mb Recherche de gènes fréquemment mutés Analyse de saturation Sous-échantillonage progressif, suivi des découvertes Nombre de gènes détectés comme mutés Selon la proportion de patients mutés ( VAF) Tumour type n Median somatic mutation frequency References (per Mb) Acute myeloid leukaemia 196 0.4 TCGA Bladder 99 7.1 TCGA Breast 892 1.2 TCGA, Banerji et al. Nature 2012 Carcinoid 54 0.5 Francis et al. Nat Genet 2013 Chronic lymphocytic leukaemia 159 0.6 Wang et al. NEJM 2011, Landau et al. Cell 2013 Colorectal 233 3.1 TCGA, Bass et al. Nat Genet 2011 Diffuse large B-cell lymphoma 58 3.3 Lohr et al. PNAS 2012 Endometrial 248 2.5 TCGA Oesophageal adenocarcinoma 141 4.0 Dulak et al. Nat Genet 2013 Glioblastoma multiforme 291 2.2 TCGA Head and neck 384 3.9 TCGA, Stransky et al. Science 2011 Kidney clear cell 417 1.9 TCGA Lung adenocarcinoma 405 8.1 TCGA, Imielinski et al. Cell 2012 Lung squamous cell carcinoma 178 9.9 TCGA Medulloblastoma 92 0.3 Pugh et al. Nature 2012 Melanoma 118 12.9 Berger et al. Nature 2012, Hodis et al. Cell 2012 Multiple myeloma 207 1.6 Chapman et al. Nature 2011 Neuroblastoma 81 0.5 Pugh et al. Nat Genet 2013 Ovarian 316 1.7 TCGA Prostate 138 0.7 Berger et al. 2011, Barbieri et al. Nat Genet 2012 Rhabdoid tumour 35 0.1 Lee et al. J Clin Invest 2012 Analyse de puissance Objectif : 90% de puissance, 90% de gènes détectés Autorise 10% de mutations manquées (faux négatifs) Selon la proportion de patients mutés (+ BMR)

Conclusion Bruit de fond important Polymorphismes séquencer l'adn normal apparié est primordial Mutations somatiques aléatoires (BMR moyen de 0,1 à 20 mutations / Mb) Recherche d'événements récurrents Position récurrente (génomique, protéique...) Voie métabolique commune (études d'enrichissement) Identifier ses besoins avant de séquencer Quelle technologie? - Illumina reads courts (30 à 100 bp), qualité élevée - Life taille et qualité des reads intermédiaires (100 à 400 bp) - PacBio reads longs (> 1kb), qualité faible - npore reads encore plus longs (> 10kb), qualité très faible Quelle technique? WGS, WES, RNA-seq, target-seq... Quelle profondeur? Deep-sequencing, shallow-sequencing... VAF ciblée (cellularité comprise!) Combien de patients? Rareté de la mutation ciblée (fréquence au sein de la population) Pour quelle application? Connaitre les limites de son design Puissance généralement limitée Ce qui est visible reste correct (peu de FP) Combien d'événements similaires a-t-on raté? (FN) Profiter des données publiques The Cancer Genome Atlas