Enjeux de la biologie haut débit en oncologie Pascal BARBRY, CNRS, Sophia Antipolis o Les technologies haut-débit ont enrichi considérablement nos approches quantitatives en biologie. o Des applications comme le séquençage ADN haut débit, les analyses en spectrométrie de masse ou l imagerie fournissent aujourd hui des masses énormes d informations susceptibles d éclairer de façon déterminante la pratique clinique en oncologie. o Comment traiter, interpréter et stocker correctement l ensemble de ces informations? 7 ième Colloque du Cancéropôle PACA Hôtel de Région Mercredi 18 février 2015, 14:30 15:45
Importance croissante de la génétique pour prédire la réponse à une thérapie ciblée en cancérologie Pathologie Biomarqueur # tests Cancer du sein Amplification d HER2 8924 Cancer de l estomac Amplification d HER2 709 Cancer colorectal Mutations de KRAS 19 347 Mutations de NRAS 3330 GIST Mutations de KIT 1105 Mutations de PDGFRA 1005 Mutations d EGFR 23336 Cancer du poumon Translocation d ALK 18861 Mélanome Mutation de BRAF V600 5026 Leucémies Détection de BCR ABL 6750 Mutations d ABL 861 TOTAL: 89254 Marqueur Nombre patients % altérations moléculaires Mutations EGFR ** 23336 10.0% 8.0% Translocation ALK * 18861 3.5% 13.4% Mutations KRAS 22958 27.0% 7.9% Mutations BRAF 20100 2.0% 8.9% Mutations HER2 17843 0.7% 10.1% Mutations PI3KCA 17375 2.4% 10.4% ** gefitinib, erlotinib, afatinib * crizotinib, ceritinib Non interprétables Données Plateformes génétiques INCa, 2013
Comprehensive molecular profiling of 230 lung adenocarcinoma EA Collisson + Cancer Genome Atlas Research Network, Nature (2014) Taux élevé de mutations somatiques: 8.9 mutations par mégabase
Comprehensive molecular profiling of 230 lung adenocarcinoma ARNm, microarn, mutations, variations du nombre de copies, méthylation, protéomique EA Collisson + Cancer Genome Atlas Research Network, Nature (2014) Taux élevé de mutations somatiques: 8.9 mutations par mégabase
Comprehensive molecular profiling of 230 lung adenocarcinoma ARNm, microarn, mutations, variations nombres copies, méthylation, protéomique EA Collisson + Cancer Genome Atlas Research Network, Nature (2014)
Complexification du dogme central de la biologie moléculaire et recherche de nouveaux biomarqueurs +pervasive +pervasive Feero WG et al. N Engl J Med 2010;362:2001-2011
«Transcription pervasive» du génome Novikova et al, J. Mol. Biol. (2013) 425, 3731 3746
«Traduction pervasive» du transcriptome RNAseq RNAse treated Slc2a1 CDS 200 reads Coding sequences are RNAse resistant Waldmann et al, in preparation
«Editing» du transcriptome
explosion des performances en séquençage de l ADN XTen $1.000 genome 40kb? ONT Roche 454 Futures technologies Short Intermediate Long
Coût par génome Loi de Moore dépassée par le séquençage de l'adn Développement plus rapide que l'industrie des semi-conducteurs! Le secteur reste néanmoins contraint par la loi de Moore via la bioinformatique, dont les coûts sont clairement sousestimés dans l image actuelle du génome à 1000$ 2014: Illumina HiSeq X10 1 human genome < $1000 La principale contrainte pour une analyse de routine de génomes humains complets va désormais se situer au niveau de la bioinformatique.
Coût par génome Loi de Moore dépassée par le séquençage de l'adn Développement plus rapide que l'industrie des semi-conducteurs! Le secteur reste néanmoins contraint par la loi de Moore via la bioinformatique, dont les coûts sont clairement sousestimés dans l image actuelle du génome à 1000$ 2014: Illumina HiSeq X10 1 human genome < $1000 La principale contrainte pour une analyse de routine de génomes humains complets va désormais se situer au niveau de la bioinformatique.
Derrière le génome à 1000$: comment gérer plusieurs pétaoctets de données chaque année? Un coût d'entrée important: séquenceur (10M $) + budget d exploitation (18 M $ par an). 1 génome = Réactifs $ 800; préparation $ 60; amortissement $ 140. Les charges supplémentaires liées à la bioinformatique : Capacité globale de calcul + capacité de stockage. Pour un HiSeq X 10 ($ 10,000,000): 1 système de calcul ~ $ 500 000, équipé de 1500 nœuds (24/7), capable de fournir 240.000 heures de calcul par semaine. Stockage de 30-50 To de données compressées par semaine (340 génomes ; à multiplier par un facteur 3x pour prendre en compte le stockage des fichiers intermédiaires). Analyse secondaire : $35-$90 / génome. Mapping: 175 000 heures de calcul par semaine (9-21.000$ / semaine; 25-65$ par génome). Portage externe via opérateur type Amazon beaucoup trop cher, même sans stockage Recherche de variants: 200 heures de calcul par génome coût supplémentaire = 10-24$ / génome (+ 3400-8200$ / semaine). http://glennklockwood.blogspot.co.uk
Retour vers la clinique Multiplication des observables: ADN, ARN, petits ARN, protéines, Multiplication des temps d observation: Suivi des mêmes observables à travers le temps d évolution de la maladie => des quantités d information colossales à stocker!
Biopsies liquides: génotyper directement l ADN tumoral circulant Le matériel des cellules tumorales peut se retrouver dans le sang à la suite d un phénomène naturel de dégradation des cellules tumorales de l organisme: ADN, ARN, protéines Une détection d ADN tumoral, présent en très faible quantité par rapport à l ADN normal issu de toutes les autres cellules, signifie la présence de cellules tumorales dans l organisme. Comme l ADN tumoral possède les mêmes altérations que la tumeur primitive, la présence de ces mêmes mutations marque l'origine de l'adn. Différentes méthodes de détection: CAPPseq (séquençage, Newman et al, Nature Med.), polymérisation activée par pyrophosphorolyse (PAP, Stern et Lantz, Clinical Cancer Research), MicroARN circulants. Fournir une perspective en 4 dimensions inclure une vision temporelle
Biopsies liquides: génotyper directement l ADN tumoral circulant Le matériel des cellules tumorales peut se retrouver dans le sang à la suite d un phénomène naturel de dégradation des cellules tumorales de l organisme: ADN, ARN, protéines Une détection d ADN tumoral, présent en très faible quantité par rapport à l ADN normal issu de toutes les autres cellules, signifie la présence de cellules tumorales dans l organisme. Comme l ADN tumoral possède les mêmes altérations que la tumeur primitive, la présence de ces mêmes mutations marque l'origine de l'adn. Différentes méthodes de détection: CAPPseq (séquençage, Newman et al, Nature Med.), polymérisation activée par pyrophosphorolyse (PAP, Stern et Lantz, Clinical Cancer Research), MicroARN circulants. Fournir une perspective en 4 dimensions inclure une vision temporelle
Complexité de la cellule Une Cellule (~4400-5000 µm3) : ~7 pg d ADN, [DNA] 3.5 mg/ml 10-100.000 cellules / échantillon ~20 pg d ARN, [RNA] 10 mg/ml <5% d ARN messagers ~10,000 gènes exprimés ~10.000 cellules / échantillon ~106 ARN distincts / cellule (ARNm: 1-1000 copies; petits ARN: 1-105) gdna ~200-300 pg de protéines [prot] 100 mg/ml ~109 protéines distinctes / cellule (1-200 copies / cell) David S. Goodsell
Le challenge des mesures sur cellule unique Dominguez et coll (2013) Journal of Immunolgical Methods
L initiative de la Canceropole PACA: «cellule unique» Bioinformatics structuring action Single Cell Platform C1, Biomark Nice/Sophia Antipolis Marseille SOPs for appropriate workflow & storage conditions WP2 Isolation of individual cells SOPs for routine isolation WP3 Genomic investigations single cell assays, miniaturization WP4 Functional assays, high content analyses Dissemination workshops, symposia, publications, etc WP1 Link between biobanks and samples processing, optimized handling bioresource protocols and workflow controls of samples SOPs for appropriate workflow WP5 Personalized Medicine Molecular characterization of cancer initiating cells and of cancer circulating cells experimental and computational methods Tech Transfert TTO, MATWIN Biobanking structuring action - Methods for deconvoluting a multicellular signature - Identification of reliable markers - Effects of chemotherapeutic and targeted drugs