Séminaire d Animation de l Axe 1 du Cancéropôle Nord-ouest Transcriptome ciblé de tissus mammaires et leucocytaires sains de gènes impliqués dans la prédisposition aux cancers du sein et/ou de l ovaire Grégoire DAVY Plateforme SéSAME, CRLCC François Baclesse, CAEN
Introduction Problématique Criblage de 28 gènes impliqués dans la prédisposition héréditaire aux cancers seins/ovaires Nombre élevé de Variants de Signification Inconnue (VSI) Un grand nombre de VSI impacteraient l épissage de l ARNm larnm Etude de l épissage : étude de l ARNm de leucocytes des patientes Légitimité d utiliser l ARNm des leucocytes en l absence du tissu relevant? ATM BAP1 BARD1 BRCA1 BRCA2 BRIP1 CDH1 CHEK2 MLH1 MLH3 MRE11A MSH2 MSH6 MUTYH NBN PALB2 PMS1 PMS2 PTEN RAD50 RAD51 RAD51B RAD51C RAD51D STK11 TP53 XRCC2 XRCC3
Objectifs Comparer qualitativement et quantitativement les transcriptomes leucocytaires et mammaires sains par une analyse de RNAseq ciblé : Les niveaux d expression de chaque gène du panel les épissages alternatifs physiologiques de ces gènes Choix méthodologique : capacité d un set de capture dit exon spécifique (pas de sondes sur les jonctions connues) à séquencer les transcrits des 28 gènes dans le tissu et dans les leucocytes
Matériel et Méthodes Prélèvements 1 prélèvement de tissu mammaire sain 4 prélèvements sanguins : 2 donneurs sains sans histoire familiale de cancer 2 patientes présentant des anomalies de l épissage : 1 renforcement du saut de l exon 3 dans BRCA2 (c.68-7t>a) 1 saut total de l exon 2 dans BRCA2 (c.67+2t>c)
Matériel et Méthodes Préparation du séquençage d ADNc par RNA-Seq Kit SureSelect XT RNA Target Enrichment for Illumina Multiplexed Sequencing (Agilent ) : Purification d ARNm darnm par capture poly(t) Préparation des librairies Capture des exons des 28 transcrits principaux des gènes du panel : Taille de la capture : 0.1 Mb Sondes d ARN de 120 pb Séquençage des échantillons multiplexés l en paired-end d 2x151 pb sur MiSeq (Illumina )
Matériel et Méthodes Analyses bio-informatiques préliminaires MiSeq Reporter : Lecture des index et Démultiplexage Utilisation de NextGene : Alignements sur le génome Calcul de taux d expression mesurés en RPKM : Reads Per Kilobase of exon (of transcript) per Million Mapped Reads TopHat : utilise l aligneur Bowtie2 Alignements sur le génome Couverture moyenne par gène et par échantillon GenoSplice : analyse qualitative et quantitative des jonctions exon-exon
Spécificité de la capture ciblée 3 Gb de données avec un Qscore > 30 pour 98% des séquences «On target» = Nombre de reads alignés sur chaque transcrit principal des gènes de la capture / Nombre total de reads de l échantillon Echantillons «on target» Leucocytes 68 à 89% Tissu mammaire 90%
Couverture et Profondeur de lecture des 4 échantillons sanguins 0-25 % BARD1 BRIP1 CDH1 XRCC2 25-50 % BRCA2 50-80 % RAD51B 80-100 % ATM BAP1 BRCA1 CHEK2 HOXB13 MLH1 MLH3 MRE11A MSH2 MSH6 MUTYH NBN PALB2 PMS1 PMS2 PTEN RAD50 RAD51 RAD51C RAD51D STK11 TP53 XRCC3 Profondeur de lecture minimum de 100x Gènes les mieux couverts : BAP1 (1500x), STK11 (2000x), PTEN (3500x) BRCA1 : Exons 7 à 10 et 22 ont une profondeur de lecture moyenne < 100x BRCA2 : L ensemble des exons a une profondeur de lecture moyenne < 100x Les exons 1 à 9 ont une profondeur de lecture de 0 à 30x Les 2 témoins positifs ne peuvent pas être analysés au niveau des exons 2 et 3
Couverture des gènes et profondeur de lecture dans le tissu mammaire 80-90 % RAD51B 90-100 % ATM BAP1 BARD1 BRCA1 BRCA2 BRIP1 CDH1 CHEK2 HOXB13 MLH1 MLH3 MRE11A MSH2 MSH6 MUTYH NBN PALB2 PMS1 PMS2 PTEN RAD50 RAD51 RAD51C RAD51D STK11 TP53 XRCC2 XRCC3 Profondeur de lecture minimum de 100x Gènes les mieux couverts : TP53 (2400x), RAD50 (2700x), CDH1 (4400x) BRCA1 : Exon 1 a une profondeur de lecture moyenne < 100x BRCA2 : Exons 1, 2, 4 et 7 ont une profondeur de lecture moyenne < 100x
RPKM Taux d expression des exons constitutifs selon leur taille, dans le tissu mammaire (exemple de BRCA1 ) ex19 ex21 ex10 ex20 ex12 ex14 ex13 ex1 ex11 Petits exons aussi bien couverts que les grands exons Premiers exons semblent moins bien couverts
Niveaux d expression des gènes (RPKM) dans le sang Pattern d expression du donneur sain n 1 RPKM Comparaison d expression des 2 donneurs sains S1 (RPKM) S2 (RPKM)
Niveaux d expression des gènes (RPKM) dans le tissu mammaire RPKM Pattern d expression du prélèvement de tissu mammaire
Niveaux d expression des gènes (RPKM) dans le tissu mammaire S5 (RPKM) S1 (RPKM) Comparaison d expression tissu mammaire / sang (donneur sain) Variations d expression concordantes aux données de puces d expression (Lukk et al. (2010), Nature Biotech)
Epissages alternatifs du gène BRCA1 NM_007294.3 Sang g( (donneur sain) Tissu mammaire (d après GenoSplice ) 5 Observés Jonction 7-8 (-3pb) 9-10 Jonction 11-12 11 Jonction 12-13 (-3pb) Jonction 13-14 (-3pb) Epissages observés décrits dans la littérature Orban and Olah, Mol Pathol. 2003 Houdayer et al., Human Mutation, 2012 Capacité à détecter des exons non présents dans la capture (NM_007300)
Epissages alternatifs du gène BRCA2 Epissages observés décrits dans la littérature Houdayer et al., Human Mutation, ti 2012 (d après GenoSplice ) Témoin tissulaire 3 12 17-18 19 Non exhaustif car manque de sensibilité (données d épissage non interprétables dans le sang)
Détection des variations nucléotidiques et de l expression allélique Exon 14 de BRCA2 c.7242a>g SNP rs1799955 (d après Alamut ) c.7242 Ratio allélique : A (97%) / G (3%) Patiente porteuse de la mutation c.67+2t>c (saut total de l exon lexon 2 de BRCA2) et du SNP Ratio allélique : A (51%) / G (49%) Patiente porteuse de la mutation c.68-7t>a (renforcement du saut de l exon 3 de BRCA2) et du SNP Capacité à : - Détecter des variations de séquence - Détecter un déséquilibre d expression allélique (à confirmer par pyroséquençage)
Conclusion des résultats préliminaires Capacité à mesurer l expression des gènes Capacité à détecter des épissages alternatifs Capacité à analyser les séquences des transcrits Capacité à détecter une expression spécifique d allèle (ASE)
Perspectives Comparer l efficacité de la capture exons spécifique à une capture favorisant les jonctions connues (projet U1079 Rouen) sur l échantillon sanguin témoin positif commun Optimiser la capture des transcrits faiblement exprimés : Augmenter la capture des exons sous représentés? Biais? Diminuer le nombre de transcrits capturés Diminuer le nombre d échantillons séquencés simultanément Augmenter la capacité de séquençage type (Illumina GaIIX) Travailler sur un tissu mammaire enrichi en cellules épithéliales Microdissection laser des lobules mammaires Anticorps monoclonaux couplés à des billes magnétiques Analyse bioinformatique du RNA-Seq ciblé : réel défi
Remerciements Laboratoire de Biologie et de Génétique éti du Cancer Baptiste Brault Olivia Bruet Laurent Castéra Robin Fouillet Nicolas Goardon Agnès Hardouin Sophie Krieger Angélina Legros Olivier Letac Antoine Rousselin Dominique Vaur Inserm U1079, Rouen Thierry Frébourg Pascaline Gaildrat Alexandra Martins Société GenoSplice Pierre de la Grange Frédéric Lemoine