1953 : double hélice d ADN 1956 : nombre de chromosomes dans le caryotype humain (46) Années 70 : boîte à outils : couper, coller, cloner, premières techniques de séquençage d ADN technique du Southern blot Années 80 : polymorphismes de l ADN : RFLP, minisatellites, microsatellites, SNP technique de PCR, automatisation, premiers gènes de maladies génétiques Années 90 : cartographie et séquençage industrialisation, analyses globales, bioinformatique Séquence du génome humain : 2003
CONTENU ET ORGANISATION DU GENOME HUMAIN Taille : 3 000 000 000 paires de bases Nombre de gènes : 25000 30000 Proportion du génome transcrite : 10 % Proportion de séquences codantes : <2 % Eléments répétés (Alu, L1, MERs, pseudogènes, mini et microsatellites, ADN satellitaire des centromères, télomères, duplications segmentaires) : >50 % Rôle des éléments non codants (>90%) peu connu: régulation des gènes, maintien de la structure des chromosomes, simples vestiges de l évolution?
Une maladie génétique survient lorsqu une erreur grave se produit dans le matériel génétique : Anomalie chromosomique : nombre, structure ou Anomalie survenant sur un gène
non muté muté GENE PROTEINE fonction normale absence de fonction ou fonction anormale Maladie génétique
DOGME CENTRAL DE LA BIOLOGIE MOLECULAIRE GENE (25000) atg gct aaa tcg cgg ggg ata Transcription ARN messager (100000 200000) aug gcu aaa ucg cgg ggg aua Traduction PROTEINE (100000 500000) Met-Ala-Lys-Ser-Arg-Gly-Ile
Plus de 3000 gènes responsables de maladies génétiques identifiés à ce jour
IDENTIFICATION DES GENES Diagnostic Mécanismes Thérapeutique - conseil génétique - prédiction - prévention - expression -fonction - modèles animaux -cibles -molécules -thérapie génique cellulaire -stratégies diverses
DIAGNOSTIC DES MALADIES GENETIQUES PAR BIOLOGIE MOLECULAIRE (ADN essentiellement) - gène exprimé dans un tissu profond, fonction difficile à mettre en évidence : analyse du produit du gène impossible - le gène (ADN) peut être analysé sur n'importe quelle cellule nucléée (globules blancs) - diagnostic possible dans certains cas même si gène non identifié (approches indirectes d analyse de liaison génétique)
DIAGNOSTIC MOLECULAIRE Intérêt en conseil génétique - sujets atteints : diagnostic de certitude, prise en charge spécifique, prévention, pronostic, - porteurs sains de la mutation (maladies récessives) - diagnostic prénatal - diagnostic préimplantatoire - diagnostic présymtomatique
TYPES DE PRELEVEMENTS Analyse post-natale : 2x5 ml sang total sur EDTA sang sur carte FTA frottis buccal Analyse pré-natale : villosités choriales cellules amniotiques (sang fœtal) Si analyse ARN : 2x5 ml sang total sur héparine
LCR enh CAAT site début de transcription et capping TATA ATG introns sites d épissage signal fin de transcription TGA site polya LCR 10-100 kb 1-10 kb -70b -40b 5 UTR promoteur 3 UTR Région adjacente 5 régulatrice exons UTR : région non traduite enh : enhancer LCR : locus control region
il n y a pas de gène moyen
Il y en a : Des petits (quelques kb) Des moyens (quelques dizaines de kb) Des grands (quelques centaines ou millions de kb) Il y en a : Des avec peu d exons (<10) Des avec pas trop d exons (10-20) Des avec très beaucoup d exons (plusieurs dizaines, centaines) Il y en a : Des assez petits avec beaucoup d exons (30 kb, 50 exons) Des grands avec pas tant que ça d exons (650 kb, 8 exons, donc grand(s) intron(s))
MUTATIONS GENIQUES Atteignent : éléments régulateurs, exons, introns, jonctions intron-exon 1) Petites délétions, duplications, insertions, inversions intragéniques : taille: quelques dizaines de bases à quelques kb avec ou sans décalage du cadre de lecture décalage : structure anormale, aboutit à codon STOP 2) Mutations ponctuelles : - non sens : STOP (TAA, TAG, TGA) - faux sens : substitution d un AA par un autre (pathogénicité?) - création/abolition d un site d épissage - délétion, insertion d 1 ou plusieurs nucléotides (2-5) : décalage du cadre de lecture 3) Mutations instables avec amplification : - (CGG)n : X fragile - (CTG)n : Steinert ; (GGTC)n : PROMM - (CAG)n - polyglutamines : maladies neurodégénératives - (GAA)n : Friedreich - (GCG)n polyalanines : maladies osseuses, SNC - (CCCCGCCCCGCG)n épilepsie myoclonique
Différents cas de figure 1) Mutation connue: - Toujours la même mutation dans le gène (rarissime) - Mutation déjà connue dans la famille 2) Mutation inconnue dans un gène avec < 5-10 exons 3) Mutation inconnue dans un gène avec > 10 exons
Recherche d une mutation connue a1 a2 Amplification PCR d un fragment portant la mutation Temps d analyse: quelques jours Détection de la mutation (séquençage, analyse de restriction)
PRINCIPE DE LA PCR (Polymerase Chain Reaction) Amplification spécifique exponentielle d un fragment d ADN ADN Double Brin 5 3 3 5 DENATURATION 95 C 5 3 HYBRIDATION 3 P2 P1 5 55-65 C 30 40 X ELONGATION 72 C
Séquençage d ADN Technique enzymatique de Sanger Séquençage en fluorescence Séquenceur automatique Longueur de fragments séquencés : 500-800 pb Séquençage des deux brins
DIAGNOSTIC DIRECT D UNE MUTATION MUCOVISCIDOSE : MUTATION G551D gène CFTR allèle normal : GGT CAA CGA allèle G551D : GAT CAA CGA (site HincII : GTCAAC) HincII PCR N/N N/Μ Μ/Μ 530 pb 320 pb digestion HincII 850 pb 530 pb 320 pb allèle normal allèle G551D 530 pb 850 pb 320 pb
MALADIE DE STEINERT Géne DMPK, localisation en 19q133 Répétition (CTG)n en région 3 non traduite normal : 5 35 CTG prémutation : 36 49 CTG mutation : 50 plusieurs milliers CTG Techniques : - Allèles normaux et petites mutations : PCR - Mise en évidence mutations: TP-PCR - Mesure de la mutation : Southern blot
MALADIE DE STEINERT père frère mère foetus foetus allèles mutés allèle normal Temps d analyse: deux semaines
Gène de taille modeste (quelques exons) Séquençage direct mutation??????
Gène de taille modeste (quelques exons) Séquençage direct mutation?????? Temps d analyse: plusieurs semaines
Cas des grands gènes : nombreux exons 20, 50,, 300 C est le cas général Exemples: mucoviscidose 27 exons syndrome de Rubinstein-Taybi 31 exons OCA2 25 exons Stratégie «indirecte» : 1) Recherche de l exon portant l anomalie 2) On ne séquence que cet exon Temps d analyse: semaines, mois
BALAYAGE D EXONS mutation?????? Techniques de recherche indirecte de mutation: SSCP, DGGE, DHPLC, HRM
RECHERCHE DE MUTATIONS PAR DHPLC CREBBP Exon 6-58,3 C Absorbance (mv) 12 11 10 9 8 7 6 5 4 3 2 1 0 0 1 2 CBP EXON 6-58,3º C 3 4 Time (Minutes ) 5 6 Patient 5 Patient 80 Patient 169 Patient 196 Exon 6-60 C Absorbance (mv) 12 10 8 6 4 CBP EXON 6-60º C Patient 5 Patient 80 Patient 169 Patient 196 2 0 0 1 2 3 4 Time (Minutes ) 5 6 Exon 6-62,2 C Absorbance (mv) 11 10 9 8 7 6 5 4 3 2 1 0 0 1 2 CBP EXON 6-62,2º C 3 4 Time (Minutes ) 5 6 Patient 5 Patient 80 Patient 169 Patient 196
SEQUENCAGE DES VARIANTS Patient 80 Exon 6 - R483X : CGA TGA
SEQUENCAGE DES VARIANTS Patient 169 Séquence Normale CC ATC CTG GGG TCT CCA GCT AGT GGA ATT Séquence Mutée CC TCC AGC TAG
Développement majeur : Séquençage à Haut Débit Technique actuelle de séquençage : Sanger - Séquençage des gènes exon par exon; gène après gène - Débit : 70,000 bases par run (x 1 ou 2) Très gros séquenceurs : plateformes de recherche, sociétés privées de service Illumina HiSeq2000 v3i : 600000 Mb/run SOLiD 5500xl (4hq) : 155100 Mb/run Illumina GAIIx : 71400 Mb/run SOLiD 4 : 96000 Mb/run Séquenceurs «moyen» débit : plateformes de diagnostic Temps d analyse élevé Grosses séries Masse de données gigantesque, en grande partie «inutiles» Serveur informatique onéreux Roche 454 Junior : 50 Mb/run Illumina MySeq : 1000 Mb/run Ion Torrent : 10 (314), 100 (316), 1000 (318) Mb/run Temps de run : 2 26 h Petites séries Masse de données modérée Serveur modeste
Séquençage à Haut Débit Les séquenceurs à moyen débit permettent d analyser plusieurs dizaines de gènes à la fois sur un nombre restreint de patients : totalement adaptés à nos besoin Objectif principal = Faire plus vite et plus complètement ce qui est fait actuellement : Actuellement Labo GM CHU : 23 gènes (283 exons +/- promoteur) Possibilités nouvelles: Augmenter le nombre de gènes analysés (albinisme, neuro, dysmorphologie) : 35 gènes, 532 exons Séquençage de gènes entiers (exons + introns + séquences flanquantes) Pathologies génétiquement très hétérogènes : ex des RMLX : 100 gènes connus (Exome complet) Avantages: Exhaustivité Flexibilité d organisation: outil commun à toutes les pathologies; analyse simultanée de patients avec différentes pathologies; pas de série Rapidité d exécution: rendu de résultats en semaines (plutôt que mois)
RECHERCHE DE DELETIONS/DUPLICATIONS Situation normale au niveau somatique : séquences autosomiques : 2 copies séquences portées par X et Y : fille 2X; garçons 1X, 1Y Nombreuses situations pathologiques avec aneusomie : délétions : cancers, Del 22q, Williams, Rubinstein-Taybi, Duchenne, retards mentaux (télomères 6-8%), surdités, duplications : CMT1A, amplification : cancers La recherche de del/dup est maintenant systématique Techniques utilisées: PCR semi-quantitative (QMF-PCR, QMPSF, MLPA) Puces à ADN (CGH-array) NB : source importante de polymorphisme CNV (copy number variants)
qcbp2 Factor IX qcbp15a DSCR1 qcbp7b qcbp12 qcbp11c qcbp3 Factor IX qcbp14 qcbp10 3000 2000 1000 0 3000 2000 1000 500 0 210 220 230 240 290 qcbp15b DSCR1 qcbp8a qcbp9a 220 230 240 270 280 Patient 15 Patient 20 Patient 62 Factor IX qcbp3 qcbp10 qcbp14 qcbp15b DSCR1 qcbp13a qcbp8a 2500 2000 1500 1000 500 0 210 220 230 240 260 290 QMF-PCR (CREBBP)
AC004493 AC005570 AC005361 AC004234 AC004034 AC004235 AC004233 AC004232 AC003966 AC004035 AC005362 AC004646 AC005590 AC004494 AC004644 AC004496 AC004645 AC005607 AC005203 AC004760 RT100 AC004651 AC004509 AC004495 AC005564 AC005736 AC004647 AC004750 AC005568 AC004778 AC004653 AC005211 AC005356 AC004789 AC005222 AC020663 A AC012676 AC009171 AC025283 AC108134 AC007151 Cen CREBBP Tel 45 40 35 30 27 48 p4 p9 p31 p34 p59 p73 p197 p218 p219 2 3 4 6 9 13 15 17 20 22 24 2729 31 1 B Tel 7 15b 15 Cen 15b 15 Tel 17 16 2 3 4 5 6 7a7b 7c 8a 8d 9a 10 11a11b 11c 12 13 13a 14 14a 15a 18 19 20 21 Cen qcbp Tel Cen p7 p15 p20 p62 p115 p246
PUCES A ADN Quelques dizaines centaines de milliers de spots: Oligonucléotides couvrant l ensemble du génome
Technique de CGH-Array Permet la comparaison du nombre de copies d'une région génomique dans un ADN à tester par rapport à un ADN de référence marquage Mélange et co-hybridation marquage ADN test ADN de référence Scan Mesure des intensités de fluorescence Sondes délétées dans l ADN test Sondes «normales» dans l ADN test Sondes amplifiées dans l ADN test
Principaux avantages de l array-cgh Interrogation simultanée de nombreux loci (génome entier, régions candidates, région cible) Pas besoin d étalements chromosomiques Résolution élevée: 150 kb -> 5-10 kb
Patiente Del16p133 vs Patient Del11q143 Lame oligos 44K Agilent
Application CGH-array étude RM syndromique RM modéré Fente palatine Cardiopathie: coarctation de l aorte, CIV Rate accessoire Strabisme, astigmatisme, hypermétropie Surdité bilatérale de transmission Dysmorphie faciale Rooryck et al Eur J Med Genet, 2007
Rooryck et al Eur J Med Genet, 2007
Résultat CGH array: DEL 17q2132 580 Kb Rooryck et al Eur J Med Genet, 2007
DELETIONS intragéniques OCA2 (albinisme) A) 070606 080816 090657 B) 030857
DIAGNOSTIC SEMI-DIRECT - Gène connu - Mutation inconnue (nombreuses mutations) Analyse de liaison génétique avec marqueurs polymorphes intra- ou juxta-géniques Marqueurs utilisés : microsatellites 1cM 1cM juxta 1 intra juxta 2 GENE marqueurs à distance # 0 cm du gène
MICROSATELLITES Répétitions en tandem de di-, tri-, tétra-nucléotides Les plus utilisés : (CA)n (n>12) Fréquence : 1 / 30 kb Partout sur le génome allele 1 allèle 2 allèle 3 = CA, CAC, CACT oligonucléotide pour PCR Très polymorphes : 6 15 allèles Informativité élevée : 80 90 % Génotypage : PCR fluo, séquenceur automatique
DIAGNOSTIC PRENATAL INDIRECT Maladie récessive liée à l X Juxta 1 Juxta 2 2 1 1 3 2 5 1cM 1cM juxta 1 intra juxta 2 1 3 1 3 1 3 2 1 2 5 2 5 GENE 1 3 2 1 2 1 2 1 Risque d erreur associé au diagnostic : 001 x 001 = 001 % Très faible car marqueurs très proches de la mutation
Exemple d un diagnostic prénatal indirect à l aide de microsatellites intragéniques
SERVICE DE GENETIQUE MEDICALE CLINIQUE - consultation - conseil génétique - diagnostic anténatal - diagnostic présymptomatique CHROMOSOMIQUE - caryotype - FISH MOLECULAIRE - recherche de mutations dans des gènes - analyse de microréarrangements Mode de fonctionnement Clinico - Biologique Discipline transversale Pédiatrie Gynécologie - obstétrique Neurologie Mucoviscidose Surdités Dermatologie Pédo-psychiatrie Autres
HEREDITE AUTOSOMIQUE RECESSIVE aa aa AA aa AA
aa aa AA aa AA
ce qui s est produit aa AA aa aa aa AA AA aa AA aa aa aa AA AA aa
ce que l on doit proposer aa AA aa aa aa AA AA aa AA aa aa aa AA AA on alerte
pas uniquement des mauvaises nouvelles aa AA AA AA aa aa AA AA aa AA aa AA AA AA AA on rassure