Clonage Positionnel Positionnement des gènes de prédisposition dans le génome humain (ou le génome de la souris, modèle d une maladie humaine)
Génétique classique vs Clonage positionnel
Positional Cloning Family studies Chromosome interval Segregation and Linkage Analyses Genomic sequences The Human Genome Project Fine Genetic Mapping Candidate genes Disease mutation Met A T G Val G T C Ser T C A Leu C T G Gln C A A Pro C G G Cys T G T A Met T G G Val T C T Ser C A C Leu T G T * A A C G G T G T Identification of Genes Causing the Disease
Clonage Positionnel 1 Données du problème et principe de l approche 2 Les outils moléculaires: marqueurs génétiques 3 Localisation des gènes de prédisposition 4 Conclusions: et l identification des gènes de prédisposition et leurs variants?
1 Données du problème et principe de l approche Liaison génétique (Linkage): coségrégation de deux ou plusieurs allèles au cours des générations en raison de la proximité de leur locus sur le génome/sur le même chromosome.
1 Données du problème et principe de l approche Taux de recombinaison: proportion de gamètes recombinés sur l ensemble des gamètes transmis par le parent. Le taux de recombinaison est une mesure de distance génétique Centimorgan: unité de distance génétique équivalant à une probabilité de recombinaison de 1% par méiose. Correspond approximativement à 1million de paires de base (1 mégabase)
1 Données du problème et principe de l approche Liaison génétique d un marqueur génétique avec un phénotype (trait qualitatif ou quantitatif): coségrégation d allèles du marqueur génétique avec (l allèle de prédisposition à) la maladie au cours des générations (en raison de la proximité de leur locus sur le génome/sur le même chromosome).
1 Données du problème et principe de l approche Maladie humaine: de monogénique à multifactorielle Causée par un seul gène Causée par un gène majeur+autres gènes+facteurs environnementaux Causée par quelques gènes+autres gènes+facteurs environnementaux Causée par de nombreux gènes+facteurs environnementaux
1 Données du problème et principe de l approche Maladie humaine monogénique (cfpénétrance) Taux de pénétrance: nb de sujets atteints et porteurs de la mutation morbide/nb total de sujets porteurs de la mutation morbide. Pénétrance complète si taux=1
1 Données du problème et principe de l approche Maladie humaine monogénique (pénétrance très élevée): Calculs de génétique formelle donnent la fréquence de l allèle délétère Analyses de liaison génétique permettent de localiser le gène (méthode des Lod scores) Analyses de recombinants permettent d affiner cette localisation
1 Données du problème et principe de l approche Maladie multifactorielle Facteurs environnementaux X, Y, Z augmentent le risque de développer la maladie N (nb inconnu) gènes inconnus défectueux prédisposent à la maladie Pour chaque gène, plusieurs allèles de prédisposition possibles (nb inconnu), et impact de chaque gène/allèle inconnu Mode héréditaire pour chaque gène/allèle inconnu
1 Données du problème et principe de l approche Maladie monogénique ou à 1 gène majeur: PARAMÈTRES calculables Héritabilité et Pénétrance Fréquence de l allèle morbide Mode héréditaire dominant, codominant ou récessif =>Analyses paramétriques de liaison génétique pour localiser le gène
1 Données du problème et principe de l approche Maladie multifactorielle: de très nombreux paramètres sont inconnus =>Analyses NONparamétriques de liaison génétique pour localiser le gène sur le génome humain =>Exploiter un modèle animal expérimental où on réduit le nombre d inconnues (contrôle des facteurs environnementaux; réduction de la complexité génétique en utilisant 2 génome parentaux; contrôle des croisements)
2 Les outils moléculaires: marqueurs génétiques (homme ou souris) Les marqueurs microsatellites: allèles identifiés par leur taille répartis sur l ensemble du génome Les SNPs: -substitution/délétion-insertion d une seule bp -de nombreuses techniques pour les typer/identifier - répartis sur l ensemble du génome
3 Localisation des gènes de prédisposition La souris, modèle expérimental De nombreuses similitudes sur les plans génomiques, physiologiques et physiopathologiques entre l homme et la souris Séquence complète des deux génomes De nombreuses lignées consanguines disponibles avec des phénotypes contrastés Des croisements entre 2 lignées ayant des phénotypes différents
3 Localisation des gènes de prédisposition La souris, modèle expérimental Des croisements entre 2 lignées résistante au neuropaludisme (R) Sensible au neuropaludisme (S) =>obtention des souris F2 =>association entre le génotype des souris F2 et un trait QUALITATIF, le neuropaludisme: => LE TEST DE LIAISON GENETIQUE EST UN SIMPLE X2
3 Localisation des gènes de prédisposition La souris, modèle expérimental Des croisements entre 2 lignées L une contrôlant bien l infection par P.chabaudi (résistante R) L une contrôlant mal l infection par P.chabaudi (sensible S) =>obtention des souris F2 =>association entre le génotype des souris F2 et un trait QUANTITATIF, la parasitémie => LE TEST DE LIAISON GENETIQUE EST UN SIMPLE t-test ou test de Mann-whitney
3 Localisation des gènes de prédisposition La souris, modèle expérimental Des croisements entre 2 lignées R et S =>obtention des souris F11, dont le génome est une mosaïque du génome des 2 lignées parentales R et S =>cartographie génétique à haute résolution dans une région d intérêt (repérée sur la base d une analyse de liaison génétique/souris F2)
3 Localisation des gènes de prédisposition La souris, modèle expérimental Des croisements entre 2 lignées R et S Établissement de lignées congéniques: le génome d une lignée congénique ne diffère du génome parental S qu au niveau d UN SEUL LOCUS (taille de la région jusquà 0,5 cm) =>montre clairement le rôle de gène(s) situé(s) dans la région étudiée.mais l identité du ou des gènes n est pas encore élucidée
3 Localisation des gènes de prédisposition La souris, modèle expérimental Démonstration directe du rôle d un gène par ciblage génique (KO) ou transgénèse: Ex: le gène X est-il impliqué dans la résistance à une maladie? KO d un gène chez une souris R Transgénèse du gène (provenant d une souris R) chez une souris S
3 Localisation des gènes de prédisposition chez l homme Une affaire nettement plus complexe. =>est-on convaincu qu il existe une composante génétique? =>si oui, peut-on modéliser cette composante suivant un modèle mendélien (1 gène voire 2 gènes max)? =>si oui (ou si non), quelles sont les méthodes d analyses adéquates de liaison génétique?
3 Localisation des gènes de prédisposition chez l homme Maladie monogénique ou à un gène majeur Pour chaque famille, calcul de la probabilité d observer les données en supposant un taux de recombinaison theta<0,5 sachant La fréquence de l allèle morbide La pénétrance La fréquence des allèles des marqueurs =>probabilité sous l hypothèse de liaison génétique (theta<0,5 ) en faisant varier theta
3 Localisation des gènes de prédisposition chez l homme Maladie monogénique ou à un gène majeur Pour chaque famille, calcul de la probabilité d observer les données en supposant un taux de recombinaison theta=0,5 sachant les paramètres suivants: La fréquence de l allèle morbide La pénétrance La fréquence des allèles des marqueurs =>probabilité sous l hypothèse de NON liaison génétique (theta=0,5 ) =>LOD score=log10 P(liaison)/P(non liaison) =>somme des LOD scores de toutes les familles
3 Localisation des gènes de prédisposition chez l homme Maladie monogénique ou à un gène majeur Calcul du Lod score pour l ensemble des familles en faisant varier theta θ
3 Localisation des gènes de prédisposition chez l homme Maladie monogénique ou à gène majeur: de nombreux succès Cystic fibrosis CFTR gene Huntington disease HD gene Alzheimer disease APP Hereditary breast cancer BRCA1 BRCA2
3 Localisation des gènes de prédisposition chez l homme Maladie monogénique ou à un gène majeur ANALYSES DE LIAISON GÉNÉTIQUES PARAMETRIQUES Puissantes Mais sensibles aux erreurs d estimation des paramètres Biais important sur l estimation du taux theta de recombinaison (ie de la localisation du gène de prédisposition)
3 Localisation des gènes de prédisposition chez l homme Maladies multifactorielles: de nombreuses inconnues/paramètres =>analyses NONparamétriques de liaison génétique, tq méthodes des paires de germains atteints L idée: si le gène X de prédisposition est proche du marqueur M alors les deux germains partageront plus d allèles que ne le voudrait le hasard /OU/ Deux germains atteints ont des génotypes similaires au locus marqueur M proche du gène de prédisposition
3 Localisation des gènes de prédisposition chez l homme méthodes des paires de germains atteints (trait qualitatif) Comparaison du nombre d allèles partagés sous l hypothèse de liaison génétique VS l hypothèse de NON liaison génétique (random distribution) =>SI différence significative ALORS il y a liaison génétique entre le marqueur et la maladie (si la différence est significative, il y a association entre un trait=maladie et un excès d allèles partagés)
3 Localisation des gènes de prédisposition chez l homme méthodes des paires de germains (trait quantitatif) Idée similaire: si le gène X de prédisposition est proche du marqueur M alors deux germains AYANT DES TRAITS SIMILAIRES partageront plus d allèles que ne le voudrait le hasard /OU/ Deux germains AYANT DES TRAITS SIMILAIRES ont des génotypes au locus marqueur M proche du gène de prédisposition X
3 Localisation des gènes de prédisposition chez l homme Une méthode des paires de germains (trait quantitatif):haseman-elston Corrélation du nombre d allèles partagés par les germains avec la différence du trait quantitatif des germains IE Corrélation de la ressemblance génotypique des germains avec leur ressemblance phénotypique
3 Localisation des gènes de prédisposition chez l homme Approche plus résolutive de la localisation: les tests d association allélique en présence de liaison génétique IE Les tests TDT (Transmission Disequilibrium Tests) IE Family-based association tests
3 Localisation des gènes de prédisposition chez l homme Le test historique de Spielman et al Un trio avec au moins un parent hétérozygote pour le marqueur et un enfant atteint Idée:on recherche un allèle donné du marqueur préférentiellement transmis par les parents hétérozygotes aux enfants atteints
3 Localisation des gènes de prédisposition chez l homme Le test historique de Spielman et al Comparaison des allèles transmis aux enfants atteints vs les allèles non transmis aux enfants atteints : McNemar's test avec b nb d allèles M2 transmis et c nb d allèles non transmis (test X2 avec 1df) (b - c) 2 b + c
3 Localisation des gènes de prédisposition chez l homme Maladies multifactorielles: quelques ex de succès (linkage+tdt) - diabète - maladie de Crohn - lèpre
3 Localisation des gènes de prédisposition: Approche combinée homme-souris Conservation de la synténie entre les génomes de l homme et de la souris: gènes colocalisés chez l homme=>orthologues colocalisés chez la souris Approche combinée/paludisme ch 5q31-q33 homme/ch 11 souris ch 6p21-p23 homme/ch 17 souris (MHC)
Régions chromosomiques Homme et Souris liées au Paludisme Human chromosome 5 10 cm Mouse syntenic chromosomal region 5q31-q33 region linked to parasitemia Linked to P. chabaudi resistance 1 11 13 15 17 18 Hernandez et al, 2003
Régions chromosomiques Homme et Souris liées au Paludisme Human chromosome 5 10 cm Mouse syntenic chromosomal region 5q31-q33 region linked to parasitemia Linked to P. chabaudi resistance 1 11 13 15 17 18 Hernandez et al, 2003
Régions chromosomiques Homme et Souris liées au Paludisme 6p21-p23 region linked to mild malaria Human chromosome 6 Linked to P.chabaudi resistance Burt et al, 1999 Hernandez et al, 2003 Chromosomes 1 4 8 9 10 13 17 Mouse syntenic chromosomal region
La susceptibilité au paludisme est liée à la région MHC chez l homme Flori et al (2003), Hum Mol Genet,12(4): 375 4,5 4 3,5 3 TNF LOD score = 3.86 P= 1.22.10-5 2,5 2 Lod score 1,5 1 0,5 0 MHC class I A C B MHC Class II DR DQ DP 1cM 1 D6S276 TNFb TNF-308, -244, -238 TNFd D6S291
La susceptibilité au paludisme est liée à la région MHC chez l homme.et chez la souris Flori et al (2003), Hum Mol Genet,12(4): 375 4,5 4 3,5 3 TNF LOD score = 3.86 P= 1.22.10-5 2,5 2 Lod score 1,5 1 0,5 0 MHC class I A C B MHC Class II DR DQ DP 1cM 1 D6S276 TNFb TNF-308, -244, -238 TNFd D6S291 Bloc synténique lié au paludisme de la souris
La susceptibilité au paludisme est liée à la région MHC chez l homme.et chez la souris Hypothèse: TNF impliqué c/l homme et la souris Analyses TDT du gène TNF chez l homme: association de plusieurs polymorphismes avec le paludisme Souris KO pour le TNF montre le rôle du TNF dans le modèle expérimental du paludisme
A la recherche des Gènes de Prédisposition Des souris et des hommes Localisation des gènes/souris Analyse du transcriptome homme et souris Ciblage génique souris Localisation de gènes de prédisposition sur le génome (10-20cM) Localisation fine de gènes de prédisposition sur le génome (1-5cM) Identification de gènes et variants associés Identification de gènes et variants impliqués Analyse de liaison Déséquilibre de liaison/tdt Étude de gènes candidats Étude fonctionnelle in vitro
4 Conclusions: Maladies monogéniques: approche génétique très efficace Maladies multifactorielles: approche génétique efficace pour la localisation plus délicate pour l identification des gènes de prédisposition Critères pour le choix des gènes candidats? Par ex, surexpression d un gène chez les sujets susceptibles