2. Duplication de gènes et évolution des familles de gènes 2.1. Evolution de familles de gènes 2.2. Evolution concertée de familles de gènes
2. 2. Duplication de gènes et et évolution des familles de gènes Duplication de gènes: évènement fondamental en évolution moléculaire = source du "bricolage moléculaire" Types de duplication: duplication d'un segment de gène duplication entière d'un gène duplication d'une partie de chromosome duplication entière d'un chromosome duplication d'un génome entier polyploïdie évolution des génomes Cause de duplication: crossing-over inégal
2. 2. Duplication de gènes et et évolution des familles de gènes Crossing-over inégal: Processus plus fréquent dans régions présentant des motifs répétés (ex. locus VNTR utilisés dans l'identification de criminels)
2.1. Evolution de familles de gènes Evolution de gènes dupliqués en entier: conservation de la fonction originale copies invariantes: production en masse de certains ARN et protéines émergence d'une nouveauté génétique: une copie conserve sa fonction initiale, l'autre acquiert une nouvelle fonction perte de la fonction originale et dégradation de la séquence (codon stop, perte TATA box, décalage de cadre de lecture, ): évolution en pseudogène
2.1. Evolution de familles de gènes Evolution de gènes dupliqués en entier: L'ensemble des gènes appartenant à un même groupe de séquences ayant évolué par le processus de duplication = famille de gènes (incluant copies fonctionnelles et non fonctionnelles) Les membres d'une famille de gènes se trouvent généralement à proximité l'un de l'autre sur le même chromosome, en raison de leur évolution par crossing-over inégal Exemple: les familles de gènes de l'α et de la β-globine chez l'homme pseudogènes
4.1. Evolution de familles de gènes A. Conservation de la fonction originale après duplication : "répétitions de dose" favorisées quand justifié par un besoin métabolique intense pour une molécule donnée: ARN ribosomaux, ARN de transfert répétés en tandem protéines ubiquistes comme les histones (lors de divisions cellulaires)
2.1. Evolution de familles de gènes B. Emergence d'une nouveauté génétique après duplication: une copie conserve sa fonction initiale, l'autre diverge et acquiert une nouvelle fonction Exemple: les protéines opsines des pigments rétiniens responsables de la vision des couleurs Chez l'homme + singes de l'ancien monde 3 opsines différentes: opsine "bleue" (iodopsine S) située sur le chromosome 7 (=autosome) opsines "rouge" et "verte" (iodopsine M et L) situées sur le chrom. X vision trichromatique Apparus par 2 évènements de duplication: 600 Ma: séparation entre iodopsine S et iodopsine "ML" (43% identité séq. a.a.) vision dichromatique après divergence de S et "ML" 35 Ma: séparation entre iodopsine M et L (96% identité séq. a.a.) vision trichromatique après divergence de M et L
2.1. Evolution de familles de gènes Exemple: les protéines opsines des pigments rétiniens responsables de la vision des couleurs Homme + singes de l'ancien monde 3 opsines vision trichromatique : opsine "bleue" (iodopsine S) située sur le chromosome 7 (=autosome) opsines "rouge" et "verte" (iodopsine M et L) situées sur le chrom. X Troubles génétiques de vision des couleurs (daltonisme): altération gène M ou L individus : si 1 seule copie porte allèle délétère (hétéroz.) vision normale individus : caractère exprimé seulement si homozygote pour allèle délétère individus : caractère toujours exprimé car une seule copie du chrom. X
2.1. Evolution de familles de gènes Emergence d'une nouvelle fonction après duplication: Ex.: vision des couleurs liée à coexistence de 3 types de gènes de pigmentation de la rétine, issus de duplication. Copies de gènes pigments rouges verts bleus
2.1. Evolution de familles de gènes C. Perte de la fonction originale après duplication et dégradation de la séquence: une des 2 copies conserve la fonction originale, l'autre devient nonfonctionnelle (mutation délétère) évolution en pseudogène (gène A pseudogène noté ΨA) mécanisme de perte de fonction: codon stop, perte TATA box, décalage de cadre de lecture, perte sites d'épissage, forte probabilité d'évolution en pseudogène après duplication (la première des 2 copies qui mute pseudogène; l'autre devient un gène à copie unique) pseudogènes très fréquents ( presque toutes familles de gènes)
2.1. Evolution de familles de gènes Datation d'un évènement de duplication: 2 gènes sont dits paralogues s'ils dérivent d'un évènement de duplication ( 2 locus distincts dans même génome: α et β) 2 gènes sont dits orthologues s'ils dérivent d'un évènement de spéciation ( même locus dans 2 génomes distincts: α espèce 1 et α espèce 2) terme "homologue" imprécis!
2.1. Evolution de familles de gènes Datation d'un évènement de duplication: on veut estimer T D = temps écoulé depuis duplication menant à α et β (2 gènes paralogues) on connait T S = temps écoulé depuis spéciation menant aux espèces 1 et 2; et les séquences des 2 paires de copies orthologues de α et β
2.1. Evolution de familles de gènes Datation d'un évènement de duplication: estimation taux substitution moyen: r α = K α /(2T S ) avec K α entre 2 espèces; r moy = (r α + r β )/2 hypothèse que même taux substitution entre α et β estimation nombre substitutions entre α et β : K αβ = moyenne 4 combinaisons calcul final: T D = K αβ /(2r moy )
2.1. Evolution de familles de gènes Exemple d'évolution d'une famille de gènes : les globines Composé de 3 sous-familles: myoglobine; α et β globines 2 protéines : myoglobine (monomérique); hémoglobine (tétramérique: 2α+2β) divergence il y a 600-800 10 6 années myoglobine: tissus musculaires hémoglobine: sang duplication puis différenciation fonction nouvelle
2.1. Evolution de familles de gènes Exemple d'évolution d'une famille de gènes : les globines Composé de 3 sous-familles: myoglobine; α et β globines sur des chromosomes différents Présence de pseudogènes 2 copies quasi-identiques duplication sans différenciation chaînes ξ+ε hémoglobines de l'embryon et du fetus duplication puis différenciation fonction nouvelle
2.2. Evolution concertée de familles de gènes Patrons attendus et observés de variation au sein d'une famille de gènes comportant 6 gènes dupliqués en tandem: observé: au sein d'une même espèce, les membres d'une famille de séquences répétées sont fortement similaires, alors que les membres de la même famille provenant d'espèces apparentées peuvent être fort différents évolution concertée des membres d'une famille de gènes
2.2. Evolution concertée de familles de gènes homogénéisation de la variation au sein d'une famille de gènes dupliqués en tandem: mécanismes qui copient une nouvelle mutation favorable apparue dans 1 élément répété vers les autres: conversion génique crossing-over inégal mutation 1 membre mutation toute famille
2.2. Evolution concertée de familles de gènes homogénéisation de la variation au sein d'une famille de gènes dupliqués en tandem: conversion génique
2.2. Evolution concertée de familles de gènes homogénéisation de la variation au sein d'une famille de gènes dupliqués en tandem: crossing-over inégal: sélection
2.2. Evolution concertée de familles de gènes Evolution concertée des gènes A γ et G γ chez les grands singes: duplication date de 55 millions d'années, nettement antérieure à la séparation Homme/Chimpanzé/Gorille exon 3: montre patron phylogénétique correspondant au temps de divergence exons 1 et 2: évolution concertée dans chaque lignée2 exon 3 exons 1 et 2 évolution concertée avec intensités dans régions du gène (contraintes sélectives )
2.2. Evolution concertée de familles de gènes Conséquences évolutives de l'évolution concertée: propagation de mutations favorables à l'ensemble des membres d'une famille de gènes retarde la divergence de copies d'un même gène complique la datation des évènements de duplication de gènes
3. Polymorphisme nucléotidique 3.1. Polymorphisme nucléotidique intraspécifique 3.2. Polymorphisme nucléotidique transspécifique
3.1. Polymorphisme nucléotidique intraspécifique Estimation du polymorphisme moléculaire dans un échantillon de n séquences tirées de la même espèce Estimateur 1: Diversité nucléotidique π π = Nombre moyen de différences nucléotidiques par site entre deux séquences de l'échantillon Estimateur 2: θ w de Watterson Estimateur 1 π12 = 5/18 π23 = 3/18 π13 = 3/18 <π> = 0.204 θ w = S/(L.a) = Nombre de sites polymorphes dans l'échantillon (S) divisé par la longueur de la séquence (L) et par facteur normatif a (a = 1+1/2+1/3+ +1/n-1) Modèle neutre, équilibre dérive/mutation : E(π) = E(θw) AGC AGT ACC TAA CAC TAG AGC TGA ACC TAA AAC TAT AGC TGT ACC TTA CAC TAT Estimateur 2 L = 18 S = 5 a = 1.5 et n = 3 θ w = S/(L.a) = 0.185
3.1. Polymorphisme nucléotidique intraspécifique 11 séquences de l'alcool déshydrogénase chez Drosophile échantillonnées dans l'espèce D. melanogaster: L = 2379 pb. (tiré de Graur & Li, 2000) variation nucléotidique concentrée au sein des introns nombre de sites polymorphes = S = 43 nombre de différences nucléotidiques entre séquences 1-S et 2-S = 3 (π 12 =3/2379=0.0013) diversité nucléotidique = moyenne des π ij: π = 0.007
3.1. Polymorphisme nucléotidique intraspécifique Effet de la taille des organismes taille des populations N (dérive génétique) Balance dérive/mutation π* = 4Nu Homo sapiens : π s = 0.0007 (Altchuler et al. 2001) Crustacés Insectes Mollusques Amphibiens Echinodermes Reptiles + Oiseaux Poissons Mammifères (Bazin et al., Science 2006)
3.1. Polymorphisme nucléotidique intraspécifique Effet d'un goulot d'étranglement associé à la domestication du maïs Forme sauvage (téosinte) Forme sélectionnée lors de la domestication
3.1. Polymorphisme nucléotidique intraspécifique Effet d'un goulot d'étranglement associé à la domestication du maïs: comparaison maïs téosinte (ancêtre) diversité nucléotidique syn. <π> = 0.025 π syn Téosinte Maïs <π> = 0.015 ( 40%)
3.1. Polymorphisme nucléotidique intraspécifique Effet du système de reproduction Evolution de l'autogamie ( autofécondation) A. lyrata (allogame) Arabidopsis thaliana Nasrallah et al., 2000, Plant Physiol. 124: 1605
3.1. Polymorphisme nucléotidique intraspécifique Effet du système de reproduction Evolution de l'autogamie chez A. thaliana diversité génétique (div. nucléotidique synonyme π S ) 100% autogamie 100% homozygotie réduction par 2 du nombre de copies de gènes (Ne ) dérive génétique π Syn. A. lyrata A. thaliana adapté de Charlesworth 2003 Phil. Trans. R. Soc. Lond. B 358:1051
3.1. Polymorphisme nucléotidique intraspécifique Gène sélectionné au cours du processus de domestication: tb1 dominance apicale chez le maïs Diversité moléculaire dans la region 5' de tb1 chez maïs et téosinte Clark, Richard M. et al. (2004) Proc. Natl. Acad. Sci. USA 101, 700-707 Perte diversité drastique dans la région promotrice de tb1 chez maïs: balayage sélectif
Déf. Auto-stop moléculaire Auto-stop moléculaire: phénomène d'association de variants (allèle, SNP) "neutres" avec les variants d'un locus soumis à sélection Cause: liaison génétique (dépend du taux de recombinaison entre locus neutre et locus sélectionné) Conséquences: ou polymorphisme au locus "neutre" par rapport aux locus "témoins" (non liés au locus sélectionné), selon le type de sélection naturelle
Liaison génétique et et déséquilibre de de liaison Principe de Hardy-Weinberg association aléatoire des allèles d'un même locus Comment s'associent des allèles de locus différents? Locus A avec 2 allèles A 1 (p 1 ) et A 2 (p 2 ) Locus B avec 2 allèles B 1 (q 1 ) et B 2 (q 2 ) si association aléatoire 4 types de gamètes: A 1 B 1 (x 1 ); A 1 B 2 (x 2 ); A 2 B 1 (x 3 ); A 2 B 2 (x 4 ) locus dits "en équilibre de liaison" = x1 = x2 = x3 = x4 (tiré de Hartl, 1994)
Liaison génétique et et déséquilibre de de liaison Si association des allèles aux locus A et B ne se fait pas de manière aléatoire au sein des gamètes locus dits "en déséquilibre de liaison" (sélection, fusion 2 pop., goulet étrangl.) paramètre supplémentaire: déviation D D = param. déséquilibre de liaison = x 1 -p 1 q 1 symétrie D = x 1.x 4 -x 2.x 3 Si hypothèses du modèle de H-W les fréquences gamétiques tendent vers équilibre de liaison mais la vitesse d'approche peut être lente (><1 locus H-W en 1 seule génération!)
Liaison génétique et et déséquilibre de de liaison Vitessse d'approche équilibre de liaison dépend du taux de recombinaison entre 2 locus D n = (1-r)D n-1 = (1-r) n D o (tiré de Hartl & Clark, 1997)
Patron de déséquilibre de liaison Locus ou sites proches le long d'un chromosome taux recombinaison déséquilibre de liaison Déséq. liaison Nordborg et al. 2002 Nature Genetics, Arabidopsis thaliana
Patron de déséquilibre de liaison
Absence de sélection: modèle neutre Le devenir de nouvelles mutations selon la théorie neutraliste de l'évolution moléculaire (Motoo Kimura) Interaction entre 2 forces évolutives: le processus de mutation-dérive fréquence mutation 1 0 Devenir de mutations neutres (synonymes; non codants) extinction de la mutation fixation de la mutation (substitution) Echelle de temps évolutive
Scénario neutre Absence de sélection: modèle neutre
Temps de fixation par dérive génétique d'un allèle neutre Si allèle sélectivement neutre devenir est déterminé par la dérive génétique dépend de N et de sa fréquence actuelle t fix Fréquences alléliques 1 0 élimination d'un alllèle mutant fixation d'un alllèle mutant Temps Temps moyen de fixation: t 4N fix générations
Sélection directionnelle Si allèle non neutre devenir est déterminé par la sélection naturelle si N est grand (sélection > dérive génétique) dépend du coefficient de sélection s: (en générat ) Fréquences alléliques 0 fixation d'un alllèle mutant favorable Temps t fix = ( 2 / s) ln(2n ) élimination d'un alllèle mutant favorable Exple: mammifère avec N = 10 6, temps moyen générat = 2 ans nouvelle mutation neutre: t fix = 4x10 6 x2 = 8 millions d'années nouvelle mutation favorable avec s = 1%: t fix = 2/0.01xln(2x10 6 )x2 = 5800 ans Evolution plus rapide sous sélection directionnelle positive!
Auto-stop moléculaire et et sélection Scénario neutre Balayage sélectif sélection
Effet de l'intensité de la sélection Balayage sélectif
Clark, Richard M. et al. (2004) Proc. Natl. Acad. Sci. USA 101, 700-707 Chute de diversité dans la région du promoteur du locus tb1 Balayage sélectif Balayage sélectif Example: tb1 dominance apicale chez le maïs Molecular diversity in the 5' region of tb1 in a sample of 24 individuals
Conséquences des balayages sélectifs Phénomène de variation du taux de recombinaison au travers d'un génome conséquences sur le niveau de polymorphisme Relation entre taux de recombinaison et polymorphisme chez la Drosophile (tiré de Hartl & Clark, 1997) 2 hypothèses: balayage sélectif autour de locus soumis à une sélection directionnelle positive sélection d'arrière-plan: élimination d'allèles neutres au voisinage de locus soumis à une sélection menant à la purge d'allèles délétères