Evolution Moléculaire et Phylogénie

Evolution Moléculaire et Phylogénie Dominique Mouchiroud dominique.mouchiroud@univ-lyon1.fr Biométrie et Biologie Evolutive, UMR5558, Lyon I Bioinformatique et Génomique Evolutive

Phylogénie : Céline Brochier-Armanet Evolution Moléculaire : Dominique Mouchiroud Reconstruire l histoire des organismes, des gènes, des fonctions : phylogénie Etudier l évolution des génomes pour mieux comprendre leur origine, leur fonctionnement, et vice versa

Plan du cours I.L évolution moléculaire Cadre théorique II. Evolution de quelques traits moléculaires Taille des génomes Taux d évolution Composition en base des génomes III. Conclusion

Plan du cours I.L évolution moléculaire Cadre théorique - les modèles d évolution - les forces évolutives - les tests de neutralité

Les acteurs de la théorie de l Evolution La théorie de l évolution par la sélection naturelle (1859) La théorie synthétique de l évolution (1930) La théorie neutraliste de l évolution moléculaire (1983) Au sein d'une même lignée, tous les individus sont différents et la nature favorise la multiplication de ceux qui sont les mieux adaptés à leur milieu. Il y a compétition pour les ressources qui impose une sélection de la part du milieu (survie des plus aptes)

Théorie neutraliste de l évolution moléculaire (1983) Vast majority of base substitutions are neutral with respect to fitness. Motoo Kimura (1924-1994) Genetic drift dominates evolution at the molecular level. A l appui de la TNEM, l hypothèse de l horloge moléculaire proposée en 62 par Zuckerkandl et Pauling. Rate of molecular evolution is equal to the neutral mutation rate. K u A l échelle macroévolutive, les génomes sont le fruit de deux forces évolutives Sélection / Dérive génétique (Hasard)

Valeurs sélectives des mutations Les mutations délétères (s<0) ne sont pas fixées dans la population en raison de leur impact sur le fonctionnement du génome. Elles sont éliminées par la sélection naturelle : sélection négative ou purificatrice. Les mutations non (ou faiblement) délétères (s~0) peuvent être transmises à la descendance. Ces mutations sont fixées aléatoirement dans la population : dérive génétique. Les très rares mutations avantageuses (s>0) sont positivement sélectionnées : sélection adaptative.

Darwin C. Wright et al. s < 0 s > 0 s = 0 s ~ 0 Ss < 0 s = coef. de sélection Kimura T. Otha T. Bernardi G. Bernardi PNAS 2007

Générateur du polymorphisme génétique «les mutations» - substitutions - insertions, délétions - recombinaison - duplication de gènes, translocation - éléments transposables - transgénèse (transfert horizontal de gènes) - remaniements chromosomiques (fission, fusion, inversion) - duplication génomique (aneuploïdie, euploïdie) Turnover génomique

Processus de fixation des mutations MUTATION nouvel allèle Réparation de l ADN Individu Population (N) Cellule germinale Cellule somatique Pas de transmission à la descendance Transmission à la descendance Plusieurs générations Polymorphisme Fixation Perte d allèle Changement des fréquences alléliques Substitutions

Diversité/Divergence Le Polymorphisme de séquences ou Diversité nucléotidique de type SNP (Single Nucleotide Polymorphism) ou CNV (Copy Number Variation) reflète les processus de mutation et de migration au sein des populations Il est mesuré en comparant les séquences de plusieurs individus appartenant à la même population ou même espèce, Il présente une variabilité inter et intra génomique, Il reflète un compris entre le coût lié au fardeau mutationnel et celui de la réparation. Mesure : p N - p S Les changements observés ou Divergences entre deux séquences orthologues d espèces différentes reflètent le processus de fixation des mutations (sélection (adaptative ou non adaptative) ou dérive génétique). Il est mesuré en comparant les séquences orthologues d individus appartenant à des espèces différentes, Il est fortement dépendent de la taille efficace de la population et de la valeur sélective de la mutation Mesure d N - d S

Forces évolutives Mutation/Migration => création d un nouvel allèle Changement des fréquences alléliques au cours des générations Generations Population Changements Dérive génétique Sélection naturelle Recombinaison (Conversion génique biaisée) Fixation de l allèle rouge

Variation des fréquences alléliques par dérive génétique (1) Par dérive génétique, il y a perte ou fixation de l allèle dans les populations de très petites tailles efficaces (N e ) Temps de fixation des allèles dans la généalogie représente le temps de coalescence. T 2 4 N e (en moyenne) T 3 T 4 T 5 2 N e (en moyenne) La probabilité de fixation d un allèle neutre est égale à sa fréquence initiale. Le temps moyen de fixation d un allèle neutre est de 4 N e. Tous les processus évolutifs qui conduisent à réduire la taille efficace comme l absence de recombinaison conduisent à des phénomènes de dérive.

Variation des fréquences alléliques par sélection naturelle (2) Ségrégation différentielle des alléles Il y a sélection lorsque les différents génotypes pour un locus donné ne participent pas de façon équivalente à la constitution génotypique de la génération suivante. Un génotype donne plus de descendants fertiles et donc présente un avantage sélectif. Meilleure Fitness pour ce génotype. Exemple : sélection au niveau de l utilisation des codons en relation avec le niveau d expression des gènes. t = (2/s) ln (2N) t = 4Ne

Variation des fréquences alléliques par recombinaison (3) La recombinaison assure le brassage génétique en conduisant à l échange de matériel génétique entre chromosome homologue ou hétérologue. La recombinaison entre le chromosome maternel et paternel lors de la meïose s accompagne s il y a cassure d une réparation par conversion génique avec ou sans crossing-over. Un dogme en génétique des populations veut que la recombinaison améliore l efficacité de la sélection en favorisant le tri des meilleurs allèles. Lorsque la recombinaison est absente, la sélection ne peut agir (effets Hill-Robertson). Balayage sélectif (Maynard-Smith et Haig 1974) Sélection d arrière garde (Charlesworth et al, 1993) Mutation avantageuse Mutation neutre Mutation délétère Mutation neutre

Conversion Génique Biaisée (gbgc) Evènement moléculaire associé à la Recombinaison méïotique T Non-crossing over Crossing over Hétéroduplex ADN T A (G->A) G (T->C) Réparation Mismatch ADN C G La conversion génique biaisée (gbgc) associée à la recombinaison s accompagne d un tri biaisé des allèles vers G/C (pas forcément les meilleurs) dans les régions fortement recombinantes (r élevé). Le mécanisme lié au gbgc s apparente à l effet d un distorteur de ségrégation. Le gbgc est un processus non sélectif qui s apparente à de la sélection.

Diversité/Divergence Taux de divergence = Taux de mutation X Prob. de fixation de la mutation Taux de divergence = Nbre de mutations fixées/ site /année Taux de mutation = Nbre de mutations produites/ site /année Taux de polymorphisme de la population Probabilité de fixation de la mutation dépend - de la taille efficace de la population (N e ) - de la valeur sélective de la mutation (s) - du taux de recombinaison (r) et de l intensité du biais de conversion génique (b)

Forces évolutives et taille efficace S = 0 évolution neutre - pas de sélection taux de divergence ~ taux de mutation Fixation aléatoire des mutations neutres s < 1/2N e petite taille efficace taux de divergence ~ taux de mutation la sélection ne peut opérer et la dérive génétique agit Fixation de mutations faiblement délétères Pas fixation de mutations avantageuses s > 1/2N e grande taille efficace taux de substitutions taux de mutations la sélection positive peut opérer Fixation des mutations avantageuses Elimination des mutations faiblement délétères

Tests de neutralité ou comment détecter la sélection Importance de la théorie neutraliste de l évolution moléculaire - Un modèle «nul» qui décrit un monde dans lequel la sélection naturelle ne joue aucun rôle, - La diversité génétique n est affectée que par la dérive, la mutation, la recombinaison et la migration. Prédire grâce au modèle neutraliste ce qu on devrait attendre (diversité, nombre d allèles, distribution de fréquences alléliques) et tester l ajustement du modèle aux données, Comparer la vraisemblance d un modèle qui ignore la sélection naturelle à la vraisemblance d un modèle qui l intègre : l amélioration permet-elle d expliquer au mieux les données?

Tests de neutralité ou comment détecter la sélection Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre.

Compartimentation structurale de l ADN Génomique GA AAA TGC GCT TTT Evolution sous modèle neutre Evolution sous modèle sélectif (5%) Région intergénique Eléménts répétés Pseudogènes Introns (CDS) Position III des codons CNCs : Enhancer Promoteur Signaux de régulation (CDS) Position I et II des codons

Inférence des processus évolutifs les positions I et II des codons sont des marqueurs des pressions sélectives liées à la traduction en acides aminées (estimateur d N, divergence non silencieux), les positions III et notamment les positions III des quartets sont des marqueurs de l évolution neutre (estimateur d S, divergence silencieux) au même titre que les introns ou les régions intergéniques, le rapport w = d N /d S mesure les processus macroévolutifs

Tests de neutralité ou comment détecter la sélection Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre, Sans donnée de polymorphisme - comparaison des divergences synonymes et non synonymes K a /K s ou d n /d s

Inférence des processus évolutifs avec gène codant Divergence non synonyme versus Divergence synonyme ω = d N d S ω > 1 d où d N > d S : sélection adaptative ω = 1 d où d N = d S : évolution neutre ω < 1 d où d N < d S : sélection purificatrice Vrai si la sélection peut jouer (Ne élevée et/ou S élevé ) Si N e est faible (ex: mammifère), la fixation par dérive génétique de mutations non synonymes faiblement délétères ou avantageuses est fréquente. Ceci induit une augmentation du rapport d N /d S (similaire à la sélection positive).

Sélection purificatrice Sélection adaptative Protéines immunitaires Protéines de résistance/virulence Protéine de reconnaissance Gamétique (Yang 2000) 8% (1% significatif) 13454 séquences codantes orthologues entre l homme et le chimpanzé Pour ce jeu de donné, ω moyen vaut 0,23 En générale, la moyenne de ω se situe entre 0,05 et 0,3

Test de Mc Donald -Kreitman (91) Type de changement Divergence d Polymorphisme p Synonymes d S p S Non synonymes d N p N H 0 : évolution neutre d N /d S = p N /p S H 1 : sélection purificatrice d N < p N H 1 : sélection adaptative d N > p N

Tests de neutralité ou comment détecter la sélection Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre, Sans donnée de polymorphisme - comparaison des divergences synonymes et non synonymes K a /K s ou d n /d s Avec des données de polymorphisme, - comparaison des taux de mutation/taux de substitution - étude des distributions des fréquences alléliques - étude de la diversité nucléotidique

Proportion de SNPs Proportion of SNPs 0.35 sites neutres sites sous sélection négative 0.25 0.15 0.05 10% 20% 30% 40% 50% 60% 70% 80% 90% <100% Fréquence des allèles dérivés 0.35 Sites neutres sites sous sélection positive 0.25 0.15 0.05 10% 20% 30% 40% 50% 60% 70% 80% 90% <100% Fréquence des allèles dérivés

Questions actuelles en génomique évolutive Quelle est la part du génome qui évolue de manière neutre et la part sous pression de sélection? Quelle est la part de génome sous sélection qui est due à la sélection adaptative ou purificatrice? Quels sont les facteurs de sélection impliqués?