Evolution Moléculaire et Phylogénie

Documents pareils
Génétique et génomique Pierre Martin

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Gènes Diffusion - EPIC 2010

Bases moléculaires des mutations Marc Jeanpierre

MABioVis. Bio-informatique et la

Les débuts de la génétique

Au-delà du coalescent : quels modèles pour expliquer la di

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Bases de données des mutations

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations

Big data et sciences du Vivant L'exemple du séquençage haut débit

Les OGM. 5 décembre Nicole Mounier

Bases de données et outils bioinformatiques utiles en génétique

Univers Vivant Révision. Notions STE

Biomarqueurs en Cancérologie

VI. Tests non paramétriques sur un échantillon

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

1 les caractères des êtres humains.

Introduction aux bases de données: application en biologie

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

MYRIAD. l ADN isolé n est à présent plus brevetable!

De la physico-chimie à la radiobiologie: nouveaux acquis (I)

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Principes de bonne pratique :

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Génomique Comparative et intégrative

Stabilitéet variabilitédes génomes au cours de la reproduction sexuée

DIAPOSITIVE 1 Cette présentation a trait à la réglementation sur les thérapies cellulaires.

THÈSE. Tiphaine Oudot

Identification de nouveaux membres dans des familles d'interleukines

Item 169 : Évaluation thérapeutique et niveau de preuve

Chapitre 2 - Complexité des relations entre génotype et phénotype

Hémochromatose génétique non liée à HFE-1 : quand et comment la rechercher? Cécilia Landman 11 décembre 2010

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Exercices de génétique classique partie II

Extraction d information des bases de séquences biologiques avec R

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

Etude, par simulations, de l intérêt d une sélection génomique dans une population porcine de type mâle

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

La reconnaissance moléculaire: la base du design rationnel Modélisation moléculaire: Introduction Hiver 2006

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

Séquence 2. L expression du patrimoine génétique. Sommaire

Variables Aléatoires. Chapitre 2

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Base de données bibliographiques Pubmed-Medline

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

TEPZZ A_T EP A1 (19) (11) EP A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: G07F 7/08 ( ) G06K 19/077 (2006.

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Première partie. Introduction Générale

TD de Biochimie 4 : Coloration.

Projet du 5 octobre du [date] (Adaptation des fonds propres de base) Sommaire

CATALOGUE DES PRESTATIONS DE LA

Estimation du coût de l incessibilité des BSA

Intervenant. Patrick MORGENSTERN. Expert-comptable, Chargé d enseignement fiscal à l Université de Bourgogne

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

PARTIE I Compte pour 75 %

Feuille d exercices 2 : Espaces probabilisés

PHOTO PLAISIRS. La Lumière Température de couleur & Balance des blancs. Mars 2011 Textes et Photos de Bruno TARDY 1

Structure quantique cohérente et incohérente de l eau liquide

La classification automatique de données quantitatives

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Séquence 1. Reproduction conforme de la cellule et réplication de l ADN Variabilité génétique et mutation de l ADN

Résonance Magnétique Nucléaire : RMN

Evaluer l ampleur des économies d agglomération

EXERCICES : MECANISMES DE L IMMUNITE : pages

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Conférence technique internationale de la FAO

Une application des algorithmes génétiques à l ordonnancement d atelier

Les tests de génétique moléculaire pour l accès aux thérapies ciblées en France en 2011

(Ordonnance sur le Livre des aliments pour animaux, OLALA) Le Département fédéral de l économie (DFE) arrête:

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

M. F. PITA Departamento de Geografía Física. Universidad de Sevilla. C/ María de Padilla s.n SEVILLA (Espagne).

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

DOSSIER DE CANDIDATURE SCIENCES TECHNOLOGIES SANTÉ Master 2 ème année Mention Biologie, Santé

Lois de probabilité. Anita Burgun

Ordonnancement en temps réel d un jobshop par métaheuristique hybride : étude comparative

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

Hervé de BOHAN QUE SONT DEVENUES LES LOIS DE MENDEL? Directeur de Thèse : Professeur F. PICARD

Introduction à la Génomique Fonctionnelle

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Logistique, Transports

Eco-système calcul et données

Séance 4. Gestion de la capacité. Gestion des opérations et de la logistique

Transcription:

Evolution Moléculaire et Phylogénie Dominique Mouchiroud dominique.mouchiroud@univ-lyon1.fr Biométrie et Biologie Evolutive, UMR5558, Lyon I Bioinformatique et Génomique Evolutive

Phylogénie : Céline Brochier-Armanet Evolution Moléculaire : Dominique Mouchiroud Reconstruire l histoire des organismes, des gènes, des fonctions : phylogénie Etudier l évolution des génomes pour mieux comprendre leur origine, leur fonctionnement, et vice versa

Plan du cours I.L évolution moléculaire Cadre théorique II. Evolution de quelques traits moléculaires Taille des génomes Taux d évolution Composition en base des génomes III. Conclusion

Plan du cours I.L évolution moléculaire Cadre théorique - les modèles d évolution - les forces évolutives - les tests de neutralité

Les acteurs de la théorie de l Evolution La théorie de l évolution par la sélection naturelle (1859) La théorie synthétique de l évolution (1930) La théorie neutraliste de l évolution moléculaire (1983) Au sein d'une même lignée, tous les individus sont différents et la nature favorise la multiplication de ceux qui sont les mieux adaptés à leur milieu. Il y a compétition pour les ressources qui impose une sélection de la part du milieu (survie des plus aptes)

Théorie neutraliste de l évolution moléculaire (1983) Vast majority of base substitutions are neutral with respect to fitness. Motoo Kimura (1924-1994) Genetic drift dominates evolution at the molecular level. A l appui de la TNEM, l hypothèse de l horloge moléculaire proposée en 62 par Zuckerkandl et Pauling. Rate of molecular evolution is equal to the neutral mutation rate. K u A l échelle macroévolutive, les génomes sont le fruit de deux forces évolutives Sélection / Dérive génétique (Hasard)

Valeurs sélectives des mutations Les mutations délétères (s<0) ne sont pas fixées dans la population en raison de leur impact sur le fonctionnement du génome. Elles sont éliminées par la sélection naturelle : sélection négative ou purificatrice. Les mutations non (ou faiblement) délétères (s~0) peuvent être transmises à la descendance. Ces mutations sont fixées aléatoirement dans la population : dérive génétique. Les très rares mutations avantageuses (s>0) sont positivement sélectionnées : sélection adaptative.

Darwin C. Wright et al. s < 0 s > 0 s = 0 s ~ 0 Ss < 0 s = coef. de sélection Kimura T. Otha T. Bernardi G. Bernardi PNAS 2007

Plan du cours I.L évolution moléculaire Cadre théorique - les modèles d évolution - les forces évolutives - les tests de neutralité

Générateur du polymorphisme génétique «les mutations» - substitutions - insertions, délétions - recombinaison - duplication de gènes, translocation - éléments transposables - transgénèse (transfert horizontal de gènes) - remaniements chromosomiques (fission, fusion, inversion) - duplication génomique (aneuploïdie, euploïdie) Turnover génomique

Processus de fixation des mutations MUTATION nouvel allèle Réparation de l ADN Individu Population (N) Cellule germinale Cellule somatique Pas de transmission à la descendance Transmission à la descendance Plusieurs générations Polymorphisme Fixation Perte d allèle Changement des fréquences alléliques Substitutions

Diversité/Divergence Le Polymorphisme de séquences ou Diversité nucléotidique de type SNP (Single Nucleotide Polymorphism) ou CNV (Copy Number Variation) reflète les processus de mutation et de migration au sein des populations Il est mesuré en comparant les séquences de plusieurs individus appartenant à la même population ou même espèce, Il présente une variabilité inter et intra génomique, Il reflète un compris entre le coût lié au fardeau mutationnel et celui de la réparation. Mesure : p N - p S Les changements observés ou Divergences entre deux séquences orthologues d espèces différentes reflètent le processus de fixation des mutations (sélection (adaptative ou non adaptative) ou dérive génétique). Il est mesuré en comparant les séquences orthologues d individus appartenant à des espèces différentes, Il est fortement dépendent de la taille efficace de la population et de la valeur sélective de la mutation Mesure d N - d S

Forces évolutives Mutation/Migration => création d un nouvel allèle Changement des fréquences alléliques au cours des générations Generations Population Changements Dérive génétique Sélection naturelle Recombinaison (Conversion génique biaisée) Fixation de l allèle rouge

Variation des fréquences alléliques par dérive génétique (1) Par dérive génétique, il y a perte ou fixation de l allèle dans les populations de très petites tailles efficaces (N e ) Temps de fixation des allèles dans la généalogie représente le temps de coalescence. T 2 4 N e (en moyenne) T 3 T 4 T 5 2 N e (en moyenne) La probabilité de fixation d un allèle neutre est égale à sa fréquence initiale. Le temps moyen de fixation d un allèle neutre est de 4 N e. Tous les processus évolutifs qui conduisent à réduire la taille efficace comme l absence de recombinaison conduisent à des phénomènes de dérive.

Variation des fréquences alléliques par sélection naturelle (2) Ségrégation différentielle des alléles Il y a sélection lorsque les différents génotypes pour un locus donné ne participent pas de façon équivalente à la constitution génotypique de la génération suivante. Un génotype donne plus de descendants fertiles et donc présente un avantage sélectif. Meilleure Fitness pour ce génotype. Exemple : sélection au niveau de l utilisation des codons en relation avec le niveau d expression des gènes. t = (2/s) ln (2N) t = 4Ne

Variation des fréquences alléliques par recombinaison (3) La recombinaison assure le brassage génétique en conduisant à l échange de matériel génétique entre chromosome homologue ou hétérologue. La recombinaison entre le chromosome maternel et paternel lors de la meïose s accompagne s il y a cassure d une réparation par conversion génique avec ou sans crossing-over. Un dogme en génétique des populations veut que la recombinaison améliore l efficacité de la sélection en favorisant le tri des meilleurs allèles. Lorsque la recombinaison est absente, la sélection ne peut agir (effets Hill-Robertson). Balayage sélectif (Maynard-Smith et Haig 1974) Sélection d arrière garde (Charlesworth et al, 1993) Mutation avantageuse Mutation neutre Mutation délétère Mutation neutre

Conversion Génique Biaisée (gbgc) Evènement moléculaire associé à la Recombinaison méïotique T Non-crossing over Crossing over Hétéroduplex ADN T A (G->A) G (T->C) Réparation Mismatch ADN C G La conversion génique biaisée (gbgc) associée à la recombinaison s accompagne d un tri biaisé des allèles vers G/C (pas forcément les meilleurs) dans les régions fortement recombinantes (r élevé). Le mécanisme lié au gbgc s apparente à l effet d un distorteur de ségrégation. Le gbgc est un processus non sélectif qui s apparente à de la sélection.

Diversité/Divergence Taux de divergence = Taux de mutation X Prob. de fixation de la mutation Taux de divergence = Nbre de mutations fixées/ site /année Taux de mutation = Nbre de mutations produites/ site /année Taux de polymorphisme de la population Probabilité de fixation de la mutation dépend - de la taille efficace de la population (N e ) - de la valeur sélective de la mutation (s) - du taux de recombinaison (r) et de l intensité du biais de conversion génique (b)

Forces évolutives et taille efficace S = 0 évolution neutre - pas de sélection taux de divergence ~ taux de mutation Fixation aléatoire des mutations neutres s < 1/2N e petite taille efficace taux de divergence ~ taux de mutation la sélection ne peut opérer et la dérive génétique agit Fixation de mutations faiblement délétères Pas fixation de mutations avantageuses s > 1/2N e grande taille efficace taux de substitutions taux de mutations la sélection positive peut opérer Fixation des mutations avantageuses Elimination des mutations faiblement délétères

Plan du cours I.L évolution moléculaire Cadre théorique - les modèles d évolution - les forces évolutives - les tests de neutralité

Tests de neutralité ou comment détecter la sélection Importance de la théorie neutraliste de l évolution moléculaire - Un modèle «nul» qui décrit un monde dans lequel la sélection naturelle ne joue aucun rôle, - La diversité génétique n est affectée que par la dérive, la mutation, la recombinaison et la migration. Prédire grâce au modèle neutraliste ce qu on devrait attendre (diversité, nombre d allèles, distribution de fréquences alléliques) et tester l ajustement du modèle aux données, Comparer la vraisemblance d un modèle qui ignore la sélection naturelle à la vraisemblance d un modèle qui l intègre : l amélioration permet-elle d expliquer au mieux les données?

Tests de neutralité ou comment détecter la sélection Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre.

Compartimentation structurale de l ADN Génomique GA AAA TGC GCT TTT Evolution sous modèle neutre Evolution sous modèle sélectif (5%) Région intergénique Eléménts répétés Pseudogènes Introns (CDS) Position III des codons CNCs : Enhancer Promoteur Signaux de régulation (CDS) Position I et II des codons

Inférence des processus évolutifs les positions I et II des codons sont des marqueurs des pressions sélectives liées à la traduction en acides aminées (estimateur d N, divergence non silencieux), les positions III et notamment les positions III des quartets sont des marqueurs de l évolution neutre (estimateur d S, divergence silencieux) au même titre que les introns ou les régions intergéniques, le rapport w = d N /d S mesure les processus macroévolutifs

Tests de neutralité ou comment détecter la sélection Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre, Sans donnée de polymorphisme - comparaison des divergences synonymes et non synonymes K a /K s ou d n /d s

Inférence des processus évolutifs avec gène codant Divergence non synonyme versus Divergence synonyme ω = d N d S ω > 1 d où d N > d S : sélection adaptative ω = 1 d où d N = d S : évolution neutre ω < 1 d où d N < d S : sélection purificatrice Vrai si la sélection peut jouer (Ne élevée et/ou S élevé ) Si N e est faible (ex: mammifère), la fixation par dérive génétique de mutations non synonymes faiblement délétères ou avantageuses est fréquente. Ceci induit une augmentation du rapport d N /d S (similaire à la sélection positive).

Sélection purificatrice Sélection adaptative Protéines immunitaires Protéines de résistance/virulence Protéine de reconnaissance Gamétique (Yang 2000) 8% (1% significatif) 13454 séquences codantes orthologues entre l homme et le chimpanzé Pour ce jeu de donné, ω moyen vaut 0,23 En générale, la moyenne de ω se situe entre 0,05 et 0,3

Test de Mc Donald -Kreitman (91) Type de changement Divergence d Polymorphisme p Synonymes d S p S Non synonymes d N p N H 0 : évolution neutre d N /d S = p N /p S H 1 : sélection purificatrice d N < p N H 1 : sélection adaptative d N > p N

Tests de neutralité ou comment détecter la sélection Différentes signatures moléculaires de la sélection peuvent être utilisées pour tester le modèle neutre, Sans donnée de polymorphisme - comparaison des divergences synonymes et non synonymes K a /K s ou d n /d s Avec des données de polymorphisme, - comparaison des taux de mutation/taux de substitution - étude des distributions des fréquences alléliques - étude de la diversité nucléotidique

Proportion de SNPs Proportion of SNPs 0.35 sites neutres sites sous sélection négative 0.25 0.15 0.05 10% 20% 30% 40% 50% 60% 70% 80% 90% <100% Fréquence des allèles dérivés 0.35 Sites neutres sites sous sélection positive 0.25 0.15 0.05 10% 20% 30% 40% 50% 60% 70% 80% 90% <100% Fréquence des allèles dérivés

Questions actuelles en génomique évolutive Quelle est la part du génome qui évolue de manière neutre et la part sous pression de sélection? Quelle est la part de génome sous sélection qui est due à la sélection adaptative ou purificatrice? Quels sont les facteurs de sélection impliqués?