Homologie - orthologie- paralogie

Documents pareils
CHAPITRE 3 LA SYNTHESE DES PROTEINES

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Travaux dirigés de Microbiologie Master I Sciences des Génomes et des Organismes Janvier 2015

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Luca : à la recherche du plus proche ancêtre commun universel Patrick Forterre, Simonetta Gribaldo, Céline Brochier

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

VI- Expression du génome

First Line and Maintenance in Nonsquamous NSCLC: What Do the Data Tell Us?

Spécialisation 3A AgroSup Dijon IAA Microbiologie Industrielle et Biotechnologie (MIB)

Introduction à la Génomique Fonctionnelle

Vue d ensemble de la vie microbienne

Big data et sciences du Vivant L'exemple du séquençage haut débit

Analyse des données de séquençage massif par des méthodes phylogénétiques

Les bases de données transcriptionnelles en ligne

Biochimie I. Extraction et quantification de l hexokinase dans Saccharomyces cerevisiae 1. Assistants : Tatjana Schwabe Marcy Taylor Gisèle Dewhurst

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

Resolution limit in community detection

STÉRÉOISOMÉRIE CONFIGURATIONNELLE STÉRÉOISOMÉRIE OPTIQUE COMPOSÉS OPTIQUEMENT ACTIFS À UN SEUL CARBONE ASYMÉTRIQUE

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

MABioVis. Bio-informatique et la

Chaînes de Markov au lycée

Génomique Comparative et intégrative

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

Cellules procaryotes Service histologie Pr.k.mebarek

Méthode SOBANE: Bruit NIVEAU 3: ANALYSE

6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses

Structure quantique cohérente et incohérente de l eau liquide

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Conférence technique internationale de la FAO

NC 35 Norme comptable relative aux états financiers consolidés

Big data : vers une nouvelle science des risques?

Contrôle de l'expression génétique : Les régulations post-transcriptionnelles

Pourquoi l apprentissage?

PROCEDURE DE REVISION DES SALAIRES

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

Contrôle de l'expression génétique :

Identification des incontournables à la démarche Lean

Les OGM. 5 décembre Nicole Mounier

β-galactosidase A.2.1) à 37 C, en tampon phosphate de sodium 0,1 mol/l ph 7 plus 2-mercaptoéthanol 1 mmol/l et MgCl 2 1 mmol/l (tampon P)

Chapitre 1 : Introduction aux bases de données

I. La levure Saccharomyces cerevisiae: mode de vie

Univers Vivant Révision. Notions STE

Seconde et première Exercices de révision sur les probabilités Corrigé

Résolution d équations non linéaires

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

MASTER (LMD) PARCOURS MICROORGANISMES, HÔTES, ENVIRONNEMENTS (MHE)

DESCRIPTIF DU DOCUMENT. Déploiement Nouveau système de rémunération au ème salaire

IlliS. Le ribosome bactérien : structure et fonctions SYNTHÈSE

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Molécules et Liaison chimique

Les débuts de la génétique

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

CH.6 Propriétés des langages non contextuels

4 : MÉTHODES D ANALYSE UTILISÉES EN ÉCOLOGIE MICROBIENNE

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

Intrants médicamenteux en agriculture et en santé : les écosystèmes microbiens sont-ils un problème ou une solution?

Problème : Calcul d'échéanciers de prêt bancaire (15 pt)

PRO-G-DIS. Installation et utilisation de la banque Claude Bernard

Dossier d'étude technique

1 Recherche en table par balayage

Production d une protéine recombinante

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

3-La théorie de Vygotsky Lev S. VYGOTSKY ( )

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

Ebauche Rapport finale

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

Partenaires: w w w. c o g m a s t e r. n e t

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

Depuis des milliers de générations, le ver à soie est l objet d une sélection

D'UN THÉORÈME NOUVEAU

MDI Chèque de Allégroupe Réclamation

Science et technique. La température et la durée de stockage sont des facteurs déterminants. Viande bovine et micro-organisme pathogène

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

CATALOGUE DES PRESTATIONS DE LA

Evaluation de la variabilité d'un système de mesure

Séquence 2. L expression du patrimoine génétique. Sommaire

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Firewall. Souvent les routeurs incluent une fonction firewall qui permet une première sécurité pour le réseau.

1 les caractères des êtres humains.

Détection des duplications en tandem au niveau nucléique à l'aide de la théorie des flots

leurs produits respectifs, et production d'anticorps spécinques. Mémoire présenté Département de biochimie Université Laval

La persistance des nombres

Séquençage et Assemblage. de Génomes. François Denizot Emmanuel Talla LCB-IBSM CNRS

Consignes pour la remise des données RESEAU

DYNAMIQUE DE FORMATION DES ÉTOILES

Retentissement de la réforme de l'ircantec 2008 sur la retraite des Praticiens Hospitaliers.

INF6304 Interfaces Intelligentes

GOL502 Industries de services

MATHÉMATIQUES APPLIQUÉES S4 Exercices

Analyse dialectométrique des parlers berbères de Kabylie

Rétablissement d un réseau cellulaire après un désastre

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

IFT3913 Qualité du logiciel et métriques. Chapitre 2 Modèles de processus du développement du logiciel. Plan du cours

Poudlard But Matériel : Mise en place Prologue d'emplacements différents

Transcription:

Homologie - orthologie- paralogie Deux gènes sont homologues s'ils ont divergé à partir d'une séquence ancêtre commune. Deux gènes sont orthologues si leur divergence est due à la spéciation (le gène ancêtre commun se trouvait dans l'organisme ancêtre). Deux gènes sont paralogues si leur divergence est due à la duplication du gène ancêtre. Donc deux séquences sont ou ne sont pas homologues. Dire que la protéine X a 80% d'homologie avec la protéine Y est donc incorrect: soit: les deux protéines présentent 80% d'identité (résidus identiques) les deux protéines présentent 80% de similitude (résidus similaires)

Homologie - orthologie- paralogie (extrait de Fitch, 2000, TIG vol. 16, N 5) Spéciation 1 Duplication 1 Spéciation 2 Duplication2 A1 B1 B2 C1 C2 C3 Sur l'arbre, les événements de spéciation sont indiqués par une fourche et ceux de duplication par une ligne horizontale. Deux gènes dont l'ancêtre commun réside à une fourche sont orthologues et deux gènes dont l'ancêtre commun se trouve sur une ligne horizontale sont paralogues. En appliquant cette règle: A1 est orthologue à B1,B2,C1,C2 et C3 B1 est orthologue à C1 et paralogue à B2, C2 et C3 B2 est orthologue à C2 et C3 et paralogue à B1 et C1 C1 est orthologue à B1 et paralogue à B2, C2 et C3 C2 et C3 sont paralogues, ils sont orthologues à B2 et paralogues à B1 et C1

Autres Définitions Xénologie : quand l'histoire d'un gène implique un transfert entre espèces de matériels génétiques (les transferts horizontaux). Les transferts de gènes entre organelles et noyau sont exclus de cette définition. Analogie : quand la similarité de caractères est apparue à la suite d'un processus de convergence. A C B C

Mycoplasma genitalium Mycoplasma pneumoniae D A Mp C B A D Mg D B C A B C D B C A

Comparaison de la position des gènes orthologues entre deux génomes a) M. genitalium/h. influenzae b) H. influenzae/e. coli (extrait de Watanabe et al., 1997, J. Mol. Evol., 44 (Suppl. 1, S57-S64)

Conservation des gènes orthologues entre E. coli et B. subtilis (issus de KEGG)

Comparaison de l'organisation des gènes de l'opéron des protéines ribosomiques (issus de KEGG)

Conservation de la structure en opérons au sein des génomes (Itoh et al. (1999) Mol. Biol. Evol., vol 16, 332-346) Analyse réalisée à partir de structures opéroniques déterminées expérimentalement : 256 opérons décrits chez Escherichia coli (~ 3,5 gènes/opéron) 100 opérons décrits chez Bacillus subtilis (~4,1 gènes/opéron) La comparaison de ces opérons avec les opérons orthologues de 11 autres génomes complètement séquencés a été réalisée. Le génome de Saccharomyces cerevisiae a été inclus dans cette liste car l'organisation de certains de ces gènes est connue pour être similaire à celle observée chez les bactéries.

Conservation de la structure en opérons au sein des génomes Définition des paires d'orthologues: (Itoh et al., 1999) Les ORFS entre les deux génomes comparés doivent être les plus similaires de façon réciproque (BBH) (Fig. 1a). La similarité doit être statistiquement significative. Si un orthologue donné présente plus de similarité avec des paralogues du même génome, tous les paralogues sont considérés comme étant orthologues au partenaire de l'autre génome (Fig. 1b). Fig. 1a Fig. 1b

Conservation de la structure en opérons au sein des génomes (Itoh et al., 1999) Définition des classes d'opérons orthologues structure opéronique identique (exactement la même dans les 2 génomes). structure opéronique similaire: partiellement conservée, les translocations, les délétions et au plus 2 insertions dans l'opéron sont autorisées. structure opéronique détruite: si 2 orthologues ou plus sont trouvés entre les 2 génomes mais la structure en opérons n'est pas conservée. structure opéronique inconnue ou perdue: si aucun ou seulement un orthologue a été trouvé dans un opéron

(Itoh et al., 1999) Génomes analysés Arbre phylogénétique sans racine obtenu à partir de l'alignement des séquences protéiques EF-2/G (facteur d'élongation) Eco: E. coli Hin: H. influenzae Hpy: H. pyloru Bsu: B. subtilis Mge: M. genitalium Mpn: M. pneumoniae Syn: Synechocystis sp. Sce: S. cerevisiae Mja: M. jannaschii Mth: M. thermoautotrophicum Afu: A. fulgidus THICU: Thiobacillus cuprinus ANANI: Anacystis nidulans THETH: Thermus aquaticus AQUAE: Aquifex aeolicus METVA: Methanococcus vannielii THEAC: Thermoplasma acidophilum SCHPO: S. pombe CHICK: Gallis gallus DROME: D. melanogaster CAEEL: C. elegans HUMAN: Homo sapiens Les nombres correspondent aux valeurs de bootstrap pour 1000 répétitions.

(Itoh et al., 1999) Conservation de la structure de 256 opérons d' E. coli dans les autres génomes

(Itoh et al., 1999) Conservation de la structure de 100 opérons de B. subtilis dans les autres génomes

(Itoh et al., 1999) Comparaison de la structure de l'opéron dnak dans 5 génomes bactériens

(Itoh et al., 1999) Nombre D'IS dans les différents génomes analysés

Conservation de l'ordre des gènes chez les procaryotes (Tamanes, 2001 http://genomebiology/2001/2/6/research) Analyse de l'ordre des gènes pour répondre aux questions suivantes: La conservation est-elle la même chez tous les procaryotes? Les régions conservées sont-elles distribuées uniformément sur le chromosome? Définitions opérationnelles: 2 ORF sont dites homologues (recherche avec Blast) si : l'alignement représente au moins 75% de la longueur des 2 ORF la e-value est inférieur à 10-5 2 ORF sont dites orthologues si on a une relation bijective de similarité ("best bidirectionnal hit" (BBH)) La mesure de la conservation des gènes entre 2 génomes est donnée par le rapport : nombre de gènes localisés dans des suites conservées nombre total de gènes orthologues Une suite : est constituée de gènes sur le même brin contient au moins 3 gènes au plus 3 insertions sont autorisées

(Tamanes, 2001) Conservation de l'ordre des gènes dans les génomes procaryotes en fonction de la distance phylogénétique mesurée par le nombre de substitutions dans les SSU rrna

(Tamanes, 2001) Conservation de l'ordre des gènes dans les génomes d'eubactéries en fonction de la distance phylogénétique mesurée par le nombre de substitutions dans les SSU rrna

(Tamanes, 2001) Conservation de l'ordre des gènes dans les génomes procaryotes en fonction de la distance phylogénétique mesurée par la moyenne des distances obtenues par phylogénie moléculaire sur 24 protéines codées par des gènes conservés dans l'ensemble des organismes étudiés.

(Tamanes, 2001) Distribution de la conservation des gènes le long des génomes Génome de référence: E. coli Axe des y: génome individuel ordonné suivant la distance évolutive (SSU rrna) croissante T: Terminaison de réplication, O: origine de réplication

(Tamanes, 2001) Distribution de la conservation des gènes le long des génomes Génome de référence: Xylella fastidosa Axe des y: génome individuel ordonné suivant la distance évolutive (SSU rrna) croissante

(Tamanes, 2001) Analyse des suites de gènes conservées entre génomes Dans les suites de gènes conservées les produits de traduction sont généralement impliqués dans une même classe fonctionnelle. Pas de classe fonctionnelle sur-représentée, à l'exception de la traduction à cause de l'opéron des protéines ribosomiques. Quand les suites sont impliquées dans le métabolisme, les gènes codent pour des enzymes qui agissent de façon séquentielle dans une voie métabolique ou qui forment des complexes enzymatiques.

Un exemple de suite de gènes conservés

Conservation de l'ordre des gènes : une empreinte des protéines qui interagissent physiquement (Dandekar et al., 1998, TIBS, 23,324-328) Ordre des gènes est considérablement modifié quand l'identité des protéines orthologues de deux génomes est inférieure à 50%. Pour avoir une conservation de l'ordre des gènes significative du point de vue de l'évolution il faut donc étudier celle-ci dans des espèces éloignées. Etude réalisée sur 3 groupes de 3 génomes avec 2 des distances intergénomiques ayant moins de 50% d'identité entre les orthologues communs. 3 protéobactéries (E. coli, H. influenzae, H. pylori) 3 bactéries Gram + (B. subtilis, M. genitalium, M. pneumoniae) 3 archébactéries (M. jannaschii, M. thermoautotrophicum, A. fulgidus) Pour éviter les problèmes de transferts horizontaux, seuls les gènes orthologues conservés dans le même ordre dans les trois génomes sont pris en compte.

(Dandekar et al., 1998) Pourcentage d'identité entre les orthologues communs des deux espèces

Conservation de l'ordre des gènes : une empreinte des protéines qui interagissent physiquement Résultats: (Dandekar et al., 1998, TIBS, 23,324-328) Environ 100 gènes orthologues sont conservés dans le même sens de transcription en paires ou en groupes dans les 3 génomes. Parmi ces paires conservées: pour au moins 75%, les gènes codent pour des protéines dont les interactions physiques ont été démontrées expérimentalement: protéines ribosomiques sous unités de l'arn polymérase sous unités de l'atp synthétase (cf. résultats de Tamanes) certaines sous unités des transporteurs ABC différentes sous unités enzymatiques protéines de la division cellulaire (FtsA et FtsZ) pour 20%, de part la fonction des protéines codées on peut prédire qu'elles interagissent physiquement pour les 5% restants, soit pas de fonction décrite pour les protéines, soit pas d'évidence d'interaction entre-elles

(Dandekar et al., 1998) Opéron tryptophane: organisation dans les 9 génomes comparés Seule la paire de gènes trpb-trpa est conservée. Ces deux gènes codent pour deux sous unités de la tryptophane synthétase.

Le concept d'uber-operon (Lathe et al.,2000, TIBS, 25, 474-479) Les études précédentes ont montré que: Individuellement, les opérons, ensembles de gènes co-transcrits et co-régulés, étaient très peu conservés au cours de l'évolution. L'ordre des gènes et le contenu en gènes des opérons ainsi que leur mécanisme de régulation pouvaient varier même dans des espèces proches. Dans cet article, Lathe et col. montrent en fait que ces réarrangements sont conservateurs, les réarrangements génomiques maintiennent les gènes individuels dans leur contexte fonctionnel et de régulation. Ce contexte est appelé uber-opéron.

Mise en évidence au niveau informatique. Le concept d'uber-operon (Lathe et al.,2000, TIBS, 25, 474-479) Définition du voisinage: 2 gènes sont voisins si ils sont dans le même sens de transcription et séparés par moins de 250 pb. Définition d'un opéron: comme il y a peu de preuves expérimentales des structures opéroniques, le terme opéron désigne ici un opéron putatif constitué d'un ensemble de gènes séparés de moins de 250 pb et dans le même sens de transcription (donc voisins). Caractérisation d'un uber-opéron, 3 étapes: 1) Un gène et ses orthologues sont identifiés dans un groupe donné de génomes (ici 15). 2) Les voisins conservés de ces orthologues sont déterminés. Un gène voisin sera considéré comme conservé, si des gènes orthologues sont trouvés dans au moins 3 génomes. 3) Les orthologues de ces nouveaux gènes sont recherchés dans tous les génomes. Les voisins conservés sont déterminés. Les étapes 2 et 3 sont répétées jusqu'à ce qu'aucun nouvel orthologue ne soit identifié. Cet algorithme converge souvent vers un nombre fini de gènes fonctionnellement apparentés. Cet ensemble de gènes forme l'uber-opéron.

(Lathe et al., 2000) Exemple conceptuel d'un uber-opéron au cours de l'évolution

(Lathe et al., 2000) Exemple de l'uber-opéron associé à la traduction

(Lathe et al., 2000) Exemple de l'uberopéron associé au flagelle

(Lathe et al.,2000) Evolution des uber-opérons Les remaniements de gènes se feraient au hasard dans les génomes au cours de l'évolution. Si des gènes lors de ces remaniements se trouvent localisés dans un autre contexte (pas de régulation appropriée) cela pourrait être sélectivement négatif pour la population et ils seraient éliminés. Par contre, si ces réarrangements placent les gènes dans un nouvel environnement contenant des gènes fonctionnellement apparentés et sous le contrôle d'une même régulation (même régulon), cela aura peu d'impact sur la survie de l'organisme et ils seront donc maintenus. D'où l'observation aujourd'hui d'uber-opérons.