TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases



Documents pareils
Utilisation du site de retours Lexibook

AVANT-PROPOS INTRODUCTION INSTALLATION INSTALLER LE PLUGIN ZOTERO INSTALLER LE MODULE DE CITATION...

Module Analyse de Génomes Master 2 module FMBS 326 Immunoinformatique

Avertissement : Nos logiciels évoluent rendant parfois les nouvelles versions incompatibles avec les anciennes.

Cliquez sur le site que vous souhaitez consulter, il s affichera directement dans le navigateur.

FICHE 17 : CREER UN SITE WEB

Cahier n o 6. Mon ordinateur. Fichiers et dossiers Sauvegarde et classement

Guide d utilisation de Symbaloo

GUIDE D UTILISATION DU BROWSER DE BEYOND 20/20

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Microsoft Windows XP. Movie Maker 2

MANUEL TBI - INTERWRITE

Introduction : L accès à Estra et à votre propre espace Connexion Votre espace personnel... 5

Guide d utilisation pour

UTILISATEUR. Notice d utilisation du service Support de Psi Informatique

Table des Matières. Pages 3-4. A propos d emblue. Page 5. L environnement emblue. Création d une campagne d marketing. Pages 6-15.

Guide d utilisation IPAB-ASSOCIATION v5.0 GUIDE D UTILISATION. à destination des associations et organismes sans but lucratif.

Les logiciels gratuits en ligne

Utilisation avancée de SugarCRM Version Professional 6.5

Travaux pratiques avec RapidMiner

Best.-Nr Manuel d utilisation logiciel Lindab Analysis. Logiciel pour la gestion des appareils de mesures Lindab PC 410 et LT600

NOTICE D' UTILISATION CAMWORKS FRAISAGE. Luc Vallée Lycée Blaise Pascal Segré

TRAVAUX DIRIGES D'INFORMATIQUE INITIATION A LA MANIPULATION DE WINDOWS 98

CS 01 D/B2I/ CONSULTATION ET TRANSMISSION DE L INFORMA-

Modification d une feuille de style

Comment réaliser une capture d écran dans Word. Alors comment ouvrir une page Word?

Manuel utilisateur Portail SAP

Zotero Gérer ses références bibliographiques

ESPACE COLLABORATIF SHAREPOINT

L ARBORESCENCE. Qu est-ce qu un dossier? L arborescence?

Cours Excel : les bases (bases, texte)

Excel 2010 Intermediaire

Création d un site Internet

Prosp'Action GUIDE UTILISATEUR. Conquête et fidélisation de clients

VOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

TD de supervision. J.P. Chemla. Polytech Tours Département productique 2ème année

Utilisation de l outil lié à MBKSTR 9

Document d accompagnement pour l utilisation du Cartable en ligne Lycée des Métiers Fernand LÉGER 2013/2014

1 - Se connecter au Cartable en ligne

SurveyMonkey Un outil de sondage électronique. Objectifs

mytnt national mode d'emploi mise à jour : septembre 2014 Votre Service Clients en ligne MA-MK * Des hommes, un réseau.

MODE D EMPLOI DU MODULE D E-COMMERCE

Ouvrir le compte UQÀM

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

CONNECT Comptabilité - Liste des fonctionnalités TABLE DES MATIERES

Organiser le disque dur Dossiers Fichiers

Utiliser un tableau de données

Clé USB. Quel type de données peut contenir une clé USB?

8. Gestionnaire de budgets

INTERWRITE Workspace

Instructions de mise à jour pour V

MEGA ITSM Accelerator. Guide de démarrage

Gestion des fichiers sur micro-ordinateur

TABLEAU CROISE DYNAMIQUE

Google Drive, le cloud de Google

Affectation standard Affectation modifiée (exemple)

GESTION DES MENUS. Un menu est un ensemble de liens permettant la navigation dans le site.

Guide de l'utilisateur

CAPTURE DES PROFESSIONNELS

Petit guide d utilisation Prezi

Réaliser un PUBLIPOSTAGE

Prezi. Table des matières

Créer son compte del.icio.us

Ces Lettres d informations sont envoyées aux extranautes inscrits et abonnés sur le site assistance (voir point N 3).

Manuel d utilisation de la base de données nationale sur la situation de l enfance en Tunisie CHILDINFO 6.0

wxwidgets dans un environnement Microsoft Windows

Découverte et prise en main de SWEET HOME 3D

Start me quick! Français

À propos de cette page Recommandations pour le mot de passe... 26

FEN FICHE EMPLOIS NUISANCES

Programme d Accès Communautaire / Atelier 4 Initiation à Microsoft Excel PLAN DE COURS 3 MICROSOFT EXCEL 4 LANCER EXCEL 4

Setting Up PC MACLAN File Server

Formation > Développement > Internet > Réseaux > Matériel > Maintenance

ANNEXE 8 : Le Mailing

MEGA ITSM Accelerator. Guide de Démarrage

Unity Real Time 2.0 Service Pack 2 update

Connecteur Zimbra pour Outlook 2007 et 2010 (ZCO) w

FANTEC DB-229US Manuel de l'utilisateur

Guide d usage pour Word 2007

Gestion des Factures

Présentation du tableau blanc interactif Interwrite

DECOUVREZ Discover TYPE EDIT V12 Français

PROCEDURE D EXPORT-IMPORT DU CERTIFICAT InVS INTERNET EXPLORER

Guide de l utilisateur : Etat du dossier au Service Client (EMEA)

Manuel d utilisation de mon.vie-publique.fr

Le portfolio numérique Tutoriel de prise en main

BIRT (Business Intelligence and Reporting Tools)

INTRODUCTION AU CMS MODX

Module Communication - Messagerie V6. Infostance. Messagerie

Méthode de préparation du fichier texte d import depuis Excel, via Access jusqu à Drupal.

GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)

Tutoriel Prise en Main de la Plateforme MetaTrader 4. Mise à jour : 7/09/

VOS RESSOURCES NUMÉRIQUES PAS À PAS

ENVOI EN NOMBRE DE SMS

GUIDE D UTILISATION. Activer votre pack Marchés Online Publier vos avis sur Profiter des services associés

MESUREZ L'IMPACT DE VOS CAMPAGNES!

Utilisation d une tablette numérique

TP01: Installation de Windows Server 2012

Transcription:

Master 1 :: module BBSG1.2.1 "Bioinformatique" :: année 2006/2007 TD2 : Histoire évolutive de la famille GH15 des glucosides hydrolases Encadrants: Emmanuel Talla (talla@ibsm.cnrs-mrs.fr) & Céline Brochier-Armanet (celine.brochier@up.univ-mrs.fr) Exercices à faire seuls, à rédiger et à renvoyer par mail au plus tard le 26 septembre 2006. Logiciels utilisés (tous gratuitement disponibles sur Internet) Logiciel d'alignement multiple CLUSTALW (ftp://ftp.ebi.ac.uk/) Éditeur d'alignement : SEAVIEW (http://pbil.univ-lyon1.fr/software/seaview.html) Logiciel de construction de reconstruction d'arbres : PHYLIP Logiciel d'édition d'arbres : NJPLOT (http://pbil.univ-lyon1.fr/software/njplot.html) A- Analyse phylogénétique de la famille GH15 des glucosides hydrolases 1- Recherche des homologues de la protéine P36914 d'aspergillus oryzae dans la banque de données nr au NCBI o Rechercher la séquence de la protéine P36914 au format FASTA au NCBI o Effectuer une requête par BLAST sur la banque de séquences protéiques nr. Qu est-ce que la banque nr? o Récupérer tous les homologues de la protéine P36914 possédant au moins le domaine GH15 au format FASTA. Combien d homologues récupérez-vous? Sauvegarder les séquences dans un fichier texte. o Quels sont les groupes d'organismes chez qui vous trouvez des homologues de glaa? Présenter les résultats sous la forme d un tableau excel (la dernière colonne peut être remplie après visualisation de l alignement) Nom de l organisme Position taxonomique Type(s) de séquence(s) Aspergillus oryzae Eukaryota; Fungi; Ascomycota; GH15+CBM20 Pezizomycotina GH15 2- Alignement des séquences de la famille Gh15 des glucosides hydrolases et expertise de l alignement o Dans votre fichier texte, modifier les identifiants de toutes les séquences de manière à avoir des identifiants uniques (ne pas utiliser pas deux fois le même identifiant pour des séquences différentes), courts (<30 caractères), ne comportant ni espaces, ni caractères spéciaux. Par exemple : >gi 114187852 gb EAU29552.1 alpha-amylase precursor [Aspergillus terreus NIH2624] => Aspergillus_terreus o Visualiser vos séquences à l aide du logiciel seaview. Quelle remarque pouvez-vous faire?

o Aligner les séquences avec le logiciel clustalw. o Pourquoi réalise-t-on un alignement des séquences avant toute analyse de séquences? o Visualiser l alignement à l aide du logiciel seaview. o Eliminer les séquences trop partielles ou ne possédant pas le domaine GH15 (fonction delete dans le menu edit). Eliminer les séquences redondantes (séquences identiques présentes chez le même organisme). o Repérer à l aide de l alignement les séquences possédant le domaine CBM20. Renommer ces séquences en ajoutant CBM20_ devant l identifiant de la séquence (fonction renommer dans le menu edit). Combien de séquences possèdent ce domaine? Quelle(s) remarque(s) pouvez-vous faire? Compléter la dernière colonne du tableau excel. o Sauvegarder les séquences au format mase (fonction save as / format mase / file.mase) o Sélectionner l ensemble des séquences constituant votre alignement. Réaliser un consensus (fonction consensus sequence dans le menu edit) en ayant préalablement fixé les options (allow gaps + seuil de 95% de résidus conservés). Quelle remarque pouvez-vous faire? o Supprimer la séquence consensus. Sauvegarder votre alignement. o Sélectionner les régions pour l analyse phylogénétique. Lorsqu on réalise une analyse phylogénétique, on n utilise pas toutes les positions d un alignement. On ne va travailler que sur des régions composées de plusieurs positions pour lesquelles à chaque position on est sur de l homologie entre tous les sites. Concrètement, ces régions sont délimitées par des résidus conservés (de même type : hydrophobes, polaires, chargés ) et ne contenant aucun gap. Exemple : Régions conservées

o Allez dans le menu sites => create set (=> donner un nom) pour effectuer votre sélection des sites à conserver pour l analyse phylogénétique. Une ligne apparaît au bas de l alignement. Faire glisser la souris en maintenant le bouton gauche enfoncé pour sélectionner les positions à analyser (les positions apparaissent en surbrillance et marquées par un X sur la dernière ligne).examiner attentivement la totalité de l alignement. B- Construction d'une phylogénie de référence basée sur la grande sousunité de l'arn ribosomique Pour comprendre l histoire évolutive d un gène (ici celle de la famille GH15 des glucosides hydrolases), il est indispensable de connaître celle des organismes chez qui le gène étudié est présent. L objectif de la seconde partie du TD est de reconstruire l histoire évolutive des organismes possédant un ou plusieurs membres de la famille des GH15 grâce à la reconstruction d une phylogénie de référence basée sur un marqueur de référence. La molécule de référence utilisée pour ce TP est la séquence de l ARN de la grande sous-unité du ribosome. L arbre obtenu sera considéré comme retraçant fidèlement l histoire évolutive des organismes étudiés. 1- Recherche des ARN de la grande sous-unité du ribosome présents chez les organismes possédant un/des membre(s) de la famille GH15 des glucosides hydrolases o A quel groupe majeur d Eucaryotes appartiennent les séquences de la famille GH15 identifiée dans la partie A. o Effectuer une requête par BLAST sur la banque de séquences nucléiques de séquences nr en limitant la recherche à ce groupe taxonomique (demander au moins 250 alignements). o Parmi toutes les séquences récupérées, sélectionner une séquence d ARN ribosomique de la grande sous-unité du ribosome représentative de chaque organisme possédant un membre de la famille GH15 des glucosides hydrolases (aidez-vous du tableau constitué en A). o Sauvegarder les séquences au format FASTA dans un fichier texte. 2- Alignement des séquences de la famille GH15 des glucosides hydrolases et expertise de l alignement o Dans le fichier texte, modifiez les identifiants de toutes les séquences de manière similaire à ce que vous avez fait dans la partie A-1.

o Aligner les séquences avec le logiciel clustalw. o Visualiser l alignement à l aide du logiciel seaview. Vérifier/corriger les erreurs grossières d alignement. o Sauvegarder les séquences au format mase (fonction save as / format mase / file.mase) o Sélectionner les sites à conserver pour l analyse phylogénétique (voir A-2). 3- Construction de la phylogénie de référence o Reconstruire une phylogénie par la méthode du neighbor-joining (methode de distance) à l aide du logiciel phylip. La reconstruction de phylogénie par des méthodes de distances commence par le calcul d'une matrice de distances. Des distances sont calculées entre chaque paire de séquences d'après un modèle d'évolution. Les distances calculées sont des approximations des distances évolutives réelles séparant les séquences. Au plus le modèle d'évolution choisi pour le calcul des distances sera proche des modalités d'évolution rée1les des séquences, au mieux seront estimées les distances évolutives. La qualité de la phylogénie obtenue est très dépendante de la qualité de l'estimation des distances évolutives. Il est donc indispensable de choisir le modèle d'évolution avec beaucoup de soin. Dans un second temps, une phylogénie sera reconstruite par la méthode du neighbor- Joining. Les longueurs des branches de la phylogénie obtenue représentent les distances évolutives estimées entre les paires de séquences. Pour le calcul des distances évolutives, vous utiliserez le programme protdist (commande protdist). Le fichier de sortie généré par protdist contenant la matrice de distances s'appelle outfile par défaut. Renommez-le avec un nom pertinent. Le logiciel de calcul d'arbre par la méthode du neighbor-joining s'appelle neighbor. Il générera un fichier appelé outttre par défaut qui contient l'arbre reconstruit. Renommez-le. o Reconstruire une phylogénie par la méthode de parcimonie à l aide du logiciel phylip (programme protpars). N oubliez par de renommer les sorties du programme protpars. o Visualiser les arbres obtenus avec le logiciel njplot. Vous pouvez faire pivoter les branches autour des nœuds et placer la racine de votre arbre. o Réaliser une capture d écran ou sauvegarder au format ps et inclure la phylogénie de référence dans le rapport à rendre.

C- Construction de la phylogénie de la famille GH15 o Construire la phylogénie des membres de la famille GH15. Raciner là de manière similaire à la phylogénie de référence obtenue dans la partie B. o Comparer la phylogénie obtenue avec la phylogénie de référence que vous aurez reconstruite (cf partie B). o Indiquer à chaque nœud si l événement représenté est un événement de spéciation ou de duplication. o Proposer un scénario évolutif pour les membres de la famille GH15 de glycosides hydrolases. Mettre en évidence sur la phylogénie de référence les organismes ayant des glucosides hydrolases composées uniquement du domaine GH15 et les organismes ayant des glucosides hydrolases composées des domaines GH15 + CBM20. Placer sur la phylogénie de référence les événements évolutifs retraçant l histoire des deux domaines. o Formuler une ou plusieurs hypothèses expliquant la présence de séquence d origine bactérienne.