TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire



Documents pareils
La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

SOMMAIRE. 3. Comment Faire? Description détaillée des étapes de configuration en fonction du logiciel de messagerie... 3

SOMMAIRE... 1 ESPACE DU CLUB...

FAIRE UN PAIEMENT TIPI

TP Protocoles SMTP et POP3 avec Pratiquer l algorithmique

Procédure de sauvegarde pour AB Magique

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Création d un site Internet

Connecteur Zimbra pour Outlook 2007 et 2010 (ZCO) w

Les outils numériques permettant l enregistrement de documents audiovisuels diffusés sur Internet sont nombreux. Certains sont gratuits.

EXCEL TUTORIEL 2012/2013

Prédiction de la structure d une

Rapports d activités et financiers par Internet. Manuel Utilisateur

NOTICE TELESERVICES : Créer mon compte personnel

T le. Se documenter tout au long de l année. séquence pédagogique L1.2 L1.4 L2.2 L e trimestre. Nom :... Prénom :... Date :...

De EnvOLE 1.5 à EnvOLE 2. Document pour l administrateur

AOLbox. Partage de disque dur Guide d utilisation. Partage de disque dur Guide d utilisation 1

Service de Virtualisation de la DSI UJF

Étape 1 : Création d une adresse courriel GMAIL

Utilisation de l éditeur.

Ces Lettres d informations sont envoyées aux extranautes inscrits et abonnés sur le site assistance (voir point N 3).

Design adaptatif. Guide de l utilisateur VIENNA LONDON MUNICH BERLIN PARIS HONG KONG MOSCOW ISTANBUL BEIJING ZURICH

Campagnes d ings v.1.6

Chess Arbiter Pro (version Dames) Notice d utilisation

1. Entrez le code client dans le champ << Code client >> si requis. Le code client est optionnel, on peut donc entrer simplement le nom du client.

Applications KIP Cloud Guide de l utilisateur

KWISATZ_TUTO_module_magento novembre 2012 KWISATZ MODULE MAGENTO

Supervision sécurité. Création d une demande de descente. 13/03/2014 Supervision sécurité Création d'une demande

À propos de cette page Recommandations pour le mot de passe... 26

Guide pour le bon fonctionnement des applications académiques avec Internet Explorer 7.x

Utilisation de la plate-forme collaborative Windchill

mailpro mode d'emploi

Charger une structure Comment ouvrir un fichier avec VMD? Comment charger un fichier PDB directement depuis la Protein Data Bank? Comment charger un

Procédure Platine Exchange 2010 Accompagnement à la migration de votre compte 09/08/ Version 1.0 Hébergement web professionnel

Manuel : Comment faire sa newsletter

GUIDE NSP Activation et gestion des produits avec NSP

Plate-forme de tests des fichiers XML virements SEPA et prélèvements SEPA. Guide d'utilisation

FICHIERS ET DOSSIERS

Qu est-ce qu un outil de travail collaboratif Google Drive?

Utilisation du site de retours Lexibook

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

Google Documents permet d élaborer un questionnaire, de le diffuser sur le net pour ensuite le dépouiller.

SUGARCRM MODULE RAPPORTS

WinBooks Logistics 5.0

Introduction aux bases de données: application en biologie

Utilisation avancée de SugarCRM Version Professional 6.5

SOMMAIRE. Comment se connecter?

GUIDE NSP Activation et gestion des produits avec NSP

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

Manuel d utilisation de la messagerie.

Document d accompagnement pour l utilisation du Cartable en ligne Lycée des Métiers Fernand LÉGER 2013/2014

TUTORIEL : Formulaire sur Google : Saisie des réponses questionnaires comptoir Mise en place de questionnaires à distance

1 - Se connecter au Cartable en ligne

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont

LES TABLETTES : EN PRATIQUE

Fonctionnement du courrier électronique

Introduction : L accès à Estra et à votre propre espace Connexion Votre espace personnel... 5

Optimiser pour les appareils mobiles

La Clé informatique. Formation Excel XP Aide-mémoire

LimeSurvey Editeur de Questionnaire

e tic o N t u in g o L

ESPACE COLLABORATIF SHAREPOINT

Manuel de mise en page de l intérieur de votre ouvrage

La Clé informatique. Formation Internet Explorer Aide-mémoire

ENVOYER DES NEWSLETTER (POM0580) (/PORTAIL/SERVICES-AU-PUBLIC/1262- ENVOYER-DES-NEWSLETTER-POM0580)

Installer Joomla Pearson France Joomla! Le guide officiel Jennifer Marriott, Elin Waring

Identification de nouveaux membres dans des familles d'interleukines

Programmation sous QT

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Gestion des documents avec ALFRESCO

Procédure d utilisation du PRM

Créer un compte itunes Store

Guide d utilisation de «Partages Privés»

Créer le schéma relationnel d une base de données ACCESS

PROCEDURE D INSTALLATION et de CONFIGURATION DU SERVICE PACK2 POUR WINDOWS XP

PARAMETRAGE D INTERNET EXPLORER POUR L UTILISATION DE GRIOTTE

Installation d un poste i. Partage et Portage & permissions NTFS

Perl Orienté Objet BioPerl There is more than one way to do it

Form Designer Guide d utilisateur DOC-FD-UG-FR-01/01/12

Présentation de Ocloud

UTILISATEUR. Notice d utilisation du service Support de Psi Informatique

PROCEDURE D EXPORT-IMPORT DU CERTIFICAT InVS INTERNET EXPLORER

Sélection du contrôleur

Date : juin 2009 AIDE SUR LES CERTIFICATS. Comment sauvegarder et installer son certificat

Hébergement et nom de domaine Plateforme e-tourisme. demo.minisites.encharentemaritime.com

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

Gestion des fichiers sur micro-ordinateur

TNT Express. Magento

Manuel d utilisation de mon.vie-publique.fr

Les différentes méthodes pour se connecter

Guide d utilisation du logiciel

FOIRE AUX QUESTIONS : FAIRE UNE RECLAMATION GAIA - DEMARCHES EN LIGNE. Index

Débuter avec Easyweb B

Windows Internet Name Service (WINS)

Prise en main rapide

Installation-Lancement

1 Modélisation d être mauvais payeur

Transcription:

TD5 : Prédiction de la structure tridimensionnelle d une protéine Modélisation moléculaire Avant de commencer le TD, installer (ou vérifier qu ils le sont) sur la partition K: du poste de travail, les programmes suivants : BioEdit : http://www.mbio.nc su.edu/bioedit/bioedit.html (pour l édition d alignements) PyMOL : (lien communiqué le jour du TD) (pour la visualisation et la manipulation de structures 3D) Avant-propos Le fonctionnement d un système biologique implique des cascades d interactions. Les protéines en sont les principaux acteurs. La capacité d une protéine à interagir dépend de sa structure tridimensionnelle (3D). Connaître cette dernière permet donc de mieux comprendre son mode d action (activité enzymatique, transport, signalisation, liaison avec un ligand, un récepteur, une membrane, etc). Les méthodes expérimentales de détermination de la structure 3D des protéines sont lourdes et coûteuses en temps et ressources, voire inapplicables (cas des protéines non solubles, par exemple). Les méthodes prédictives dites in silico proposent une alternative rapide et bon marché. Elles sont basées sur un ensemble de lois physiques, statistiques et biologiques. On convient généralement qu il en existe 2 grandes classes : les méthodes dites de «modélisation comparative» et les méthodes «ab initio». Les premières dépendent de l existence de protéines homologues dont les structures ont été déterminées expérimentalement. Les secondes méthodes ne se basent que sur des lois physiques et statistiques. Les algorithmes utilisés par ces dernières sont très gourmands en temps de calcul et les résultats obtenus progressent avec les progrès en informatique. A l heure actuelle, et malgré les immenses progrès des méthodes ab initio, les méthodes comparatives sont encore celles qui proposent les meilleures prédictions. Lorsqu on s intéresse à la fonction d une protéine, il est utile d avoir recours à la modélisation afin de tester des hypothèses ou d orienter des expériences. Enfin, la modélisation moléculaire bénéficie de tous les avantages de l informatique qui la rendent compatible avec les analyses à grande échelle. 1. Récupération d une séquence protéique d inté : Ouvrir un navigateur Web et se connecter à la base de données OryGenesDB (http://orygenesdb.cirad.fr/). Cliquer sur l onglet «Tools» puis sur l onglet «Get sequences», un formulaire s affiche. Dans la partie «Input», sélectionner le chromosome3 et la région d intérêt comprise entre 18150000 et 18160000, à taper dans les boîtes «From» et «To». Dans la partie «Output», cocher la case «Protein sequences corresponding to gene models». Cliquer sur le bouton «Run» pour soumettre la requête.

Cliquer sur le lien «Download Protein file». Copier la séquence FASTA de la dernière protéine de la liste obtenue, correspondant au gène Os03g31750 et nommée pyruvate, phosphate dikinase, chloroplast precursor, putative, expressed» et la copier dans un fichier texte. 2. Recherche de données structurale : Chercher la protéine d intérêt dans la base de données Expasy Swiss-Prot (http://ca.expasy.org/s prot/). Ouvrir la page descriptive de la protéine et étudier les données disponibles, en particulier les données structurales : Dans l item «Sequences», observer si la protéine présente un peptide signal : Si oui, récupérer la séquence de la protéine mature indiquée et la copier au format FASTA dans un nouveau fichier appelé «protein_name.txt». Si l information n est pas disponible, soumettre la séquence au programme SignalP3.0 pour obtenir une prédiction du site de clivage en utilisant la brique Galaxy/Prediction /SignalP. Editer la séquence pour supprimer le peptide signal éventuellement, selon les prédictions obtenues grâce à SignalP. Dans l item «Cross-reference s / 3D structure databases» : Y a-t-il un numéro d a ccès à la Protein DataBank (PDB)? Si oui, chercher la référence sur lapdb ( http://rcsb.org/pdb/). Est-ce une structure d éterminée expérimealement (Résonnance M agnétiqu Nucléaire, Cristallographie aux rayons X, Microscopie Cryo-Electr onique)? Si oui, rentrer chez soi : un modèle expérimental vaut toujours mieux qu un modèle théorique. Si c est un modèle théorique, essayer d en produire un meilleur! Dans l item «Cross-reference s / Family and domain databases» : Existe-t-il une référence dans Pfam? Si oui, visite Pfam (http://pfa m.sanger.ac.uk/) pour connaître le(s) domaine(s) protéique(s) annoté(s). Parmi les protéines classées dans la même famille Pfam, y a-t-il des protéines dont la structure 3D est connue? Si oui, noter le nom de ces protéines et le urs codes PDB correspondants : Protein name PDB code

Recherche de similarité de séquences avec Blast : Soumettre la séquence d intérêt à Blast (http://blast.ncbi.nlm.nih.gov/) : Choisir l outil protein Blast (blastp) Copier la séquence ou charger le fichier puis sélectionner labase de données PDB Lancer le Blast puis observer les hits retournés : Que sont les protéines en question (fonction, poids moléculaire?...) Quelle est la plus grande couverture d alignement et quel est le plus grand pourcentage d identité obtenus? Est-ce le même hit qui présente les deux? ******************************* OPTIONNEL ***************** ************** 4. Threading et prédiction de structures secondaire : Soumettre la séquence d intérêt au serve PSIPRED (http://bioinf.cs.ucl.ac.uk/psipred/) : Cliquer sur le lien pou r accéder au serveu. Copier et coller la séquence à l endroit indiqué. Sélectionner l option «Fold Recognition (pgenthreader - with profiles and predicted secondary structure)». Décliquer les options de filtrag. Il est possible d indiquer une adresse mail ACADEMIQUE pour recevoir les résultats, Indiquer un nom pour le job, par exemple : «protein_name_your_name». Page de résultatsde PSIPRED : Le(s) fold(s) de quelle(s) structure(s) 3D pourrai(en)t correspondre à la protéine d intérêt, et avec quel degré de certitu? Si plusieurs folds sont susceptibles de correspondre, sont-ils similaires ou au contraire très différent? Noter les codes PDB et les classifications SCOP et CATH des struc tures identifiées avec les labels «CERT» ou «HIGH» : PDB code SCOP fam ily CATH family Short description Pour étudier et comparer les structures secondaires prédites dans la protéine d intérê avec celles observées dans les structures expérimentales, cliquer su r le bouton «Start Jalview» et agrandir l alignement. ***************************************************************************

5. Sélection de protéine(s) template(s) : Parmi les protéines de structures connues retournées précédemment (par Blast, PSIPRED, Pfam), certaines l ont-elles été plusieurs fois? Si oui, quelle est la qualité de ces structures (technique expérimentale, résolution)? Pour chacune, la couverture de l alignement par Blast est-elle significative? Le pourcentage d identité est-il important? Dans quelle zone se situera-t-on, de "safe homology modeling" ou "twilight"? Parmi ces protéines, en sélectionner au maximum 3 ou 4 selon les critères suivants : Eliminer les protéines synthétiques, les fragments, les protéines mutantes Privilégier les protéines naturelles, ou au pire recombinantes Plus grand pourcentage d identité de séquence avec la protéine cible Structures déterminées par cristallographie de rayons X, préférentiellement Meilleure résolution possible (plus petit nombre en Angström) Non redondantes entre elles (plus grande diversité possible entre les templates) o Taille similaire à celle de la protéine cible Fonction biologique similaire si possible Pour identifier les structures redondantes ou très similaires, télécharger les séquences des protéines et les aligner avec ClustalW dans BioEdit ou sur le serveur ClustalW (http://www.genome.jp/tools/clustalw/). Choisir la matrice Blosum62 et les pénalités 12 et 2 pour l introduction et l extension de gaps, respectivement (option «SLOW/ACCURATE»). Important : Le fait d utiliser plusieurs templates permet d augmenter la précision du modèle obtenu en explorant au mieux le paysage structural. Cependant, pour des raisons de temps de calcul, il faudra ne retenir que la meilleure structure pour ce TD. 6. Préparation des fichiers de modélisation Fichier séquence cible Le programme de modélisation par homologie de référence s appelle Modeller (http://salilab.org/modeller/). La séquence de la protéine d intérêt doit être mise au format PIR compatible avec Modeller (il existe malheureusement plusieurs formats PIR légèrement variants). Exemple : >P1;1bdmA structurex:1bdm.pdb: 0 :A:+318 :A:undefined:undefined:-1.00:-1.00 MKAPVRVAVTGAAGQIGYSLLFRIAAGEMLGKDQPVILQLLEIPQAMKALEGVVMELEDCAFPLLAGLEATDDPD VAFKDADYALLVGAAPRLQVNGKIFTEQGRALAEVAKKDVKVLVVGNPANTNALIAYKNAPGLNPRNFTAMTRLD HNRAKAQLAKKTGTGVDRIRRMTVWGNHSSIMFPDLFHAEVDGRPALELVDMEWYEKVFIPTVAQRGAAIIQARG ASSAASAANAAIEHIRDWALGTPEGDWVSMAVPSQGEYGIPEGIVYSFPVTAKDGAYRVVEGLEINEFARKRMEI TAQELLDEMEQVKALGLI*

Editer le fichier FASTA pour supprimer les sauts de ligne. Convertir la séquence FASTA au format PIR en utilisant la brique Galaxy/Modeller/Fasta2Pir Note : En cas de modélisation ayant recours à plusieurs templates, une étape d alignement structural de ces derniers aurait été nécessaire à ce niveau. Fichier template Depuis le serveur de la PDB, télécharger le fichier de coordonnées (choisir le.pdb) correspondant à la structure qui sera utilisée comme template pour la modélisation. Fichier alignement cible/template Modeller contient diverses routines, l une d elles permet de générer l alignement des séquences cible/template, nécessaire pour le calcul du modèle de la protéine cible. Utiliser la brique Galaxy/Modeller/Salign2DbyModeller pour lancer Modeller et générer l alignement cible/template Télécharger le fichier.ali généré Ouvrir le fichier d alignement avec BioEdit L alignement est-il optimal? Par exemple, les résidus de cystéine sont-ils correctement alignés? (N y a-t-il pas de gaps dans les structures secondaires prédites pour la séquence cible?) Corriger manuellement l alignement si nécessaire, en vous aidant du tableau suivant qui décrit les propriétés physico-chimiques des acides aminés :

7. Modélisation : Lancer la brique Galaxy/Modeller/3DmodelbyModeller Télécharger le fichier.pdb obtenu 8. Evaluation du modèle : Soumettre le modèle à : Verify3D (http://nihserver.mbi.ucla.edu/verify_3d/) Noter le score général et observer les codes couleurs Y a-t-il des régions avec de très mauvais scores? Si oui lesquelles? ProSA-web (https://prosa.services.came.sbg.ac.at/prosa.php) Noter le z-score ('Overall model quality') Le modèle a-t-il des caractéristiques de protéine native? ('Local model quality') Y a-t-il des régions de qualité moindre? (= plus grande énergie, en rouge) Whatif (http://swift.cmbi.ru.nl/servers/html/index.html) Cliquer sur 'Protein analysis' puis 'Secondary Structure, symmetry and accessibility' pour utiliser le programme DSSP Les structures secondaires assignées correspondent-elles à celles calculées par PSIPRED? Qmean (http://swissmodel.expasy.org/qmean/cgi/index.cgi) Noter le score global Qmean, observer les scores locaux Y a-t-il des régions de qualité moindre? Sont-elles les mêmes que celles identifiées par ProSA-web? 9. Visualisation : Lancer PyMOL et charger le modèle : La structure générale est-elle cohérente? Mettre en évidence les résidus cystéines : select cysteine, resn cys Choisir une option qui permette de mettre en évidence les ponts disulfure et les structures secondaires : S (show) as cartoon, S sticks, C red Charger le fichier template et aligner les structures : align prot1, prot2 Explorer les fonctionnalités de PyMOL, et au besoin, consulter PyMOL Wiki (http://www.pymolwiki.org/index.php/main_page). 10. Applications : D après la qualité du modèle obtenu, quelles applications sont et ne sont pas envisageables? Si vous avez des questions relatives à ce TD ou à cette thématique de recherche, n hésitez pas à nous contacter : lamotte@supagro.inra.fr. TD préparé par Cécile Fleury & Frédéric de Lamotte