TEQAP: Tri Et Quantification d Analyses Protéomiques

Documents pareils
Protéomique Séance 1 Introduction aux données de protéomique et aux outils de recherche

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

Thermo Scientific Training Courses. La clé de la réussite pour votre laboratoire. Catalogue Formations 2015 Suisse

Thermo Scientific Training Courses. La clé de la réussite pour votre laboratoire. Catalogue Formations 2015 France

Big data et sciences du Vivant L'exemple du séquençage haut débit

AutoCAD Petit exercice sous

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Concept Paper: Quantification de Protéines Spécifiques par SRM/MRM Perspectives d Application et Limitations Actuelles

EMME : un environnement de gestion des métadonnées expérimentales

Guide d utilisation pour

IMMUNOLOGIE. La spécificité des immunoglobulines et des récepteurs T. Informations scientifiques

LA MESURE DE MASSE POUR LA DÉTERMINATION DE PÉRIODES RADIOACTIVES

Big Data et Graphes : Quelques pistes de recherche

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Critères pour les méthodes de quantification des résidus potentiellement allergéniques de protéines de collage dans le vin (OIV-Oeno )

Laboratoire de Photophysique et de Photochimie Supra- et Macromoléculaires (UMR 8531)

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

5.5.5 Exemple d un essai immunologique

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Mass Spec/tacular. performance, productivité et fiabilité. Systèmes CPL/SM Agilent série Our measure is your success.

: seul le dossier dossier sera cherché, tous les sousdomaines

Faculté des Sciences d ORSAY

Echantillonnage Non uniforme

Programme consultant expert (PCE)

Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège

Biomarqueurs en Cancérologie

Programme détaillé. LES TABLEAUX DE BORD Formation en présentiel (21 h) accompagnée d un parcours e-learning Excel (5 h)

Introduction aux bases de données: application en biologie

AGREGATION DE BIOCHIMIE GENIE BIOLOGIQUE

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Voici les objectifs de la séance d'aujourd'hui :

1. Laboratoire National de métrologie et d Essais (LNE) 1rue Gaston Boissier Paris Cedex sebastien.sannac@lne.fr

Big Data et Graphes : Quelques pistes de recherche

ANTICORPS POLYCLONAUX ANTI IMMUNOGLOBULINES

L immunoenzymologie. Technique puissante couramment utilisée e en recherche et en diagnostic cificité des anticorps pour leurs nes

Extraction d information des bases de séquences biologiques avec R

PROFIS Installation. Module 4: Module 3D Design

Jean-François Boulicaut & Mohand-Saïd Hacid

1 Modélisation d être mauvais payeur

PLATE-FORME DE MICROSCOPIE ÉLECTRONIQUE À TRANSMISSION

Formavie Différentes versions du format PDB Les champs dans les fichiers PDB Le champ «ATOM» Limites du format PDB...

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Spectrophotomètres. Spectrophotomètres modèle Les spectrophotomètres Série 67 : 3 modèles uniques

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

101 Adoptée : 12 mai 1981

Spectrophotomètre double faisceau modèle 6800

Domaine : Sciences, Technologies et Santé Mention : Nutrition, Sciences des aliments, Agroalimentaire

Chapitre 7 : Structure de la cellule Le noyau cellulaire

ATELIER IMAGEJ. Différentes applications vous sont proposées pour apprendre à utiliser quelques fonctions d ImageJ :

COUSIN Fabien KERGOURLAY Gilles. 19 octobre de l hôte par les. Master 2 MFA Responsable : UE Incidence des paramètres environnementaux

TECHNIQUES: Principes de la chromatographie

Suivi de la formation

TD de Biochimie 4 : Coloration.

DATA QUERY : MODÉLISATION AVANCÉE DE VOS DONNÉES

Environmental Research and Innovation ( ERIN )

1 Culture Cellulaire Microplaques 2 HTS- 3 Immunologie/ HLA 4 Microbiologie/ Bactériologie Containers 5 Tubes/ 6 Pipetage

Mesure de la surface spécifique

Mesure agnostique de la qualité des images.

Mise en pratique : Etude de spectres

Les Réseaux sans fils : IEEE F. Nolot

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!

SYLLABUS MASTER. Mention BIOCHIMIE BIOTECHNOLOGIES

GAMME UVILINE 9100 & 9400

PROGRAMME (Susceptible de modifications)

Le rôle de l endocytose dans les processus pathologiques

BIOLOGIE CLINIQUE ACTUALITES ET PERSPECTIVES D AVENIR

THE SEPARATION OF A TRACER FOR THE RADIOCHEM1CAL ANALYSIS OF RADIUM 226.

CAPTURE DES PROFESSIONNELS

Expérience 3 Formats de signalisation binaire

Centre Universitaire LA CITADELLE 220, avenue de l Université B.P DUNKERQUE CEDEX 1 GUIDE DES ETUDES LICENCE PROFESSIONNELLE

Compléments - Chapitre 5 Spectroscopie

Perl Orienté Objet BioPerl There is more than one way to do it

ANF Becquerel Assurance qualité Normalisation.

Stages - le calendrier

Procédure d utilisation du Beckman CEQ 2000 XL pour la réalisation de programmes de séquençage ou de génotypage.

Biochimie I. Extraction et quantification de l hexokinase dans Saccharomyces cerevisiae 1. Assistants : Tatjana Schwabe Marcy Taylor Gisèle Dewhurst

Capacité étendue d utilisation en réseau

Excel 2010 Intermediaire

DELTA. Technologie XRF portable pour les applications PMI

Je sais utiliser. Logiciel gratuit de gestion des photos. Étude en 5 parties

MAB Solut. vos projets. MABLife Génopole Campus 1 5 rue Henri Desbruères Evry Cedex. intervient à chaque étape de

MABioVis. Bio-informatique et la

A N A L Y S E U R E N L I G N E D A G V D E S B I C A R B O N A T E S D E L A L C A L I N I T E

Thierry DELZESCAUX. «biopicsel» group, URA CNRS-CEA 2210 Service MIRCen, I²BM, CEA Fontenay-aux-Roses, France.

FORMATIONS STAGES INSERTION PROFESSIONNELLE. UFR Sciences Orsay. Isabelle DEMACHY

SVE 222 & PCL-442. Fascicule de Travaux Pratiques

Sommaire. BilanStat manuel de présentation et d utilisation Page 2

MANUEL UTILISATEUR : RECETTES TABLE DES MATIERES PIE : PRESTATIONS INTERNES ET EXTERNES

Enregistrement et transformation du son. S. Natkin Novembre 2001

CICE - Présentation Accès à DS mode CICE

Les bases de données

Mathématiques et leurs interactions. Mathématiques et leurs interactions. Mathématiques et leurs interactions. Mathématiques et leurs interactions

Gestion de références bibliographiques

Intérêt du découpage en sous-bandes pour l analyse spectrale

BIRT (Business Intelligence and Reporting Tools)

Bio-Rad Laboratories CONTRÔLE DE QUALITÉ. Le logiciel de Bio-Rad pour une gestion experte du contrôle de qualité

Transcription:

TEQAP: Tri Et Quantification d Analyses Protéomiques D. Bouyssié, E. Mouton, A. Gonzalez de Peredo, R. Albigot O. Schiltz et B. Monsarrat. Laboratoire de Protéomique et Spectrométrie de Masse des biomolécules Institut de Pharmacologie et de Biologie Structurale, CNRS UMR 5089 Toulouse

Stratégies de protéomique différentielle basées sur l analyse de mélanges peptidiques par nanolc-ms/ms NanoLC Spectromètre de masse MS MS/MS Logiciel d analyse automatique gi 4503747 filamin B, beta (actin binding protein 2 gi 4503745 filamin A, alpha (actin-binding protein gi 12667788 myosin, heavy polypeptide 9, non-mu gi 4507907 von Willebrand factor precursor; Coa gi 14916725 Talin 1 gi 4557597 filamin C, gamma (actin-binding prote gi 1346640 Cellular myosin heavy chain, type B (N gi 1362789 DNA-activated protein kinase, catalyt gi 4505877 plectin 1, intermediate filament bindin gi 16933542 fibronectin 1 isoform 1 preproprotein gi 4507195 spectrin, beta, non-erythrocytic 1 isofo gi 4758012 clathrin heavy chain; clathrin, heavy p gi 10834587 fer-1 like protein 3 [Homo sapiens] gi 4506787 IQ motif containing GTPase activating gi 4758294 glutamyl-prolyl trna synthetase; glut gi 1345959 Fatty acid synthase gi 7512790 hypothetical protein DKFZp564P0562 gi 1170510 Eukaryotic translation initiation factor gi 2135874 p53-binding protein 1 - human (fragm gi 1346682 Nestin gi 6681259 multimerin [Homo sapiens] gi 10436768 unnamed protein product [Homo sapi gi 18105007 carbamoylphosphate synthetase 2/asp gi 280833 Myl protein human gi 7304875 alpha-2-hs-glycoprotein [Mus muscul Comparaison des listes de protéines Comparaison basée sur les spectres MS/MS Comparaison basée sur les spectres MS Outils bioinformatiques Avec marquage isotopique (ICAT, SILAC, itraq,.) Sans marquage

ICAT Stratégies de protéomique différentielle par marquage isotopique et nanolc-ms/ms -DOX THAP3 + DOX contrôle 1-fractionnement subcellulaire 2-Marquage c-icat-c12 c-icat-c13 Protéines rassemblées Fractionnement des protéines (gel 1D) KDa 201 120 100 56 38 29 20 G1 Digestion de chaque bande Sélection des peptides ICAT sur colonne d avidine Analyse LC-MS/MS de chaque fraction 7 G19 SILAC Analyses Mascot -DOX THAP3 + DOX contrôle 1-Marquage Arg0 Arg10 Cellules rassemblées 2-fractionnement subcellulaire Fractionnement des protéines (gel 1D) KDa 201 120 100 56 38 29 20 7 Digestion de chaque bande Analyse LC-MS/MS de chaque fraction

Traitement bioinformatique des données de nanolc-ms/ms: Problèmes et objectifs Présence de faux positifs et de faux négatifs dans les listes Mascot Tri et Validation Fractionnement protéique: présence de protéines redondantes dans des fractions consécutives Concaténation des résultats E1 E20 n bandes n fichiers bruts de nanolc-ms/ms n fichiers résultats Mascot Expériences de marquage isotopique ICAT et SILAC: calculer le ratio des protéines validées Quantification à partir des données brutes Utilisation des listes (rapports, autres applications) Exportation au format XML et Excel

TEQAP: Tri Et Quantification d Analyses Proteomiques Données Mascot n fichiers DAT MFP Données triées et validées n fichiers VALID.XML Données Analyst QS n fichiers bruts Extraction des intensités Génération de listes nonredondantes de protéines Module de Quantification Module d Analyse différentielle RAPPORT de QUANTIFICATION liste de protéines spécifiques liste de protéines communes Export sous format Excel

Module MFP (Mascot File Parseur) 1ère étape: tri automatique des protéines Règles de filtrage définies par l utilisateur, basées sur le nombre, le rang, et le score des peptides: critères de validation critères d exclusion Résultat de la validation automatique (tableau concis): Les protéines répondant aux critères prédéfinis sont validées (vert) Les protéines ambiguës apparaissent en rouge et doivent être vérifiées manuellement

Module MFP (Mascot File Parseur) 2ème étape: validation manuelle des protéines ambiguës Tableau détaillé: Affichage des peptides attribués à chaque protéine Visualisation rapide des spectres MS/MS L utilisateur peut choisir de valider une protéine ambiguë Lien hypertexte vers spectre MS/MS Une fois la validation terminée sur un fichier résultat: Enregistrement de la liste de protéines et de peptides au format XML Exportation de la liste au format Excel Génération d une liste d exclusion pour une 2ème analyse nanolc-ms/ms

Module MFP (Mascot File Parseur) 3ème étape: Concaténation des résultats 1 EXPERIENCE E1 n bandes n fichiers bruts de nanolc-ms/ms E20 n fichiers. dat Mascot Regroupement des résultats obtenus sur l ensemble de l expérience: Elimination des doublons Création d une liste globale non redondante des protéines identifiées dans l échantillon Exportation au format Excel

Module de Quantification 1- Extraction des intensités des précurseurs à partir des données brutes Extraction en «batch» (Extract Daemon) en associant le fichier.dat de chacune des bandes de gel (après validation par MFP) au fichier brut correspondant. 2- Calcul des ratios des protéines Fenêtre de vérification des ratios pour une protéine Fenêtre de visualisation des ratios de toutes les protéines d une bande de gel 3- Création du rapport de quantification Liste globale et non redondante de l ensemble des protéines identifiées dans l expérience avec leur ratio moyen normalisé, exportable au format Excel.

Etude de THAP3: marquage ICAT et SILAC sur protéines nucléaires -DOX THAP3 + DOX contrôle c-icat-c12 extrait nucléaire c-icat-c13 Arg0 Arg10 Cellules rassemblées Protéines rassemblées extrait nucléaire Analyse LC-MS/MS de chaque fraction Analyse Mascot 4 Rapport de Quantification TEQAP Ratio des protéines identifiées ICAT 3 4 935 protéines identifiées 2 1 0 1-1 -2-3 -4 3 2 2 3 4 37 protéines surexprimées 47 protéines sousexprimées 1.65 1.65 SILAC 1495 protéines identifiées 838 protéines avec au moins un peptide ICAT 1059 protéines avec au moins un peptide marqué 732 protéines quantifiées 998 protéines quantifiées

Perspectives Extension du module de quantification à d autres types de marquages Actuellement : ICAT SILAC Perspectives : marquage métabolique N15, marquage enzymatique O18, marquage chimique itraq Compatibilité avec d autres types d instruments Actuellement : QSTAR (Applied Biosystems) Perspectives : format unifié en protéomique de type mzxml Interprétation des résultats Termes GO Annotations SwissProt Autres stratégies de protéomique différentielle Spectral counting Intensité du signal MS

Analyse différentielle par comparaison de listes de protéines NanoLC Spectromètre de masse MS/MS Logiciel d analyse automatique gi 4503747 filamin B, beta (actin binding protein 2 gi 4503745 filamin A, alpha (actin-binding protein gi 12667788 myosin, heavy polypeptide 9, non-mu gi 4507907 von Willebrand factor precursor; Coa gi 14916725 Talin 1 gi 4557597 filamin C, gamma (actin-binding prote gi 1346640 Cellular myosin heavy chain, type B (N gi 1362789 DNA-activated protein kinase, catalyt gi 4505877 plectin 1, intermediate filament bindin gi 16933542 fibronectin 1 isoform 1 preproprotein gi 4507195 spectrin, beta, non-erythrocytic 1 isofo gi 4758012 clathrin heavy chain; clathrin, heavy p gi 10834587 fer-1 like protein 3 [Homo sapiens] gi 4506787 IQ motif containing GTPase activating gi 4758294 glutamyl-prolyl trna synthetase; glut gi 1345959 Fatty acid synthase gi 7512790 hypothetical protein DKFZp564P0562 gi 1170510 Eukaryotic translation initiation factor gi 2135874 p53-binding protein 1 - human (fragm gi 1346682 Nestin gi 6681259 multimerin [Homo sapiens] gi 10436768 unnamed protein product [Homo sapi gi 18105007 carbamoylphosphate synthetase 2/asp gi 280833 Myl protein human gi 7304875 alpha-2-hs-glycoprotein [Mus muscul Echantillon 1 Echantillon 2 Liste 1 Liste 2 Comparaison des listes Pb: reproductibilité de chacune des listes? répéter la manip jusqu à couverture analytique complète de l échantillon Ex: analyse de membrane plasmique de cellules endothéliales (Durr E et al, Nat Biotechnol. 2004) Run 1: 260 protéines identifiées Run 2: 34% de nouvelles protéines Run 3: 20% de nouvelles protéines. Run10: 4.2% de nouvelles protéines 450 protéines avec une couverture analytique de 95%

Module d Analyse différentielle Capture TEQAP module différentiel

Analyse semi-quantitative par comparaison du nombre de MS/MS par protéine Protéine Q8WTV1 identifiée dans l échantillon 1 Protéine Q8WTV1 identifiée dans l échantillon 2 «Spectral counting» Liu, H.; Sadygov, R. G.; Yates, J. R., 3rd. Anal. Chem. 2004. A Model for Random Sampling and Estimation of Relative Protein Abundance in Shotgun Proteomics Zybailov B, Coleman M.K., Florens L, Washburn M, Anal. Chem. 2005. Correlation of Relative Abundance Ratios Derived from Peptide Ion Chromatograms and Spectrum Counting for Quantitative Proteomic Analysis Using Stable Isotope Labeling Colinge J, Chiappe D, Lagache S, Moniatte M, Bougueleret L., Anal Chem. 2005. Differential Proteomics via probabilistic peptide identification scores.

Analyse semi-quantitative par comparaison du nombre de MS/MS par protéine («spectral counts») Liu H, Sadygov RG, Yates JR 3rd, Anal Chem. 2004 A model for random sampling and estimation of relative protein abundance in shotgun proteomics. Nombre de MS/MS Nombre de peptides Couverture de séquence

Module d Analyse différentielle Spectral counting Protéines communes Peptide commun VPLVAPEDLR m/z= 554.8 Analyse quantitative Signal MS Expérience 00012 Expérience 00013 Intensité = 16 Intensité = 91

Identification et quantification par nanolc-ms/ms Fichier d entrée:.wiff (Analyst, Applied Biosystems).raw (MassLynx, Micromass).raw (Xcalibur, ThermoFinnigan).baf (Compass, Bruker) mzxml (format commun) MS 2 Quantification ProICAT, ProQuant Xpress, ASAPratio MSQuant TEQAP Conversion des MS/MS en listes de masses:.mgf.dta.pkl.txt 1 Identification des peptides et des protéines (Moteurs de recherche) Mascot Sequest ProteinLynx ProId, ProICAT, ProQuant Phenyx Spectrum Mill. Validation Automatique ou manuelle Logiciels dédiés (ProteinProphet) Liste de protéines identifiées validées Liste de protéines identifiées validées et quantifiées

Profiling par nanolc-ms et identification ciblée Fichiers d entrée (x fichiers):.wiff (Analyst, Applied Biosystems).raw (MassLynx, Micromass).raw (Xcalibur, ThermoFinnigan).baf (Compass, Bruker) mzxml (format commun) Fichier d entrée:.wiff (Analyst, Applied Biosystems).raw (MassLynx, Micromass).raw (Xcalibur, ThermoFinnigan).baf (Compass, Bruker) mzxml (format commun) Conversion des MS/MS en listes de masses:.mgf.dta.pkl.txt nanolc-ms 1 Quantification DecyderMS SIEVE Quoil MSight nanolc-ms/ms ciblée 2 Liste de masses et de temps d élution correspondant à des signaux différentiels Identification des peptides et des protéines (Moteurs de recherche) Mascot Sequest Phenyx. Liste de protéines différentielles identifiées