Protéomique Séance 1 Introduction aux données de protéomique et aux outils de recherche Mathieu Courcelles BCM2003 26 Mars 2009
BCM2003-H09 Protéomique Démonstrateur: Mathieu Courcelles Questions? Via le tutorat en ligne (http://www.agorabcm.com/) Disponibilités sur rendez-vous (email)
Horaire Séance 1 Introduction aux données de protéomique et aux 26 Mars outils de recherche Remise devoir 3a Séance 2 Phosphoprotéomique: À la recherche des 2 Avril modifications post-traductionnelles Distribution devoir 3b Séance 3 Mise en contexte des identifications 9 Avril Remise devoir 3b Questions sur le projet
Applications de la protéomique Étudier le protéome à petite (une ou quelques protéines) ou grande échelle (centaines à milliers en même temps). Comprendre la signalisation cellulaire, le développement. Modifications post-traductionnelles (phosphorylation, acétylation/méthylation, ubiquitination, glycosylation, etc). Isoformes et mutations. Biomarqueurs pour cancer et maladies (analyse quantitative)
Expérience typique de protéomique Extraction des protéines Digestion Trypsique Mélange de peptides MS HPLC Analyse des données Identification / Quantification Chromatographie liquide et spectrométrie de masse
Comment fonctionne un spectromètre de masse Vidéos Agilent TOF http://www.youtube.com/watch?v=plslwr5efs8 Agilent Q-TOF http://www.youtube.com/watch?v=r_d-ni0fk7a FT-ICR http://www.youtube.com/watch?v=a7qmkpypzsa
MS Survey Scan Séquençage de peptides Intensité relative masse / charge (m/z) Data dependent analysis
MS Survey Scan Séquençage de peptides Intensité relative 1. Isolation d un ion masse / charge (m/z)
MS Survey Scan Séquençage de peptides Intensité relative 1. Isolation d un ion 2. Fragmentation masse / charge (m/z)
MS Survey Scan Séquençage de peptides Intensité relative 1. Isolation d un ion 2. Fragmentation masse / charge (m/z) MS/MS Scan
Identifications des peptides MS/MS dataset (milliers) Interprétation automatisé des spectres Identification des peptides/protéines MS/MS Scan
Détection des peptides (MassSense) Détection des ions peptidiques dans les données brutes pour extraire leur intensité Légende: Basse Itensité Haute Intensité MS Survey Scan BIN7005 2008
Détection des peptides (MassSense) Région agrandite On peut voir différents ions peptidiques. BIN7005 2008
Détection des peptides (MassSense) H 1,2 C 12,13 N 14,15 O 16,17,18 S 32,33,34,36 Profile isotopique BIN7005 2008
Détection des peptides (MassSense) m/z = 1/z Sommet d intensité et charge BIN7005 2008
Détection des peptides (MassSense) Liste de peptides avec leur valeurs -m/z -temps de rétention -intensité BIN7005 2008
Format de fichiers Données brutes (format binaire propriétaire).wiff (Agilent).raw (dossier) (Micromass MassLynx).raw (ThermoFinnigan Xcalibur) Liste de pics.pkl (Micromass MassLynx).mgf (Mascot generic format).dta (Sequest).mzData (XML) (HUPO Proteomics Standards Initiative (PSI) ).mzxml (Institute for Systems Biology ).mzml (effort pour combiner.mzdata et.mzxml)
Pré-traitement des spectres MS/MS Détermination de la charge du peptide précuseur Ajustement de la masse du précuseur Simplification du spectre pour faciliter l interprétation automatisé (ratio signal/bruit). Qualité des spectres MS/MS Ex: Mascot distiller, Proteome Discoverer
Interprétation des spectres MS/MS Séquençage de novo (comparable à la méthode manuelle). Peaks, VEMS, PepNovo, LutefiskXP, AUDENS, NovoHMM Recherche d ions MS/MS Mascot, Sequest, OMSSA, X!Tandem, PepSplice Empreintes de masse peptidiques Mascot, Profound, MS-Fit, Aldente, VEMS Comparaison de spectres X!Hunter, BiblioSpec, Bonanza, SpectraST
Interprétation des spectres MS/MS Données sur ESILBAC: /UDEM/COURS_BAC/BCM2003/dbcm2003/Proteomique/tp1_data Mascot http://mascot.iric.ca/mascot http auth: usager: CHM3101, mot de passe: johnfenn usager: p0xxxxxx, mot de passe: temp2003 http://www.matrixscience.com Peaks Online http://www.bioinfor.com:8080/peaksonline/ X! Hunter http://h201.thegpm.org/tandem/thegpm_hunter.html
Peptide Mass Fingerprint Trypsin Digest http://www.umiacs.umd.edu/~nedwards/teaching/bchm676_spring_2007/handouts/lecture3.ppt
Peptide Mass Fingerprint MS http://www.umiacs.umd.edu/~nedwards/teaching/bchm676_spring_2007/handouts/lecture3.ppt
Peptide Mass Fingerprint http://www.umiacs.umd.edu/~nedwards/teaching/bchm676_spring_2007/handouts/lecture3.ppt
Protein Sequence Myoglobin GLSDGEWQQV LNVWGKVEAD IAGHGQEVLI RLFTGHPETL EKFDKFKHLK TEAEMKASED LKKHGTVVLT ALGGILKKKG HHEAELKPLA QSHATKHKIP IKYLEFISDA IIHVLHSKHP GDFGADAQGA MTKALELFRN DIAAKYKELG FQG http://www.umiacs.umd.edu/~nedwards/teaching/bchm676_spring_2007/handouts/lecture3.ppt
Protein Sequence Myoglobin GLSDGEWQQV LNVWGKVEAD IAGHGQEVLI RLFTGHPETL EKFDKFKHLK TEAEMKASED LKKHGTVVLT ALGGILKKKG HHEAELKPLA QSHATKHKIP IKYLEFISDA IIHVLHSKHP GDFGADAQGA MTKALELFRN DIAAKYKELG FQG http://www.umiacs.umd.edu/~nedwards/teaching/bchm676_spring_2007/handouts/lecture3.ppt
Peptide Masses 1811.90 GLSDGEWQQVLNVWGK 1606.85 VEADIAGHGQEVLIR 1271.66 LFTGHPETLEK 1378.83 HGTVVLTALGGILK 1982.05 KGHHEAELKPLAQSHATK 1853.95 GHHEAELKPLAQSHATK 1884.01 YLEFISDAIIHVLHSK 1502.66 HPGDFGADAQGAMTK 748.43 ALELFR http://www.umiacs.umd.edu/~nedwards/teaching/bchm676_spring_2007/handouts/lecture3.ppt
Peptide Mass Fingerprint ALELFR LFTGHPETLEK HGTVVLTALGGILK HPGDFGADAQGAMTK VEADIAGHGQEVLIR GLSDGEWQQVLNVWGK GHHEAELKPLAQSHATK YLEFISDAIIHVLHSK KGHHEAELKPLAQSHATK http://www.umiacs.umd.edu/~nedwards/teaching/bchm676_spring_2007/handouts/lecture3.ppt
Séquençage de novo
Mascot - Recherche d ions MS/MS Utilise d abord l empreinte de masse comme dans PMF. Cherche dans la base de données de protéines les peptides possibles pour les masses correspondantes. Valide l identification avec les ions fragments.
X!Hunter Comparaison de spectres Spectre à interpréter Déterminer le % d identité Base de données de spectres annotés
Synthèse des méthodes d interprétation des spectres MS/MS Séquençage de novo (comparable à la méthode manuelle). Peaks, VEMS, PepNovo, LutefiskXP, AUDENS, NovoHMM Recherche d ions MS/MS Mascot, Sequest, OMSSA, X!Tandem, PepSplice, Zcore Empreintes de masse peptidiques Mascot, Profound, MS-Fit, Aldente, VEMS Comparaison de spectres X!Hunter, BiblioSpec, Bonanza, SpectraST
Références Mascot Perkins. D., Pappin D., Creasy D., Cottrell J. (1999) Probability-based protein identification by searching sequence databases using mass spectrometry data. Electrophoresis 20(18), 3551-67 Peaks Ma B, Zhang K, Hendrie C, Liang C, Li M, Doherty-Kirby A, Lajoie G (2003) PEAKS: powerful software for peptide de novo sequencing by tandem mass spectrometry. Rapid Commun Mass Spectrom. 17(20), 2337-42 X!Hunter Craig R., Cortens J. C., Fenyo D., and Beavis R. C. (2006) Using annotated peptide mass spectrum libraries for protein identification. J. Proteome. Res. 5(8), 1843-1849