Mascot VS Phenyx. Emmanuelle COM. Plate-forme protéomique Biogenouest, Rennes

Dimension: px
Commencer à balayer dès la page:

Download "Mascot VS Phenyx. Emmanuelle COM. Plate-forme protéomique Biogenouest, Rennes"

Transcription

1 Mascot VS Phenyx Emmanuelle COM Plate-forme protéomique Biogenouest, Rennes Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 1

2 Procédure classique d identification de protéines par spectrométrie de masse Échantillon biologique Extraction des protéines Protéines Sousfractionnement / Purification Gel 1D, Gel 2D, HPLC, etc Digestion enzymatique Peptides Empreinte peptidique massique Intensité Analyse MS Séparation par chromatographie liquide (LC) IDENTIFICATION m/z Spectrométrie de masse Information de séquence Intensité m/z Analyse MS/MS (fragmentation) Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 2

3 Identification et gestion des données Spectre MS/MS ProteinScape Archivage et gestion des données Mascot serveur local Base de données (NCBInr, Swissprot, etc ) Phenyx serveur local Base de données (NCBInr, Swissprot, etc ) Paramètres de recherche identiques Requêtes en parallèles Diminution importante des temps de requêtes Cluster 12 noeuds Résultats d identification Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 3

4 ProteinScape Accès aux informations fournies par les moteurs de recherche (protein list) Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 4

5 Phenyx Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 5

6 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 6

7 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 7

8 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 8

9 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 9

10 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 10

11 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 11

12 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 12

13 Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 13

14 Stratégie d identification Multiscoring = Validation croisée des résultats d identification Mascot et Phenyx Résultats au dessus du seuil validés par un moteur de recherche et confirmés par le second Vérification de l ensemble des résultats fournis par un seul moteur Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 14

15 Comparaison de résultats: Nb de protéines identifiées Etude LC-MS/MS : découpe systématique de bandes de gel 1D Protein MS/MS Mascot Score MS/MS Phenyx Score 60S ribosomal protein L7a OS=Homo sapiens GN=RPL7A PE=1 SV=2 222,4 L-lactate dehydrogenase A chain OS=Homo sapiens GN=LDHA PE=1 SV=2 135,8 31,1 40S ribosomal protein S4, X isoform OS=Homo sapiens GN=RPS4X PE=1 SV=2 128 Glyceraldehyde-3-phosphate dehydrogenase OS=Homo sapiens GN=GAPDH PE=1 SV=3 225,2 43,1 Prohibitin-2 OS=Homo sapiens GN=PHB2 PE=1 SV=2 345,6 Guanine nucleotide-binding protein subunit beta-2-like 1 OS=Bos taurus GN=GNB2L1 PE=2 SV=3 451,2 110,3 40S ribosomal protein S3a OS=Homo sapiens GN=RPS3A PE=1 SV=2 140,3 Histone H1.2 OS=Homo sapiens GN=HIST1H1C PE=1 SV=2 239,4 Histone H1.3 OS=Homo sapiens GN=HIST1H1D PE=1 SV=2 239,4 Histone H1.4 OS=Homo sapiens GN=HIST1H1E PE=1 SV=2 239,4 Ig gamma-1 chain C region OS=Homo sapiens GN=IGHG1 PE=1 SV=1 355,3 Tubulin alpha-1c chain OS=Homo sapiens GN=TUBA1C PE=1 SV=1 113,3 40S ribosomal protein S3 OS=Homo sapiens GN=RPS3 PE=1 SV=2 92,9 40,5 ADP/ATP translocase 2 OS=Homo sapiens GN=SLC25A5 PE=1 SV=6 146,7 70,1 60S ribosomal protein L7 OS=Homo sapiens GN=RPL7 PE=1 SV=1 165,2 Ig lambda chain V-III region LOI OS=Homo sapiens PE=1 SV=1 80,9 40S ribosomal protein S2 OS=Homo sapiens GN=RPS2 PE=1 SV=2 200,5 IGHG1_HUMAN Ig gamma-1 chain C region OS=Homo sapiens GN=IGHG1 PE=1 SV=1 76,1 RS6_HUMAN 40S ribosomal protein S6 OS=Homo sapiens GN=RPS6 PE=1 SV=1 62,6 COPE_HUMAN Coatomer subunit epsilon OS=Homo sapiens GN=COPE PE=1 SV=3 16,8 Nombre de protéines identifiées : Mascot > Phenyx Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 15

16 Comparaison de résultats: Nb de protéines identifiées Etude LC-MS/MS: découpe systématique de bandes de gel 1D Protein MS/MS Mascot Score MS/MS Phenyx Score hypothetical protein PAB0813 [Pyrococcus abyssi GE5] 18,7 hypothetical protein PAB2305 [Pyrococcus abyssi GE5] 46,3 DNA primase [Pyrococcus abyssi GE5] 20,2 hypothetical protein PAB0383 [Pyrococcus abyssi GE5] 365,5 105,1 elongation factor 1-alpha [Pyrococcus abyssi GE5] 10,8 hypothetical protein PAB0938 [Pyrococcus abyssi GE5] 12,2 4-aminobutyrate aminotransferase [Pyrococcus abyssi GE5] 12,1 serine hydroxymethyltransferase [Pyrococcus abyssi GE5] 396,6 80,8 cell division control protein. [Pyrococcus abyssi GE5] 12,9 methyl-accepting chemotaxis related protein [Pyrococcus abyssi GE5] 29,1 hypothetical protein PAB0816 [Pyrococcus abyssi GE5] 32,3 hypothetical protein PAB1237 [Pyrococcus abyssi GE5] 9,8 site specific DNA-methyltransferase [Pyrococcus abyssi GE5] 41,4 sarcosine oxidase, subunit alpha [Pyrococcus abyssi GE5] 17,3 hypothetical protein PAB2383 [Pyrococcus abyssi GE5] 369,2 60,5 threonine synthase [Pyrococcus abyssi GE5] 27,4 sun protein (fmu protein) [Pyrococcus abyssi GE5] 14,1 DNA repair protein RAD25 [Pyrococcus abyssi GE5] 29,1 hypothetical protein PAB1420 [Pyrococcus abyssi GE5] 25,8 Nombre de protéines identifiées : Phenyx > Mascot Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 16

17 Comparaison de résultats: Nb de protéines identifiées Etude MALDI-TOF/TOF: 384 spots 972 MS/MS (3 MS/MS par spot) Mascot 156 proteines PHENYX 171 proteines 83,7 % des protéines identifiées par Mascot et Phenyx 3,9 % des protéines identifiées par Mascot 12,4 % des protéines identifiées par Phenyx Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 17

18 Comparaison de résultats: Nb de protéines identifiées Etude MALDI-TOF/TOF: 1150 spots 5700 MS/MS Spectres de masse MS Identifiés avec Mascot 30 % 7% 8% 49 % 5% 1% Spectres de masse MSMS Identifiés avec Mascot 1 % Spectres de masse MSMS Identifiés avec Phenyx Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 18

19 Comparaison de résultats: Faux positifs Etude MALDI-TOF/TOF FP FP+TP FDR gel 1 Phenyx ,40% gel 2 Mascot 2 Phenyx ,80% gel 3 Mascot 1 Phenyx ,80% Etude LC-MS/MS : 20 bandes 1D / échantillons FP FP+TP FDR échantillon 1 Phenyx ,54% échantillon 2 Phenyx ,40% échantillon 3 Phenyx ,00% Nombre de faux positifs : Phenyx > Mascot Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 19

20 Conclusion Mascot Phenyx Facilité d'utilisation Utilisation plus complexe Significativité = score seuil fixé par l'algorithme (p < 0.05) Protéines avec score < seuil fixé: difficulté d'interprétation Moins de faux positifs Moins de protéines identifiées Score seuil modifiable par l'utilisateur Pas de protéines score < seuil fixé Plus de faux positifs Plus de protéines identifiées Possibilité de comparaison avec des résultats d autres moteurs de recherche Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 20

21 Blandine Charoy Emmanuelle Com Mélanie Lagarrigue-Reboutier Régis Lavigne Djibril Ousmanou Charles Pineau Ecole chercheur publier et échanger les résultats des analyses protéomiques _ Grande Motte _ 16 juin 2009 Page 21