Satellite Modélisation Dynamique de Réseaux de Régulation Biologique Des mesures aux modèles et des modèles aux mesures Analyse de données de protéomique par spectrométrie de masse samedi 9 juillet 2005 IBCP, Lyon yves.vandenbrouck@cea.fr 1
"The analysis of the entire protein complement expressed by a genome, or by a cell or tissue type. Wasinger VC et al Progress with gene-product mapping of the mollicutes: Mycoplasma genitalium. Electrophoresis 16 (1995) 1090-1094 Complexité Fonction Dynamique Compartimentation 2
Protéomique et cartographie cellulaire 3
État des lieux : connaissance actuelle en matière de localisation 4
Corrélation niveau d expression mrna /protéine total: r p = 0.93 regardons de plus prés Gygi et al., 1999 inner set: r p = 0.35 5
L avènement de la Post-Génomique Aborder la compléxité du protéome (abondance, diversité, PTM )? Tirer des informations spatiales et temporelles? Rendre compte de la réponse cellulaire à l échelle de systèmes Utiliser l ensemble de ces informations à des fins de design et de développement de drogues! ""#$ % &"#$' " ( # % # )&#) # % * 6
"!! ( 0 $$$ $2#! * * - * / Mise en place d une plateforme protéomique #$& $$& $ % # ) *! (& ' $, % + #22 #2 2 % " 0 1 ' 2 0 1! /. - - 1 7 1 6 5 4 * " 4 + * 3 " * *!,& &#, % + " / $ : 7 9 (( 8 * 3 ##,$% 2 (22 # % 0 4 4 4 0 # -! / - ' / 1 0 < 4 ;! 3 1 / * 9 - #( 2 & % " ) / & = ' 8 " * 9 / 3 6 (, % + * + 5 0 7
Organisation d une plate-forme protéomique «haut débit» électrophorèse préparation analyse MS interprétation identification validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines 8
Quelques définitions Quadrupole Q Time of flight TOF Ion Trap Fourier transform mass spectrometry FTMS Source: ionisation Analyseur(s) Détecteur (m/z) Atmospheric Pressure Chemical Ionisation (APCI) Chemical Ionisation (CI) Electron Impact (EI) Electrospray Ionisation (ESI) Fast Atom Bombardment (FAB) Field Desorption / Field Ionisation (FD/FI) Matrix Assisted Laser Desorption Ionisation (MALDI) 9
Identification des protéines en MS électrophorèse préparation analyse MS interprétation identification validation échantillon échantillon préparé spectre brut spectre interprété résultat brut Identification de protéines 10
Principe d analyse «classique» en MS «haut débit» Trypsine (K, R; / P) Chymotrypsine (F, W, Y, L, M) {CNBr (M)} Peptide Mass Fingerprint : PMF 11
Les outils de la Protéomique./0. -."+ "+, Ec = ½ mv 2 12
Les outils de l analyse protéomique : MS à haut-débit Trace des peptides en mode MS Echantillon 12 "+" 567!36./0. 100% 644 523 758 606 531 765 839 666 1015 1046 1211 0 400 500 600 700 800 900 1000 1100 1200 1300 m/z 3.0.4# 13
principe d identification en MALDI &" #$ # # 01-/, 942.56 1061.62 1102.63 1189.66 1304.74 14
Peptide Mass Fingerprinting: Effet de la précision en masse sur la recherche recherche m/z Mass Tolerance (Da) # Hits Database 1529 1529.7 1529.73 1529.734 1529.7348 1 0.1 0.01 0.001 0.0001 478 164 25 4 2 Impose aux expérimentalistes de travailler sur : la résolution (pouvoir de séparation) la précision (écart de masse m) 15
Besoin de résolution? A basse résolution, masse moyenne Spectre de peptide avec 94 atomes de carbone (19 résidus) Haute résolution masse Monoisotopique 1981.84 1982.84 C13 naturellement incorpore: 1.1 % Basse 0 13 C résolution (tout 12 C) 1 13 C 6130 6140 6150 6160 6170 m/z 1983.84 2 13 C 16
Résolution & précision en masse 8000 15 ppm d erreur Résolution = 18100 Counts 6000 4000 24 ppm d erreur Résolution = 14200 2000 55 ppm d erreur Résolution = 4500 0 2840 2845 2850 2855 Mass (m/z) 17
Peptide Mass Fingerprinting: Effet du nombre de peptide sur la recherche Search m/z tolérance de masse # Hits Database 1529.73 1529.73 1252.70 0.1 0.1 164 7 1529.73 1252.70 1833.88 0.1 1!! Ceci dépend aussi de la taille de la protéine et de la pureté du spot 18
Search engines for proteins identification PeptIdent http://us.expasy.org/tools/peptident.html Mascot http://www.matrixscience.com/search_form_select.html ProteinProspector http://prospector.ucsf.edu/ MOWSE http://srs.hgmp.mrc.ac.uk/cgi-bin/mowse PeptideSearch http://www.mann.embl-heidelberg.de/ GroupPages/PageLink/peptidesearchpage.html AACompSim/AACompIdent http://www.expasy.ch/tools 19
20
21
Limites de l analyse MALDI-TOF Peu de peptides générés (protéines de faible MW (5-20 kda), hyper acides, modifiées, hyper basiques) Phénomène de distorsion lié à la désorption relative, compétitivité vis-à-vis de la matrice Mélange de protéines (>3) Protéine inconnue (absente des banques de données protéiques) Mélange trop complexe => superposition de plusieurs PMF Séquençage en MS/MS 22
1"% 23
Principe d analyse «classique» MS-MS «haut débit» Trypsine (K, R; / P) Chymotrypsine (F, W, Y, L, M) {CNBr (M)} 24
Les outils de l analyse protéomique : séquençage des peptides en mode MS/MS 12./0.40. "+" 567!36 8 0 W 100 554.33 159.09 E % 0 288.14 685.37 272.17 871.46 1000.49 100 200 300 400 500 600 700 800 900 1000 30.40.4# 25
Les outils de la Protéomique./0.40. -."+ 8#" "+, 2""#" 26
Les outils de la protéomique 8 0 W 100 554.33 159.09 E % 0 288.14 685.37 272.17 871.46 1000.49 100 200 300 400 500 600 700 800 900 1000 9 9!"#$%!"#$& 27
Les outils de la protéomique #" " '() ) % %*+ 12 0.40. 28
1"% 29
Les outils de la protéomique (),* #-$ -! " -' - + # & 0# #+ :.0.40.." # ""# # + # 0.40.' 30
Identification en MS/MS : approche directe et indirecte Limites : Directe : spectres doivent coïncider exactement (substitution), protéines absentes Indirecte : qualité du spectre, résidus isobares error-prone Ile / Leu, Lys = Gln, Trp = [Glu + Gly] 31
!! "#$% Le concept d étiquette peptidique (M. Mann)? P M W? 100 554.33 % 685.37 871.46 0 1000.49 100 200 300 400 500 600 700 800 900 1000 W M P! Un court fragment peptidique Deux masses flanquantes de séquence inconnue PEPTIDE SEQUENCE TAG 32
La protéomique : un outil d annotation fonctionnelle Sample Clust ers unique peptides # of cluster # of peptides Total peptides pepti de coverage Avg acc /cluster clust ers with TMDs %clus ters with TMDs # total precursor s QSCX28J21 U937-PNM S 112 13 8 256 335 2.4 2.7 6 4% 2289 Unassigned observations Environ 40 à 80% des informations obtenues par ms/ms ne sont pas utilisées. Raisons (2/3 protéines non connus) variants, inconnues, modifications Post-traductionelles, chimiques, dégradations, etc 33
1"% 34
Protéomique et annotation des génomes % ( * 9##!'+' '+' '+' 0.40. 0.40. 35
Protéomique et annotation des génomes % ( * Identifier protéines non référencées dans les banques & 100 159.09 554.33 100 159.09 554.33 % 0 288.14 272.17 685.37 871.46 1000.49 100 200 300 400 500 600 700 800 900 1000 11001200 % 0 288.14 272.17 685.37 871.46 1000.49 100 200 300 400 500 600 700 800 900 1000 11001200 36
Annotation des génomes par MS-MS: principe PepLine Taggor PepMap 37
La protéomique : un outil d annotation des génomes % %$.! * #$ )( ( :3 : : '( ( 3 38
La protéomique : un outil d annotation des génomes % %$. * #$ +( )( ( :3 : : '( ( 3 39
La protéomique : un outil d annotation des génomes - ) )( ( #$(( (. *, ) )( ( (( ( "#$( % 40
La protéomique : un outil d annotation des génomes. / % #, 510 878 736 GDE 634 310 ISI 1048 908 ESD 432 1124 DFE 156 156 1248 GPI IIG! "# $% Chromosome I d A.thaliana Subsequence from nt 2133100 to nt 21328001 (reverse strand) corresponding to protein At1g06950 : chloroplast inner envelope protein ACTGGAGTTTAACAACCTGCTAGTTTCCTTGAAAAGTCATTCAGAGGCAG ATCAATTTGCACGCGGGGTTGGCCCTATTTCTTTGATAGGTGAAGATGCT TTTGACCTTCTCTTTTCTGAAGAAAAATTATTGGCTCTCAACCTTGGATC TATGTGGCTTAGGTGATGAGTCTGATTTTGAGAGGAGAATGGATGATTTA AAGCTCCTTTATAGAGCATATGTTACAGATGCTTTATCTGGTGGGCGCTT AGAAGAAAATAAGGTATACTCAGTTTTGTATAAGATATTATGTACTAAAG " 41
154886!" % == #$%&$'( )* +%,-. #"36;< :: 1 MRALEEDQYI RQVDGYLPTA EVAFIDEIFK EKIEPPVYVS DRRLVKSIQL 51 LQVRARAPSA XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX 101 XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX XXXXXXXXXX LWLAAEESEA 151 VATALEPKLV KTRAAVEQVL FDVVMLEVAL RNGADPVTLA NLMPKHWADF 201 IRNSDITEVK PIGTTPLSGG RRP 42
$ 2 /0 1 '(2!( / >08 >08 $ 23 #$%$ #% ##!$ &!# '##& () ( *!! + 89 01 4 5*6 2 & " 34% "$7"$ # 2,! 2 43
: 5 6 ; Projet GenoProtéome 44
Les «outils» de l analyse protéomique : Quantification Mesurer des niveaux relatifs d expression des protéines 45
Quid du temps de ½ vie des protéines? ornithine decarboxylase lipoprotein lipase tyrosine transaminase phosphoenolpyruvate carboxykinase 11 min 1 h 1.5 h 2 h tryptophan oxygenase HMG CoA reductase glucokinase alanine transaminase serum albumin arginase lactate dehydrogenase adult collagen infant collagen 2 h 3 h 12 h 0.7 1 d 3.5 d 4 5 d 16 d 300 J 1 2 J & 150 J 46
Stratégies pour les analyses protéomiques comparatives Analyse nanolc-ms Comparaison des peptides présents dans les échantillons Analyse du signal des ions (peptides trypsiques) Echantillons biologiques Echantillons biologiques Marquage isotopique différentiel Liste de peptides potentiellement intéressants Identification des marqueurs par nanolc-ms/ms 47
Analyse directe du signal d ions Chaque ion (précurseur) est réprésenté par: Échantillon A -Un rapport m/z -Un état de charge -Un temps de rétention -Une intensité -Une aire Trypsine NanoLC-MS intensité t Echantillons sans marquage isotopique 48
Analyse directe du signal d ions Echantillons sans marquage isotopique Échantillon A Échantillon B Trypsine NanoLC-MS Trypsine NanoLC-MS intensité t intensité t 49
Analyse directe du signal d ions Echantillons sans marquage isotopique Échantillon A Échantillon B Trypsine NanoLC-MS Trypsine NanoLC-MS intensité t intensité t 50
Analyse directe du signal d ions Carte MS Construire 2 cartes MS pour les deux échantillons «Carte MS».0.( # 4? 538.78 522.60 551.27 650.81 442.71 588.77 480.61 406.22 m/z 120. 3 (50. 51
Analyse directe du signal d ions Alignement Pour chaque masse de la carte : Rechercher les pics sur les chromatogrammes extraits Mettre en correspondance ces pics en admettant un décalage en temps de rétention m/z temps rétention m/z temps rétention 52
Application à l étude de la différenciation des cellules souches embryonnaires murines ES différenciées Différentiel ES totipotentes m/z temps 2 min -- totipotentes -- différenciées 53
Stratégies pour les analyses protéomiques comparatives Analyse nanolc-ms Comparaison des peptides présents dans les échantillons Analyse du signal des ions (peptides trypsiques) Echantillons biologiques Echantillons biologiques Marquage isotopique différentiel Liste de peptides potentiellement intéressants Chimique : ICAT Métabolique : SILAC Identification des marqueurs par nanolc-ms/ms 54
Marquage isotopique des protéines (SILAC : Stable isotope labeling with amino acids in cell culture ) 12 C-Arg 13 C-Arg ES Lysat cellulaire ESd Lysat cellulaire Mélange rapport 1:1 Fractionnement par SDS-PAGE Découpe des bandes et digestion par la trypsine Identification des protéines par LC-MS/MS Quantification des peptides à partir des chomatogrammes extraits de la MS ref. Ong, S.-E. et al. (2002) Mol. Cell. Proteomics 55
Marquage isotopique des protéines Échantillon A Échantillon B Marquage isotopique (lourd/ léger) échantillon «léger» mélange échantillon «lourd» Trypsine NanoLC-MS t m/z 56
Marquage isotopique des protéines (SILAC) 12./0. "+" 567!36 Co-élution Arg 12 C Arg 13 C 57
Application à l étude de la différenciation des cellules souches embryonnaires murines Peptide: XXXXXRXXXXXXXXXXXXK Arg 12 C m Arg 12 C+ 13 C Arg 13 C Mesure du ratio des intensités des peptides séparés m/z 58
Conclusion et Perspectives Identification par nanolc-ms/ms Analyse nanolc-ms Liste de peptides potentiellement intéressants Liste de paires de peptides quantifiés potentiellement intéressants Vérification et quantification sur analyse nanolc-ms Identification des marqueurs par nanolc-ms/ms pas systématique permet de cibler la MS/MS 59
9) 5 6778" (3,*077 0777 4 (3,*67 0112 (3,*0 45 (3,*67 60
Fourier Transform Ion Cyclotron Resonance Mass Spectrometer (FTICR-MS) Une nouvelle technologie vers plus : - de résolution - de précision - de sensibilité Arrivée courant 2005 61
Vers la protéomique à très haute résolution : analyse nanolc-ft FT-MS >100,000 peptides détectés 62
La plate-forme protéomique L étape limitante : la bioanalyse Valider, interroger et donner un sens! 63
# #<#.' " '#<.= "2* >#??#>@& " + =&A? B:@, "* C#D:.,A< ** "#$$&?A, E <:.&.$ ** -:?&F CG >#., F! E#,<&,-A:B #E.#. = HI > #,<& #@:J# & "A:'A, &KL>:& &,:>:&$ '* +E&"#' " E.>A:A:4 64