Journée des Doctorants IPHC, 31/01/2008 500 750 1000 1250 1500 1750 2000 2250 2500 2750 BEDNARCZYK Audrey, FOUILLEN Laetitia, ALLIEN Sébastien Directeur: VAN DORSSELAER Alain Laboratoire de Spectrométrie de Masse Bio-Organique Institut Pluridisciplinaire Hubert CURIEN IPHC-DSA, ULP, CNRS, UMR 7178 ECPM- 25, rue Becquerel F- 67087 STRASBOUR
DE L ADN AUX PROTEINES ADN Transcription ARN Traduction Côté N-terminal Phe COOH Mt Met Ala Ser Cys Côté C-terminal Protéines NH 2 Lys Cys Acides aminés
QU EST-CE QUE LA PROTEOMIQUE? Le protéome correspond à l ensemble des protéines présentes dans un type de cellules : - à un moment donné de sa vie - dans un environnement et des conditions donnés - avec un historique donné L analyse protéomique par spectrométrie de masse consiste à : - identifier - caractériser - quantifier Problème biologique Choix de la stratégie en protéomique
STRATEIES D ANALYSES EN PROTEOMIQUE Analyse d une protéine Spectre de masse Empreinte peptidique massique Digestion enzymatique Analyse MS Une protéine Mélange de peptides Analyse LC-MS/MS Intens. x105 1.25 1.00 +MS2(870.3), 0.6-1.0min #(30-39) 288.1 A E I 0.75 717.3 D E T T S 977.5 0.50 517.3 588.3 830.4 1193.5 0.25 1106.5 1294.5 460.4 428.3 777.8 892.4 1134.4 1262.5 1452.5 1395.5 1566.6 0.00 400 600 800 1000 1200 1400 Spectres de fragmentation Information de séquence
STRATEIES D ANALYSES EN PROTEOMIQUE Identification à partir de la masse de peptides Mélange de peptides Spectre MS Empreinte peptidique massique
STRATEIES D ANALYSES EN PROTEOMIQUE Analyse d une protéine Spectre de masse Empreinte peptidique massique Digestion enzymatique Analyse MS Une protéine Mélange de peptides Analyse LC-MS/MS Intens. x105 1.25 1.00 +MS2(870.3), 0.6-1.0min #(30-39) 288.1 A E I 0.75 717.3 D E T T S 977.5 0.50 517.3 588.3 830.4 1193.5 0.25 1106.5 1294.5 460.4 428.3 777.8 892.4 1134.4 1262.5 1452.5 1395.5 1566.6 0.00 400 600 800 1000 1200 1400 Spectres de fragmentation Information de séquence
STRATEIES D ANALYSES EN PROTEOMIQUE Analyse d un mélange de protéines Spectre de masse Empreinte peptidique massique Séparation des protéines (gels 1D, 2D, chromatographie, ) Digestion enzymatique Analyse MS Mélange de Protéines Mélange de peptides Analyse LC-MS/MS Intens. x105 1.25 1.00 +MS2(870.3), 0.6-1.0min #(30-39) 288.1 A E I 0.75 717.3 D E T T S 977.5 0.50 517.3 588.3 830.4 1193.5 0.25 1106.5 1294.5 460.4 428.3 777.8 892.4 1134.4 1262.5 1452.5 1395.5 1566.6 0.00 400 600 800 1000 1200 1400 Spectres de fragmentation Information de séquence
STRATEIES D ANALYSES EN PROTEOMIQUE Analyse d un mélange de protéines Spectre de masse Empreinte peptidique massique Séparation des protéines (gels 1D, 2D, chromatographie, ) Digestion enzymatique Analyse MS Mélange de Protéines Mélange de peptides Analyse LC-MS/MS Intens. x105 1.25 1.00 +MS2(870.3), 0.6-1.0min #(30-39) 288.1 A E I 0.75 717.3 D E T T Séparation chromatographique des peptides 0.50 517.3 588.3 830.4 977.5 S 1193.5 0.25 1106.5 1294.5 460.4 428.3 777.8 892.4 1134.4 1262.5 1452.5 1395.5 1566.6 0.00 400 600 800 1000 1200 1400 Spectres de fragmentation Information de séquence
EQUIPEMENTS elcutter (Bruker Daltonics) Spectre de masse Empreinte peptidique massique Séparation des protéines (gels 1D, 2D, chromatographie, ) Digestion enzymatique Robot de pré-digestion (MassPrep, Waters) Analyse MS MALDI-ToF (Ultraflex II, Bruker Daltonics) Mélange de Protéines Mélange de peptides Analyse LC-MS/MS 2 nanohplc-chip-trap (Agilent Technologies-Bruker Daltonics) Séparation chromatographique des peptides HPLC 1100 (Agilent Technologies) MicroHPLC 1100 (Agilent Technologies) Alliance (Waters) CapLC-Q/ToF (Waters) Spectres de fragmentation Information de séquence
STRATEIES D ANALYSES EN PROTEOMIQUE Exploitation des données de masse Données MS expérimentales Données MS théoriques Spectre de masse Empreinte peptidique massique Comparaison par des moteurs de recherche Banques de séquences protéiques CCFDSDFRTHTTYIPLMRKMD EASCVNFJRPQSDHLKITYPM DFHERILPMKYITRFNCHDSF NVCDSDFRAQSDFERTHPL AQRSFEDEHDIRLFPMTFKN VFNDFHERILPMKYITRFNC MNVFFRDSQACVSDEFRHKITP VDFCERSFDCVAQDHFIRLP HDSFAQRSFEDEHDIRLFPMT LFMDLMFPRTEQASSCVFHDN RFEDDFHERILPMKYITRFNC FMFYRHTTDNVHCFSQDAE FKNVDFCERSFDCVAQDH RTIPLYMTIFKSREFDYASRH HDSFAQRSFEDEHDIRLFPMT QDSFEDTHFFKFLFMPITLF FERILPMKYITRFNCHDSFA FIRLPFMFYRHTTDNVHCFS EYD FKNVDFCERSFDCVAQDH KITRYFHNVDFSQREAS QRSFEDEHDIRLFPMTFKNV QDAEQDSFEDTHFFKFLFM FIRLPFMFYRHTTDNVHCFS DFCERSFDCVAQDHFIRLPF PITLFKITRYFHNVDFSQRE QDAEQDSFEDTHFFKFLFM MFYRHTTDNVHCFSQDAEQ AS PITLFKITRYFHNVDFSQRE DSFEDTHFFKFLFMPITLF AS KITRYFHNVDFSQREAS Intens. x105 +MS2(870.3), 0.6-1.0min #(30-39) 288.1 Digestion et fragmentation simulées 1.25 1.00 0.75 0.50 0.25 0.00 428.3 460.4 517.3 A 588.3 E 717.3 I 777.8 830.4 D 892.4 Spectres de fragmentation Information de séquence 977.5 400 600 800 1000 1200 1400 E 1106.5 S 1134.4 1193.5 T 1262.5 1294.5 T 1395.5 1452.5 1566.6 identification 516,90 634,79 612,75 752,93 879,89 999,78 1134,48 1368,84 809,89 1596,28 878,78 1675,89 956,56 1888,44 994,83 1059,01 712,43 1166,99 750,09 1234,56 812,34 1345,78 933,66 1423,67 978,55 1624,97 1207,45 1777,22 1327,87 1878,38 1387,23 1505,72 1678,06 1835,79 1944,55
STRATEIES D ANALYSES EN PROTEOMIQUE Exploitation des données de masse ADN Banque de séquences protéiques CTCCTCACCCATCCCCCACCACACATCCCCCCACTCAAC CACCACACACACAATCCCCCACCCCCCCCAACCATCTCACC ACACAACTCAAACCCCCCTCCTACACATTATCCACAATCC CTAATCCAAATTCTCTAAACTCCACCCTCCCATTCTACC ACCACCTCCAATATTCTACCCTAACCCCCAACCCCCTCC AACCTCATCATCCACAAACCCCACACCCATCACCCACCACCAC CACCCCCACCACTTCCACCCCCCCCACCAACCTCCCC CATCAACCCCACCTCCCCACCACTCATTCCACCACCCAAAATC TCTTCCAAAACTTAATCTCCCTTCTTTATCATCTACA TCCAATCAATCCACCACAATCCCCTCACCACATATCCATATCA CCCCACCATTCCTCCCCATCTCATCCTCACCTATCCATACCTAC AACTACTTTCCTACTCTCCACAATACCACTTCACAACA TTTTCTCATCATTCCCCTATCAACTCCACCAATTATCAC CCCCACCACCACACCCCCCCCAACTCTCCTCCTCC CCTTCCCTCTTCCCAACCATTCCCCATAACAAATTCCTCTTT CAACTCCCACAATCTTCTCCTACTCCCTCCCCT TCCACCCARTCACTTCCAATTTCAATCCCAAATCCCCATTTTAC CTCCCTATCTATTCAAACTCCTCCCACCTCACCA ACCTCCCCCCCCCCTCATCACCCACAATCTCACCCTTTT CACTCTTCACTTTCCCATCCAACCCCACTCCCACCACAA CTTTCCCCCACTCTATCTCACCCCACTTCCAAAACCCACACC CTAATCCTTTTACCCTCTCCCACTCTTCACCAC. CCFDSDFRTHTTYIPLMRKMD MCFDSDFRTHTTYIPLMRKMD EASCVNFJRPQSDHLKITYPM DFHERILPMKYITRFNCHDSF MFHERILPMKYITRFNCHDSF NVCDSDFRAQSDFERTHPL AQRSFEDEHDIRLFPMTFKN VFNDFHERILPMKYITRFNC MFNDFHERILPMKYITRFNC MNVFFRDSQACVSDEFRHKITP VDFCERSFDCVAQDHFIRLP HDSFAQRSFEDEHDIRLFPMT LFMDLMFPRTEQASSCVFHDN RFEDDFHERILPMKYITRFNC MFEDDFHERILPMKYITRFNC FMFYRHTTDNVHCFSQDAE FKNVDFCERSFDCVAQDH RTIPLYMTIFKSREFDYASRH HDSFAQRSFEDEHDIRLFPMT QDSFEDTHFFKFLFMPITLF FERILPMKYITRFNCHDSFA MERILPMKYITRFNCHDSFA FIRLPFMFYRHTTDNVHCFS EYD FKNVDFCERSFDCVAQDH KITRYFHNVDFSQREAS QRSFEDEHDIRLFPMTFKNV QDAEQDSFEDTHFFKFLFM FIRLPFMFYRHTTDNVHCFS DFCERSFDCVAQDHFIRLPF PITLFKITRYFHNVDFSQRE QDAEQDSFEDTHFFKFLFM MFYRHTTDNVHCFSQDAEQ AS PITLFKITRYFHNVDFSQRE DSFEDTHFFKFLFMPITLF AS KITRYFHNVDFSQREAS Traduction automatique des gènes prédits
THESE: Sébastien allien PROTÉOMIQUE «ORIENTÉE» N-TERMINALE POUR UNE AMÉLIORATION DES BANQUES PROTÉIQUES Les banques protéiques : - Résultat d annotation automatique du génome (programmes bioinformatiques) - Présentent des erreurs (Codon start) Conséquences des erreurs de prédiction: -Mauvaise définition de la séquence protéique -Problèmes en biologie Start codon ADN CTT TA AT TTT ACT AAC CC TAT TCC PROT Met Phe Thr Asn Arg Tyr Ser Peptide N-terminal On a une idée de l existence des erreurs dans les banques protéiques mais quelle est leur étendue et comment les corriger?
THESE: Sébastien allien PROTÉOMIQUE «ORIENTÉE» N-TERMINALE POUR UNE AMÉLIORATION DES BANQUES PROTÉIQUES Les banques protéiques : - Résultat d annotation automatique du génome (programmes bioinformatiques) - Présentent des erreurs (Codon start) Conséquences des erreurs de prédiction: -Mauvaise définition de la séquence protéique -Problèmes en biologie Start codon ADN CTT TA AT TTT ACT AAC CC TAT TCC PROT Met Phe Thr Asn Arg Tyr Ser Peptide N-terminal Caractériser expérimentalement un maximum de peptides N-terminaux. Comparaison données expérimentales /prédictions
THESE: Sébastien allien PROTÉOMIQUE «ORIENTÉE» N-TERMINALE POUR UNE AMÉLIORATION DES BANQUES PROTÉIQUES R NH 2 Tris-HCl 50mM (ph8.2) R NH 2 NH 2 CH K TMPP COOH Ac NH CH K COOH Etape clé de la stratégie : Protéine H 3 CO H 3 CO H 3 CO H 3 CO P + OCH 3 O OCH 3 O CH 2 C O N OCH 3 O ΔM : + 572.18 Da TMPP-Ac-OSu H 3 CO OCH 3 Br - (N-Succinimidyloxycarbonylmethyl)tris(2,4,6- trimethoxyphenyl)phosphonium bromide) Après marquage : Caractérisation améliorée des peptides N-terminaux en LC-MS/MS Approche appliquée à M. smegmatis : - identification de 443 peptides N-terminaux uniques - taux d erreur de 20 % sur la prédiction des codons start - correction / validation des séquences théoriques Extension de la stratégie pour valider / corriger les prédictions dans le génome des autres mycobactéries - dépôts en ligne (ftp) de l ensemble des séquences validées / corrigées
THESE : Fouillen Laetitia STRATÉIES PROTÉOMIQUES: ANALYSES DIFFÉRENTIELLES PAR ELS (1D, 2D) Le jeûne prolongé chez le manchot Adélie: Variation des protéines plasmatiques Collaboration avec T. Raclot, IPHC-DEPE Recherche de partenaires d interaction: Stratégie gels 1D Protéine-Protéines PARP9: Cancer du Colon ARN-Protéines ARN viral de VIH-1 Prélèvement de plasma Préparation des échantillons (déplétion albumin ) Comparaison des gels 2D correspondants à différentes phases de jeûne Séparation sur gel 2D Excision Digestion F. Dantzer et V. Schreiber, Laboratoire Intégrité du génome, ESBS, Strasbourg Préparation des échantillons (IP, colonne d affinité..) Excision Digestion Equipe du C. Branlant, Laboratoire MAEM, Université Poincaré, gel 1D Nancy Comparaison d intensité des spots détectés LC-MS/MS (ESI-IT) Identification des protéines Identifications LC-MS/MS ESI-Q-ToF Protéines exprimées différentiellement entre les phases de jeûne Thèse T. Wasselin: Jeûne prolongé chez le rat (plasma et muscle) Liste de protéines candidates ( validés par des méthodes biologiques par les collaborateurs)
THESE : Fouillen Laetitia STRATÉIES PROTÉOMIQUES: ANALYSES DIFFÉRENTIELLES PAR ELS (1D, 2D) Le jeûne prolongé chez le manchot Adélie: Variation des protéines plasmatiques Collaboration avec T. Raclot, IPHC-DEPE Recherche de partenaires d interaction: Stratégie gels 1D Protéine-Protéines PARP9: Cancer du Colon ARN-Protéines ARN viral de VIH-1 Prélèvement de plasma Préparation des échantillons (déplétion albumin ) Comparaison des gels 2D correspondants à différentes phases de jeûne Séparation sur gel 2D Excision Digestion F. Dantzer et V. Schreiber, Laboratoire Intégrité du génome, ESBS, Strasbourg Préparation des échantillons (IP, colonne d affinité..) Excision Digestion Equipe du C. Branlant, Laboratoire MAEM, Université Poincaré, gel 1D Nancy Comparaison d intensité des spots détectés LC-MS/MS (ESI-IT) Identification des protéines Identifications LC-MS/MS ESI-Q-ToF Protéines exprimées différentiellement entre les phases de jeûne Thèse T. Wasselin: Jeûne prolongé chez le rat (plasma et muscle) Liste de protéines candidates ( validées par des méthodes biologiques par les collaborateurs)
THESE: Bednarczyk Audrey CARACTERISATION FINE DES PROTEINES DU CHEVEU HUMAIN Collaboration avec L ORÉAL Applications Protéines: 85 % Eau, lipides, pigments, métaux: 15 % Mieux comprendre la structure du cheveu Influence des différents traitements sur la nature des protéines Etude de la qualité d un cheveu selon son ethnie. 2 classes de protéines majoritaires Filaments intermédiaires (kératines) Protéines associées aux kératines (KAPs) Schéma cheveu: Plowman JE, 2003, J. of Chromato. B, 787, 63-76
THESE: Bednarczyk Audrey CARACTERISATION FINE DES PROTEINES DU CHEVEU HUMAIN Collaboration avec L ORÉAL Applications Protéines: 85 % Eau, lipides, pigments, métaux: 15 % Mieux comprendre la structure du cheveu Influence des différents traitements sur la nature des protéines Etude de la qualité d un cheveu selon son ethnie. 2 classes de protéines majoritaires Filaments intermédiaires (kératines) Protéines associées aux kératines (KAPs) MAIS Complexe fibreux très stable peu soluble Kératines majoritaires par rapport aux KAPs Schéma cheveu: Plowman JE, 2003, J. of Chromato. B, 787, 63-76
THESE: Bednarczyk Audrey CARACTERISATION FINE DES PROTEINES DU CHEVEU HUMAIN Collaboration avec L ORÉAL Applications Protéines: 85 % Eau, lipides, pigments, métaux: 15 % Mieux comprendre la structure du cheveu Influence des différents traitements sur la nature des protéines Etude de la qualité d un cheveu selon son ethnie. 2 classes de protéines majoritaires Filaments intermédiaires (kératines) Protéines associées aux kératines (KAPs) MAIS Complexe fibreux très stable peu soluble Kératines majoritaires par rapport aux KAPs Deux approches complémentaires Séparation des protéines: Approche gels d électrophorèse 2D Extrait total vs. Extrait cortex: Approche chromatographie liquide 2D Excision des spots Extraits digérés Digestion el 2D LC-MS/MS Fractionnement par LC LC-MS/MS Mise en évidence d un nouveau type de liaison intermoléculaire entre kératines et KAPs Identification de protéines minoritaires Modifications Localisation des protéines Mieux comprendre cette machinerie complexe (modifications, interactions, localisation des protéines) Schéma cheveu: Plowman JE, 2003, J. of Chromato. B, 787, 63-76
LE LSMBO C EST UN PEU UNE FOURMILIERE La reine Jean-Marc Strub Fabrice Bertile Hélène Diemer Jennifer Jund Danièle Thiersé (électrophorèse) Véronique Trimbour (secrétaire) Les soldats Alain Van Dorsselaer Agnès ovasse Nicolas Barthelemy Thierry Wasselin Sarah Sanglier Laetitia Fouillen Christine Schaeffer Cyril Colas Fabrice Varrier (informaticien) Chrystel Husser (électrophorèse) Les ouvrières Cédric Atmanene Les ouvrières qualifiées Sébastien allien Daniel Ayoub Audrey Bednarczyk uillaume Béchade Jean-Michel Saliou Véronique Delval
VENEZ NOUS VOIR SI Vous voulez faire de l analyse de protéines par masse? Vous voulez faire des gels 1D et 2D de protéines? Danièle Thiersé et Chrystel Husser pourront vous aider La séquence d une protéine purifiée? Séquençage d Edman Mesure de masse? MALDI-MS, C-MS, ESI-MS, LC-MS Venez voir Jean-Marc Strub et Christine Schaeffer
LE LSMBO VOUS REMERCIE POUR VOTRE ATTENTION