Le package XCMS pour l analyse de profils de chromatographie liquide spectrométrie de masse



Documents pareils
Protéomique Séance 1 Introduction aux données de protéomique et aux outils de recherche

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

MYCOTOXINES : changements règlementaires et analytiques

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Thermo Scientific Training Courses. La clé de la réussite pour votre laboratoire. Catalogue Formations 2015 France

Mass Spec/tacular. performance, productivité et fiabilité. Systèmes CPL/SM Agilent série Our measure is your success.

Thermo Scientific Training Courses. La clé de la réussite pour votre laboratoire. Catalogue Formations 2015 Suisse

TECHNIQUES: Principes de la chromatographie

A N A L Y S E U R E N L I G N E D A G V D E S B I C A R B O N A T E S D E L A L C A L I N I T E

Environmental Research and Innovation ( ERIN )

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

THEME 2. LE SPORT CHAP 1. MESURER LA MATIERE: LA MOLE

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

1. Laboratoire National de métrologie et d Essais (LNE) 1rue Gaston Boissier Paris Cedex sebastien.sannac@lne.fr

SVE 222 & PCL-442. Fascicule de Travaux Pratiques

Présentation des outils du laboratoire: les techniques chromatographiques

EMME : un environnement de gestion des métadonnées expérimentales

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Projet ARMED Assessment and Risk Management of MEdical Devices in plasticized polyvinylchloride

Résonance Magnétique Nucléaire : RMN

LA MESURE DE MASSE POUR LA DÉTERMINATION DE PÉRIODES RADIOACTIVES

Programme consultant expert (PCE)

EXERCICE II. SYNTHÈSE D UN ANESTHÉSIQUE : LA BENZOCAÏNE (9 points)

RÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

1: généralités; 2: l évaluation par l opérateur; 3: l analyse d image; 4: la densitométrie en absorbance et en fluorescence; 5: la conclusion.

Fiche 19 La couleur des haricots verts et cuisson

3: Clonage d un gène dans un plasmide

Partie Observer : Ondes et matière CHAP 04-ACT/DOC Analyse spectrale : Spectroscopies IR et RMN

Laboratoire Eau de Paris. Analyses et Recherche

BREVET D ÉTUDES PROFESSIONNELLES AGRICOLES SUJET

Compléments - Chapitre 5 Spectroscopie

DÉFICITS IMMUNITAIRE COMMUN VARIABLE

de l air pour nos enfants!

Laboratoire de Photophysique et de Photochimie Supra- et Macromoléculaires (UMR 8531)

Structure quantique cohérente et incohérente de l eau liquide

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

ANALYSE SPECTRALE. monochromateur

Introduction aux bases de données: application en biologie

Chapitre 02. La lumière des étoiles. Exercices :

Mesure agnostique de la qualité des images.

SYLLABUS MASTER. Mention BIOCHIMIE BIOTECHNOLOGIES

4. Conditionnement et conservation de l échantillon

MABioVis. Bio-informatique et la

! analyse du fonctionnement

Biomarqueurs en Cancérologie

Analyse des données de séquençage massif par des méthodes phylogénétiques

Critères pour les méthodes de quantification des résidus potentiellement allergéniques de protéines de collage dans le vin (OIV-Oeno )

Big data et sciences du Vivant L'exemple du séquençage haut débit

Physiopathologie : de la Molécule à l'homme

PLAN DE COURS. Reconnaître le rôle des mathématiques ou de l informatique dans la société contemporaine (0011)

Liste des projets retenus en 2009

ANNEXES AU REGLEMENT N 06/2010/CM/UEMOA

Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE

Eco-système calcul et données

Conception de Médicament

101 Adoptée : 12 mai 1981

Concept Paper: Quantification de Protéines Spécifiques par SRM/MRM Perspectives d Application et Limitations Actuelles

PLATE-FORME DE MICROSCOPIE ÉLECTRONIQUE À TRANSMISSION

Analyse & Medical. Electrovannes miniatures

(Page de garde) ~ I ~

Science et technique. La température et la durée de stockage sont des facteurs déterminants. Viande bovine et micro-organisme pathogène

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Evaluation de la typicité des vins liés au terroir : proposition de méthodes pour les professionnels de la filière

! Séquence et structure des macromolécules. " Séquences protéiques (UniProt) " Séquences nucléotidiques (EMBL / ENA, Genbank, DDBJ)

TD-SEC MODE OPÉRATOIRE

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

PRESENTATION GROUPE LHP

AGREGATION DE BIOCHIMIE GENIE BIOLOGIQUE

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Centre Universitaire LA CITADELLE 220, avenue de l Université B.P DUNKERQUE CEDEX 1 GUIDE DES ETUDES LICENCE PROFESSIONNELLE

Suivi d une réaction lente par chromatographie

Traits fonctionnels : concepts et caractérisation exemples des prairies Marie-Laure Navas, Eric Garnier, Cyrille Violle, Equipe ECOPAR

OUTILS DE FINANCEMENT DE L INNOVATION TECHNOLOGIQUE ET DE LA VALORISATION DE LA RECHERCHE

TerrOïko : JEU en collaboration avec la SEEM

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

TP N 3 La composition chimique du vivant

EP A1 (19) (11) EP A1 (12) DEMANDE DE BREVET EUROPEEN. (43) Date de publication: Bulletin 2009/25

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Rôle des acides biliaires dans la régulation de l homéostasie du glucose : implication de FXR dans la cellule bêta-pancréatique

Consensus SFTA Novembre Soumission chimique : Prise en charge toxicologique

TS 31 ATTAQUE DE FOURMIS!

Production d une protéine recombinante

AGRÉGATION DE SCIENCES DE LA VIE - SCIENCES DE LA TERRE ET DE L UNIVERS

chromatographie en phase liquide.

La classification automatique de données quantitatives

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

RAPPORT DE TEST DE CONFINEMENT SELON BS

Réunion des DU de Biogenouest 19 mars 2014

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

K W = [H 3 O + ] [OH - ] = = K a K b à 25 C. [H 3 O + ] = [OH - ] = 10-7 M Solution neutre. [H 3 O + ] > [OH - ] Solution acide

BACTÉRIE PARTICULE D ARGENT

Gènes Diffusion - EPIC 2010

Travaux pratiques avec RapidMiner

EXCEL et base de données

Quelques éléments de bibliographie :

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Transcription:

JOURNÉE R Vendredi 24 mai 2013 Le package XCMS pour l analyse de profils de chromatographie liquide spectrométrie de masse Séverine ZIRAH (szirah@mnhn.fr) Muséum National d Histoire Naturelle, Département RDDM UMR 7245 CNRS -MNHN Molécules de communication et adaptation des micro-organismes (MCAM)

Couplage chromatographie liquide spectrométrie de masse (LC-MS) 1 Source Analyseur Détecteur vide poussé 10-5 -10-7 mbar Spectromètre de masse Abondance m/z

Couplage chromatographie liquide spectrométrie de masse (LC-MS) 1 Source Analyseur Détecteur vide poussé 10-5 -10-7 mbar Chromatographie liquide haute performance (HPLC) Spectromètre de masse

Couplage chromatographie liquide spectrométrie de masse (LC-MS) 1 Source Analyseur Détecteur vide poussé 10-5 -10-7 mbar Chromatographie liquide haute performance (HPLC) Spectromètre de masse

Couplage chromatographie liquide spectrométrie de masse (LC-MS) 1 Source Analyseur Détecteur vide poussé 10-5 -10-7 mbar Chromatographie liquide haute performance (HPLC) Spectromètre de masse

Comparaison de profils LC-MS 2 Profil des sels biliaires après incubation avec un surnageant bactérien Bile + milieu de culture Interaction entre Giardia lamblia et Lactobacillus johnsonii Collaboration Marie-Agnès Travers, CisséSow, Isabelle Florent, Philippe Grellier Bile + surnageant surnageant Lactobacillus johnsonii LA1 Giardia lamblia

Comparaison de profils LC-MS 2 Profil des sels biliaires après incubation avec un surnageant bactérien Bile + milieu de culture Interaction entre Giardia lamblia et Lactobacillus johnsonii Collaboration Marie-Agnès Travers, CisséSow, Isabelle Florent, Philippe Grellier Bile + surnageant surnageant Lactobacillus johnsonii LA1 Giardia lamblia ADC : Acide déoxycholique R=H [M-H] - : m/z391,2 AC : Acide cholique R=OH [M-H] - : m/z407,2

Comparaison de profils LC-MS pour la métabolomique METABOLOMIQUE Mesure quantitative de l ensemble des métabolites dans un système cellulaire sous des conditions données ceux qui sont détectables avec les méthodes analytiques utilisées. génome régulation des gènes TRANSCRIPTOMIQUE ENVIRONNEMENT PROTÉOMIQUE expression des protéines métabolisme MÉTABOLOMIQUE 3

Comparaison de profils LC-MS pour la métabolomique (2) Analyses LC-MS (1) Préparation des échantillons (3) Traitement des données (4) Analyse statistique name fold tstat pvalue mzmed rtmed npeaks Groupe1 Groupe2 Ech1 Ech2 Ech3 1 M268T234 3.424489552 4.834454003 2.04E-05 268.10 233.95 20 1 19 152.63 160.65 549.13 2 M532T1458 1.908698484-3.976496454 0.001110454 532.16 1457.87 24 12 12 452.10 195.04 481.12 3 M284T1624 1.968937295-4.016948562 0.001119564 284.21 1624.32 37 12 24 1261.31 841.17 1460.25 4 M641T2099 2.492096758-3.854338971 0.001872463 641.19 2098.51 45 12 33 2665.65 736.15 3005.83 Gr 1 Gr 2 (5) Identification des composés d intérêt biomarqueurs Recherche dans des bases de données Comparaison avec un standard Time, min Expériences MS/MS Isolement et caractérisation par d autres méthodes analytiques (RMN, IR..) 4

Exigences pour l analyses de données LC-MS n analyses LC-MS Matrice de données n k Chaque échantillon est caractérisé par le même nombre de variables Chacune de ces variables est représentée sur l ensemble des individus Une variable d un échantillon a la même signification biologique (représente le même métabolite) pour tous les autres échantillons Capacité de prédiction Somme sur le temps de rétention Alignement // Décomposition en fenêtres de temps 5

Le package xcms pour l analyse de données LC-MS et GC-MS n analyses LC-MS n individus répartis en 2 groupes Matrice des k pics (tr, m/z) avec les intensités pour chaque individu Analyse statistique Proposition de «biomarqueurs» Smith et al., Anal. Chem. 78: 779-787 (2006) 6

Le package xcms pour l analyse de données LC-MS et GC-MS Smith et al., Anal. Chem. 78: 779-787 (2006) 7

xcms: (1) détection des pics Smith et al., Anal. Chem. 78: 779-787 (2006) 8

xcms: (2) correspondance des pics entre échantillons Smith et al., Anal. Chem. 78: 779-787 (2006) 9

xcms: (3) correction des temps de rétention Smith et al., Anal. Chem. 78: 779-787 (2006) 10

xcms: (4) remplissage des données de pics manquantes Smith et al., Anal. Chem. 78: 779-787 (2006) 11

xcms: (5) analyse statistique : test t univariépour chaque pic 12 name fold tstat pvalue mzmed rtmed npeaks Groupe1 Groupe2 Ech1 Ech2 Ech3 1 M268T234 3.42 4.83 2.04E-05 268.10 233.95 20 1 19 152.63 160.65 549.13 2 M532T1458 1.91-3.98 0.00111045 532.16 1457.87 24 12 12 452.10 195.04 481.12 3 M284T1624 1.97-4.02 0.00111956 284.21 1624.32 37 12 24 1261.31 841.17 1460.25 4 M641T2099 2.49-3.85 0.00187246 641.19 2098.51 45 12 33 2665.65 736.15 3005.83 5 M639T2099 2.56-3.83 0.00192063 639.18 2098.62 45 12 33 31828.55 7503.64 34338.54 6 M640T2099 2.56-3.80 0.00205874 640.19 2098.52 45 12 33 10205.49 2502.55 11341.15 xcms: (6) visualisation des pics d intérêt Gr 1 Gr 2 Groupe1 Groupe2

Exemple : La cécidomyie du buis / Collaboration Michel Baylac Profil d extraits de feuilles buis attaqués ou non par des cécidomyies NA-1 NA-2 A-1 Conversion en format universel : NetCDF Répartition des fichiers NetCDF en dossiers par groupe Attaque Non attaque 13

xcms: Code R 14 cdffiles<-list.files(mydatadir,recursive=true,full.names=true) xset <- xcmsset(cdffiles) xset <- group(xset) xset2 <- retcor(xset,family="symmetric",plottype="mdevden") xset2 <- group(xset2) xset3 <- fillpeaks(xset2) reporttab <- diffreport(xset3, Attaque", Non attaque","example", 10, metlin = 0.15)

Choix de la gamme de temps de rétention 15 1 er échantillon de la série 3 (en rouge) et même échantillon lancé après les 86 runsde la série 3 (en noir) idx<-which(xset@peaks[,"rt"] < 3000) head(idx) xset@peaks<-xset@peaks[idx,]

Contenu de «diffreport» 16 name fold tstat pvalue mzmed rtmed npeaks Attaque Non attaque Ech1 Ech2 Ech3 1 M268T234 3.42 4.83 2.04E-05 268.10 233.95 20 1 19 152.63 160.65 549.13 2 M532T1458 1.91-3.98 0.00111045 532.16 1457.87 24 12 12 452.10 195.04 481.12 3 M284T1624 1.97-4.02 0.00111956 284.21 1624.32 37 12 24 1261.31 841.17 1460.25 4 M641T2099 2.49-3.85 0.00187246 641.19 2098.51 45 12 33 2665.65 736.15 3005.83 5 M639T2099 2.56-3.83 0.00192063 639.18 2098.62 45 12 33 31828.55 7503.64 34338.54 6 M640T2099 2.56-3.80 0.00205874 640.19 2098.52 45 12 33 10205.49 2502.55 11341.15

ACP à partir de la matrice des pics 17

xcms Metlin 18 http://metlin.scripps.edu/ Scripps Center for Metabolomics and Mass Spectrometry

Autres packages dérivés de xcms Version «online» xcms2: analyse de spectres de fragmentation (MS/MS) interrogation de bases de données. metaxcms: comparaison de plus de deux classes d individus. Autres packages pour l analyse métabolomique CAMERA et Astream: annotation de données métabolomiques LC-MS. http://link.springer.com/content/pdf/10.1007%2f978-3-540-71233-6_29.pdf Alonso et al, Bioinformatics 27:1339-40 (2011) Metabonomic: traitement des données + analyses multivariées(pcs, LDA, PLS ). Izquierdo-Garcíaet al,,bmc Bioinformatics 10: 363 (2009) MetabolAnalyze: analyses multivariées(ppca, PPCCA, MPPCA). Nyamundanda, G., Gormley, I.C. and Brennan, L. Probabilistic principal components analysis for metabolomic data. Technical Report. University College Dublin (2010) Metabolomics: fonctions graphiques : dendrogrammes, matrices de contrastes http://cran.r-project.org/web/packages/metabolomics/metabolomics.pdf(avril 2013) Metab: pré-traitement de données GC-MS. Agio et al, Bioinformatics 27:2316-8 (2011) 19

Bases de données Metlin metabolite Database (Données MS) http://metlin.scripps.edu/ ChemSpider (Données MS) Human Metabolome Database KNApSAcK (Métabolites de plantes) http://www.chemspider.com http://www.hmdb.ca/ http://prime.psc.riken.jp/?action=metabolites_index BioMeta Database (Voies métaboliques) http://biometa.cmbi.ru.nl/ BiGG(Biochemically, Genetically and Genomicallymetabolic network reconstructions) http://bigg.ucsd.edu/main.pl Biocyc (Collection de voies métaboliques/génomes) http://biocyc.org/ Ecocyc (Gènes et Métabolisme de Escherichia coli K-12) http://www.ecocyc.org/ Metacyc (Voies métaboliques) http://www.metacyc.org/ 20

Profils LC-MS pour la métabolomique GENOME REGULATION DES GENES Transcriptomique EXPRESSION DES PROTEINES ENVIRONNEMENT METABOLISME Métabolomique HO O O O H N OH O OH O Acide hippurique OH OH Acide citrique Protéomique