Application de la chimiométrie en recherche pharmaceutique Lionel Blanchet Analytical Chemistry / Chemometrics Radboud University Nijmegen This study/ work was performed (partly) within the framework of the Dutch Top Institute Pharma project D4-102.
Plan TI Pharma Organisation Partenaires Projets Exemples
Top Institute Pharma (description) Institut multidisciplinaire Objectif: développement pharmaceutique et/ou medical Projets trop important pour une entreprise seule Priority medecines définies par l Organisation Mondiale de la Santé (ex: malaria) 80 partenaires impliqués (moitié industrie)
Top Institute Pharma (financement) Partenariat public privé Moyens mis en œuvre Gouvernement Néerlandais 50 % Industrie (Financement) 19 % Industrie (Matériel) 19 % Universités Néerlandaises 24% Définissent les projets ET les applications
Top Institute Pharma en chiffres 4 ans d existence 48 projets: Maladies auto-immune Maladies cardiovasculaires Cancer Maladies infectieuses Maladies cérébrales Efficacité du processus de découverte pharmaceutique 600 chercheurs (plein temps) 130 publications par an 12 brevets
Première application : Recherche de biomarqueurs de la sclérose en plaques
Sclérose en plaques Maladie inflammatoire autoimmune Démyélinisation Conduction nerveuse réduite Principalement chez les jeunes adultes Plus commun chez les femmes (ratio 4:1) PAS DE DIAGNOSTIC DISPONIBLE
Diagnostic par IRM Multiples lésions cérébrales visibles Diagnostic tardif Difficile à établir: - Lesions se résorbent - Confusion avec tumeurs Objectif du projet : définir des bio-marqueurs de la sclérose en plaques dans le liquide céphalorachidien i.e. par ponction lombaire
Exemple de projet: détection de maladies cérébrales par analyse du liquide céphalorachidien (CSF) Barriere hémato-encéphalique Echange CSF - Sang CSF Blood C0 2 et 0 2 glucose et amino acides penicilline et acides organiques Ions potassium CSF Production Collecte Homme ~ 500 ml/jour 6-15 ml Rat ~ 5.5 ml/jour 20 μl Composition du liquide céphalorachidien reflète l état du système nerveux
Difficultés cliniques Collecte d échantillons humains en nombre Volontaires en bonne santé Etablir diagnostic Variabilité naturelle entre individus Facteurs influents
Modèle animal Expérience contrôlée reproduisant les symptômes de la sclérose chez le rongeur Experimental autoimmune encephalomyelitis (EAE) Progression des symptomes EAE Score neurologique (unité arbitraire) Paralysie du Bout de la queue Paralysie de la moitié du corps Rétablissement complet Jour 0 Injection Jour 10 Jour 14 Echantillonage de CSF Temps (j) Faire la différence entre inflammation et neuroinflammation
EAE Experimental design Typical Disease Progression of the EAE Neurological score (arbitrary unit) Paralysis of the tip of the tail Paralysis up to the limbs Complete recovery Day 0 Injection Day 10 Day 14 CSF sampling Time (days) Day 10 Day 14 Control Healthy Control Inflammation A C B D 15 rats per groups Total 90 samples EAE E F Experiment objective : distinguish disease (EAE) from inflammation
Instrumentation et mesures nanolc ESI Orbitrap Proteomics Chip MS GC-MS 1 H NMR Metabolomics UPLC-MS-MS Au total 150 000 mesures obtenues par échantillons
Complémentarité des méthodes Proteomics Metabolomics NMR 51 cmpds GC+NMR 36 cmpds Esi Orbitrap 8000 proteins Chip + ESI 2000 prot Chip MS 3000 proteins LC+NMR GC+LC+NMR 16 cmpds 16 cmpds GC+LC 16 cmpds LC-MS/MS 20 cmpds GC-MS 106 cmpds 308 composé Enorme quantité d information Validation inter plateformes Pb: pas de marqueur univarié Besoin de la chimiométrie
Analyse exploratoire (par plateforme) Metabolomics : score plot 80 60 40 1 2 3 Analyse en composantes principales (ACP) = directions maximisant la variance expliquée PC2-->11.7% 20 0-20 Contrôle + Inflammation Chaque point = 1 animal Axes = 1ere et 2nde direction de l ACP -40-60 EAE -80-150 -100-50 0 50 100 150 PC1--> 31.2%
Visualization, Clustering and Classification Analyse supervisée 0.4 0.2 LV1 PC1 ACP: explique un maximum de variance X 2 0-0.2-0.4 Analyse supervisée : explique maximum de variance en relation avec information extérieure 0.5 0 X 1-0.5-1 -0.5 0 X 3 0.5 1 nécessaire d entrainer l algorithme (puis de valider le modèle)
ecva extended Canonical Variates Analysis Méthode basée sur Fisher LDA Direction w maximisant le ratio de covariances: Pb 2 classes w's w's between within w w Maximiser Minimiser S between S within Separation optimale des groupes
ecva extended Canonical Variates Analysis Méthode basée sur Fisher LDA Direction w maximisant le ratio de covariances: Problème de valeurs propres: S between w = λs w's w's within w between within w w Problème à 2 classes : ( x1 x2)( x1 x2 )' w = λs within w Régression PLS : ( 2 x 1 x ) k = λs within w y = Rb ecva compresse chaque data set en 5 variables latentes (6 groupes -1) orgaard et al. J. Chemometr. 20 (2006) 425-435
Résultats 0.8 Analyse multivariée (fusion de toutes les plateformes) 0.6 0.4 Contrôle + Inflammation PC 2 (13.4726 %) 0.2 0-0.2-0.4-0.6-0.8 EAE jour 14 EAE jour 10 Control 10 Control 14 Inflam 10 Inflam 14 Disease 10 Disease 14 Test control 10 Test control 14 Test inflam 10 Test inflam 14 Test disease 10 Test disease 14-1 -2-1.5-1 -0.5 0 0.5 1 PC 1 (44.4428 %) Séparation des groupes d intérêt
Résultats 0.8 Modèle et test (fusion de toutes les plateformes) 0.6 0.4 Healthy + Inflammation controls Tests PC 2 (13.4726 %) 0.2 0-0.2-0.4-0.6-0.8 EAE day 14 EAE day 10 Control 10 Control 14 Inflam 10 Inflam 14 Disease 10 Disease 14 Test control 10 Test control 14 Test inflam 10 Test inflam 14 Test disease 10 Test disease 14-1 -2-1.5-1 -0.5 0 0.5 1 PC 1 (44.4428 %) Test correctement prédit (pas de surentrainement du modèle)
Résultats PC 2 (13.5261 %) 0.8 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8-1 biplot on fused data Biplot sur modèle complet Complement C3 Lysine ( UPLC MS MS) Lysine ( NMR) 335 365 235 211 201 388 469 431 345 141 309 246 405 138 203 361 292 60 459 284 438 215336 480 194 471 229 493 202-1.5 295 126 347 382 486 207 427 404 303 390 307 73 190 236 245 259 356 266 269 352 383 183 240 248253 319 274 145 191 174 125 176 195 100 212 154 155416 485 467 181 179 184157 185 197 102 101 163 178 254 466 407 234 391 489 497 318 209 389 103 409 316 487 426 324 68 291 225 346 298 440 481 341 367 116 219 387 282 496 475 313 200 395 370 198 380 205 247 208451 476 470 196 401258 495213 463 392 443-1.5-1 -0.5 0 0.5 PC 1 (43.1844 %) 442 Citrulline 222 Haptoglobin Control 1 10 Control 2 14 Inflam 3 10 4 Inflam 14 5 Disease 10 6 Disease 14 230 Neuronal cell adhesion molecule Inter-alpha-trypsin inhibitor Quelles variables (metabolites ou proteines) sont responsables de la separation des groupes?
Conclusions Possible d analyser de large quantités de données biologiques Possible et recommandé d utiliser simultanément plusieurs instrumentations Point de vue biologique: possible de prédire le début des symptômes Etude du mécanisme de la maladie
Problèmes ouverts Intégration de connaissance (et validation) System biology Simplification des modèles Validation sur de larges quantités d échantillons (collecte) Compensation de la variabilité biologique (humain)
Acknowledgements