Conception assistée par ordinateur de molécules thérapeutiques D. Gilis Bioinformatique génomique et structurale Faculté des sciences appliquées Université Libre de Bruxelles
Objectif: illustrer en quoi les techniques de conception assistée par ordinateur, de modélisation, de simulation sont également applicables aux molécules et dans le domaine biomédical. En quoi certaines molécules permettent de guérir, en quoi ont-elles un rôle thérapeutique? interagissent, inhibent, activent certains processus biologiques. Quelques exemples péniciline azidothymidine (AZT) aspirine
Cibles de ces molécules: certaines protéines Les protéines sont formées par un agencement d acides aminés. Il y a 20 acides aminés naturels différents ( alphabet à 20 lettres) Il s agit donc d un polymère biologique, dont les briques sont des acides aminés: acide aminé1 acide aminé2 acide aminé3 acide aminé5 acide aminé6 Nombre d acides aminés: de ± 50 à plusieurs milliers, selon la protéine. acide aminé4 Particularité: une protéine adopte une structure tridimensionnelle, qui va lui conférer ses propriétés biologiques.
Séquence I C I I Structure 3D Fonction biologique: catalyse, régulation, transport,...
Le rôle des protéines est assez divers: catalyse de réactions biochimiques (enzymes)
transport de molécules ou ions (hémoglobine)
régulation du génome
les acides nucléiques (ADN, ARN) ADN ACTTGCATCATCGTATCGTTACATGTAG ARN: messager ACUUGCAUCAUCGUAUCGUUACAUGUAG Protéine I C I I
Pour concevoir un nouveau médicaments, l industrie pharmaceutique exploite diverses approches. Par exemple: isolation d un principe actif d une plante suivie d éventuelles modifications chimiques, génération des nouvelles molécules par des techniques combinatoires,... La modélisation in silico peut également aider à concevoir de nouvelles molécules, et à comprendre leur mode de fonctionnement. Illustration des techniques in silico: un antibiotique Mode d action d un antibiotique: empêcher une protéine vitale pour la bactérie de fonctionner correctement. Identifier une cible (protéine); Concevoir une molécule permettant d inhiber cette cible.
Identification d une cible On identifie un processus vital pour une bactérie; : réaction biochimique : les produits des réactions
Identification d une cible On identifie un processus vital pour une bactérie; On identifie une protéine associée à ce processus, et qui présente suffisamment de différences avec son équivalente (dans sa fonction) éventuellement rencontrée chez l Homme; : réaction biochimique : les produits des réactions
Identification d une cible On identifie un processus vital pour une bactérie; On identifie une protéine associée à ce processus, et qui présente suffisamment de différences avec son équivalente (dans sa fonction) éventuellement rencontrée chez l Homme; On recherche une molécule qui bloque le fonctionnement de cette protéine. : réaction biochimique : les produits des réactions
Identification d une cible Une cible possible: la dihydrofolate réductase (DHFR) Cet enzyme intervient dans le métabolisme du folate, qui est nécessaire à la division cellulaire. La DHFR est également présente chez l Homme (désavantage).
Identification d une cible Une cible possible: la dihydrofolate réductase (DHFR) Cet enzyme intervient dans le métabolisme du folate, qui est nécessaire à la division cellulaire. La DHFR est également présente chez l Homme (désavantage). Mais les DHFR humaines et de microorganismes présentent certaines différences.
Identification d une cible Une cible possible: la dihydrofolate réductase (DHFR) Cet enzyme intervient dans le métabolisme du folate, qui est nécessaire à la division cellulaire. La DHFR est également présente chez l Homme (désavantage). Mais les DHFR humaines et de microorganismes présentent certaines différences. Un antibiotique agissant sur la DHFR devrait donc présenter une spécificité suffisante pour celle de micro-organismes. La structure tridimensionnelle a été obtenue expérimentalement.
Identification d une cible Une cible possible: la dihydrofolate réductase (DHFR) Cet enzyme intervient dans le métabolisme du folate, qui est nécessaire à la division cellulaire. La DHFR est également présente chez l Homme (désavantage). Mais les DHFR humaines et de microorganismes présentent certaines différences. Un antibiotique agissant sur la DHFR devrait donc présenter une spécificité suffisante pour celle de micro-organismes. La structure tridimensionnelle a été obtenue expérimentalement. Son site actif est identifié
Après avoir identifié une cible, Identification d une molécule qui bloque le fonctionnement de la cible Plusieurs approches peuvent être combinées: Connaissant le site actif, on construit une molécule qui s y adaptera. On peut également simuler le positionnement d une molécule dans le site actif et évaluer la force de ses interactions avec la protéine. Le premier ingrédient d une méthode de simulation moléculaire est la fonction d énergie. Celle-ci permet d évaluer les interactions électrostatiques, les interactions de type pont hydrogène, les interactions de Van der Waals,...
Les fonctions d énergie On peut distinguer deux grandes classes de fonction d énergie Potentiels semiempiriques Potentiels dérivés d une base de données de protéines de séquences et de structures connues Potentiels semi-empiriques Ces potentiels correspondent à une expression analytique qui décrit les diverses interactions inter-atomiques. Leur forme générale est: E=Eliaison + Eangle + Etorsion + Enon-liés + Eautre
berg. 52 The function includes five terms: ž Ai j B / i j G G Ý vdw 12 6 i, j ri j ri j ž Ci j D / i j G Ý EŽ t. hbond 12 10 ri j ri j i, j q i q j G Ý elec Ž r. r G tor i, j N tor i j i j Ž. Ž r i 2 j 2 2. G Ý S V S V e Ž 1. sol i j j i i, j being calcu program th faces. Unfo in the val surface are surface tha in the com the pairwi et al. 58 : thi consistent w mulation u ligand, frag atoms are and then s volume aro where the five G terms on the right-hand side by protein Obtention des paramètres d une fonction d énergie semi-empirique: soit par are coefficients empirically determined using linear regression by the ato calcul de mécanique quantique, analysis soit from par optimisation a set of protein ligand empirique de manière atom à to g ce que les calculs complexes correspondent with known aux mesures binding constants, expérimentales. shown method ma in Table I. The summations are performed over all nents: buri pairs of ligand atoms, i, and protein atoms, j, in of apolar pr addition to all pairs of atoms in the ligand that are atoms in separated by three or more bonds. charged pr
Potentiels dérivés d une base de données Principe: dériver des paramètres énergétiques / des scores au départ de fréquences d observation d associations entre des éléments de séquence et de structure au sein d une base de données de protéines (ou de complexes protéine-ligand) dont on connaît les séquences et les structures. Base de données Eléments de séquence Base de données non biaisée, de structures de bonne qualité et assez grande.
Eléments de structures: paramètres permettant de décrire la structure des protéines: Distances entre acides aminés: peuvent se calculer entre atomes (description atomique) ou entre centre géométrique de la chaîne latérale,... Fréquence d association entre des paires d acides aminés et des domaines de distance. Exemple: nombre de fois qu on observera une paire A-G à une distance comprise entre 3,2 et 3,4 Å (nécessité de grouper les distances en domaines).
On relie ces fréquences d observation à un paramètre énergétique au travers de la relation de Boltzmann: ΔG= G(SC, ) G(S) = kt i,j log P(s P(s i i,c j ) )P(c j ) On peut travailler au niveau atomique: la protéine est alors représentée par tous ses atomes. On peut travailler à un niveau plus simplifié: la protéine est représentée par certains types d atomes ou par ses acides aminés.
Le deuxième ingrédient d une méthode de simulation moléculaire est l algorithme d exploration de l espace conformationnel. Il s agit d une méthode qui permet d explorer les conformations possibles afin de trouver celle d énergie minimum.
Plus précisément, on explore l espace des conformations en vue de trouver le minimum d énergie: Energy Structure correspondant au minimum
Méthodes d exploration de l espace conformationnel Les méthodes permettant d explorer l espace des conformations sont variées.! Eviter de rester coincé dans un minimum local! Quelques exemples: Méthode de Metropolis Monte Carlo Modification aléatoire de la conformation Evaluation du score de la nouvelle conformation Accepte la nouvelle conformation selon la condition: ε exp (-ΔE / kt) où ε est un nombre aléatoire compris entre 0 et 1 k est la constante de Boltzmann T est la température ΔE est la différence d énergie entre la conformation générée (E1) et la dernière conformation acceptée (E2)
Le facteur exp (-ΔE / kt) correspond au rapport du facteur de Boltzmann décrivant la probabilité d avoir les états d énergie E1 et E2 dans un ensemble canonique (mécanique statistique). Algorithme génétique Algorithme qui se base sur les règles de la génétique. Etape 1: création d une population de m solutions possibles, générées aléatoirement. Chaque membre de la population est codé par un vecteur. L énergie de chacun des membres est évaluée. Etape 2: création d une nouvelle population. Par exemple m/2 membres de la population parente sont sélectionés aléatoirement, avec un biais dépendant de leur énergie. Cette nouvelle population est soumise à des opérateurs: Recombinaison entre deux vecteur: ABCDEFGH MNOPQRST => ABCDQRST MNOPEFGH Mutation: modifie un élément du vecteur
Exemple complet: simulation du système cible dihydrofolate réductase antibiotique trimethoprim
Résultat de la simulation Succession des minima rencontrés en cours de simulation
Résultat de la simulation Bleu: solution finale de la simulation Vert: structure obtenue expérimentalement
Résultat de la simulation En changeant de méthode de simulation: Bleu: solution finale de la simulation Vert: structure obtenue expérimentalement
Conclusions Abordé les ingrédients de la simulation de systèmes biologiques, en relation avec le domaine biomédical. Approches complémentaires aux techniques expérimentales: simlations pour défricher, approches expérimentales sur les quelques solution retenues.