QSAR 3D
Plan 1. Introduction 2. Vue d'ensemble de la méthode 3. CoMFA 3.1. Etapes clés 3.2. Recherche conformationnelle 3.3. Superposition de structures 3.4. Calcul des propriétés 3.5. Corrélations et analyses statistiques 3.6. Interprétations 4. CoMSIA 4.1. Définition 4.2. Calculs des indices 5. Exemple 6. Applications Limites
1. Introduction Contexte : - Le QSAR 2D est limité: - besoin de beaucoup de composés - interprétation des descripteurs difficiles - Besoin de prendre en compte la vraie information 3D des molécules - Besoin de comparer des composés quelquefois très différents QSAR 3D Plusieurs méthodes de QSAR-3D, mais principalement CoMFA (Comparative Molecular Fields Analysis) et CoMSIA (Comparative Molecular Similarity Analysis).
2. Vue d'ensemble de la méthode Point de départ: Au moins 20 molécules avec activités bien déterminées.
2. Vue d'ensemble de la méthode Les molécules sont toutes modélisées et alignées les unes sur les autres
2. Vue d'ensemble de la méthode Une grille est créée et un atome sonde est placé en chaque nœud de la grille. On calcule l'énergie électrostatique et de vdw pour chaque molécules. Chaque point (nœuds) sert pour la détermination de l équation du QSAR. Atome sonde
2. Vue d'ensemble de la méthode On visualise les zones 3D où l activité varie : En rouge un groupement électronégatif est souhaité En bleu un groupement électropositif est souhaité En vert un groupement peu encombrant est souhaité En jaune un groupement encombrant est souhaité
3. CoMFA 3.1. Etapes clés Besoin de structures 3D Recherche conformationnelle? Positionnement des molécules dans la grille Alignement? Calcul des propriétés Méthode? Corrélation Quelle méthode? Validation Statistique?
3. CoMFA
3. CoMFA 3.2. Recherche conformationnelle Systematic Search Tous les angles de torsions varient de 0 à 360 de façon systématique. Efficace mais très long voir impossible à mettre en œuvre si trop d angles Grid Search La même chose mais ici les angles ne varient qu entres certaines valeurs imposées par l utilisateur (exemple : 60 à 180 ). Pour être exhaustif il faut être large et on retrouve les mêmes problèmes que le systematic search Random Search Les angles varient de façon aléatoire. Rapide. L efficacité dépend uniquement du nombre d essai GA Search Recherche via un algorithme génétique. Rapide. Il faut contrôler les paramètres de l algo génétique
3. CoMFA 3.2. Recherche conformationnelle Recherche systématique: Tous les angles de torsions varient de 0 à 360. Un ensemble de conformations est généré. On sélectionne alors l'énergie la plus basse. Méthode exhaustive : mais 6 angles de 0 à 360 par pas de 10 36x36x36x36x36x36 = 2 176 782 336
CoMFA 3.3. Superposition de structure Le CoMFA est très sensible à l'alignement structural. C'est son talon d'achille. 3 types d alignements possibles Pharmacophore Il faut avoir déterminé un pharmacophore Docking Il faut la structure 3D de la macromolécule cible MCSS Il faut des molécules peu dissemblable
CoMFA 3.3. Superposition de structure 1. Superposition par pharmacophore: Pharmacophore : schéma stéréoélectronique moléculaire conduisant à un mécanisme d'action précis
CoMFA 3.3. Superposition de structure Alignement (superposition) par pharmacophore Avantages Permet de rechercher la conformation biologiquement active (à l aide du pharmacophore) dans la recherche conformationnelle. On peut mixer des molécules dont le squelette est éloigné. Inconvénient Il faut trouver le pharmacophore! Attention à ne pas prendre des molécules trop différentes (mode d action identique?) La précision du pharmacophore est souvent limitante pour l alignement.
CoMFA
CoMFA 3.3. Superposition de structure MCSS : Maximum Common Sub-Structure On cherche et on aligne les molécules selon un squelette commun Ne permet pas de savoir quelle conformation prendre (la plus stable?). On ne peut mixer des composés trop différents. Difficulté à trouver le squelette commun optimum.
CoMFA 3.3. Superposition de structure MCSS : pourquoi? Agoniste de la dopamine (anti-parkinson)
CoMFA 3.3. Superposition de structure MCSS : pourquoi? Antagoniste de HMG-CoA (anticholesterol)
3.4. Calcul des propriétés CoMFA Types de sondes Sp3 C+ Sp2 O- Sp3 N+ H+ Ca 2+ La sonde est généralement un carbocation. Atome sonde
CoMFA 3.4. Calcul des propriétés n E C = q i q j i=1 n E VDW = i=1 Dr ij A ij r ij 12 B ij r ij 6 Calcul E elec et E vdw classique Il faut une valeur cut-off pour ne pas prendre en compte (et mesurer) des données trop importantes +/- 30. E elec donne le champ électrostatique. E vdw donne le champ stérique
CoMFA 3.5. Corrélations et analyses statistiques On est dans un problème de QSAR classique pour la prise en compte de l'activité biologique. On ne peut pas corréler directement une concentration : il faut prendre le logarithme de la concentration. Il faut prendre : Des données biologiques provenant d une même série d expériences (les tests biologiques peuvent varier énormément). Des données chiffrées!!! (IC50 > 10 µm ne veut rien dire en QSAR) Prendre en compte la précision (si elle a été déterminée) avant de conclure trop rapidement sur une étude COMFA.
CoMFA 3.5. Corrélations et analyses statistiques
CoMFA 3.5. Corrélations et analyses statistiques Une analyse statistique est nécessaire pour valider la corrélation 3D- QSAR. Première étape : validation croisée Méthode LOO (Leave One Out) un composé sort du lot. La corrélation est faite sans ce composé et on regarde s il s éloigne du modèle obtenu. On réitère l'opération pour chaque composé. On obtient un paramètre q² Si q² > 0.3 on a une corrélation statistiquement parlante q 2 =1.0 Y Y Y PREDI Y EXPER 2 Y EXPER Y MOYEN 2
CoMFA 3.5. Corrélations et analyses statistiques Deuxième étape : régression linéaire On mesure le coefficient de corrélation r². Il doit être le plus proche de 1. Troisième étape : test On teste notre modèle sur des molécules dont on connaît l activité biologique. On calcule l écart à la réalité. Généralement la proportion de molécules pour l'apprentissage et le test est de 5/1
CoMFA 3.5. Corrélations et analyses statistiques 9 8,5 2 R pred = SD PRESS SD pic50 predicted 8 7,5 7 6,5 6 5,5 Ntest SD= Y exp i Y train 2 i Ntest PRESS= Y exp predict i Y 2 i i 5 4,5 2 R pred 0.3 4 4 4,5 5 5,5 6 6,5 7 7,5 8 8,5 9 pic50 experimental
CoMFA 3.6. Interprétations L analyse des composés permet de donner de nouvelles pistes de recherche.
CoMFA 3.6. Interprétations Un modèle COMFA peut être quelquefois interprété comme le négatif du site d interaction de la macromolécule.
CoMSIA 4.1. Définition CoMSIA: Comparative Molecular Similarity Analysis CoMSIA est très proche de CoMFA, c'est une extension de cette méthode Prinicpales différences: - Plus de descripteurs: Electrostatique Stérique Hydrophobique Donneur de liaison H Accepteur de liaison H - Calcul d'indices à la place d'énergie
CoMSIA 4.2. Calculs des indices: L'idée est d'adoucir les champs de type CoMFA par une fonction gaussienne. A q = f,k i e r 2 ij probe,k i,k A est la valeur de l'indice au point de grille q. i est l'index qui permet de faire la somme de tous les atomes de la molécule j qui est concernée par le calcul. ωi,k est la valeur de la propriétée physicochimique k pour l'atome i. ωprobe,k est la valeur de l'atome sonde pour la propriété k. α est un facteur d'atténuation (0,3) Atome sonde: Charge +1// Rayon de vdw 1A // Hydrophocité +1 // Donneur de liaison H // Accepteur de liaison H
CoMSIA 4.2. Calculs des indices:
Exemple Structure de DAPY avec RT accessible par RX. Utilisation de la structure RX de DAPY pour construire les ligands et garder la conformation "bioactive". Alignement selon la méthode MCSS
Exemple Application de la méthode CoMFA et la méthode CoMSIA avec recherche de la meilleure combinaison de descripteurs. CoMFA: q² = 0,597 et R² = 0,948 // CoMSIA (SEDA) q² = 0,738 et R² = 0,988
Exemple Electrostatique: le noyau aromatique doit être plus électropositive pour favoriser le stacking avec la tyrosine 181 de la RT Hbond donor favorable violet, correspond aux liasons H de l'enzyme
Applications & limites Le CoMFA et le CoMSIA, comme toutes les méthodes 3D-QSAR, font parties des (les?) meilleures méthodes pour le drug-design Avantages par rapport au QSAR 2D Véritables QSAR 3D, on peut visualiser les zones des ligands impliquées dans l'activité biologique. Analyses des ligands entier plutôt que des sous-structures. Souvent la méthode ultime de corrélation Défauts du CoMFA/CoMSIA Pas d'équation directe avec les propriétés comme dans QSAR-2D. Pas de prise en compte de l hydrophobie (sauf CoMSIA) Il faut spécifier l alignement initial de la molécule. Échoue souvent si quelques molécules sont très différentes. On peut difficilement comparer deux études COMFA.
FIN