Dynamique des protéines, simulation moléculaire et physique statistique Gerald R. Kneller kneller@llb.saclay.cea.fr, kneller@cnrs-orleans.fr Université d Orléans Laboratoire Léon Brillouin, CEA Saclay Centre de Biophysique Moléculaire,CNRS PPF Orléans / Tours 20/01/2004 p.1/44
Intérêts de l équipe Etude et modélisation de la relation dynamique-fonction des protéines Développement d algorithmes de simulation (MD) Développement de logiciels pour la simulation moléculaire et leur analyse Spectroscopie neutronique, et autres techniques spectroscopiques (FCS, RMN,...) PPF Orléans / Tours 20/01/2004 p.2/44
Méthodes Simulations de dynamique moléculaire, calcul de modes normaux Traitement numérique du signal Spectroscopie neutronique (+ FCS + RMN) Physique statistique hors équilibre PPF Orléans / Tours 20/01/2004 p.3/44
Thématique actuelle Dynamique d une protéine sous pression - Thèse terminée sur la dynamique du lysozyme sous pression (V. Hamon, CBM Orléans) - Dynamique interne de protéines mésophiles et barophiles/-phobes sous l influence de la pression - recherche d une différence systématique (P. Calligari, LLB/ILL Grenoble) Développement d une plate-forme de simulation à l Institut Laue-Langevin PPF Orléans / Tours 20/01/2004 p.4/44
Thématiques à l horizon Dynamique lente et fonction des protéines - Etude par spectroscopie FCS / microscopie confocale (SOLEIL) - Développement de nouvelles méthodes stochastiques et quantiques de simulation (avec F. James, P.E. Jabin). Physico-chimie de la cellule - Transport de particules virales - Polymérisation dans le cytosquelette Phase exploratoire avec l Institut Pasteur PPF Orléans / Tours 20/01/2004 p.5/44
Simulation MD PPF Orléans / Tours 20/01/2004 p.6/44
MD classique Equations de Newton m α ẍ α = F α, α=1,...,n. Forces et potentiel / champ de force F α = U(x 1,...,x N ) x α Chaque atome est une masse ponctuelle Potentiel effectif pas d électrons explicits Dynamique newtonienne des atomes PPF Orléans / Tours 20/01/2004 p.7/44
Conditions périodiques PPF Orléans / Tours 20/01/2004 p.8/44
Condition de "images minimale" PPF Orléans / Tours 20/01/2004 p.9/44
Lyszoyme A gauche : Représentation atomique. A droite : squelette. PPF Orléans / Tours 20/01/2004 p.10/44
Chaînes polypeptidiques PPF Orléans / Tours 20/01/2004 p.11/44
Champ de force (AMBER 94) U = + + liaisons αβ angles αβγ ( k αβ r αβ r (0) αβ ) 2 ( ) 2 k αβγ φ αβγ φ (0) αβγ k αβγδ cos (n αβγδ θ αβγδ δ αβγδ ) dihèdres αβγδ + paires αβ 4ǫ αβ + paires αβ q α q β 4πǫ 0 r αβ ( [σαβ r αβ ] 12 [ σαβ r αβ ] 6 ) nonliées PPF Orléans / Tours 20/01/2004 p.12/44
Discrétisation Vitesse et accélération ẋ α x α(n +1) x α (n 1), 2 t ẍ α x α(n +1) 2x α (n)+x α (n 1). t 2 Algorithme de Verlet x α (n +1)=2x α (n) x α (n 1) + t2 m α F α (n). PPF Orléans / Tours 20/01/2004 p.13/44
Caractéristiques du calcul numérique Nombre d atomes N 2 10 4 10 5 Nombre d interactions N 2 (interactions non-liées) Nombre de pas d intégration 10 6 10 7 Adapté pour calcul parallèle : - décomposition en domaines - ou décomposition en sous-ensmbles fixes - en tout cas : communication forte PPF Orléans / Tours 20/01/2004 p.14/44
Echelles Echelle spatiale : 0.1nm 10nm Echelle de temps : 0.1ps 10ns Comparables aux échelles accessibles par diffusion de neutrons thermiques Comparaison facilitée par l interaction directe des neutrons avec des noyaux atomiques = objets simulés PPF Orléans / Tours 20/01/2004 p.15/44
Diffusion de neutrons PPF Orléans / Tours 20/01/2004 p.16/44
Expérience schématique k q θ k 0 k d²σ dωdω k 0 θ detectors sample PPF Orléans / Tours 20/01/2004 p.17/44
Section efficace différentielle Ici d 2 σ dωdω = k k 0 S(q,ω) q = k 0 k, ω= E 0 E sont les transferts de quantité de mouvement et de l énergie, respectivement, et S(q,ω) est le facteur de structure dynamique. PPF Orléans / Tours 20/01/2004 p.18/44
Facteur de structure dynamique S(q,ω) = 1 2π φ(q,t) = α,β + dt exp( iωt)φ(q,t), b α b β e iqt R β (t) e iqt R α (0). b α b β = moyenne sur isotopes et orientations relatives entre le spin du neutron et celui de l atome cible. φ(q,t) est la fonction intermédiaire de diffusion. PPF Orléans / Tours 20/01/2004 p.19/44
Spectre neutronique S(q,ω) elastic quasielastic inelastic -3.0-2.0-1.0 0.0 1.0 2.0 3.0 ω = energy transfer PPF Orléans / Tours 20/01/2004 p.20/44
Analyse des simulations PPF Orléans / Tours 20/01/2004 p.21/44
Analyses simples Fonction de corrélation variables continues 1 c AB (t) = lim T T T/2 T/2 dτ A(τ + t)b (τ). Fonction de corrélation variables discrètes c AB (n)= 1 N t n N t n 1 k=0 A(k + n)b (k). Utilisation intensive de FFT. PPF Orléans / Tours 20/01/2004 p.22/44
Analyses sophistiquées Modélisation d une trajectoire MD par un processus stochastique autoregressif de l ordre P, u(t)= P n=1 a (P) n u(t n t)+ǫ P (t). ǫ P (t) est un bruit blanc de l amplitude σ P. Les coefficients {a (P) n,σ P } sont ajustés aux données (algorithme de Burg). PPF Orléans / Tours 20/01/2004 p.23/44
Modèle semi-analytique Modèle analytique dans le plan complexe : U(z)= + n= u(n)z n = 1 P σ P j=1 a(p) j z j Fonction d autocorrélation : C(z)= σ 2 P ( 1 )( P j=1 a(p) j z j 1 ). P l=1 a(p) l z l ) PPF Orléans / Tours 20/01/2004 p.24/44
Racines caractéristiques All-pole form of C(z) : C(z)= 1 a (P) P Les {z k } sont les racines de z P σp 2 P k=1 (z z k) P l=1 (z z 1 l ). p(z)=z P P k=1 a (P) k z P k. PPF Orléans / Tours 20/01/2004 p.25/44
Estimation directe de spectres Spectre de puissance par C(z) : c(ω)=c (exp[iω t]). Fonction de corrélation multiexponenetielle : C(n)= 1 2πi η dz z n 1 C(z)= P j=1 β j z n j. Here β j β j ({z k })=const., z j η : z >z j, j.! < 1, and PPF Orléans / Tours 20/01/2004 p.26/44
Simulation / Expérience 100 1 exp. data IN5 (q el = 4 nm -1 ) global diffusion + Gaussian resolution simulation, total spectrum S(q,ω) [a. u.] 0.01 0.0001 1e-06 0.01 0.1 1 10 ω [mev] PPF Orléans / Tours 20/01/2004 p.27/44
Caractéristiques du calcul numérique Utilisation extensive de FFT Utilisation extensive de l algorithme de Burg pour estimer les paramètres du modèle AR. Efficacité comparable à la FFT. Parallélisation triviale - Les fonctions de corrélation pour chaque atomes peuvent être calculées indépendemment. - Idem pour différents vecteurs q dans S(q,ω). - = communication 0. PPF Orléans / Tours 20/01/2004 p.28/44
Développement de modèles PPF Orléans / Tours 20/01/2004 p.29/44
Relaxation non-exponentielle 100 MD simulation (q = 4nm -1 ) Fitted Lorentzian S(q,ω) [arb. units] 1 0.01 0.001 0.01 0.1 1 ω [mev] S(q,ω) simulé pour la dynamique interne du lysozyme et lorentzienne ajustée. PPF Orléans / Tours 20/01/2004 p.30/44
Energie interne d une protéine potential energy surface in proteins substates Surface rugeuse de E pot d après Frauenfelder ( sous-états conformationnels ). Beaucoup de degrées de liberté couplés, avec des échelles de temps très différentes. PPF Orléans / Tours 20/01/2004 p.31/44
Fonction mémoire (Zwanzig, 1961) Equation de la fonction mémoire t c(t)= t 0 dτ ξ(t τ)c(τ) Dynamique Brownienne ξ(t) =γδ(t) = c(t) =c(0) exp( γt). PPF Orléans / Tours 20/01/2004 p.32/44
Dynamique brownienne fractionnaire Fonction de corrélation c(t)=e β ( (t/τ) β ), 0 <β 1. Fonction de Mittag-Leffler E β (z)= k=0 z k Γ(1 + βk). PPF Orléans / Tours 20/01/2004 p.33/44
Fonction de corrélation φ(t/τ) 1 0.8 0.6 0.4 ξ fbd (t/τ) 50 40 30 20 10 0-10 0 0.5 1 1.5 2 t/τ 0.2 0 0 1 2 3 4 5 t/τ Modèle DBF (β =1/2) = ligne continue, exponentielle étirée (β =1/2)=points et traits, exponentielle = traits. PPF Orléans / Tours 20/01/2004 p.34/44
Fonction mémoire et spectre Fonction mémoire (0 <β<1) ξ(t) (β 1) ( t τ ) β 2, 0 dt ξ(t)=0. Spectre de c(t) S fbd (ω)= 2τ sin(βπ/2) ωτ ( ωτ β +2cos(βπ/2) + ωτ β ). pour 0 <β 1. Lorentzienne pour β =1. PPF Orléans / Tours 20/01/2004 p.35/44
Modèle et simulation 1.5 log 10 (ωτ) -2-1.5-1 -0.5 0 1 simulation fractional BD log 10 S(q, ν) 0.5 0-0.5 0-0.2-0.4-0.6-0.8-1 0 1 2 3 4 5 Time [ps] -1-3.5-3 -2.5-2 -1.5-1 log 10 (ν ps) Facteur de structue dynamique et fonction mémoire pour Lys à q =10nm 1 par MD et modèle DBF. PPF Orléans / Tours 20/01/2004 p.36/44
Nos codes PPF Orléans / Tours 20/01/2004 p.37/44
Molecular Modeling Toolkit Bibliothèque de simulation moléculaire Langages : Python et C Orienté objet Techniques implementées : Dynamique Moléculaire, Modes Normaux, Minimization d énergie, etc. Parallelisé Développé depuis 1996 par K. Hinsen http ://dirac.cnrs-orleans.fr/mmtk/ PPF Orléans / Tours 20/01/2004 p.38/44
nmoldyn Analyse de trajectoires de Dynamique Moléculaire, en particulier pour comparer avec la diffusion de neutrons Interface graphique Basé sur MMTK Langage : 100% Python Développé depuis 1991 par G. Kneller et collaborateurs http ://dirac.cnrs-orleans.fr/nmoldyn/ PPF Orléans / Tours 20/01/2004 p.39/44
nmoldyn PPF Orléans / Tours 20/01/2004 p.40/44
PPF et équipement PPF Orléans / Tours 20/01/2004 p.41/44
Nos intérêts Mise à disposition de nos codes par une interface Web. Prévoir échange de volumes de données importants (trajectoires MD). Les analyses par nmoldyn sont idéales pour un calcul distribué. PPF Orléans / Tours 20/01/2004 p.42/44
Equipement Saclay : 8 noeuds Opteron / partie d une grappe de 64 noeuds du DRECAM / CEA Saclay. Orléans : Grappe de 20 PC bi-proc Pentium III en fin de vie. + PCs de bureau. PPF Orléans / Tours 20/01/2004 p.43/44
Remerciements K. Hinsen, CBM Orléans LLB Saclay M.C. Bellissent-Funel, LLB Saclay Saclay V. Hamon, CBM Orléans G. Sutmann, FZ Jülich (D) T. Rog & K. Murzyn, Krakow (PL) PPF Orléans / Tours 20/01/2004 p.44/44