怎样用计算方法来分析、预测、
蛋白质
序列及结构
主题:
基于蛋白质的物理 VS. 经验知识的方法
7.91 Amy Keating
对一个分子模拟或模型,你需要:
1. 蛋白质的表征
2. 能量函数
3. 搜索算法或最优化算法
共价势能项
Brooks et al., J. Comput. Chem. 4: 187-217 (1983)
非共价势能项
莱纳德 · 琼斯势能
“精确项”
近似项
势能面是一个 3N-6 维的空间。对蛋白质分子,假定存在一个能量最小
的天然结构。这些分子构象可能有多个局部极小点 。其中,可能仅有
一些能量点靠近全局最小点
能
量
势能面的取样
能量极小化
-“堤度下降”搜索,一般到最临近局部极小点
-可以用于松弛结构
-可能对因变异导致的局部结构改变也适用
正则模式分析
-定义关于局部极小结构扭曲的“特征运动”
-运动次序从易(“低频”)到难(“高频”)
分子动力学
-在给定的温度下运动( 300K )
-全体统计力学均等
蒙特卡罗 / 模拟退火算法
-描述景观的性质和没有模拟分子实际运动的热力学参
数
能量极小点
势能, U ( R )
X -射线结构
构象空间, R
•迭代步骤
到达规定误差终止,比如小
的梯度
•差的初始结构产生差的局部极小点
•多极小点问题
只能找到局部极小点
简单极小点应用
1. “极小点微扰方法”对变异建模
-假定单点变异与自然结构变异类似
• 对自然类型蛋白质的支链结构寻找稳定构象
• 用能量极小来松弛待研究的结构(所有的自由
度)
Shih, Brady, and Karplus, Proc. Natl. Acad. Sci. USA82: 1697–1700
(1985); hemagglutinin Gly to Asp mutation
1. 在分析试验或预测结构的能量之前消除应力
2. 用 X -射线晶体学或 NMR 来建立和修正结构
正则模式分析
•运动及其相对运动表征
•热动力学性质
数学近似:独立的谐振子序列
如预言所示表示势能面的局部扩张
实际
谐振子近似
正则模式查找“易”形变点
•低频,易于运动的点在高分子起决定作用
蛋白质的正则运动有时符合生物的相关运动
•“剪切”或“扭曲”构象改变在酶中是常见的
•比较用 NMA 计算的结构与实验观察到的结构。
通常低频模式表示这种变化(但可能不是能量最低的模型)
•NMA 是从静态结构获得其运动状态的一种方法。
分子动力学模拟
•用一含时函数来模拟分子运动
-获得蛋白质在溶液中的短程运动状
态
•可以用这种模拟方法来计算:
-平均结构(在给定的温度下, T )
-原子的振动(在温度 T 下)
-热动力学定量描述(含时)
Verlet “ 蛙跳” 算法
运行分子动力学模型
•最小化初始坐标
•按麦克斯韦-玻尔兹曼分布给定初始向量
•用小的时间步子来对牛顿运动方程积分(典型的 1 飞秒 =1 x 10-15秒 )
•平衡态(运行动力学程序直至到达平衡)
•生产动态特动力学(在预想的温度下动力学仍然有用)
用蒙特卡罗对构象空间取样
用蒙特卡罗随机样本构象取样,而不是模拟分子实际的含时运动
1. 从一随机的(能量极小点)构象开始
2. 评估其能量= E0
3. 使构象随机改变(如:转动一个键)
4. 评价新的能量= E’
5. 判决:
如果 E’ < E0 ,接受改变,设定 E0= E’ 。到步
骤 3
如果 E’ > E0 ,且如果 exp[-(E’-E0)/kT] > 随机数
# ,
然后接受改变,设 E0= E’ ,到步骤 3
否则丢弃这种改变,到步骤 3
6. 继续按任意的依时随机运行接受
使产生的构象符合玻尔兹曼分布
蒙特卡罗和分子动力学的用途
1.浏览能量全景图
全局极小是什么
其它的极小点是什么
这些极小点的能垒是什么
2. 计算热动力学值
3. 观察不同状态间的连接方式
分子动力学和蒙特卡罗间的区别 ?
分子动力学和蒙特卡罗都能用于多种用途
如果你想知道体系的含时状态,就必须用分子动力学
蒙特卡罗对宽范围的构象空间取样比较好,因为它随机
移动可以远离局部极小
GroEL 变构的机理动力学模型
分子动力学模拟用于
探求 GroEL 分子伴侣的
变构机理,该分子是在
ATP 和 GroES 分子间产
生的
请看下文的图 1 a
Ma, J, PB Sigler, Z Xu, and M Karplus. "A Dynamic Model for The Allosteric Mechanism of GroEL."
J Mol Biol. 302, no. 2 (15 September 2000): 303-13.
显示了与 ATP 作用的变构机理
计算的终点由 X -射线实验结构决定,
但是通常不容易到达实验结构
模拟正常的变构很慢,但“靶分子动力
学”能确定这些变化过程。
首先黄色的中间体的结构域向下移动,
引发定点上绿色的结构域向上移动。
模拟能显示正负协同相互作用的可靠性
的细节
请看下文的图 2b 和 5b
Ma, J, PB Sigler, Z Xu, and M Karplus. "A Dynamic Model for The Allosteric Mechanism of GroEL."
J Mol Biol. 302, no. 2 (15 September 2000): 303-13.
分子动力学模拟现在可以用于庞大的系统
水通道(水可以通过,质子却不能)的模拟。水分子和
磷脂双分子层都要计算在内-总计 101 , 000 个原子。
请看下文的图 1
de Groot, Bert L., and Helmut Grubmüller. "Water Permeation Across Biological Membranes: Mechanism
and Dynamics of Aquaporin-1 and GlpF." Science 294 (14 December 2001): 2353-2357.
分子动力学模拟水通道允许溶剂分子通过
10 纳秒模拟足以观察水分子的实时运动因为渗透速率是 3x109 s-1 。
可以观察其选择性机理&速率的决定因素。
请看下文图 2
de Groot, Bert L., and Helmut Grubmüller. "Water Permeation Across Biological Membranes: Mechanism
and Dynamics of Aquaporin-1 and GlpF." Science 294 (14 December 2001): 2353-2357.
用分子动力学来模拟蛋白质的折叠
绒毛蛋白( 36 个残基,与溶剂显相关)头部的折叠模拟:
1 us 模拟, 2 fs 步长, 512Clay 处理器耗时数月!
结论:
在模型中 NMR 结构是稳定的。
60ns 后结构显示 50%的螺旋性,与其它蛋白质的实验数
据符合较好。
对给定的初始高能状态产生一螺旋结构和稳定接触
对二级和三级与稳定态接触的相似性,存在一个亚稳态
Duan & Kollman Science (1998) 282, 740-744
绒毛蛋白头部
A. 非折叠
B. 980 ns 部分折叠
C. 自然态
E. 源于稳定聚类的结构
时间进化:
A. 自然螺旋状态
B. 自然接触
C. 旋转半径
D. 溶剂化自由能
请看下文的图 1 和图 2:
Duan, Yong, and Peter A. Kollman. "Pathways to a Protein Folding Intermediate Observed in a
1-Microsecond Simulation in Aqueous Solution." Science 282 (23 October 1998): 740-744.
分子模型-一些最后忠告
模型的势能函数是近似的(出于一些相当好的目的);计算并不能代替实验
有能力将计算结果分成多步,可以发现用其它方法得不到的结果
对具体的问题建立一个精确的模型有其自身的价值
解析结构问题用X -射线晶体学
&
NMR谱
怎样确定X -射线晶体结构
1. 晶体生长- 用 X -射线晶体学来确定结构依赖于晶格点的重复结构
2. 收集衍射样本-晶体中原子周期性的空隙在 X -射线透过时产生衍
射现象而出现“斑点”
4. 经过傅立叶变换得到一个倒易空间以描述其电子密度的
4. 这一步需要解析相位波状态的知识,该波不能直接的由状态问题测得。
4. 建立蛋白质的初步模型来描述由实验数据得到的电子密度的信封模型
5. 通过迭代改变模型以修正结构并比较其于实验数据的符合程度
蛋白质晶体的生长
在解决结构问题时通常有一速决步。
蒸汽扩散悬滴法
缓冲溶液,盐,
沉淀
1. 选择一个你认为比较典型
得折叠结构
2. 提纯蛋白质
3. 浓度 > 10 mg/ml
收集衍射数据
衍射图中的斑点有什么含义?
每一个斑点表示原子空隙满足布拉格定律而在衍射时产生连续的干涉
nλ = 2dsinθ
晶体
平面
因此由斑点的强度得到的 q 表示平面的电子密度的大小,该
平面是周期性的 d 间隔平面
注意: λ = 0.5 到 1.5 Å
衍射模式表示倒易空间
大的 θ -> 小的 d; 高分辨率
小的θ -> 大的 d; 低分辨率
每一个斑点源于在衍射方向上
该平面具有恰当的距离
由于版权原因衍射图像未能给出
蛋白质的电子密度表示这些
周期性函数的重叠…
傅立叶变换
这是电子密度
这是衍射模式
Courtesy of Kevin Cowtan: http://www.ysbl.york.ac.uk/~cowtan/sfapplet/sfintro.html
相位问题:我们不知道使用什么相位对波函数有贡献。大问题
可见调幅
原子散射因子-与原
子 j周围的电子密度相
关
相位由原子 j 的
坐标 X,Y,Z 决定
我们观察的是 Ihkl α |Fkhl|2
我们不能直接测量相位
Fhkl 为结构因子
Courtesy of Kevin Cowtan: http://www.ysbl.york.ac.uk/~cowtan/sfapplet/sfintro.html
Courtesy of Kevin Cowtan: http://www.ysbl.york.ac.uk/~cowtan/sfapplet/sfintro.html
强度的影响 VS 相位的傅立叶变换
duck强度
cat 相位
Courtesy of Kevin Cowtan: http://www.ysbl.york.ac.uk/~cowtan/sfapplet/sfintro.html
因此,怎样得到相位呢?
Ⅰ分子替换
你认为结构中“ Borrow” 相位比较相似
比如: duck强度和 goose 相位能合理地确定真实的结构
注意“模型偏好”-需要控制,以确保你没有把数据强加再假想模
型结构上
它是怎样工作的:
取出模型结构并按晶体的基本单位来转换 /旋转。计算预期的结构因子。
控制 R值
如果你找到了一个很有意义的非随机的 R值,这个模型可能就是一个好的模型。
尽量优化该模型,看 Rfree 值是否有改进
因此,怎样得到相位呢?
Ⅱ重原子方法
如果你可以得到含有重原子的一个或多个相同几何结构的晶体的话,那么
F 蛋白质•重原子 = F 蛋白质 + F 重原子 ,得到含有重原子的衍射模式和不含重原子
的衍射模式,该模式仅仅给出了重原子的衍射模式。
该结构可以由“模式图”来表示
模式图给出了原子间的所有向量。这对蛋白质整体并没有帮助,但对一足够小的结
构,你可以得到全体结构信息(手性信息除外)。
一旦你有重原子衍射结构,你可以用这来推出原始结构的相位。(相信我的这一点
-我们没有时间来详细的解释)
谱图迹通常需要序列知识
X -射线晶体结构精讲
模型:
斑点的
计算强度
数据:斑点的
实际强度
所有斑点
的总和
实验观察的
斑点实际强度
从试验计算
的斑点强度
U 杂化 = U 分子模型 + sU X -射线 实验
•模拟退火算法用在杂化势能上能快速的改进结构和 X -射线观察结果,该结构是
在 保持合理的化学性质的基础上得到的。(大半径收敛)
•以前有效的方法是局部极小,而局部极小容易停留在局部极小区域(小半径收敛
)
结构修正和 R 因子
当前模型 观察到的 X -射线
幅度
衍生模型幅度
R = Σ 所有测量项 ||F 观察 | - |F 计算 ||/Σ|F 观察 |
在观察数据&立体化学原理的指导下做相应改变
自由 R 因子
90%的 X -射线
幅度
当前模型
10%的 X -射线
幅度
衍生模型幅度
R = Σ||F 观察 | - |F 计算 ||/Σ|F 观察 | R 自由 = Σ||F 观察 | - |F 计算 ||/Σ|F 观察 |
改变模型 评估模型