有什么公式可以定位特定数值所在的位置(行和列是自定义的红色框选,例如3-K,如图)请大神帮忙解答?

在日常工作中,经常会有一些倒计时的应用,例如常见的距高考还有n天、距项目结束还有n天等。使用Excel中的日期函数结合强制刷新的VBA代码,就能制作出倒计时牌。

接下来一起看看具体的操作步骤:

步骤1 假设假期结束日期为2022年9月14日0时,在C2单元格输入以下公式,得到剩余的整数天数。

步骤2 设置D2单元格自定义格式为:

然后在D2单元格中输入以下公式:

虽然NOW函数属于易失性函数,但是如果在工作表中没有执行能够引发重新计算的操作,公式结果并不能自动实时刷新,因此需要添加定时刷新的VBA代码。

步骤3 按<Alt+F11>组合键打开VBE编辑器,依次单击【插入】→【模块】命令,在【工程资源管理器】中单击选中刚刚插入的“模块1”,在右侧的代码窗口中输入以下代码。

如下图所示,A列是一些乱七八糟的数据,现在需要提取最后出现的数值,你会怎么写函数公式呢?

这个公式总结成套路,如下:
=LOOKUP(一个比查询范围同类数据都大的值,单列或单行查询范围,单列或单行结果范围)
如果该套路的第3参数省略,则将查询范围视为结果范围。

LOOKUP函数的这个套路性用法有什么用呢?如果只是提取A列最后的数值……似乎也没啥作用?
我先举个简单的小栗子。
如下图所示,是一份考评表。需要在N列计算每个人最后参与考评的月份。

例如A2单元格的看见星光,最后考评的月份是3月(3月就失业了),A4单元格的肥书记,最后考评月份是12月……
那么函数应该怎么写呢?

这就是我们刚刚说的LOOKUP套路性用法不是?
=LOOKUP(一个比查询范围同类数据都大的值,单列或单行查询范围,单列或单行结果范围)

B2:M2是单行查询范围,B$1:M$1是对应的单行结果范围,250比查询范围内所有的同类数据都大,因此返回最后出现的数值对应的月份。

打个响指,你要是觉得250不好听,换成其它数值也可以,比如521、666、888、999等等,没别的要求,只要比查询范围内所有的同类型数据都大就行了。

如下图所示,需要把A列数据前面的数值提取到B列,例如204看见星光,结果为204,165606If结果为165606,等等……

说来你不信,前面的数字是月薪..▼

LEFT(A2,ROW($1:$15))部分,从A2单元格的左边,依次提取1、2、3、4……直至15位的数据,返回结果:2,20,204,204看,204看见……
再通过减负运算(–),将LEFT函数的计算结果转换为数值。此时纯文本无法进行数学运算,例如–204看,它将返回错误值#VALUE!。

LOOKUP天生忽略错误值,再用一个比查询范围所有数值都大的数值9^9进行查询,也就返回最后出现的数值,即204。

怎么样,是不是有点意思呢?

最后,留一个扩展题儿,如何快速提取A列最后出现的文本值呢?

示例文件下载,百度网盘..

今天再给大家分享一段代码,作用是按任意列,将总表数据拆分为多个分表。
如下图所示的数据为例,是一张总表,标题行存在合并单元格等特殊情况,现在需要按任意字段,比如C列的班级字段,拆分为多张分表。

复制运行以下代码即可▼

'获取用户输入的标题行数▼

说起合并单元格,经常与表格打交道的表哥表妹对它肯定是又爱又恨吧。
在数据表中使用合并单元格,往往会大家带来很多麻烦。

比如说,筛选、排序、数据透视表等操作都会因为合并单元格的存在而无法使用。在合并单元格的表格中使用公式汇总数据,也会变得非常困难。
但是,如果你有一个得罪不起的老板偏偏对合并单元格钟爱有加,那就惨了。

其实合并单元格也可以乔装改扮,通过整容使其具有合并单元格的外观,同时尽量不影响我们的正常汇总等操作。
先看看下面这个员工补贴表:

如果对A列的数据按部门进行合并单元格,在H2单元格使用公式来计算指定部门的差旅补贴。

我们看H2单元格的结果只有200,这个肯定是不对的哦。
再来看看下面这个图,貌似一样的表格,使用一样的公式,结果却截然不同:

这里的A列,就是使用了整容术。

回到基础数据里,咱们一起操练起来:

【数据】【分类汇总】【全部删除】

最后删除A列空白列,B列设置格式,添加边框,OK了。
这时候选中A2:A11,计数结果就是10了。

整容术完成,这样的表格就实现了既有合并单元格的外观,同时最大程度保留表格的汇总功能不受影响,你也试试吧。

刚刚接触Excel的小伙伴,总会遇到各种奇怪的问题。接下来老祝就和小伙伴们一起看看这些奇怪的问题怎么破。

1、找不到开发工具选项卡怎么办?

默认情况下,开发工具选项卡不会显示在功能区内,如果要显示开发工具,可以右键单击功能区的任意选项卡,自定义功能区→勾选开发工具就可以显示了。

2、行号列标都变成数字怎么办?

别人家的Excel列号是字母ABC……,我家的Excel列号变成了123……,我是不是用了假的Excel?

出现这个问题,是不小心勾选了R1C1的选项,只要在选项里把这个勾勾去掉就可以了哦:

3、按钮变成灰色怎么办?

当打开某个文件时,你会发现很多按钮变成了灰色不可用的状态,这个问题让很多小伙伴都困惑过。

其实,这是使用高版本的Excel程序打开了低版本xls格式的工作簿,只要按F12键,把工作簿另存为xlsx格式,然后重新打开,这些功能就可以使用了哦。

4、按方向键不能切换单元格怎么办?

在Excel中为什么按方向键整个页面都往下拉,而不是一个个单元格切换?
这是因为不小心按了ScrollLock键,也叫做滚动锁定键,只要再按一下就好了。按键位置一般是在键盘的这个地方:

5、输入公式不计算怎么办?

很多小伙伴在单元格中输入公式后,结果就变成这样了:

出现这种情况,先检查一下公式所在单元格的格式,把格式设置成常规后再双击一下公式,按回车,就恢复正常了。

6、复制公式显示同样的结果怎么办?

如果公式向下复制后,各个单元格中都是一样的结果,多数情况下是你的Excel开启了手工重算。
只要在【公式】选项卡下,依次单击计算选项→ 自动,就OK了。

7、身份证号码不能正常显示怎么办?

输入身份证号码后,后三位都是000了?明明输入的没错为什么出不来?
电脑没坏,Excel也没没抽风。只要在输入之前,先选中单元格区域,设置为文本格式,然后就可以一路高歌了:

相对引用与绝对引用是Excel公式中既非常基础又非常重要的内容。我们将从这里开始,带领大家学习如何编写公式,总体思路是先有思路,后有动作,然后调整细节。

相对引用与绝对引用的4种状态展示

我们打开Excel表格,在单元格中使用公式来解决问题。下面以图1-1所示的A7:E10单元格区域的数据为例,讲解如何引用单元格。

图1-1基础单元格示例

在H7单元格中输入“=”,然后单击A7单元格,形成公式“=A7”。再将H7单元格向右向下复制,形成“相对引用”,如图1-2所示。横向复制后,A变为了B、C、D;纵向复制后,7变为了8、9、10。这就是相对引用,引用的单元格会随着单元格的变化而变化。

如果公式无论是横向复制还是纵向复制,始终都要引用A7单元格,该怎么办呢?

在N7单元格中输入“=”,然后单击A7单元格,形成公式“=A7”。然后按【F4】键,就会看到公式变成“=$A$7”,字母A和数字7前都增加了美元符号“$”,我们把它称为“图钉”,如图1-3所示。这时将N7单元格向右向下复制,它的公式始终是“=$A$7”。“$”就像图钉一样把列号和行号牢牢地固定在那里。

上述情况就是绝对引用。这种引用方式常常用于某个单元格值被多个单元格使用的情况。例如,在A7单元格中输入数字/s/1wTbyKRcIJCd7olk8Fux7MQ?pwd=3tya

所谓逆向查询,就是关键字在数据表的右侧,而要得到内容在数据表的左侧。
如下图,希望根据E2单元格指定的客户名,从左侧的数据表中查询对应的客户等级。

该公式的模式化用法为:
先使用MATCH函数在一行或一列的区域中找到查询值的位置,再使用INDEX函数,返回对应位置的内容。

该公式的模式化用法为:
先使用一行或一列的查找区域与查找内容进行逐一对比,得到一组逻辑值。当条件成立时,结果为TRUE,否则为FALSE。
再使用0除以这些逻辑值,0除以TRUE,结果返回0,否则返回错误值。
最后使用LOOKUP函数,以1作为查找值,在以上内存数组中查找到0的位置,并返回要返回内容区域中与之位置相对应的信息。

该公式的模式化用法为:
=XLOOKUP(要找谁,在哪里找,要返回哪里的内容)
XLOOKUP函数目前可在Excel 2019以及最新版本的WPS表格中使用。查找区域以及返回内容的区域,都需要指定一行一列的范围。


2022年9月20日发(作者:伍思业)

上海文华财经资讯股份有限公司

文华赢顺期货交易软件v6基金细分类型.7功能说明

在软件设计中,我们为每个界面所能做的操作都精心准备了右键菜单,所以如果您在

使用软件过程中找不到某个功能基金从业协会的会员分类,请试试鼠标右键产业基金属于什么行业分类。

如:修改报价抬头顺序—>右键的【抬头格式(域)调整】。

更换报价列表合约—>右键的【选入合约】。

如:再增加一个副图窗口—>右键的【增加副图】。

切换主图/副图指标—>右键的【技术指标】股票基金代码分类。

如:同时显示其他合约的分时图—>右键的【其他】—>【叠加其他合约】

看多天的连续分时图—>右键的【历史回忆】

修改分时图的上下坐标范围—>右键的【设置坐标范围】

如:对某个持仓设置止损—>右键的【设置止损单】

平所有持仓—>右键的【撤平仓单+账户清仓】

对挂单撤单重发委托—>右键的【对价跟进】

撤掉所有挂单—>右键的【撤所有挂单】

软件上方“系统工具条”中的按钮支持自定义设置全球etf基金分类,不需要的按钮可以删除请问哪种分类的基金风险更高,需要的

按钮也可以增加基金性质分类私募。如下图所示:点击红框位置私募基金分类经营,在弹出的菜单中勾选或取消勾选按钮项按证券发行主体分类基金可分为,

达到增加或删除的效果。

(一)不同指标线形提亮你的眼睛

在做分析时经常需要很多的指标线同时显示基金分类为哪四种,但最关键的指标线可能只有1、2条,时时在

众多指标线中找到关键线很考验我们的双眼私募股权基金风险分类。软件中的指标线可以绘制出很多形式,我们

可以将关键的指标线显示成特殊的线形基金产品的策略分类,这样在众多的指标线中就可以很方便的找到它基金的分类和类型。

MA30:MA(C股权投资基金分类题库,30),CIRCLEDOT;//将30周期均线绘制成小圆点分级基金有哪些分类。

周期均线为红余额宝基金分类,否则为绿

5、只显示指标数值基金板块主题分类,不绘制指标线

H20:HHV(H基金的的分类介绍,20)国际qdii基金的二级分类有哪些,NODRAW;//取20周期高点作为看盘参考社科基金的选题分类,只显示数值量化私募基金分类,不画线保本基金 投资策略 分类。

L20:LLV(L,20)基金代码和分类,NODRAW;//取20周期低点作为看盘参考,只显示数值,不画线。

(二)用颜丰富你的图表

常见的k线颜是用开盘价收盘价比较大小决定的,但有的用户不希望上升趋势中的阴线

(绿)和下降趋势中的阳线(红)颜影响我们对趋势的判断。在软件中可以通过指

标编写,完全按照您的需求显示k线颜证券投资基金不可以按什么分类。不仅仅是k线颜可以绘制引导基金分类,还可以绘制带颜

指标带医疗保险基金分类,让图表彩更丰富美国私募基金管理人规模分类,更有利于我们分析。

2、将指定区域用颜填充

MA5:MA(C股票型基金板块分类,5)以下关于证券基金的分类介绍 错误的是,COLORGREEN;

于10周期线时用红填充

小于10周期线时用绿填充

(三)注释、图标、声音使你的图表更生动

当指标或k线达到某种条件的时候可能是趋势开始的信号基金分类表格,我们经常需要在这样的位

置标注作为提醒基金按投资品种分类,但在指标线非常接近目标值时很容易看错基金企业分类标准,并且手动在图上标注也非常

麻烦私募地产投资基金如何分类。为了解决这个问题,软件提供了相应的指标支付宝基金分类排行,可以在满足您设定的条件时自动在图

上标注或声音提醒私募证券基金的分类,让电脑帮我们标注并提醒我们,即准确、又方便基金投资风格的分类。

2、在符合条件的位置标注图标

MA30:MA(C基金5大分类是什么意思,30)自然科学基金技术领域分类,CIRCLEDOT;//将30周期均线绘制成小圆点

3、在符合条件时,发出声音警报

穿10周期均线时发出声音报警

注:下图中黄圈处为满足条件位置国家基金学科分类名称与代码,盘中满足条件的时候根据基金的投资目的进行分类,会发出声音报警基金的定义和分类标准。

如下图①—⑤所示建立和加载指标基金信息披露的分类。

注:如果下图紫框中选择“副图指标”社科基金申请学科分类,指标加载后显示在副图上;选择“主图附加

指标”天天基金页面中分类怎么查看,指标加载后作为k线的附加指标显示在主图上;选择“主图k线形态”指标加载

后代替k线显示在主图上。

使用一款行情交易软件以下关于证券基金的分类介绍,一般是从它的界面开始着手基金分类及年收益,用好软件的个性化设置,打造

【系统工具】中的【个性化设置】,是软件功能设置的集结地投资REITs的QDII基金分类,可以找到针对报价、k

线图、分时图、颜、字体的大部分设置项目,所以要设置成自己的风格请到这里规划下

软件下方的书签,像我们平时看书所用的书签一样,能快速切换到想要查看的页面。

如下图的“大商所DCE”就是一个书签。

如下图所示etf基金是什么基金分类,我们还可以打造属于自己的个性化书签,以便更加方便快捷的打开属于

我们的页面私募股权基金的股东分类。

删除、移动、重命名书签:

在盘中,趋势和震荡行情经常交替出现基金 分类 组织形式,在不同行情下我们使用的分析指标也不尽相

同基金分类介绍 知乎,如此私募基金的分类和特点,难道在行情转换时每次都修改一次指标么?有了我的指标区国家自然科学基金工程材料口分类,这一切都变得简

单!操作步骤如下图所示:

做技术分析时,由于各周期的特性不同体育类科研基金分类,通常需要不同的周期设置不同的指标基金分类风险评级。周期化指标区功

能可以针对不同周期基金公司按客分类,建立其独立的指标模板垃圾分类的指数基金。设置好后再打开图表就可以默认显示针对这个周

期的特定指标指数型基金标的分类,让技术分析最大程度灵活化、个性化,如下图所示收入周期化指标区基金的详细分类。

(五)指标周期化并合约化

除了不同周期的个性化需求,不同合约由于特性不同私募基金按投资标的分类,也需要设置不同的指标。周期化并合约化

功能可以针对每个期货、股票品种的不同周期私募基金产品评级分类,建立其独立的指标模板银华基金分类。设置好后再打开图表就

可以默认显示针对这个合约这个周期的特定指标,如下图所示收入周期化并合约化指标区。

1、导出备份个性化设置

步骤:【系统工具】—>【备份个性化设置】—>【导出】

注册文华云账号后可以上传包括页面、书签、指标区、止损单、条件单等的个性化设置国家基金口子分类,在

不同客户端登陆云账号均可下载之前云端存储的个性化设置论著必须有基金和分类号。

(一)文华商品指数—国内期货市场的大盘指数

投资者对某一交易品种价格的变化容易了解国家自然科学基金 分类,但对于多种相关品种或某一类品种价格

变化,要逐一了解,既不容易也不胜其烦基金分类及风险排行榜。如果不了解市场环境基金风险如何分类,投资者很难把握交易的

大方向目前各家银行基金产品分类。而指数可以反映某一类品种的整体走势,为投资者的交易提供既直接又有效的参

文华商品指数(wenhuaCCI),跟踪国内28种上市商品价格综合表现如何看基金投资目标分类,较全面地涵盖了目

前市场上的期货品种债券型基金的二级分类是。指数由“文华商品”总指数和“有金属”、“建材”、“化工”、

“煤炭”、“谷物”、“饲料”、“油脂”、“软商品”八大分类指数fof基金概念和分类,以及28个品种的

分支指数构成。指数的实时价格数据基金目的分类,在文华财经行情信息系统中实时发布,给投资者提

供一个国内大宗商品价格及时走势的有效参考股票基金管理人分类。

有板块指数:铜、铝、锌、铅、镍;

建材板块指数:螺纹钢、玻璃;

化工板块指数:橡胶、塑料、PVC、PTA、甲醇、聚丙烯;

煤炭板块指数:焦煤、焦炭、动力煤;

谷物板块指数:大豆、小麦、玉米;

饲料板块指数:豆粕、菜粕、玉米;

油脂板块指数:豆油、棕榈油、菜籽油;

软商品板块指数:棉花、白糖;

工业品指数:铜、铝、锌、铅、镍、螺纹钢、玻璃、橡胶、塑料、PVC、PTA、甲醇、聚

丙烯、焦煤、焦炭、动力煤、铁矿石;

农产品指数:大豆、小麦、玉米、豆粕、菜粕、豆油、棕榈油、菜籽油、棉花、白糖、

文华商品指数:包含以上总计28个品种山东省自然科学基金方向分类。

(1)、各品种的指数(如橡胶指数)是加权计算的,以各月份的持仓量为权重基金风险大小的分类。计算的结

果是价格,单位为人民币元。

(2)、文华商品指数,以及各行业指数(如有板块指数),是算数平均计算的社会保险基金分类方法,首先对

所包含的所有品种进行指数标尺化政府基金支出分类,然后进行算数平均蚂蚁财富自选基金能分类吗。计算的结果是标尺化的点数。

(3)、标尺的单位为点,最小变动点数为0.01私募证券投资基金的产品分类。标尺以1994年9月12日为基准日(现

存最早的上市期货品种大豆的开盘日期)国际货币基金组织的货币制度分类,基准指数为100点。

案例一:文华商品指数为用户交易提供参考信息

图一为沪锌1分钟线图,在11点左右处在盘整状态国家基金E09分类,此时无法预知后市如何。

图二为叠加了有指数k线的沪锌1分钟k线图,如果能同时观察有指数会发现沪

锌在盘整状态时指数已出现下跌趋势,若当时持有多单基金分类ppt模板,就应该小心了。果然基金行业板块分类有哪些,从后面的

k线走势可以看出沪锌随着大盘出现下跌趋势。如果没有指数其他基金业务分类,很难做到在把握市场大环

境的前提下结合品种进行交易4种基金分类。

案例二:文华商品指数为程序化模型提供连续测试数据

图三为一年左右的股指合约k线图公募基金分类注册,检测模型在合约的长期效果时基金分类和手续费,无法避免合约的

交割-挂牌期的跳空(跳空会影响指标值的连续性)和不活跃期(用户一般不会选择这个时

期进行交易),检测效果会失真,显然用具体合约测试模型不具有可靠性。

图四为if加权(指数)合约对冲基金 策略分类,指数以各月分持仓量为权重加权计算,走势会非常接近

主力合约,且具有很好的数据连续性,模型检验结果更具有参考价值国际货币基金组织的分类 中国大。

方法一:点击软件下方书签中的“商品分类指数”如图五所示基金分类 货币型基金。

方法二:在软件报价上点击鼠标右键,点击【选入合约】,在弹出窗口中左侧找到"亚洲指

数"、"大连商品"、"郑州商品"、"上海金属"、"上海橡胶"市场基金运作方式分类,在中间栏目中选择对应指

数下面选项中哪个股票型基金分类的说法,点【选入】按钮大学不同科研项目基金分类,即可显示需要的指数。

常见的报价列表只有价格、持仓量、成交量等原始数据,软件中利用这些原始数据做

出更有利于我们交易的特抬头指标证券投资基金的组织形式分类,能准确揭示合约在市场的活跃程度和主力资金动向,

为投资者选择合约和技术分析提供参考依据。

活跃的合约往往存在更多交易机会,投资者通常通过成交量的大小来判断合约活跃

程度,但成交量大的合约持仓量往往也会很大基金的LP分类,很难单纯通过成交量值判断合约活跃性保险保障基金分类。

软件中增加了“投机度”抬头试述股票 债券 基金的分类,可以用最快最简单的方法找到最活跃的合约。

2、60秒速涨、现涨:

投资者通常会在报价列表中找有异动的合约寻找交易机会债券基金分类与名称,抬头中只有涨幅反应当

天的行情涨跌股票基金分类主要包括,无法反应出短时间的行情异动。报价中列表中新增“60秒速涨”和“现

涨”抬头基金的分类 etf,可以很容易的发现短时间内上涨/下跌幅度大的合约,可以对这样的合约更多

关注基金分类中属于按投资标的进行划分的是,抓住交易机会。

沉淀资金可以反应市场资金构成,体现投资者对品种的投资热情。从图中可以看到

价格和持仓量并不高的股指合约占据了市场的一大部分资金基金绩效评价分类,股指价格变化对市场的影

响不容小觑货币基金分类和指数基金分类那个风险高。

价格上涨一个百分点,可能是一千万资金推动的基金的分类风险可以分为,也可能是一亿资金推动的国家自然科学基金面上项目的分类,这两

种情形对投资者而言有完全不同的指导意义。“资金流向”抬头可以反应合约的资金流

入流出值大小,再配合观察投机度指标,如果投机度值也非常大搞懂基金分类,很可能是大资金在换

手进场了货币基金按份额分类。

k线实体越长,则力量越强基金分类法,反之则力量越弱基金管理人分类,趋势度抬头可以反映k线实体与上下

影线间的比例,上涨力量越强该值不断接近1基金分类的意义,下跌力量越强该值不断接近-国家自然科学基金学科分类,力量越弱

越接近0公募基金按券商结算模式分类,再配合涨跌幅基金分类和评估,可以更精准的判断力量大小,我们在报价列表上就可以轻松找

出哪些合约更有交易机会。

沉淀资金=持仓量*最新价*单位手数*保证金比例

资金流向=((持仓量*最新价–(持仓量-日增仓)*昨收)*单位手数*保证金比例

投机度=成交量/持仓量

60秒速涨=(最新价-前1分钟最新价)/前1分钟最新价

现涨=最新价–前一笔最新价

趋势度=(最新价-开盘价)/(最高价-最低价)

日增仓%=日增仓/持仓量

在报价列表单击鼠标右键->抬头格式(域)调整基金分类 契约。

点击抬头名称(如:资金流向)可以对抬头内容进行排序上证基金分类。

(三)五档行情看清市场

期货中盘口默认显示1档买卖国家自然科学基金学科分类,就是说我们只能看到市场上最近的报价和量,无法得

知在买一卖一价之后的深度市场数据和市场上整体情况。而市场行为包含一切信息,一切

信息都会以价格形势反映在图表中,如果能了解市场状态基金的分类及适合人,对我们的交易决策有很大帮助通达信ETF基金如何分类,

而五档行情可以让我们看清市场。

案例一:五档行情看清市场

下图为普通的盘口,只能看到最近一档的买量和卖量为339:274银河基金分类.显示多空双方都比较

活跃政府性基金支出功能分类编码,但后劲如何我们无法得知。

下图为同一时间的五档盘口截图:可以看到卖②—卖⑤的量远远大于买②—买⑤的量基金分类百度百科,

市场看空的力量更大国家自然科学基金支持项目分类。在看买卖方总量对比1880:,空方占据了主导方向,短时

间内价格很难出现反弹分类基金什么情况下折。通过五档数据,让我们深度的了解了市场状态,为我们的交易提

供了更多的参考信息基金分类架构图。

注:买卖量右侧的绿条为量的比例,+-数字为各价位委托手数的增减支付宝买的基金如何分类。

案例二:L2数据让我们发现大单:

在普通的盘口上按照投资标的分类 开放式基金可以分为(),我们只能看到买一/卖一价的总量吉林省科研基金分类,这个量有可能是一个人的行为科学基金分类,也可

能是多个人的行为,无法预测是否有大单存在。

L2数据可以显示出买一/卖一量的前10笔挂单组成小鸡看见蚂蚁财富基金分类,如下图:卖一量为1256手债券基金分类,这1256

手由多笔挂单组成社会基金所有权分类,其中的第一笔1000手为一人所挂,大单空向行为显现我国基金的分类有哪些类型,再配合持仓量

增减可以确定大单进/出场。

大商所有五档和L2数据发布中国基金业协会会员分类,中金所有五档数据发布基金销售属于什么行业分类,都为收费项目科技基金分类。如需购买请

点击软件菜单的【帮助】->网购付费功能,进行购买。付费后您会获得一个带有授权行情

账号,用此账号登陆软件基金项目等级分类是怎么分的,自动显示五档/L2数据。

中金所五档不提供市场的加权平均价格和总委量基金的行业分类,软件中显示的是五档的算术平均价

期权合约复杂繁多,我们需要一些重要的辅助数据来判断期权合约的风险和价值。如

常见的风险指标delta、Gamma等。但这些数据交易所不发布按所投资对象不同投资基金的分类不包括,在国外很多机构自己购置计

算软件、计算工具根据模型输入市场数据做出来小鸡看到蚂蚁基金分类中有货币基金,对于我们普通的交易者更是难于实现债券基金的分类方法。

软件中提供了专业的期权T型报价(如下图所示)证券投资基金分类的意义,不仅让复杂繁多的期权合约

清晰化、简单化显示青年基金分类评审怎么找专家,还提供了实时监控各类风险的抬头报价,你需要的这里都有!

注:红底为实值合约区青年基金分类选择,蓝底为虚值期权合约区,可在菜单【系统工具】—>个性化设置中修改底基金的分类方式是。

衡量标的物价格变动时基金经理分类,期权价格的变化幅度。

如美国国家科学基金会的学科分类,Delta=0.5晨星网的基金组别和基金分类,那么标的物价格涨一元基金回购和债券怎么分类,期权价格会上涨0.5元。该值越高scp基金会分类等级,意味着期权

价格对标的资产价格变化越敏感。

衡量标的物价格变动时,期权Delta值的变化幅度基金的分类 各类基金的特点。

该值越高,意味着Delta值对资产价格变化越敏感基金的一级分类。

衡量随着时间的消逝,期权价格的变化幅度。

简单理解为时间每经过一天基金公司产品分类,期权价值会损失多少怎么区分基金的分类。

衡量标的物价格波动率变动时美国基金公司分类标准,期权价格的变化幅度。

该值越高,期权价格对波动率的变化越敏感。反之证券基金投资范围分类,波动率变化对期权价格变化的影响越

衡量利率变动时,期权价格的变化幅度基金业协会 适当性原则 分类。

也可以简单的理解为期权价格对无风险利率变化的敏感程度按中基协规定的基金分类。该值越高货币基金商业模式分类,期权价格对利率

变化越敏感基金产品风险评价分类。

标的物价格与期权价格的比值etf基金分类大全。

杠杆比率越高基金具体分类,标的物价格每单位的变动可带来的盈利或亏损就越大基金营销目标客户分类,意味着投资风险较

高私募基金投资标的分类.

期权到期前开放式指数基金的分类,标的物价格需要变动多少百分比才可让期权投资者在到期日实现损益平衡。

溢价率衡量期权风险高低指数基金行业分类,该值越高国家社科基金评审如何分类,实现损益平衡越不容易,投资风险越高。

点击软件下方的"国内期权"书签投资基金发行分类,或者在期货合约报价列表单击鼠标右键—>期权链。

注:报价列表右键—>抬头格式(域)调整国家自科学基金学科分类,调用更多风险指标抬头一篇文章看懂基金分类。

期权合约数量是标的物数量的20倍之多股权投资基金范围分类,想从众多合约中寻找合适交易的那一个需要

很大工作量根据国际货币基金组织的分类 中国。软件将期权中常用的策略分析方法基金行业分类数据,划分为六种彩票式交易策略,自动为我

们筛选适合各类策略的合约基金分类方式是,并对每个期权合约给出简洁、专业的损益平衡分析图,让期

权交易有了最得力的助手基金会的行业分类。

案例一:以小博大(似买双球),“看大涨”策略

使用时机:多头涨势如虹,预料后续还有一波不小的涨幅基金公司风格分类。

付出相对较低的有限成本买入看涨期权国家自然科学基金 中药学分类,标的合约行情大涨超过损益平衡点后行权,

可获得丰厚利润(涨势越大,赢利越多),似买双球(投入小,损失小国家自然基金项目的分类,胜率低,有可

能获得高回报)。当然基金管理人风险等级分类,你也可以在行权前转手卖掉期权合约,赚取其中的价差债券基金有哪几种分类情况。“看大

涨”策略中罗列出了符合此交易需求的期权合约(与此相反则是“看大跌”策略)。

下图为“看大涨”期权合约报价,及合约对应的损益平衡分析图。

案例二:以大博大(似买刮刮卡),“看小涨”策略

使用时机:看多后市公司型基金分类标准,但认为不会大幅上涨短债基金属于以下哪类投资需求分类。

付出相对略高的有限成本买入看涨期权基金分类的规定,标的合约行情上涨超过损益平衡点后行权省社科基金分类,

可获得利润(涨势越大,赢利越多),似买刮刮卡(投入稍高,损失稍高,胜率稍高,也

有可能获得高回报)。当然关于基金的基本分类题库,同样你也可以在行权前转手卖掉期权合约按投资的对象不同 投资基金的分类不包括,赚取其中的价差基金按设立方式分类。

“看小涨”策略中罗列出了符合此交易需求的期权合约(与此相反则是“看小跌”策略)。

下图为“看小涨”期权合约报价中国证监会对基金类别的分类标准,及合约对应的损益平衡分析图。

案例三:“看不涨”策略(似卖双球)。

使用时机:期货价格经过一段上涨,面临高点或阻力,预计后市转空或者进行调整债券基金发行者分类。

卖出看涨期权中国晨星基金评价体系对基金分类用,获得权利金国家自科基金分类。当标的合约行情下跌,期权买方不会行权,这样可以获

得权利金基金代码分类标准,如果行情上涨超过损益平衡点将会损失,上涨越多,损失越大。似卖出双球

(收益小,胜率高,一旦失败,损失不可预计)。当然也可以在行权前平仓股权投资基金按属性分类,获得价差收

益。“看不涨”策略中罗列出了符合此交易需求的期权合约(与此相反则是“看不跌”策

下图为“看不涨”期权合约报价基金定义和分类标准,及合约对应的损益平衡分析图。

点击“国内期权”书签,或者在报价列表单击鼠标右键—>期权链,调出期权报价页面场内基金分类板块代码,在

点击下图红框位置调出不同策略的报价列表及损益图社会保险基金险种分类。

案例一、红绿柱揭示多空能量对比

常见的分时图上只有分时线、成交量、持仓量分类 公益基金 投资基金,均价线常见价量指标,没有体现多空

双方力量的指标scp基金会异常分类。如下图,股指开盘后价格下探国家自然科学基金领域分类,之后有了小幅的回调基金从组织性质上分类 可以是,此时无法预测后

势私募基金分类 境内美元,如果能知道当时的多空力量对比情况,对我们的交易决策有很大的帮助。

软件分时图中轴增加了反应多空能量对比强度的指标证券投资基金的分类及概述,红柱代表多头强,绿柱代表空

头强,柱的长短代表能量的大小基金分类知识。如下图所示投资对象分类的基金有,价格出现回调时如果能同时观察能量柱,

会发现绿柱在逐步缩短海通基金分类,空方力量在减弱,如果当时持有空仓,要小心了。随后能量柱由

绿转红我国现有基金分类,多方力量增强债券基金货币基金 分类,价格出现了微幅上涨请回答社会保障基金分类情况。多空能量柱让我们在分时图上又多了一个

参考指标股票基金分类介绍。

(当前价格-前第5分钟价格)/前第5分钟价格,开盘1-5分钟均与开盘价比较庄园小课堂那种分类基金风险高。正数

为红创业投资基金分类,负数为绿。

打开软件上方菜单【系统工具】下的“个性化设置”,在左侧找到“分时图设置”私募证券投资基金 分类,勾

选“显示多空能量红绿柱”。

案例二、叠加其他合约分时走势下列关于基金的分类说法正确的是,价差变化一目了然

关联合约的价格走势会存在一定的变化关系关于基金分类 以下说法,所以我们在交易的时候,对其相关联合

约的价格走势也要实时注意,但这样需要频繁在两个合约间切换观察比对,非常麻烦。如

下图所示为在沪深300与if合约的分时图,在交易时经常需要在两个合约间来回切换基金的分类 创业投资基金。

如果能将两个合约的分时线放在一张图上显示基金业协会关于分类备案的文件,就会更直观、方便,给我们省去了很

多麻烦基金分类包括。下图为if叠加了沪深300合约分时图,价差变大变小一目了然。当if与沪深

300价格超过合理价差时,可以对if做相应的买入/卖出委托。

股指合约:股指/沪金/沪银合约:分时图上点击鼠标右键->现货基差互联网基金如何分类。

除以上合约外的其他合约:分时图上点击鼠标右键->叠加其他合约。

(二)消除跳空还你连续图表

由于新旧合约更迭天天基金行业分类,在新合约上市时会出现大幅度跳空缺口基金是根据什么分类的,使得图表断档不连续,

这样的图表无法使用画线、指标等常规方法进行分析;以指标为基础的程序化也可能因为

跳空影响而出现错误的信号,导致错误的指导国际货币基金组织的四大分类。

跳空现象不仅出现在新合约上市阶段社会保障的基金分类,由于受到夜盘影响19种基金分类图解,也经常出现在每

天的开盘时间股票分类基金,在开盘的关键时刻影响我们对行情的判断基金等级分类标准。

下图为if305日k线图,合约在交割—挂牌(2011.5债券型基金的二级分类.20-2012支付宝里的基金分类在哪.3.19)期间存在很大跳空基金产品如何分类,

均线大幅度偏离k线趋势,均线指标失去了分析指导作用。

下图为if1305日k线消除跳空后的效果基金混合型分类。在交割—挂牌的无数据期间补充了if加权指数

日线数据(白K线部分),消除跳空后图表更连续开放式基金代码如何分类,指标更平滑,我们即可按惯用的方法

下图为if305的1分钟k线图,在2013指数基金也有很多分类吗.4基金按性质的的分类.24日开盘价和前一天的收盘价间存在很大

空,均线受前一天k线数据影响我国私募基金资金来源分类,对开盘的做空趋势反应迟钝公募基金和私募基金的分类。

下图为消除跳空后的if分钟k线图,消除跳空后均线与前一天趋势保持一致股权投资基金分类天使投资,

均线交叉形态彻底形成,做空指令显现生命科学 系统分类 国家自然科学基金 技术路线 范例,消除跳空后我们得到了更多的信息和机会壹基金垃圾分类联合行动计划。

原理1:折算历史k线数据:

用前一天最后一根k线的收盘价-新一天第一根k线的开盘价,计算出跳空缺口的

差距,在K线图中消除该差距。

原理2:插入一段仿真k线:

在合约交割至挂牌期间插入文华品种指数的数据国际qdii基金的分类。

1、日线以下周期采用折算历史k线的方式消除跳空开放式基金分类介绍。

2、日线及日线以上周期提供折算历史k线和插入仿真k线两种方式消除跳空基金监管分类,采用哪

3、消除跳空机制目前还尚未应用到外盘合约。

k线图界面点击鼠标右键->其他->消除跳空。

(三)分价图的解读—显现压力位看清成交密集区

如下图所示筑基金丹元婴分类,分时图的横坐标是时间融资 基金分类,纵坐标是价格和成交量东方财富网基金的分类,从分时图中可以分析

出每一个时间点的成交量对价格的影响私募基金银行账户分类。但如果想除去时间条件了解某个价位上总成交量,

分析市场中对哪个价位争议最大私募基金分类私募股权基金,及某个价位上多空双方的对比情况主动型基金是哪个分类,分时图就无法实现

想要除去时间看清真正的价量关系基金代码的分类,我们需要一个以成交量为横坐标、价格为纵坐标

的图表支付宝基金怎么分类,下图右侧的分价图正是这样的图表。从分价图中可以很容易找到成交量最大的价

位哪种分类基金风险较高,这样的价位很可能成为日后的一个支撑、压力价位债券基金按照类型分类。再从下图看价位对应的多空双方

的成交量,大部分价位都是空方(绿线)大于多方(红线),合约的价格也在空方的推动下

分价图以当日逐笔成交明细数据为基础美 私募基金分类 7倍,统计每个价位上多空双方成交量的大小,以

及每个价位的成交量与当日总成交量的比山东省自然基金分类。分价统计图的意义是看成交主要是集中在哪些

价格上,以及多空力量的对比。

如下图所示港股基金股分类,分价图共有两种形式我国的基金分类,分别是“对比模式”和“非对比模式”。

如下图所示方式调出分价图。

(四)k线标注看众家纷说

我们在交易过程中可能会对某段走势或某根k线有自己的看法想与人分享基金的分类视频,或者想听听

大家的意见和大家进行交流学习科研项目分类 其他 博后基金,但常常苦于没有好的沟通方式,只能在各论坛或者里

交流,圈子小,信息量也有限支付宝基金里面行业板块分类怎么找不到了。

增加了k线标注功能基金分类术语大全,可以在某根k线上发表看自己的看法基金投资类型的分类,也可以看到他人的看法,并

且可以在k线上留下自己的交易记录,如下图支付宝的基金如何分类。

在k线图上点击鼠标右键->其他->k线标注

1、调出“k线标注”功能后交易所基金分类,在需要标注的k线位置点击鼠标左键投资基金按投资渠道与客体分类,在弹出的文华说说窗

口中对选中k线发表看法、填下单记录西安社科基金分类。

2、文华说说窗口弹出后,有说说记录的k线下面会出现黄点,点击黄点所对应k线查看该

1、说说是对应合约和周期的中国投资基金的分类,所以要在发表过的合约和周期上查看。

2、说说是大家都能看到的基金的分类及特殊品种,你也能看到别人对行情的看法私密基金策略分类。下单记录是私密的基金的定义性质特点及分类,只看到自

目前期货市场中有一种被普遍应用于预测行情走势的方式是:看成交多空双方的力量强

弱蚂蚁财富基金分类货币基金,市场多方力量强价格会上涨;空方力量强价格会下跌。当成交量出现异动时自然基金委学科分类,多空双

方力量强弱会明显显示出来指数基金和货币基金分类风险高,我们可据此预测价格走势。

但市场上出现明显异动的情况不是天天都有发生养老保险基金运行模式分类,如下图所示债券型基金 分类。如何找到一个指

标能更好的了解多空双方力量强弱??

文华独创的“多空量比(DUALVOL)”指标对期货市场成交量变化具有更高的敏感度法学论文基金项目分类,

可实时揭示多空能量强弱,如下图所示临床自然基金分类。用户可以根据指标中的红、绿柱判断市场多空双

方力量强弱,从而对市场的未来走势判断提供更精准的参考价值。

柱高:主动买量与主动卖量的差值;值为正则在中轴之上画柱,值为负则在中轴之下

柱颜:柱颜与主动买量、主动卖量的差值有关,求SMA(主动买-主动卖基金的分类及适合人,P,1)的返

回值,如果值为正则为红柱,值为负则为绿柱(P为指标的参数值基金分类社保基金有产业基金吗,可自

在k线图的副图上单击鼠标右键—>技术指标—>量仓分析指标—>多空量比。

(3)相关常见问题解答:

①、主动买量基金分类标准及差别,主动卖量是怎么计算的?

答:最新成交价与卖价相同则该笔成交量为主动买的成交量,最新成交价与买价相同则

该笔成交量为主动卖的成交量。

②、如何修改“多空量比”指标参数p的值?

答:在多空量比指标上点击鼠标右键—>设置指标参数民间公益基金分类。选中DUALVOL,修改右侧P值。

  • 参考译文: 淮海一粟, , ; 刘恒江,

本教程用于引导学生运行蛋白质的分子动力学(MD)模拟. 如果待研究蛋白不包含非标准氨基酸残基, 教程所用的流程可作为研究蛋白的一个良好起点. 完成本教程后, 学生应该能够知晓设置和运行模拟所涉及的步骤, 以及在不同模拟阶段应如何选择. 此外, 学生还应该知道如何对模拟结果进行核查以保证模拟质量, 并了解可以使用哪些分析方法, 哪些分析方法更适合自己的需要.

本教程的目的在于考察一段小肽结合到其蛋白受体时, 生物分子相互识别的两种机理–构象选择以及诱导匹配–所具有的不同贡献. 完成本教程后, 学生应该能够:

  • 使用GROMACS设置和运行蛋白的MD模拟.

  • 对模拟结果进行质量核查并分析

  • 对从多肽的不同构象开始的不同模拟, 比较结果

  • 对手头的体系能够得出一些理论上的考虑

大多数教程都是使用终端或控制台应用程序完成的, 因为我们用于准备和进行模拟的程序没有图形化界面. 为了便于了解这种新的运行环境, 我们准备了一份简单的帮助文档, 以便让你熟悉在Linux环境下”生存”所需的基本命令. 点击下载此文件.

Linux下的所有命令都需要小心输入, 因为shell(负责解析命令的程序)是区分大小写的. 另一经常发生的错误是将数字0当成了大写字母O, 小写字母l当成了数字1, 或者反过来. 你可以简单地复制粘贴这些命令: 先使用鼠标选中它们, 然后在需要输入的地方按下鼠标中键(Linux模式, Windows下未必可行). 首先来试试下面的命令:

这会列出你的当前用户名. 请确保你不是以root用户登录.

上面的命令列出当前工作目录下的所有文件和文件夹. 当遇到file not found之类的错误时, 可以使用这个命令来检查.

这个命令给出当前目录的完整路径.

此命令展示了如何更换目录.

2. 蛋白-多肽相互作用

在决定细胞命运的大量蛋白-蛋白相互作用中, 多肽起着关键作用, 并占了大约40%的比例. 从辅激活剂到抑制剂, 它们在许多信号和识别途径中都有涉及, 并且已经被证实与大量蛋白结构域存在相互作用, 例如, MHC, SH3和PDZ结构域就是由于其多肽亲和能力而知名. 由于功能的多样性以及间接参与的许多生物途径的重要性, 使得多它们与许多疾病相联系. 药物设计中的一个领域就专门研究多肽并用于治疗各种疾病. 与小分子抑制剂相比, 多肽的优点在于可以模拟蛋白结合的结构域, 并且自身足够大能竞争性地抑制蛋白蛋白相互作用. 许多药物先导分子就包含抗菌多肽.

尽管科学家们收集了蛋白多肽相互作用的大量数据, 确定它们形成的复合物的结构仍然是个挑战. 这主要源于两个障碍, 多肽柔性极高, 并且与其底物的相互作用很弱, 这突出了它们在信号传导或调节中的重要性, 因为这些功能通常依赖于瞬态过程. 这些障碍使得实验结构测定并不简单, 需要借助额外的计算方法如生物分子对接才能完成. 从建模的角度看, 常规的用于蛋白-配体或者蛋白-蛋白对接的算法也经常受到柔性问题的困扰.

解决柔性问题的一个途径是进行分子动力学模拟, 对多肽的构象空间进行采样, 收集具有代表性的构象, 并用于预测它们与蛋白受体的相互作用.

3. 生物分子的识别机理

上个世纪人们提出了一些理论来解释分子的识别过程. 在这些理论中, 构象选择诱导匹配 机理在过去的50年中得到了大致相同多的支持. 构象选择假定, 在配体不存在的情况下, 蛋白处于多种离散构象状态的平衡中, 其中包括倾向与配体结合的那个构象. 这一概念与诱导匹配理论相反, 后一理论起初引入用于描述酶的活性, 认为构象匹配是由与底物的结合导致的.

在本教程中, 我们要考察这一两难问题–诱导匹配和/或构象选择, 方法是使用不同初始构象的分子动力学模拟对多肽的构象空间进行采样. 我们将不同的轨迹与实验确定的多肽在与其蛋白受体形成的复合物中的构象(结合构象)进行比较, 并检查这一构象在MD过程中是否出现, 这样就能验证构象选择理论.

经典分子动力学模拟从定义好的构型开始, 使用牛顿运动方程来计算粒子的轨迹. 对于体系中的每一粒子, 所受的合力根据它与其他粒子的相互作用来计算, 这些相互作用以力场进行描述. 力除以粒子的质量为加速度, 再加上粒子以前的位置和速度, 就决定了一小段时间步长之后粒子的新位置. 高的时间和空间分辨率使得MD模拟在测试基于实验数据的模型, 理解功能背后的原理并形成新的假说时非常有用. 不幸的是, 模拟体系的大小以及时间尺度存在限制.

本教程使用进行MD模拟和分析, 它是一个可以免费获取程序包, 遵循GNU GPL(General Public License). GROMACS程序只有命令行界面, 这意味着每一步运行都要键入程序的名称及其选项. 注意命令是区分大小写的, 每一命令键入时都必须精确地与教程一致, 关于GROMACS的更多信息以及手册请见其官方网站. (提示: MPI并行版本的GROMACS可以在多个节点(集群中的机器)上分配任务从而提高性能, 对单机而言MPI并不能提高性能, 因为GROMACS可以自动使用单个机器的多个核心)

由于程序只有命令行界面, 因此我们必须使用终端. 尽管在Windows环境下借助DOS终端也可以运行GROMACS, 使用Linux有一些优点, 这也是本教程的选择. 对一些学生来说, 从Windows转到Linux或许会感到别扭, 因为他们已经更习惯了Windows提供的界面. 重要的一点是记住, Linux并非Windows的免费克隆品, 而是一个功能强大, 高度可定制化的操作系统, 能够使你的计算机发挥更大的威力. 从Windowa转到Linux有时会被描述成. 开始使用Linux终端时, 需要知道一些最基本的命令(ls, cd, mkdir,

默认情况下, 你的系统已经正确设置好了.

你可以使用gmx luck命令测试GROMACS是否正确安装. 幸运的话, 你会得到一句引言. 这说明你的GROMACS已经正确安装好了.

在进行其他操作之前, 必须要获得初始结构. 结合构象可以从获取, 它是一个蛋白三维结构的数据仓库, 根据每个蛋白的登记号(如1klu)搜索蛋白(提示: 你可以使用命令下载文件: wget

蛋白数据库的页面, 除了提供结构的坐标文件(pdb文件)外, 也包含了分子体系的一些有用信息, 如所有分子的一级序列, 二级结构的指认, 长度, 生物功能等. 花些时间来浏览页面, 收集待研究分子的尽可能多的信息.

为开始教程, 根据多肽的PDB号下载相应的结构, 并记下下列信息:

  • 确定结构的实验方法及其分辨率

  • 多肽的一级结构(氨基酸序列)

  • 多肽的来源: 天然蛋白还是大蛋白的一部分?

首先使用分子查看软件来看看分子的结构, 我们建议使用PyMOL. 可使用下面的PyMOL命令来载入结构

执行上面的命令后, PyMOL会启动, 在一个窗口中使用线形模式来显示分子, 并在主窗口的右面列出各个对象, 这些对象可以通过点击其名称来移除. 每个对象名称的后面是菜单, 用于更改显示模式. 试着使用卡通模式来显示结构. 对那些习惯使用键盘的人(我们强烈建议你也使用这种方式), 可以通过在窗口中键入下面的命令来达到目的

使用上一步骤中收集到的信息, 通过键入下面的命令来选择包含多肽的pdb链

然后抽取多肽链保存到另一个对象

计算并显示蛋白的溶剂可及表面

对蛋白表面和多肽使用两种可区分的颜色进行着色

选择处于多肽5埃之内的所有蛋白残基进行着色, 这构成了蛋白-多肽的界面

如果对显示结果满意, 你可以进一步使用ray命令改善显示结果, 并使用png filename命令保存图片.

使用下面的命令记下在PyMOL中显示的结合多肽的氨基酸序列

比较PyMOL显示的序列和蛋白数据库给出的序列, 二者是否相同? 为什么?

PyMOL也可以用于生成多肽的初始构象. 默认情况下, 你可以使用Build菜单, 选择构象和需要增加的残基. 此外, 我们提供了一个脚本build_seq, 可以对给定的氨基酸序列生成相应的理想构象. 这个脚本可能很有用, 因为对于一些多肽构象, 如聚脯氨酸II, PyMOL并不知道所需要的phi/psi角度组合. 你可以通过在窗口中键入下面的命令来获知如何使用这个脚本

使用这个脚本生成多肽的三个不同构象, 我们在教程中要使用它们, 所以要给它们指定不同的名字, 将下面命令中的XXXXXX替换为结合多肽的序列(PyMOL中有显示)

使用卡通模式显示新创建的多肽

使用align命令在空间中对齐并叠合不同的构象, 查看它们的差异程度有多大

对齐与叠合计算会返回原子位置的根均方偏差(RMSD), 它定量地表征了不同构象的结构异同. 请记下每个align命令给出的RMSD值.

最后, 使用save命令保存构象, 类似下面保存螺旋多肽的命令

得到的pdb文件可以用于开始准备模拟.

现在使用命令quit退出PyMOL. 正如你注意到的, 绘制结构必需的所有信息都保存在.pdb文件中. 你可以使用gedit来查看pdb文件, 并试着理解这种文件格式.

pdb文件包含了很多涉及蛋白, 用于确定结构的实验方法和条件等的信息. PDB数据库网页实际就是将这些信息展示给你的. pdb文件中也包含了每一个原子的直角坐标. 注意, pdb文件中一般不包含成键连接信息, 而PyMOL像大多数分子查看软件一样绘制了原子之间的成键, 这些成键是自动根据原子间的距离来确定的.

结合态多肽的pdb文件和你自己使用build_seq生成的有什么不同(如氢原子)?

为你的结构创建一个目录. 由于最后需要将结果合并起来, 最好通过组合PDB标识(如peptide_bound, peptide_helix等)和个人标识指定明确且唯一的目录名称. 将结构文件复制到目录中并切换目录. 举例来说,

请仔细阅读教程, 并检查在每一步是否成功完成. 请细心阅读程序输出!!! 如果程序给出错误信息, 这些信息通常是自明, 容易理解. 检查文件类型和程序输出以理解每一步的过程. 大多数文件是可读的, 除了扩展名为.tpr, .xtc, .trr.edr的文件

分子动力学(MD)模拟包含三个步骤: 首先, 必须准备好输入数据(模拟体系); 其次, 必须对准备好的体系运行成品模拟; 最后, 必须分析模拟结果并将其置于相关背景中. 尽管第二步是计算中最耗时的部分, 一些模拟常需要运行几个月, 实际上最费劲的步骤在于模拟体系的准备和模拟结果的分析. 本教程的这一部分提供准备蛋白MD模拟, 运行, 分析结果的一个示例.

本教程使用 5.1.4版本, 大多数命令来自这一程序. 所采用的更通用, 也可以用于其他MD程序. 每一步骤会使用一个有输入和输出的节点示意地表示出来. 一个步骤可以是执行单个程序, 也可以是几个程序的组合, 其中一个的输出作为另一个的输入. 在单个程序的情况下, 会指定输入/输出类型和控制选项. 对大多数程序/步骤, 只会列出使用的输入/输出选项. 大多数程序提供了更多高级控制选项, 这里不再细述. 如果你有兴趣, 可以参看每个程序的帮助页面, 里面给出了程序功能的完整列表和说明. 这些帮助页面可以使用程序的-h选项来显示. 在工作流程中, 程序以黄色背景上的名称来标识, 输入/输出数据以绿色背景上的描述性名称标识, 蓝色块表示输入数据, 基本不依赖于待研究的结构. 橙色块是包含多个步骤及相关程序的过程. 在这种表示方法中, 橙色块单独用于表示模拟步骤, 在下面会详细解释. 数据到过程的连接线, 每一程序输入或输出的命令行选项使用黑色背景上的白色标识.

准备模拟体系是MD中最重要的步骤. 执行MD模拟可以在原子尺度洞察动力学的过程, 用于理解实验观察到的现象, 验证理论假说, 或者为一个有待实验验证的新假说提供基础. 然而, 对于上述各种情形, 设计的模拟必须适合目的, 要根据实际情况对模拟过程进行设计, 这意味着设置模拟的时候必须十分小心.

缺失残基/侧链/原子, 非标准基团

本教程我们模拟的是多肽. 整个过程的首要步骤是选择初始结构, 如前面所说. 然后就要检查这个结构是否缺失残基和原子, 这些残基和原子模拟时必须考虑, 因此必须想办法补充完整. 从pdb库下载的文件中会列出缺失的残基和原子. 由于本教程不涉及蛋白建模, 因此所用的初始结构是完整的, 不存在缺失, 因此无需进一步处理.

另一个需要注意的问题是, pdb结构文件中可能包含非标准残基, 修饰过的残基, 溶剂分子或者配体. 这些基团没有力场参数可用. 如果存在这样的基团, 要么除去它们, 要么补充它们的力场参数, 这牵涉到MD的高级课题. 本教程假定结构不含这类基团, 只包含天然氨基酸.

最后, 一些晶体散射数据的分辨率足够高, 能够在密度网格中区分水分子. 通常这些水分子只以氧原子表示, 在开始准备步骤前必须去除它们, 除非出于特殊目的要保留它们. 对本教程的多肽不需要考虑这种情况.

幸运的是, 大多数的这些”问题”分子在PDB文件中都被标识为杂原子(HETATM), 这样可以使用sed命令轻松地移除它们

对结构文件进行进一步检查以了解其质量是一个好习惯. 例如, 在晶体结构解析的精修过程中, 谷氨酰胺和天冬酰胺的酰胺基团的取向可能不正确; 组氨酸残基的质子化状态和侧链取向也可能存在问题. 列出了与蛋白有机氨基酸最相关的化学性质, 可做参考. 为了进行正确的结构验证, 可以利用一些程序和服务(如WHATIF). 本教程假定所用结构对模拟目的而言足够好, 不存在问题, 可直接用于准备体系.

一个分子可由各个原子的坐标, 成键和非键相互作用的描述来定义. 由于从PDB文件获得的结构只含有原子坐标, 我们首先必须构建拓扑, 它给出了原子类型, 电荷, 成键情况等信息. 拓扑对应着某一特定的力场, 选择使用何种力场是一个值得仔细考虑的问题. 这里我们使用AMBER99sb-ILDN全原子力场, 它被广泛用于采样和折叠模拟的研究.

拓扑与结构的匹配很重要, 这意味着结构数据也需要根据所用力场进行转换. 可以使用pdb2gmx程序转换结构并建立拓扑数据. 该程序可以构建分子的拓扑, 前提是这些分子由特定的构建单元(如氨基酸)组成. pdb2gmx使用构建单元的数据库进行转换, 对于数据库中没有的分子或残基, 程序无法识别, 转换过程会失败. 使用-ter选项后GROMACS会提示分子的末端变化, 合适的选择应该能够正确地表示体系. 在本教程中, 这取决于多肽是一个更大蛋白的片段(非带电末端)还是一个完整的分子(末端带电).

注意, 你可以使用下面的命令将gro文件和pdb文件进行互换

仔细阅读屏幕输出的提示, 并检查组氨酸质子化状态所做的选择, 注意蛋白质的总电荷数. 也要浏览输入结构的文件(protein.pdb)和输出的结构文件(protein.gro, GROMACS格式). 注意两种格式的区别. 最后浏览拓扑文件及其结构.

记下转换前后原子数目的区别, 解释为什么. 选择拓扑文件中的一个氨基酸残基, 列出其中的每个原子及其类型, 电荷.

在对体系进行能量最小化前, 需要选定模拟体系的大致外形(空间排布方式). 大多数常见的模拟都是在周期性边界条件(PBC, periodic boundary conditions )下进行的, 这意味着要定义一个单位晶胞, 它可以填充堆积整个空间. 这样就可以模拟一个无限, 周期性的体系, 避免了由于模拟盒子的墙壁导致的边界效应. 只有少数几个通用形状可用于设置PBC. 我们将使用盒子, 因为它对应于球的最佳堆积, 因此对自由旋转的分子是最佳选择. 为避免周期映像之间的直接相互作用, 我们设置多肽和盒子边界之间的最小距离为1.2 nm, 这样两个相邻的堆积盒子的距离就会大于2.4

4. 结构的能量最小化(真空中)

现在, 一个适合所选力场并且格式正确的结构文件已经建好了, 同时还得到了相应的拓扑和盒子. 然而, 由于结构转换中, 牵涉到氢原子的删除和添加, 这可能会导致局部有些过大的应力, 比如因两个原子的位置太接近而引起的作用力. 因此我们必须对结构进行能量最小化, 使其松弛一点. 这其实就是一个, 包括两个过程: 第一步, 结构和拓扑同时还有一些控制参数被整合在一起, 形成描述整个体系的单个文件. 这个过程会生成一个运行输入文件, 该文件可以作为唯一的输入文件, 用于第二步动力学模拟的mdrun程序. 把这个过程分为两步的好处是, 运行输入文件可以传送到专门的(高性能)计算机网络或者超级计算机, 并在那里完成模拟计算. 然而, 一般只在成品模拟中才会这么做.

为了执行这些步骤, 需要用到一个.mdp参数文件, 将该 保存到自己的工作目录下. 该文件包含一些能量最小化的控制参数, 请查看其中的内容. 注意, 文件中以integrator开始的行指定了所用的算法. 本例中, 指定采用最速下降法进行1000步能量最小化. 现在, 用以下命令整合结构和拓扑文件以及一些控制参数:

grompp程序将会提示此体系的净电荷不为零, 还会输出一些与体系和控制参数有关的其他信息. 该程序也会产生一个额外的输出文件(mdout.mdp), 里面包含所有控制参数的设置. 下一步, 运行mdrun

由于只有3150个原子, 能量最小化很快就完成了. 使用选项-v会将每步的势能和最大受力打印出来, 以便于跟踪能量最小化过程. -deffnm选项设定了所有输出文件的默认文件名, 避免了对每个输出文件进行命名, 从而减少了需要设置的选项. 现在, 结构弛豫好了, 我们该添加溶剂了.

使用了什么方法进行能量最小化? 参数文件中指定了多少步, 实际使用了多少步进行能量最小化? 什么原因致使能量最小化在指定步之前停止? 体系最终的势能为多少? 使用PyMOL载入能量最小化之前和之后的结构, 并进行比较.

现在单位晶胞已经设定好了, 结构也优化好了, 我们可以添加溶剂了. 有好几种溶剂模型, 每种模型多少都与某一力场密切相关. Amber99SB力场通常使用TIP3P水分子模型, 这个模型你已经在前面选择过了. 添加溶剂不需要拓扑, 但可能需要更新拓扑, 在其中添加溶剂. 使用以下命令向盒子中添加TIP3P溶剂:

看看protein.top文件的结束部分, 其中有添加溶剂的内容, 检查添加的溶剂分子的数目.

向体系中添加了多少水分子, 对应的体积多大? 体系中现在有多少原子?

执行命令后, PyMOL会绘制一个线框来显示三斜晶胞盒子的边界. 可能看起来不太明显, 但这个三斜形状对应于菱形十二面体. 另一个值得注意的事情是, 并非所有的溶剂都处于盒子内, 但都以长方体块状排布. 有时, 蛋白质也会部分地伸出水外面.

蛋白伸出水面外部为什么不是问题?

6. 添加离子: 抗衡电荷和浓度

目前我们已经有了溶剂化的蛋白质, 但体系仍存在净电荷. 为了使体系呈电中性, 我们必须添加一定数目的抗衡离子. 此外, 添加一定浓度的离子, 可认为是一个好的做法. 程序genion能完成这些任务, 但它需要一个运行输入文件作为输入文件, 即一个包含了结构和拓扑的文件. 就像前面一样, 我们可以使用grompp来生成这样的文件. 下载,

并指定必须加入超量的某一特定种类的离子以使体系呈电中性(-neutral). genion程序会询问用离子取代何种分子, 选择SOL组.

注意: 为中和体系电荷而添加的离子的数量. 通过将一些水分子替换为离子, 体系的拓扑文件protein.top不再正确. 你可以修改拓扑文件, 减少溶剂分子的数目, 同时在文件的最后一部分(molecules)中SOL的后面增加一行, 指定添加的NA离子的数目, 并再增加另一行指明CL离子的数目. genion也提供了一个-p选项能够自动更新拓扑文件, 更方便.

向体系中添加了多少钠离子和氯离子?

7. 溶剂化体系的能量最小化

到此为止, 整个模拟系统已经准备好了. 在开始成品模拟前, 唯一要做的是对体系再次进行受控的弛豫. 由于添加溶剂以及替换离子, 可能会产生不利的相互作用, 例如, 原子间的重叠, 同种电荷太接近等, 因此需要对体系再次进行能量最小化, 其步骤与前面相同: 先运行grompp, 再运行mdrun:

参数文件中指定了多少步, 优化过程进行了多少步? 体系最终的势能多大?

8. 溶剂和氢原子位置的弛豫: 位置限制MD

为了耗散掉体系的最大应力, 我们使溶剂分子适应蛋白, 即, 我们允许溶剂自由移动, 而将蛋白的非氢原子或多或少地固定在参考位置. 这么做的目的是为了确保溶剂的构象”匹配”蛋白质. 这一步骤是第一个真正的MD步骤, 控制参数在中. 浏览这个文件, 注意integrator行和define行. 后者用于控制拓扑文件的内容: define = -DPOSRES将定义全局关键字POSRES. 查看拓扑文件最后的内容, 理解位置限制是如何打开的.

也要注意, 我们开始引入温度并对体系进行热浴耦合. 换句话说, 体系将在打开温度耦合的情况下运行一小段时间, 让体系弛豫到一个新的状态. 为此, 我们为粒子赋予了速度, 这是通过参数gen_vel来控制的, 并在下一行设定了速度分布(Maxwell分布)的温度和随机数生成器的种子(gen_seed). gen_seed被设为-1, 但应该更改为另外的值(提示: 可以使用命令更改, 如sed -i /^gen_seed/s/-1/设定值/ npt.mdp). MD模拟是最重要的一步, 所以每次都以相同的坐标, 速度和相同的参数开始模拟时, 就会导致模拟结果一模一样, 这不是我们所希望的.

查看上面提供的mdp文件, 你使用哪个温度模拟体系? 选择这一特定温度的原因何在?

编辑完参数文件后, 使用gromppmdrun程序来准备和运行模拟:

为什么我们建议你修改随机数种子的值而不是使用自动生成的随机种子(默认值-1)? 模拟长度是多少ps? 在拓扑文件中位置限制是如何包含进去的? 有两个分别耦合到热浴的组, 它们是哪些组, 每个组中包含哪些粒子?

看看总能量, 势能和动能的变化会很有趣. 在前一步, 粒子没有速度, 所以没有动能, 因此也没有温度. 现在, 模拟一开始, 原子就被赋予速度因此获得了动能.

模拟过程中的能量信息被保存在不可读的(二进制)文件中, 其扩展名为.edr. 该文件中的信息可用gmx energy命令提取. 绘制体系的温度, 势能, 动能和总能量随时间变化的图.

运行上面的命令后, 会提示你一系列能量项以供选择, 所选能量项的结果将会被写入指定的输出文件中. 输入与温度, 势能, 动能和总能量相对应的数字, 最后输入0(零), 回车. (提示: 你可以通过使用管道(|)自动选择某些项, 例如echo 10 11 12 14 0 | gmx energy ...,

输出文件(.xvg)可以用xmgrxmgrace程序查看, 这些程序需要预先安装好. 也可以用我们提供的Python查看, 它能在终端窗口上显示出基于字符的图形.

注意: 绿色曲线是总能量, 黑色是势能, 蓝色是温度, 红色是动能. 你也可以点击曲线并填写Legend窗口以改变图例. 别忘了点击accept以接受改变.

温度如何变化? 势能/动能/总能量如何变化, 如何解释?

9. 放开限制: 第二次预平衡

预平衡常常分为两个阶段, 第一个阶段使用NVT系综(粒子数, 体积, 温度恒定), 这一系综通常也称为等温等容系综或正则系综. 这一预平衡过程所需的时间步数取决于体系的性质, 但在NVT中, 体系的温度应该会在需要的值附近达到一个平台. 如果温度没有稳定. 就需要延长模拟时间. 作为示例, 我们在前面已经进行了这一步骤, 现在就进行下一步骤.

前面的NVT预平衡, 稳定了体系的温度. 在进行数据收集前, 我们也必须稳定体系的压力(因此也包括稳定密度). 压力平衡在NPT系综下进行, 这一系综的粒子数, 压力和温度保持不变, 也被称为等温等压系综, 最能代表实验条件. 现在开始慢慢放开限制, 让体系弛豫到新的状态. 下载参数控制, 看看其中的压力耦合参数.

查看控制参数文件, 找到控制压力耦合的参数.

运行结束后, 再次查看一下能量和温度. 使用前面的方法抽取它们. 数据提取方法同前:

温度如何变化? 势能/动能/总能量如何变化, 如何解释?

现在开始重复相同的平衡模拟, 并逐步放开限制

10. 非限制性MD模拟: 最后一步预平衡

完成两个阶段的预平衡后, 体系在需要的压力与温度下平衡好了. 我们现在可以放开位置限制运行成品模拟以收集数据了. 过程与前面的类似, 因为我们要将检查点文件(在这种情况下它包含了压力耦合的信息)用于grompp. 下载.

运行结束后, 再次查看一下能量和温度, 同时注意观察压力变化. 使用前面的方法抽取它们. 数据提取方法同前:

看看能量, 温度和压力的变化曲线.

温度如何变化? 压力如何变化?

最后一个问题与如何从有限数量的粒子系统中提取热力学性质直接有关. 粗略地说, 热力学指的是大量粒子(例如, 几十亿个而不是几千个)的行为. 对大量粒子的性质进行平均能够减少波动, 相反, 仅对少量粒子进行平均, 较大的波动无可避免.

由于我们引入了压力耦合, 体系的密度会发生变化. 从能量文件中提取密度数据, 方法如下:

体系密度随时间如何变化? 如果打开压力耦合, 体系的密度为什么会变化?

终于到了最后一步. 我们已经得到了或多或少平衡好的溶剂化体系, 其中包含我们感兴趣的蛋白质, 所以该进行成品模拟了. 记住, 成品模拟并不表示整个模拟都可以用来分析感兴趣的性质. 虽然已经消除了初始构象的一些影响, 体系还不太可能已经达到平衡状态. 在分析阶段, 我们会检查模拟的哪一部分可以认为处于平衡状态, 适合用于进一步处理分析. 但首先需要设定运行参数. 这里只需要运行另一个模拟步骤, 类似于准备体系的最后一步. 然而, 这一步也是另一处需要考虑模拟目的的地方, 所以应当选择能满足待分析性质的有关控制参数. 可考虑以下问题:

  • 研究的问题在什么时间尺度上发生? 或者, 模拟需要运行多长时间?

  • 需要多少帧轨迹? 或者时间分辨率取多少?

  • 需不需要保存粒子的速度?

  • 是否需要输出所有原子的数据, 还是只需要蛋白质的坐标数据?

  • 每隔多久记录一次能量文件和日志文件?

  • 每隔多久记录一次坐标和速度的检查点文件?

我们将运行50纳秒的模拟. 下载控制参数, 先查看其中的内容.

为了完成50纳秒的模拟, 需要多少步?

你必须编辑参数文件, 指定运行步数使得总模拟时间为50 ns. 然后使用grompp命令将最终的结构文件和准备步骤中得到的拓扑文件合并为一个运行输入文件.

虽然运行输入文件是二进制格式, 我们还是可以查看其内容. 在某些情况下, 模拟会发生一些意外, 这可能与内部控制和力场参数有关. 在这种情况下, 查看运行输入文件尤为有用. gmx dump程序可以将运行输入文件转换为可读格式. 转换后的内容可能会有很多页, 因此建议将其重定向到一个文件中, 或使用moreless命令分屏显示文件. 输入以下命令查看运行输入文件的内容(注意, 在实际操作时, 需要把文件名protein_md.tpr替换为运行grompp后所得到的文件名):

模拟结束后就可以进行数据分析了. 这是一个重要的过程, 包括三个阶段. 首先, 有必要进行一些标准的检查, 以便对模拟质量进行评估. 如果评估结果表明模拟良好, 就可以对每个模拟进行分析, 回答预设的研究问题了. 最后, 来自不同模拟的结果可以综合起来.

注: 文件名应当能反映文件的内容, 根据模拟体系的不同而不同. 这里我们假定使用默认的文件名, 这意味着会有以下文件:

  • topol.tpr: 运行输入文件, 包含模拟开始时体系的完整描述

  • confout.gro: 结构文件, 包含最后一步的坐标和速度

  • traj.trr: 全精度轨迹, 包括随时间变化的位置, 速度和力

  • ener.edr: 随时间变化的有关能量数据

  • md.log: 模拟过程的日志, 包含模拟过程中的信息

另外, 许多分析工具都能生成.xvg格式的文件. 这些文件能用xmgrxmgrace程序查看, 也可用Python在终端以字符形式显示.

在进行其他分析之前, 必须确认模拟正常结束. 有许多原因可能导致模拟中断, 特别是涉及力场或体系平衡不充分的问题, 要检查模拟是否正常结束, 可以使用gmx check程序

确认模拟运行了50纳秒.

轨迹文件中有多少帧, 时间分辨率为多少?

模拟信息的另一个重要来源是是日志文件. 在md.log的结束部分给出了模拟过程的统计数据, 包括CPU和内存资源的使用情况以及模拟时间. 查看日志文件的结束部分. 如果你使用less, 可以按住G(shift-g)来略过前面部分, 跳到文件结束. (提示:

模拟实际运行了多少时间(小时), 模拟速度为多少(ns/day)? 要模拟1 s需要多少年? 势能的哪部分贡献消耗量大部分计算时间?

现在是有趣的部分, 尽管多数分析都归结为从轨迹文件中提取图像, MD当然最重要是的体系的运动. 我们要看看轨迹.

首先使用GROMACS提供的查看器ngmx来看看. 虽然该程序的完善程度和视觉效果不及其他查看软件, 但它能够根据拓扑文件的信息绘制成键. 其他查看软件可能隐含长程键, 导致这些键被认为太长而不画出, 或者会在非常接近的原子之间画出键. 这是对模拟结果分析的一个常见错误. 使用ngmx载入拓扑和轨迹文件:

看看程序菜单, 试试不同的选项. 播放动画. 观看过程. 通过右边的选项控制. 右击或左击选择选项来改变查看.

为了可视化轨迹, 我们将从轨迹中抽取1000帧(-dt 50), 并去除水分子(当提示选择时, 选择蛋白Protein). 此外, 我们还要消除跨过盒子边界的跳跃形成连续轨迹(-pbc nojump). 要处理这些事情, 我们使用瑞士军刀般的GROMACS工具trjconv, 它有1001个可能的组合选项. 我们使用它输出一个多模型的pdb文件, 用于PyMOL可视化.

在PyMOL中载入轨迹

载入所有帧后, 播放动画

当播放动画时, 所有其他控制仍可以工作. 你可以使用鼠标旋转或缩放体系, 也可以改变分子的表示模式.

如果多肽扩散超过盒子边界, 会发生什么?

如果一切正常的话, 现在你可以看到多肽的扩散, 翻转和扭动. 但我们对内部运动更感兴趣, 而不是整体行为. 在PyMOL中, 你可以使用命令intra_fit将轨迹中的所有其他帧与第一帧对齐, 随后, 你可以使用orient命令设定聚焦点在多肽上

现在所有帧都已经叠合好了, 你可以看到多肽的一些部分比另一些部分运动得更剧烈, 这种运动的差异在后面会进行定量化分析.

当然, 使用卡通模式表示多肽显示效果会更好:

上面的命令会将碳骨架表示为粗管状, 而无法显示正确的二级结构元素, 因为.pdb文件中没有二级结构信息. PyMOL能够计算蛋白的二级结构, 但只计算一帧, 然后将结果应用到所有的帧. 例如, 下述命令可以计算第一帧的二级结构:

通过指定状态编号, 可以改变要计算的帧

最后, 让我们同时查看所有帧, 检查多肽的柔性和刚性区域

请随便摆弄PyMOL. 试着放大柔性或刚性区域, 并检查侧链的构象. 请使用raypng命令制作图像, 即使浪费点(CPU)时间也不要紧(提示: 将场景输出为POV-Ray格式, 得到的图像可能更酷). 但记住, 如果图像的场景太过复杂, 可能会导致PyMOL的内置光线追踪器崩溃, 这种情况下, 你可以直接使用png保存屏幕上的图像.

如果有足够的机时, 你可以考虑制作一段不错的动画. 你可能已经注意到了, 轨迹的噪声很大. 这基本上是热噪声, 因此只是蛋白正常行为的一部分, 但这些噪声对制作好的动画会有影响. 我们可以滤除这些高频的运动, 只保留更慢更平滑的整体运动. 为此, 可以使用filter命令:

退出PyMOL(quit), 检查目录下的文件(ls), 你会发现多了好些文件, 包括250张图片. 以每秒30帧的速度, 这些图片可以制作大约8秒的动画. 下载和参数, 用它来生成单帧图像的动画(你可能需要编辑参数文件来改变文件名):

对轨迹进行了最初的可视化检查后, 该对模拟质量进行一些更彻底的检查了. 质量保证(QA)包括对一些热力学参数收敛程度的测试, 如温度, 压力, 势能和动能等. 更常用的含义, QA试图评价模拟是否达到平衡. 通过起始结构和平均结构的均方根偏差(RSMD)也可以对结构的收敛性进行检查. 接下来必须检查相邻周期性映像之间没有相互作用, 因为这种相互作用会导致一些非物理效应. 最后一步QA测试是计算原子的均方根波动, 并与晶体学数据的b因子进行比较.

我们首先从能量文件中提取一些热力学数据, 包括温度, 压力, 势能, 动能, 晶胞体积, 密度以及盒子大小等. 这些量中的大多数已经在前面的准备步骤阶段检查过了. 能量分析使用energy命令进行, 该程序读入能量文件, 也就是模拟过程中生成的扩展名为.edr的文件. energy命令会提示需要从能量文件中抽取哪些项, 并为其生成一个图形. 使用下面的命令

执行命令后将列出一系列存储在.edr文件中的能量以及相关项. 本教程的能量文件中可能含有59项, 每一项都可以抽取并作图. 最前面的9项对应于力场中的不同能量项, 44以上的项列出对蛋白Protein和非蛋白Non-Protein组划分后的结果, 包括二者之间的相互作用. 键入要提取的性质的序号并回车就可以得到相应的.xvg数据文件. 要抽取温度, 键入temperature 012 0并回车(也可不键入0, 但需要回车两次). 使用xmgrace查看下图形, 观察温度如何围绕设定值(310 K)上下波动.

也可以从热力学性质的涨落计算体系的. 为此, 除体系温度外, 还必须从.edr能量文件中抽取焓(NPT系综)或总能量Etot(NVT系综)的值. 进一步, 我们必须使用-nmol选项明确指定体系中的分子数目(你可以查看拓扑文件的最后部分获知体系中分子的总数). 这样energy就可以自动计算热容并在输出部分的最后报告这个值. 更多细节请参考手册D.29.

体系的平均温度和热容多少?

通过名称引用能量项可实现能量文件的自动处理. 使用echo和管道(|)可以将一个程序输出重定向为另一个程序的输入, 这样energy的选择可以自动完成. 要抽取多个项, 各项之间必须以\n分割, 复制粘贴或键入以下命令行来抽取其他项.

逐个查看这些文件, 观察对应数值的收敛情况. 如果有的数值没有收敛, 这意味着模拟还没有达到热力学平衡状态, 必须延长模拟时间才能进行进一步的分析. 此外, 达到平衡前的过程是不能用于分析的. 这里, 为简单起见, 我们忽略这些考虑, 直接使用模拟的结果进行分析.

energy.xvgbox.xvg文件中给出的是什么性质? 估计压力, 体积和密度的稳定值.

一些性质收敛慢, 达到平衡所需的时间长于另一些性质. 特别的, 温度很容易收敛而体系各部分间的相互作用可能收敛较慢. 这样会导致温度已经收敛到平衡值, 而体系不同部分之间的相互作用仍需要更长时间进行平衡. 查看多肽与溶剂之间的相互作用能:

3.2 周期性映像间的最小距离

质量保证中最重要的检查事项之一就是确保周期性映像之间没有直接的相互作用. 由于周期性映像是全同的, 其间的相互作用是物理上不应该发生的自相互作用, 会导致模拟结果不合理. 设想具有偶极矩的蛋白会有直接的相互作用. 那么同一蛋白处于盒子边界的两个末端之间就会产生吸引, 这将影响蛋白质的自身的行为并导致模拟结果不合理. 我们通过计算每一时刻周期性映像之间的最小距离来证实这种情况不会发生.

周期性映像之间的最小距离多大, 何时出现? 在你的模拟过程中, 用于长程非键作用的截断距离是多少? 根据这一距离, 两个周期性映像之间允许的最近距离多大? 当最小距离小于截断距离时, 哪一非键能量项受影响最大, 为什么? 如果最小距离小于截断距离, 会发生什么情况? 你的模拟中是否出现了这种情况? 选择C-alpha组重新运行mindist, 结果有变化么? 对你的体系而言, 这意味着什么?

要注意小距离事件是不时出现还是持续出现. 如果持续出现, 很可能影响蛋白的动力学; 如果只是偶尔出现, 那基本没有影响.

不仅直接相互作用需要担心, 非直接效应, 即以水为媒介的间接相互作用也可能引起问题. 例如, 蛋白可以导致水在离其最近的四个溶剂化层中出现有序性, 这大约对应于1 nm的距离. 理想情况下, 最小距离不应该小于2 nm.

取决于某(些)原子质量与分子重心的关系, 可用于表征蛋白质结构的密实度. 作为QA的一部分, 我们将计算回旋半径, 它给出了每一时刻分子形状的信息, 可以与实测得的水动力学半径相比. 可以使用gyrate计算回旋半径, 这一程序将会给出回旋半径的各个分量, 对应于惯性矩阵的本征值. 这意味着第一个单独的分量对应于分子的最长轴, 最后一个对应于最短轴. 实际上, 三个轴的值给出了分子形状的整体描述,

查看回旋半径及其分量, 注意这些值如何达到平衡值.

回旋半径收敛了么? 如果是, 什么时候收敛, 收敛值为多少? 不同多肽模拟给出的回旋半径其涨落行为是否类似, 为什么? 你能将回旋半径的涨落与周期性映像的最小距离联系起来么?

除了能量等性质, 也能够通过结构的变化和弛豫来考察模拟趋向平衡的收敛性. 通常, 这种弛豫仅仅使用结构到参考结构(如晶体结构)的欧几里德距离来衡量. 这一距离被称为均方根偏差(RMSD). 然而, 我们也建议再考察一下到平均结构的弛豫, 即相对于平均结构的RMSD, 个中原因将在下节说明. 但是要计算相对于平均结构的RMSD, 需要首先获得平均结构. 平均结构可以在计算时顺便获得.

RMSF计算每个原子相对于其平均位置的涨落, 表征了结构的变化对时间的平均, 给出了蛋白各个区域柔性的表征, 对应于晶体学中的b因子(温度因子). 通常, 我们预期RMSF和温度因子类似, 这可以用于考察模拟结果是否与晶体结构符合. RMSF(和平均结构)使用rmsf命令计算. -oq选项可以计算b因子, 并将其添加到参考结构中. 我们最关心的是每个残基的涨落, 这可使用选项-res设定.

使用xmgrace查看RMSF的图形, 区分柔性和刚性区域.

确定最柔性区域的起始和终止残基编号, 给出其最大振幅. 比较不同多肽构象的结果. 是否有区别? 如果是, 哪个构象柔性最大, 哪个构象柔性最小?

为了对这些结果获得关联性的印象, 这里有个人类朊蛋白质1qlz的RMSF, 图中标示出了会导致CJD疾病的突变残基.

将两个pdb文件载入PyMOL, 根据b因子对结构bfactors.pdb进行着色, 并确定柔性区域. 平均结构是非物理结构. 查看下其中的一些侧链, 注意观察平均对构象的影响.

颜色分布在b因子值的范围内, 其中蓝色表示最小值(最稳定), 红色表示最高值(波动最大). 你可以通过截断最大值来调整颜色范围, 例如将其设置为350:

如果你很好奇, 可以再次计算b因子, 但这次使用每个原子的值:

在当前的PyMOL中载入新生成的bfactors-atom.pdb文件, 这样可以直接将其与残基平均的b因子相比较. 如果需要, 不要忘了重新调整颜色范围.

比较和对照两个b因子的结构.

以下图像显示的是根据模拟计算得到人类野生型UbcH8蛋白的b因子着色图. 蓝色对应低值, 红色对应高值.白色区域表示目前已知的能够反转蛋白质相互作用特征的残基. 在图像右侧, 你可以看到那些在螺旋2的前后环区有较高的b因子.第二个图像是螺旋2的前环的放大显示.

当心! 由于你的多肽可能会跳出盒子外, 我们必须处理轨迹, 将粒子重新置于中心的周期性映像中. 为此, 可使用下面的命令:

由于计算RMSF时也得到了平均结构, 我们现在可以计算. RMSD通常用于表征结构到平衡态的收敛情况. 如前面所讲, RMSD是结构变化对原子总数的平均, 基本上是一个距离表征, 低的值最有意义. RMSD可以用rms命令计算, 此命令可以实现对不同时刻不同分组的原子进行结构平均. 首先计算所有多肽原子的RMSD, 使用初始结构作为参考结构

如果观察到了, 在什么时间RMSD达到平台期, 平衡值多少?

再次计算, 但只考虑骨架原子:

这次的RMSD值更低, 这是由于计算时排除了通常更柔性的侧链原子, 在两种情形下. 两个RMSD都应该增大到一个平台值, 这意味着相对于参考结构, 多肽的结构达到了一定的距离, 然后或多或少保持在那个距离. 然而, 随着距离的增加, 可能的构象数目也在增加, 这意味着尽管RMSD达到了一个平台值, 但结构可能仍在趋近于其平衡态. 为此, 我们建议同时也检查趋向于平均结构的收敛情况.

与前面得到的图像进行比较. 注意在哪一点RMSD值开始趋平.

简要讨论下两个(相对于起始结构与相对于平均结构)图像的区别, 哪一个更能表征收敛情况?

到从为止, 我们完成了分析的第一部分, 包括可视化考察和质量确保检查. 现在该深入一点, 发掘一下蛋白质内部的情况. 分析的第二部分包括可根据多肽构象计算的结构性质, 例如氢键数量, 溶剂可及表面或特定的原子-原子间距离等.

结构分析: 构象派生的性质

  • 当提示选择时, 如果教程没有明确说明如何选择, 或者没有遵循教程自身的逻辑, 请选择蛋白Protein组.

确认模拟已经收敛到平衡态后, 就可以进行一些真正的分析了, 模拟数据的分析可以分为几种类型. 第一类包括对单个构象进行解释, 在每个时间点根据一些函数获得一个值或多个值. RMSD和回旋半径就是例子. 这样的性质, 可称为构象依赖或瞬时性质. 此外, 也可以在时域对过程进行分析, 例如, 通过对一段时间内的平均化得到(自)相关或涨落. 在本部分会进行一些常见的分析, 其中的每种分析都会得到直接由轨迹(随时间变化的坐标)导出的某个值的时间序列. 问题可以参考程序运行时的屏幕输出或图像.

氢键数目是一类信息丰富的性质, 无论是内部氢键(蛋白-蛋白)还是蛋白和周围溶剂之间的氢键. 氢键存在与否可以通过氢键施体-H-受体之间的距离和施体-H-受体之间角度来推断. hbond命令可计算模拟过程中分子间或组间的氢键数目以及氢键距离或角度的分布. 使用下面的命令, 然后查看得到的输出文件

讨论两种情形下氢键数目的关系, 每种情形下的氢键数目的波动情况.

特定的氢键可以使用包含待研究原子编号的索引文件来考察. 查看多肽前一半和后一半所涉及的氢键. 你必须看看confout.gro文件来检查残基编号并将多肽大致分为两半. 假定你的多肽含有14个残基, 其编号始于22终于35. 你想将它分为两部分, 22-28和29-35. 下面的第一个命令将在组选择菜单中创建两个新的条目, part_1part_2. 第二个命令是一个使用索引文件运行hbond的通用命令. 你可能想要看看N端和C端之间的氢键, 例如, 可以用来监测β发卡的形成.

注意, 你必须根据自己的多肽替换上面命令中的数字.

根据氢键分析, 你的多肽在模拟过程中是否形成类似β发卡的构象?

判定蛋白结构的最常用参数是指定二级结构元素, 如α螺旋, β片层. 能提供这一信息的一个程序是dssp, 但前提是你的电脑已经安装了dssp程序. 此程序并不是GROMACS发行的一部分, 但能够从获得. 下载后请解压, 然后将环境变量DSSP设定为程序的路径, 如/home/student/dssp.

GROMACS提供了一个dssp的接口, 可以计算轨迹中每帧的二级结构.

首先, 需要生成消除跳跃的轨迹

secondary-structure.xvg文件包含一个时间序列, 列出了每帧中与每一二级结构类型相关的残基数目. 更多的细节在.xpm文件中, 它使用颜色编码了每个残基在一段时间内的二级结构. .xpm文件可以使用类似Gimp的程序查看, 但可以使用GROMACS工具xpm2ps添加一些有用的元数据, 得到的结果可以使用gview查看, 或转换为pdf后使用xpdf或evine查看.

讨论二级结构的变化, 如果有的话. 比较不同蛋白二级结构的稳定性.

蛋白质骨架的phi和psi扭转角是两个洞察蛋白质结构特性的有用参数. phi对psi的绘图称为拉氏图, 该图中某些特定区域反映了蛋白二级结构元素或氨基酸的特性, 而(这些区域之外的)其他区域被认为是禁阻的(不可到达). phi/psi随时间的变化可以体现出结构的转变. 这些角度可以通过rama程序进行计算, 尽管结果有些粗略, 因为程序将所有角度都输出到单一的文件中. 若想研究单个残基, 可通过Linux程序grep将其从图中选出来.

此文件中包含了全部氨基酸的所有phi/psi角. 要抽取某个残基的角度, 例如LEU-24, 可键入

抽取每个残基(除边界外)的拉氏图, 并用xmgrace对其进行可视化, 描述它们的主要相似性与差别.

根据拉氏图, 讨论每个残基的构象稳定性.

动力学和时间平均性质的分析

每组学生模拟了一个从不同构象开始的多肽, 这样做的目的在于增加采样, 或者增加模拟能够覆盖的结构空间. 为了对轨迹和多肽构象性质有一个完整的观点, 我们必须将轨迹拼合到一起.

由于大多数操作/计算在执行时都需要一个拓扑文件, 为避免使用哪个文件, 从那个轨迹开始之类的问题, 请从下载你的多肽文件. 这一文件包含了多肽分子位于原始蛋白-多肽复合物中的直角坐标. 你也可以使用这一结构来计算相对于结合结构的结构相似性. 下载pdb文件后, 你必须将其转换为GROMACS的坐标文件(.gro), 这是教程中第一步骤的重复操作. 别忘了选择合适的力场和水模型, 尽管后一选择对分析并无影响.

这样, 使用新生成的这个文件来创建索引文件, 这样我们可以进行更多的选择. 在这一步, 与前面不同, 我们不需要指定任何特定的残基组, 因此, 我们简单地推出程序(键入q)

现在我们可以对我们新生成的轨迹进行截断, 使用trjconv去除前10 ns. -b选项设定要创建的新xtc文件的开始时间, 单位为ps, 这意味着我们需要新文件从10 ps开始. -dt选项指定我们要保留的时间精度. 当提示选择时, 选择Protein来生成xtc文件.

为什么我们只分析最后40 ns的轨迹?

下面的命令会输出一个单一的.xtc文件, 其中包含以下列顺序排列的四个轨迹, bound-helix-polypro-extended. 这一顺序很重要因为后面要进行比较, 因此需要特别注意. -settime选项指定在拼合轨迹时使用连续的时间, 这意味着首帧时间为10 ns的第二个轨迹, 会恰好放在第一个轨迹的后面50 ns处. 如果你忘记了这个选项, 所拼合的轨迹具有重复的时间戳(即每一轨迹的原点都是10 ns). 我们要选择选项congtinuec, 指示trjcat从前一轨迹的最后时间戳处开始新的轨迹.

我们在前面已经计算过RMSD, 并用其来检查模拟的收敛性, 但它也可以用于更进一步的分析. RMSD是两个结构之间的表征. 如果我们对轨迹文件中每一对结构的组合计算RMSD, 就可以看到是否有属于同一类型或具有相同特征的结构组. 属于同一组的结构其RMSD值较低, 而与其他组结构的RMSD值更高. 利用矩阵来表示RMSD值, 可以用于识别转变状态.

要建立RMSD矩阵, 可使用rms处理两条轨迹. 如果你要单独考虑组(簇)及其在不同轨迹之间的转变, 可以将所有的四条轨迹合并为一条, 再使用rms生成交叉RMSD矩阵. 所有的RMSD计算时, 选择主链组Mainchain.

得到的矩阵是灰阶图. 为了显示更清楚, 可以使用彩虹梯度图.

分析时为什么选择主链组? 你看到多少簇? 在不同的轨迹中, 你是否对相同构象进行了采样? 你是如何发现的? 什么是轨迹的重叠, 即对相同构象空间进行采样? 你能发现多少转变? 从这个分析你能得到什么结论? 这是你预期的结果么? 请证实你的观点.

基于结构间的距离RMSD, 可以将结构归并为反映构象可及性范围及其相对权重的一组组团簇. 这可以通过聚类算法来完成, cluster命令实现了一些聚类算法. 这一程序会生成好几个输出文件. 检查该程序的帮助文档, 了解每一个它们的含义, 然后运行程序. 注意, 我们已经计算了RMSD矩阵, 可以将它作为cluster的输入.

聚类算法使用的RMSD截断值为多大? 这一值代表什么, 如何影响得到的团簇数目? 共有多少团簇? 最大的两个其尺寸多大?

前两个团簇之间是否存在可觉察的差别?

采用RMSD比较结构的一个不足之处在于, 它包含了最小二乘叠合, 这会影响结果. 但是, 一个蛋白的结构也可以使用一系列的原子间距来表示. 这可以用于获得一个比较的表征量, 并且不依赖于叠合, 这就是距离RMSD(dRMSD). 可以利用rmsdist命令来计算dRMSD.

dRMSD何时收敛? 收敛值多大? 所得图像与标准RMSD相比有何区别? 查阅GROMACS手册, 看二者是如何计算的. 试着根据二者的计算方法解释你观察到的区别.

我们现在要回答构象采样的问题, 在我们的轨迹中, 我们是否对多肽的结合构象进行了采样? 为此, 我们要对多肽的结合构象再次运行rms. 我们可以使用合并的轨迹来进行这一分析, 而不是计算并生成四个不同的RMSD图形. 记住你生成的合并轨迹中构象的顺序, 这很重要. 当叠合计算RMSD值时, 选择主链Mainchain组.

如果在计算时我们包含整个蛋白(即所有原子), 而不是只选择主链Mainchain原子, 结果会有什么变化? RMSD和距离RMSD图形有区别么? 在不同轨迹中, 你是否对多肽的结合构象进行了采样? 对你研究的情况, 关于对蛋白多肽识别的构型采样假说你能得出什么结论?

本分析的最后一步是计算自由能形貌(FEL, free energy landscape), 它由不同多肽构象开始的轨迹采样所得. 除了看起来很酷以外, 它能显示出 在整个模拟过程中多肽所经历的自由能的谷和丘. 此外, 在对接计算中需要选择有代表性的结构时, FEL会变得更有意义.

FEL表示一个映射, 分子在模拟过程中所经历的所有可能构象到相应能量的映射. 典型的能量是Gibbs自由能. 正如你所想象的, 使用直角坐标来代表不同的构象是不合适的(你能想象4维形貌么?). 因此, FEL通常使用两个变量来表示, 它们反映了体系的特定性质, 并表征了构象变化. 例如你可以使用绕一根特定键的扭转角, 或分子的回旋半径, 或相对于天然状态的RMSD来作为这两个变量. 第三个变量是自由能, 可以从体系相对前面所选变量的分布(概率分布)来估计. 当使用三维表示时, 形貌图中的谷表示低自由能区域, 代表体系的亚稳定构象, 丘表示连接这些亚稳定状态的能量势垒.

FEL的计算可以使用GROMACS命令sham, 为了体验更好, 我们提供了一些额外的脚本将FEL载入Mathmatica(建议使用版本9), 并漂亮地显示出来. 此外, Mathmatica还可以用于识别形貌中的谷, 并确定哪些坐标匹配这些特定的状态. 利用这些信息可以追溯sham的输入, 用于提取轨迹中的时间帧, 进而得到代表性的结构.

我们将计算两个变量用于表示自由能. 为表示多肽的构象变化, 我们计算其回旋半径, 以及相对于平均结构的RMSD. 我们不使用天然状态, 因为那会破坏后面的对接模拟. 并且, 我们可以基于合并的轨迹计算这些变量. 计算FEL的一个前提是充分采样, 或者使用不同的初始速度重复进行长时间的模拟, 或者如在我们所做的, 从不同的构象开始进行模拟.

我们如何从MD轨迹中抽取代表性结构用于对接模拟? 给一个前面用来分析多肽构象变化的方法, 并说明这种方法可用于此目的.

因为FEL分析依赖于在多肽构象空间的充分采样, 并基于构象的分布进行Gibbs自由能估计, 我们需要准备新的轨迹文件(.xtc), 其中的帧数是我们到目前为止所用的十倍. 注意我们没有使用-dt选项. 对所有四条原始轨迹重复下面的步骤, 注意要更改名字.

使用和前面完全一样的做法合并高分辨率轨迹(当提示时间戳时选择ccontinue)

现在我们需要生成FEL计算所需的数据. 先计算合并轨迹的回旋半径Rg, 方法如前:

为计算相对于平均结构的RMSD, 首先必须重新计算整条轨迹的平均结构. 再次使用rmsf命令生成平均结构(-ox选项), 然后使用平均结构做参考, 利用rms计算RMSD, 方法如前. 当提示时, 对叠合和计算都选择蛋白Protein组.

sham命令需要一个文件, 其中包含多个列, 每一列代表不同的坐标. 为生成一个正确的输入文件, 我们使用Perl脚本sham.pl, 并将我们刚生成的两个xvg文件作为它的输入. Perl是一种很类似Python的编程语言. 这个脚本将两个文件作为输入, 并假定数据处于文件的列中. xvg文件的第一列通常是时间, 第二列是感兴趣的坐标. 与Python一样, Perl的计数也是从零开始, 因此选择列数时小心. 下载并执行下面的命令. 输出文件只是两个xvg文件的简单合并, 第一列代表时间, 第二列和第三列是特定时刻的Rg值和相对于平均结构的RMSD.

现在我们有了正确的sham输入文件, 可用于生成FEL. 如果你还记得, Gibbs自由能可以根据分布概率计算出来, 并且依赖于指定的温度. 使用sham的选项-tsham来指定正确的体系温度(如果你不记得这个值, 可检查成品模拟所用mdp文件中的值).

如果使用sham计算FEL时, 指定非常高的温度, 会出现什么情况?

sham的输出可以使用xpm2ps输出到ps文件, 再用pdf阅读器查看. 但是, 当选择代表性结构时这种二维等值线图帮助不大, 需要查看数据时也很麻烦. 为此, 我们准备了一个Mathmatica文件, 可用于FEL的2D或3D可视化和检查. 由于Mathmatica不支持xpm文件, 我们准备了一个Python脚本用于将任意的xpm文件转换为3列数据的文本文件, 这样更易操控. 你可以下载, 用它转换xpm文件

下载Mahmatica, 然后打开, 遵照其中说明, 更改开头的文件路径. 如果一切正常, 你可以看到类似下面的图像

查看FEL并找到其最小点(谷)的位置. 选择你认为具有代表性的一些最小点(5). 你可以通过在2D等值线图上右键点击, 选择Get Coordinates选项来获知对应的坐标. 之后, 当你在图像上移动鼠标时, 会显示每个特定点的坐标. 记录这些坐标, 然后返回原始的sham.pl脚本输出文件查找相应的时间戳. 使用sham生成FEL的过程涉及坐标的分格, 因此对原始值有所近似, 不要期待你能找到精确的对应值.

从FEL中选择你认为能代表多肽状态的五个点, 记下它们的坐标.

为了在150000行中查找特定的内容(尽管使用gedit的搜索选项很方便), 我们提供了一个搜索时间戳的. 可以使用它来得到5个时间戳. 你需要提供sham.pl的输出, 并给出两个坐标(顺序要正确). 下面是一个示例

如果你总是得到No timestamp found...这样的错误信息, 试着使用附近稍有区别的点, 或打开脚本增加变量nval的值到100或更大.

将代表性结构的时间帧与以前根据RMSD矩阵获得的相比, 这些代表性结构是否与结构簇相符?

一旦你有了5个点的时间戳, 你可以使用它们从合并的轨迹中抽取代表性结构. 下面的例子抽取45 ns时刻的结构:

在PyMOL中打开代表性结构以及结合结构, 并比较二者.

以下分析整理自泛素耦合酶教程, 用于说明操作过程, 但具体问题未必适用于前面的多肽-蛋白教程.

特定氢键可以用包含相应原子数量的索引文件来得出. 从分析1得出的RMSF及b-factors显示loops 2 和 3 (helix 2附近)值比较高. 实验数据也显示, loop 1可能在UbcH6 and UbcH8的多个行为中起了一定作用. 看看这些loop所包含的氢键连接. 第一个命令会在菜单中弹出3个新的条目去选择基团, 每个loop一个. 第二个命令是一个通用命令g_hbond, 需要一个索引文件. 你可能想看看每个loop里的氢键、loop1和loop2之间的氢键;例如, 某个特定的loop和蛋白质其他部分的氢键(为此可能需要修改索引文件)或者和水形成的氢键, 等…

除了氢键之外, 蛋白质不同的带电残基之间也常形成盐桥. 它对蛋白质的结构起着重要的稳定作用, 尤其是当它们处于憎水环境中时, 例如蛋白质核心. 但是盐桥也能在蛋白质暴露的表面形成, 这对于介导蛋白质的识别过程往往很重要. 残基间的盐桥分析可以用saltbr命令进行. 程序会输出一系列xvg文件, 给出-/-, +/-(最关注的)和+/+残基间的距离. 当需要时, 通过设置-sep选项, 这个程序可以为每对相反的带电残基产生一个输出文件, 这些残基位于轨迹中的某点, 彼此处于一定的截断距离范围内(这里是0.5 nm, 通过-t选项设置). 这将产生许多文件, 所以分析时最好建立一个单独的目录. 执行以下命令:

为了更清晰, 删除与钠离子和氯离子有关的文件:

看看以下残基之间的相互作用:

对于这些相互作用你有什么想法? 残基K60和D88高度保守, 仅仅将UbcH8中的残基D56突变为E56都会改变蛋白的相互作用方式. 其可能原因何在?

溶剂可及表面积(SAS)

这四个参数都可用sasa命令计算, 它还可以计算每个残基或原子一段时间内的平均SAS. 输键入下面的命令, 要计算SAS的组和输出组都选择蛋白Protein, 然后查看输出文件.

哪个残基是最容易被溶剂触及的?

原子间距离的分析和NOE

前面用到的rmsdist命令也可用于进一步的距离分析. 特别地, 为了解结构及其稳定性, 查看原子间的平均距离及其波动可能会有用处. 使用下面的命令对蛋白质中每对原子间的平均距离及其波动进行计算获得矩阵, 然后用上面的步骤重新着色, 并显示.png文件的结果(rmsmean.pngrmsdist.png).

简单地解释两个图像: rmsmean表示结构, rmsdist表示柔性/稳定性. 回想前面分析得到的信息并查看结构.

从实验角度看这些距离同样重要. 原子间距离的边界值可以由NMR实验推断——利用核的Overhauser效应(NOE)——这也是NMR结构计算间的主要推动力. 如果蛋白质模型正确, 这个预期得可以到的NOE信号可通过MD模拟来计算. 这些信号与距离密切相关, 特别是r-3和r-6权重的距离. 这些信号也可以用rmsdist计算.

模拟战, 最小的1/r3和1/r6平均距离为多少?

计算向量的弛豫计算及其自相关. 对蛋白质, 通常包括碳骨架N-H或侧链C-H向量. 这种自相关给出了向量能保持其方向多长时间的量度, 因而为表征可变性和稳定性提供了指示. 序参量是自相关的长程限制. 如果一个分子能够自由旋转, 序参量将不可避免地减小到零; 但在分子框架内(内部参考框架), 序参量常有一个明确的值, 这个值表明总体稳定性. 通过叠合蛋白质, 这个参考框架可以固定下来,

N-H序参量可以用chi命令计算. 这个程序可以写出一个.pdb文件, 把序参量加入了b因子列, 更容易查看. 该程序也计算J耦合参数, 并可以和NMR结果相比较, 或用于指导NMR实验.

看看.xvg文件中的序参量, 并用PyMOL查看.pdb文件, 根据b因子的值给残基着色.

记下起始与终止的残基, 具有最高序参量值的两个区域的平均值. 序参量与波动(RMSF)相比如何?

一个常用的, 但常常理解不深的分析方法是对轨迹进行主成分分析(PCA, PrincipalComponents Analysis). 这种方法有时候也称为本征动力学(ED, essential dynamics), 目的在于识别原子的大尺度集约运动, 从而揭示隐藏在原子波动后面的结构信息, 帮助确定哪些运动方式对蛋白质的整体动力学贡献最大.

在含有N个原子的体系中, 存在3N-6个可能的内部运动方式(另外6个自由度用来描述体系的外部整体的平动和转动). 在MD模拟中, 粒子的波动是互相关联的, 因为粒子彼此之间存在相互作用. 关联的程度有大有小, 但那些通过键直接相连或者彼此位置接近的粒子会产生显著的运动一致性. 粒子运动之间的相关性导致了体系总体波动的结构性, 对大分子而言, 这种结构常常与其功能或(生物)物理特性直接有关. 因此, 研究原子波动的结构性可以为了解这些大分子的行为提供有价值的洞见. 然而, 确实需要一定程度的线性代数方法和多元统计方面的知识才能来解释结果并认识到该方法的缺陷. 特别的, PCA的目标是用新的变量来描述原始数据, 这些新变量是原始变量的线性组合. 这也是PCA存在的最主要问题: 它仅仅使用原子运动间的线性关系来解释问题.

PCA的第一步是构建协方差矩阵, 它表征了每对原子之间原子运动的共线性程度. 协方差矩阵从定义上说是一个对称矩阵. 接着将这个矩阵对角化, 得到一个特征向量矩阵和特征值的对角矩阵. 每个特征向量描述了粒子的集约运动, 其中的向量值表示相应原子参与运动的程度. 通常, 体系中的大多数(>90%)运动是由10个以下的特征向量或主成分来描述的. 与特征向量相应的特征值等于以集约运动中的每个原子描述的波动的总和, 因此是与特征向量相关的总运动的一个度量, 可用于比较不同情况下蛋白质的可变性, 但对不同大小的蛋白质进行比较时, 就难以得到有意义的解释. 更多信息请参考Leach的9.14.

协方差分析会生成很多文件, 因此最好在一个新的目录中运行:

协方差矩阵的构建和对角化可使用covar命令. 键入下述命令进行分析:

对PCA, 我们主要关心蛋白质骨架上的原子, 因此提示时选择backbone组. 构建和对角化协方差矩阵可能需要一些时间.

协方差矩阵的维数多少? 特征值的总和多少?

现在, 看看covar.xpm文件中的协方差矩阵.

矩阵显示了原子间的协方差. 红色表示两个原子运动一致, 而蓝色表示它们彼此向相反的方向运动. 红色的深度表示波动振幅的大小. 对角线上的值对应于前面得到的RMSF图.

查看除端基外运动最剧烈的两个部分, 它们之间如何相对运动, 它们各自相对于蛋白的其他部分如何运动?

从协方差矩阵能得到一组组相关或反相关运动的原子, 从而可以将其集约运动重新写入总运动. 我们前面提到过, 特征值保存在eigenvalues.xvg文件中, 通过相应特征值表示出总波动.

使用文本编辑器查看eigenvalues.xvg文件, 计算头五个特征向量对总运动的百分比以及累积百分比.

典型地, 最初五个特征值将捕获主要运动, 这相当于>80%的总运动. 如果解释的总波动较低, 就说明没有明确的集约运动.

为了解特征值的实际意义, 可用anaeig命令作进一步的分析. 为了更近地看看前两个特征值, 键入以下命令

特征值对应于运动方向. 选项-extr沿着选定的特征值从轨迹中提取极端结构. 把这些结构导入PyMOL查看:

把 pdf 文件中的模型分开, 删除原始结构.

给模型着色. 特征值1中的极端结构显示为蓝-绿色而特征值2为黄-红色.

用PyMOL的align命令, 能画出表示两种构象差异的小条.

对特征值1而言, 极端结构之间的最大区别是什么? 对特征值2呢?

为了理解特征值的意义, 想象一下旅行推销员在欧洲城市间的移动. 这种移动可用地球坐标系统来说明, 对每个位置需要采用三个坐标. 虽然这样做没有问题, 但如果你只想解释推销员的移动, 这种方法不是最佳的. 因为理论上, 任何坐标系统都一样好, 我们可以定义一个新的坐标系统来解释推销员的移动. 实际上, 因为地球表面可以用二维空间代表, 我们只需要两个坐标而无须三个. 直观看来, 有人会以南北极(经度)和东西轴(维度)说明, 但也可以从移动中推断出轴. 比方说推销员在伦敦-雅典轴上走的最多, 这个轴可以作为第一个特征值; 第二个特征值与第一个正交. 用这种方式, 推销员在欧洲的每个位置就可以用在这两个特征值上的投影唯一地确定下来. 对它们的投影作图, 就可以显示出旅行路线. 沿着第一个坐标的极端投影对应于雷克雅未克(Reykjavik, 冰岛首都)和莫斯科, 即使它们实际上不在这个轴上.

蛋白质构象也和上面所述的一样. 你看到的极端投影并不一定对应于物理结构, 但是它们可以表征沿轴的运动和总的运动程度. 为了解蛋白质沿构象空间的移动, 我们可以画出特征值2对特征值1的投影图. 为此, 从两个.xvg文件中提取投影数据并且合并到文件ev1-vs-ev2.dat中. 注意’>’表示输出由屏幕重定向到一个文件中, 所以你看不到任何屏幕输出.

投影的形状如何? 它们相互依赖么(分布有所重叠)? 如果只对最后7.5 ns进行分析, 是否得到相同的特征向量(轴)? 使用最后5.0 ns呢?

◆本文地址: , 转载请注明◆
◆评论问题: , 欢迎留言◆

我要回帖

更多关于 范围公式 的文章

 

随机推荐