前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >几个常见的弱相互作用测试集(1):JSCH2005、S22

几个常见的弱相互作用测试集(1):JSCH2005、S22

作者头像
用户7592569
发布2020-07-27 15:26:29
6920
发布2020-07-27 15:26:29
举报
文章被收录于专栏:量子化学

最近几篇推送会简单介绍几个常见的弱相互作用测试集,欢迎大家批评指正。标题中的测试集在文献中可能对应好多种英文说法,如data set、benchmark database、benchmark set、training set、validation set、assessment set、test set等等,在不同的用途中应该选用恰当的说法。

JSCH2005、S22

文献:Petr Jurečka, Jiří Šponer, Jiří Černý, Pavel Hobza, Phys. Chem. Chem. Phys., 2006, 8, 1985–1993

1. JSCH2005

JSCH为作者四人的姓的缩写,2005为提出年份。该论文发表于2006年,但文章的收稿日期为2006年1月4日,因此文章应该是2005年完成的。JSCH中共有143个结构,包含了三种摆放方式的DNA、RNA碱基对和一些氨基酸对,原子数最少24,最多54。几个代表性的结构如下图所示:

在这类化合中,主要存在氢键和色散两种弱相互作用。文章主要对这些化合进行了MP2和CCSD(T)水平的结合能的计算。在这篇文章中,作者对我们常说的结合能作了两种形式的区分。结合能的笼统定义为

ΔE=E(AB)−E(A)−E(B)

即复合物的能量减去两个单体的能量,而单体的结构是直接取自复合物的结构还是经过优化的结构,便对应着两种定义,作者在文中分别称之为interaction energy和stabilization energy,两者之差实际就是单体在复合物中结构和经过优化的结构的能量差,称为deformation energy。这也提醒我们在自己的研究中,要注意当谈及结合能时,最好说清楚单体的结构是否经过优化。

在计算方法上,作者在MP2水平下,使用了aug-cc-pVDZ、aug-cc-pVTZ基组,部分较小的体系还使用了aug-cc-pVQZ基组,并使用了以下两种外推方式,将能量外推到基组极限:

在CCSD(T)方法下,由于当时的计算条件远不如现在,最多只能用到aug-cc-pVDZ基组,因此CCSD(T)在基组极限下的能量使用了以下方法得到:

以上外推和近似在《电子能量的基组外推以及ORCA中的自动实现》一文中均提到过。

对比以氢键结合和堆叠方式结合的碱基对的结合能,文章中得到结论,MP2方法通常会略微低估氢键作用,而比较多地高估色散相互作用。事实上,这已经是目前计算化学领域的常识了,MP2方法对氢键往往表现不错,而对π-π类型的弱相互作用往往会严重高估。因此在处理色散相互作用主导的体系时,CCSD(T)是非常有必要的。

此外,作者还得到一个有趣的结论。长期以来人们认为DNA双螺旋结构的主要稳定因素来自于两条链之间的氢键相互作用,而文中作者发现碱基对之间的氢键相互作用大概在10到30 kcal/mol,而色散相互作用往往也会有10几kcal/mol,而在实际的DNA双螺旋结构中是存在碱基之间的堆叠结构的,因此色散相互作用也是很关键的。

2. S22

S22为Set 22的缩写,包含了22个化合物,是一些较小的模型体系。作者将其分成了三类,如下图所示:

关于相互作用能的计算,所用的方法和所得结论与JSCH2005类似。文中作者提到,在当时,一个新的方法通常只用少量含氢键的体系和极少的(有时只有一个)色散作用体系进行参数拟合和测试。而将方法应用到实际体系中之后才会发现其不足之处。因此他们提出一个比较稳定的数据集,可供新方法进行测试。作者认为他们提出的S22数据集中包含了各种弱相互作用类型,可以较好地用来对量子化学方法(如DFT方法)进行评价。

受限于当时的计算能力,S22数据集中的结合能的精度还不是太高。而且作者根据体系的大小,对不同的体系使用了不同大小的基组。对公式(3)中的两项,第一项为MP2基组极限的能量,作者一共使用了cc-pVTZ/cc-pVQZ、cc-pVQZ/cc-pV5Z、aug-cc-pVTZ/aug-cc-pVQZ三种可能的组合进行了能量外推,不同体系所用的基组不一致。对于公式(3)中的第二项(常称为ΔCCSD(T)校正项)对不同的体系也是在不同的基组下得到的。因此,后续不断有论文对S22数据集的结合能进行了更高精度的计算,并对近年来新发展的波函数方法的变体(如SCS-MP2、SCS-CCSD等)和众多的密度泛函进行了标定(如Truhlar等曾使用S22测试集的结合能数据对40种泛函进行了测评)。

2010年,S22的作者Hobza等人又对S22数据集进行了扩展。在原始的S22数据集中,所有的结构均是经过优化的平衡结构。在扩展的S22中,作者对每个结构的单体之间的距离进行了改变,共改变了4个距离,因此每个体系共有5个结构,作者将其命名为S22×5数据集。

S22数据集还存在另外两个问题,一是所包含的弱相互作用类型偏少,二是所含的体系基本局限在碱基(JSCH2005中含有一些氨基酸)等生物分子。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子化学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档