前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ICLR 2022 | 能量启发的分子构象优化

ICLR 2022 | 能量启发的分子构象优化

作者头像
DrugAI
发布2022-03-25 13:56:29
2590
发布2022-03-25 13:56:29
举报
文章被收录于专栏:DrugAI

编译 | 夏忻焱 审稿 | 沈祥振

本文介绍了关嘉麒&Wesley Wei Qian团队发表在ICLR 2022的文章《ENERGY-INSPIRED MOLECULAR CONFORMATION OPTIMIZATION》。作者研究如何预测分子的空间原子排列或分子构象,提出了一个神经能量最小化的概念。他将预测问题归结为一个展开的优化过程,并将神经网络参数化来学习隐式构象能量场的梯度空间。假设底层势能有不同的函数表达式,作者可以重新解释并统一许多现有的模型,还可以有原则地推导出SE(3)-equivariant神经网络的新变体。

1

介绍

3D分子构象是决定分子很多物理化学和生物特征的最重要的特征之一。在考虑化学反应和相互作用的空间约束或电子效应时,分子的3D电荷分布和物理形状至关重要。因此,分子构象被广泛应用在定量结构活性关系(QSAR)评估和药物发现中。随着对虚拟药物筛选和de novo 药物设计的关注度日益提高,目前更需要快速准确地预测分子构象以得到其3D 几何特征。

最近,深度学习技术被引入来解决并且取得了理想的结果。例如,生成模型被提出首先生成原子对的配对距离,然后从这类矩阵中推导出构象体。因为3D结构是间接生成的,所以第二步中对于估计距离的误差很敏感,可能需要额外的模型来编码冗余量。与此同时,出现了许多SE(3)-equivariant网络来处理3D旋转对称的输入,使其能够直接操作三维笛卡尔坐标。最近这类模型最成功的应用是用于蛋白质结构预测的AlphaFold系统。尽管有许多好处,然而现有的SE(3)-equivariant网络要么来自需要昂贵系数计算的复杂数学理论,要么是基于消息传递直觉的启发式计算。

作者提出了一种全新的方法,将分子构象预测展开为固定数量的优化步骤,其中神经网络被参数化来学习隐式构象能量场的梯度空间。在此方法中,该模型可以将一个给定的构象体向更稳定和能量优先的状态去优化。作者不仅可以重新解释现有模型,而且可以从构象能量函数的假设中推导出SE(3)-equivariant模型的新变体,使得模型的结构与其物理假设保持一致。通过实验发现,这些新变体与其它SE(3)等模型相比,在构象体优化方面的性能表现更好。此外,作者提出的优化方法也适用于构象体的生成,可以生成多样且准确的构象体。

此论文的主要贡献包括:

  • 将构象体预测问题转化成一个多步骤展开的优化过程,其中学习了隐式构象能量场的梯度空间。
  • 提出了一个全新的框架,明确地将底层能量函数与SE(3)-equivariant神经网络联系起来,这样就可以推导出与物理假设一致的新模型,或者从能量的角度解释一些现有的模型。
  • 展现了在优化和生成任务里,分子构象预测的具有竞争性经验性的表现。

2

方法

分子构象代表了原子的3D排列,与构象能量联系紧密。因为分子构象的每个平衡点都可以被视为势能表面的局部最小值。因此可以通过梯度下降找到这些稳定结构,因为这是一个能量最小化的过程。具体地,给定一个特定的能量函数E,可以通过梯度下降更新3D直角坐标来优化构象体X,使得E最小化:

其中γ是学习率,我们可以观察到

为一个稳定结构。因此,如果能量函数E(X|)是完全表征的且对X可微,我们可以通过迭代应用梯度下降来更新,很容易地从初始构象体中找到一个稳定的分子构象。不幸的是,情况通常不是这样。

作者利用神经网络的计算能力,让它直接从数据中学习梯度场,而不是手工设计能量函数及其梯度。一旦网络被训练,就可以用该模型展开优化,并执行上述优化的神经版本,其中公式1中的梯度项∇E不是来自显式能量函数,而是由神经网络估计的。

对于所有∈X,∈和∈,其中φ是估计各自梯度场的神经网络,神经网络的精确参数将取决于能量函数。在这项工作中,为了简单起见,作者将视为一个常数表示,因此,它在作者的模型中没有更新。

3

结果

3.1分子构象优化

如表1所示,所有的优化模型都可以改进由RDKit+MMFF估计的初始构象。从新框架中得到的新变体也明显优于两个最先进的SE(3)-equivariant模型。

如图2所示,作者的模型可以产生既实际而且能量稳定的结构体。在没有刻意设计的情况下,作者的模型预测的构象体也能很好地捕捉到基本成分的结构(例如,苯在同一平面上形成一个环)。对于初始构象体(RDKit+MMFF)没有以最稳定方式折叠/旋转的大分子,作者的模型也可以将构象体优化到稳定状态后来作为参考构象体。

如图3所示,可以发现由作者的模型预测的构象计算出的HOMO-LUMO间隙与参考构象吻合良好,而参考构象与力场优化构象之间的相关性却要低得多。在第二项研究中,作者针对QM9基准,用参考或预测的构象训练了一个标准的神经网络模型SchNet。如表2所示,用作者预测的构象体训练的模型优于其它预测构象体训练的模型。

3.2分子构象生成

如表3所示,作者的模型在所有的指标上的表现都很有竞争力,特别是在更具挑战性的GEOM-QM9药物数据集上,本模型超过了所有的机器学习方法。这些结果表明,作者的优化公式可以很容易地推广到多样化且准确的构象集合的生成设置中。

4

总结和讨论

本文提出了一种新的分子构象预测公式,通过参数化一个SE(3)-equivariant网络来模拟构象能量景观的梯度场。通过将SE(3)-equivariant模型与潜在的能量函数联系起来,作者还发现了一个新的视角,主要推导出SE(3)-equivariant模型的新变体,该模型与物理系统的一组明确的基本假设相一致。通过大量的实验,作者证明了所提出的方法能够优化一个给定的构象到其最能量稳定的状态,并有效地生成一个不同的和准确的构象的集合。这种受能量启发的视角也为思考SE(3)-equivariant模型提供了一个新的方向,并期望社区通过更适合其应用的能量假设得出更有趣的变体。

对于未来的工作,作者的兴趣也超出了小分子的构象,因为作者可以进一步扩大系统规模来模拟更大的生物分子系统,如蛋白质-配体复合物。此外,探索像DEQ这样对平衡状态直接建模的模型也是很有趣的。由于作者的训练目标对手性是盲目的,系统将需要在模型生成后推断手性,而作者能否构建内置手性的系统仍然是一个有趣的问题。最后,由于具有快速生成高质量分子构象集成的能力,作者也对使用构象集成的分子机器学习很感兴趣。

参考资料

Guan, J., Qian, W.W., Ma, W.Y., Ma, J. and Peng, J., 2021, September. Neural Energy Minimization for Molecular Conformation Optimization. In International Conference on Learning Representations.

代码

https://github.com/guanjq/confopt_official

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档