首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Natl. Sci. Rev. | LamNet: 面向药物研发及更广泛计算科学的炼金术路径感知自由能预测框架

Natl. Sci. Rev. | LamNet: 面向药物研发及更广泛计算科学的炼金术路径感知自由能预测框架

作者头像
DrugOne
发布2025-12-25 15:01:26
发布2025-12-25 15:01:26
450
举报
文章被收录于专栏:DrugOneDrugOne

本文介绍由浙江大学侯廷军教授和谢昌谕教授团队发表的一篇关于加速炼金术自由能计算的最新研究工作。在该研究中,作者提出了一个全新的炼金术路径感知的图神经网络框架LamNet,旨在精准物理计算与快速AI预测之间开辟第三条道路,将计算物理原理与图神经网络深度融合,为蛋白-配体结合自由能预测提供高精度、高效率和高泛化的实用工具。高精度自由能计算是药物研发中最关键却最昂贵的步骤之一,几十年来,研究人员始终在两条道路之间艰难平衡,经典物理计算准确但极其耗时和门槛高,而纯数据驱动的深度学习方法计算高效但面临泛化危机。LamNet针对这些瓶颈,通过建模配体在蛋白口袋中的炼金术转化路径和构建深度融合计算原理的学习框架,显式刻画和学习了沿热力学路径的自由能变化趋势,使得模型具备物理一致性与更强的泛化能力。该模型在RBFE和ABFE任务上进行了大规模跨体系测试,取得了优于现有深度学习模型且接近经典物理计算精度的表现,同时实现了最高3-4个数量级的加速。

研究背景

自由能是统计物理中的核心概念,对于理解蛋白-配体相互作用、预测分子行为以及推进理性药物设计至关重要。无论是在先导化合物优化阶段不同衍生物结合能力的比较,还是在早期药物筛选阶段潜在候选物的快速评估,准确且高效的自由能计算都至关重要。然而,现有高精度方法通常依赖于分子动力学模拟,计算成本高昂,难以支撑药物研发所需的广泛探索。同时,模拟体系内部的构象动力学、配体结合口袋的柔性变化以及溶剂效应等使得自由能计算极易受到参数设置、采样策略和初始构象的影响。因此,在保证准确度的前提下尽可能地提升效率,仍是计算药物设计领域亟需解决的重要难题。

当前主流的自由能计算方法主要包括两大类:物理解离路径方法与炼金术自由能方法。物理路径方法通过模拟配体沿真实物理路径解离的过程,能够提供高物理保真度的自由能变化信息,但在现有算力条件下少有应用。炼金术自由能方法通过一系列由λ参数描述的炼金术中间态将两个终态连接起来,在保持高精度的同时具备相对较高的应用价值,是目前高精度方法的金标准。然而,炼金术自由能方法仍面临两方面的局限性:其一,计算成本依旧很高;其二,结果高度依赖于λ参数的设置,尤其是结构扰动较大时难以收敛。已有研究提出了一系列变体,如LaDyBUGS、CS-FEP-CAR,虽在一定程度上改善了精度与效率之间的平衡,但仍未从根本上化解成本高、适用性受限的问题。与此同时,深度学习方法因其推理速度快而受到广泛关注,但普遍依赖于静态结构数据,缺乏对动力学与微观物理过程的刻画,导致其面临泛化灾难,难以跨体系推广。更重要的是,这类模型通常无法捕捉相互作用的动态贡献,也无法反映自由能沿炼金术路径的连续变化规律。综上,现有方法要么受限于计算代价,要么受限于物理表达能力,尚未形成兼具准确性、效率与可推广性的统一自由能计算/预测框架。

为突破上述瓶颈,研究团队开发了全新炼金术路径感知图神经网络框架LamNet。该模型的学习框架设计紧密遵循炼金术计算物理的基本原理,显式建模了沿热力学路径变化的窗口级自由能,从而在不依赖高成本模拟的情况下复现炼金术自由能方法的底层物理机制。LamNet使用过程级模拟数据进行训练,并结合数据可靠性指标,能够准确预测窗口级自由能,同时具备跨体系的强泛化能力。LamNet可支持三类应用:(1)高效、可靠的RBFE预测;(2)可扩展的ABFE预测;(3)通过优化λ参数来改进经典计算的收敛性。值得强调的是,LamNet是一个新颖的深度学习框架,通过特定变化路径的设计和训练数据生成,可扩展到其他自由能计算方法和广泛的计算科学领域中。

模型架构与设计理念

如图1所示,LamNet的整体流程由三个主要阶段构成:输入阶段、表征学习阶段和输出阶段。在输入阶段,LamNet包含了终态分子结构和λ参数,以区分不同下游任务的热力学路径以及隐式代表一系列期望的炼金中间态。在表征学习阶段,LamNet首先从分子结构中提取原子层面的节点和边特征,并对λ参数进行编码,随后通过异质信息传递区分共价与非共价相互作用,从而建立完整的相互作用图。同时,LamNet通过乘性融合体现炼金术自由能计算中的相互作用随λ的动态变化。此外,LamNet通过特征拼接顺序编码热力学循环的两条路径,使模型能够区分不同转化路径的自由能贡献。在输出阶段,LamNet不直接预测最终的RBFE或ABFE,而是预测每一个λ下的窗口级自由能,使模型能够学习自由能景观的缓慢与动态变化趋势,更好地识别炼金转化的物理规律。此外,LamNet引入损失加权策略增加高质量样本的权重和减少低质量/噪声样本的影响,进一步提升模型的可靠性。最终,RBFE或ABFE可通过累积不同路径预测的窗口级自由能直接获得;同时,通过控制相邻窗口之间的自由能差不超过特定阈值,模型也可用于优化λ参数设置。

此外,LamNet使用经典计算累积的过程数据,这一特性对AI与计算化学两个领域均具有重要意义。从AI的角度看,LamNet突破了传统“静态结构—实验亲和力”一一对应的数据限制,为解决数据扩增瓶颈提供了新的方向。从计算化学角度看,LamNet为将以往常被忽略的模拟过程数据转化为有价值的训练资源提供了新思路,从而提升分子模拟的科学价值,也有助于推动数据共享。

总之,这些特殊的设计使得LamNet在结构上天然具备与炼金术自由能计算理论一致的物理解释性。通过学习复杂体系在炼金路径上自由能的平滑变化规律,LamNet作为一种数据驱动方法也能体现出不同寻常的泛化能力。同时,受益于建模角度的微观性和过程性,LamNet可以实现多重下游应用,其不仅能够预测自由能,还可以指导和改进经典计算。

图 1:LamNet工作流。

结果与讨论

泛化能力测试

研究首先在12个结构与序列差异显著的蛋白体系上系统评估了LamNet的泛化能力。实验包括靶点特异性测试和留一靶点排除测试。图2左图显示,当LamNet仅在单一靶点的模拟数据上训练时,即使在零样本条件下,模型也能够实现对未见靶点验证集的准确预测(大多数情况下Pearson r高于0.85)。图2右图进一步表明,当LamNet在11个靶点上训练并用于预测剩余靶点的验证集时,模型在所有体系中均保持了稳定且优异的泛化能力(Pearson r均高于0.85)。这些结果表明,LamNet能够在多种分布外场景中保持可靠的性能,而这通常是深度学习模型的薄弱之处。

图 2. LamNet在窗口级自由能预测中的泛化表现。

RBFE基准测试

LaDyBUGS基准测试

接下来,研究评估了LamNet在药物设计中最常见的自由能计算任务:RBFE预测中的表现。研究选取了Robo等人在研究LaDyBUGS方法时使用的三个测试体系。为了更全面地探索LamNet的表现,将其与LaDyBUGS及经典计算方法TI进行了对比。为评估LamNet的泛化能力与在药物设计中的实际应用能力,当测试集中靶点与训练集中靶点重复时,采用留一策略,将各靶点视为独立的外部测试集合进行预测。

与LaDyBUGS和TI相比,LamNet及其不同变体在RBFE预测中表现出更高准确性,并保持了良好的一致性。如图3所示,其中(a-d)为LamNet各变体,(e-h)为不同采样设置下的LaDyBUGS与TI。在cMet体系中,LamNet的准确性与排序表现最佳(RMSE = 0.84 kcal/mol,Pearson r = 0.72)。在thrombin体系中,LamNet_p_w的准确性最高(RMSE = 0.31 kcal/mol),并保持较好的排序能力(Pearson r = 0.86)。pfkfb3的结论类似(RMSE = 1.02 kcal/mol,Pearson r = 0.68)。此外,LamNet的数据驱动特性带来了显著的计算效率提升。TI每个窗口通常需要5 ns的采样,对应约2000 GPU 小时/靶点;LaDyBUGS总采样时长为5 ns,对应约20 GPU 小时/靶点。而LamNet在单张GPU上仅需不到一分钟即可完成一个靶点的预测,实现了3-4个数量级以上的加速。

图 3. LaDyBUGS测试集的RBFE预测结果。

FEP1&FEP2基准测试

研究进一步在两个大规模测试集FEP1与FEP2上评估了LamNet的表现。除非另有说明,模型默认配置为带损失加权策略的LamNet(LamNet_w)。如图4a-c所示,FEP1测试集包含8个蛋白靶标,共计199个配体。在此数据集上,LamNet的整体RMSE为1.21 kcal/mol,Pearson r为0.61,达到具有竞争力的结果。值得注意的是,在CDK2与thrombin两个体系中,LamNet的Pearson r(分别为0.75与0.71)与FEP/REST(5 ns/λ,分别为0.48与0.71)相比表现更为优异,说明其预测更符合实验趋势。此外,LamNet在CDK2、Jnk1、thrombin和Tyk2四个体系中也表现出接近或优于CS-FEP-CAR的性能。图4d-f展示了LamNet在FEP2测试集上的表现。该测试集包含8个靶标,共264个配体。在FEP2上,LamNet的整体RMSE为1.30kcal/mol、Pearson r为0.63。尽管其结果略低于FEP+,但整体趋势高度一致。

其他结果进一步展示了LamNet作为可扩展、可靠RBFE预测方法的潜力。图4g-h 显示,当仅提供少量标注配体对并从零开始训练时,LamNet即可在排序准确性上超越FEP。这表明,即使LamNet在某些靶标上的零样本性能略逊于FEP,一旦加入少量标注数据,它即可快速适应并提供更高质量的预测,这对于早期药物发现(数据稀缺阶段)尤具价值。

研究还将LamNet与多种主流打分模型在FEP1与FEP2的16个靶标上进行了系统比较。不同模型在不同靶标上各有优劣,说明它们的适用性具有显著差异。值得强调的是,与唯一严格端到端预测RBFE的深度学习基线模型PBCNet相比,LamNet具备两方面优势:(1)LamNet仅使用约6000个训练样本,约为PBCNet(60万)的1%,却实现了相当甚至更好的预测与泛化能力;(2)LamNet的训练数据来自计算过程数据而非实验数据,而后者在规模与获取难度上长期受限。因此,通过提升模拟质量或延长模拟时间,LamNet的性能仍有显著提升空间。值得关注的是,与以往的数据驱动模型相比,LamNet更擅长学习具有较高柔性的结合模式,这得益于其从炼金路径中学习动态相互作用特征的能力。此外,研究还与基于结构预测的亲和力预测模型Boltz2进行了比较。在FEP1的四个靶标上,LamNet与Boltz2的Pearson r相近(0.59 vs 0.66)。尽管Boltz2可在结构缺失的情况下给出自由能预测,但其泛化能力明显受限,且包含结构预测模块导致整体效率降低。

综上,这些结果说明LamNet兼具强适应性、高数据效率和基于物理的泛化能力,是面向真实药物研发场景的可靠且可扩展的RBFE预测框架。

图 4. FEP1与FEP2测试集上的RBFE预测结果。

活性悬崖场景测试

为了进一步验证LamNet的泛化能力及其在真实药物研发场景中的潜在应用价值,研究将LamNet与多种基线模型一起,在具有高难度的活性悬崖场景中进行评估。研究采用了BindingNet-AC测试集,共有51,022个配体对用于RBFE预测。实验结果表明,大多数现有模型在活性悬崖情境下性能显著下降,表明对于数据驱动方法而言,分布外泛化仍是一个极具挑战的问题。值得注意的是,表现最突出的模型LamNet与OnionNet2均融入了物理信息,这说明引入物理先验是缓解泛化危机的关键因素之一。此外,即便LamNet的训练数据规模相对较小且来源受限,它仍然取得了稳健的预测表现,体现了其架构在复杂体系中的可靠性与可扩展性。

ABFE基准测试

研究进一步考察了LamNet在另一项关键应用场景ABFE计算中的表现。由于在真实生物大分子体系上构建ABFE数据集往往需要极其昂贵的计算成本,研究选择了SAMPL挑战中的主-客体体系作为验证对象。具体而言,研究选用了CB7主-客体体系(图5a),该体系也是Ding等人提出的DeepBAR方法验证中使用的核心测试集。为全面评价LamNet的能力,研究将其结果与DeepBAR、PMF、以及MM/GBSA进行了对比。考虑到ABFE训练数据稀少,而损失加权策略会进一步加剧数据稀疏性,研究中用于ABFE的LamNet均未采用加权训练策略。

LamNet的ABFE预测结果如图5b所示。整体来看,LamNet能够给出四个客体分子的合理排序,尽管在绝对值精度上略低于DeepBAR和PMF,但显著优于基于经验公式的MM/GBSA。这些结果表明,即便在训练数据极为有限的情况下,LamNet仍能提供可靠的ABFE预测。同时需要注意的是,LamNet的训练数据来自短时间(每个λ窗口仅1 ns)模拟产生的约600个数据点,噪声较大;而DeepBAR则使用长时间轨迹(20 ns与100 ns)的 160万条数据进行训练。在如此悬殊的数据量级下,LamNet仍表现出接近PMF与DeepBAR的性能,具有相当的竞争力。此外,LamNet也能够以较低门槛迁移至更复杂的生物大分子体系,而这是DeepBAR及多数经典计算方法难以实现的。

图 5. ABFE计算结果。

λ参数优化测试

与直接预测自由能不同,LamNet还能够通过预测窗口级自由能来协助评估相邻λ 窗口之间的重叠度,从而优化λ的设置,进一步提升炼金术自由能计算的效率。这构成了研究探索的第三类应用场景。借鉴Zeng等人的经验,研究以相邻窗口之间的自由能差值作为衡量窗口重叠程度的指标,并设定10 kcal/mol的阈值。在0-1的区间内以0.001 为步长对每个窗口的自由能进行预测,并基于预测结果通过优化算法给出推荐的λ窗口划分。为验证该策略能否提升经典计算的效率,研究选取了两组复合物(CDK2_1oiu_1h1q和MCL1_32_46),比较优化前后的计算收敛情况。

如图6所示,采用LamNet优化后的λ参数设置能够显著改善收敛效果,CDK2体系的计算时间由52小时缩短至8小时(约6.5倍加速),MCL1体系的计算时间由16小时减少至3.5小时,且自由能估计的不确定性明显降低。这些结果表明,LamNet能够通过预测窗口级自由能识别自由能曲面中的平缓区域(可减少窗口数量)与剧烈变化区域(需增加窗口密度),从而给出更合理的λ参数设置。与依赖经验的试错式调参方法不同,LamNet所提供的预测驱动、自适应窗口划分方案无需前置模拟,也不依赖计算科学家的经验,可直接作为自动化管线中的模块使用,这一能力意味着LamNet有潜力大幅降低炼金术自由能计算在大规模研究中的总体成本,可作为针对于数据驱动模型难以处理的体系的一种可靠替代方案。

图 6. 基于LamNet优化λ参数设置的经典RBFE计算结果。

结论

该研究团队提出了LamNet,一种融合物理原理、具备炼金路径感知能力的图神经网络框架,旨在为长期困扰炼金术自由能计算的一系列核心问题提供系统性的、具有变革意义的解决方案。LamNet将计算物理原理与基于分子动力学模拟的过程数据有机结合,在统计热力学建模与数据驱动预测之间架起了桥梁。它不仅能够在广泛的化学空间中可靠预测RBFE与ABFE,同时还能用于优化经典计算方法中的λ参数,从而显著提升整体计算效率。

在构建LamNet的过程中,研究团队识别出一条有潜力推动物理计算与深度学习融合发展的最佳平衡点。与任何端到端的黑箱式亲和力预测模型相比,LamNet的优势在于其高度可靠且具有前所未有的泛化能力。这归因于LamNet的建模遵循炼金路径,将原本困难的问题分解为一系列物理上更易学习的子任务。另一方面,与任何炼金术自由能方法相比,LamNet又能带来3-4个数量级的加速。这是因为它本质上是一个数据驱动的预测器。在多项基准测试中,LamNet均表现出卓越性能,能够在保持甚至提升精度的同时,大幅降低计算成本。

总体而言,LamNet 展示了深度学习与炼金术自由能计算相结合的一条新路径,使得自由能方法能够更高效、更大规模地应用于真实药物发现。未来,研究团队将继续优化并获取用于训练LamNet 的高质量过程级数据,同时进一步提升模型在不同化学体系中的策略与适应能力,最终目标是构建一个稳健、可靠、以物理为基础的AI框架,为药物研发提供真正可落地的工具。

参考资料

Renling Hu, Jialu Wu, Qun Su, Shimeng Li, Yang Li, Tianyue Wang, Yu Kang, Tong Zhu, Chang-yu Hsieh, Tingjun Hou, LamNet: an alchemical-path-aware graph neural network to accelerate binding free energy calculations for drug discovery and beyond, National Science Review, 2025, nwaf559.

https://doi.org/10.1093/nsr/nwaf559.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-12-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档