DRUGONE
分子结构优化的精度直接决定了计算化学与分子设计任务的可靠性。研究人员提出了一种基于物理约束黎曼流形的去噪模型(R-DM),用于实现具有化学精度的分子结构优化。不同于传统在欧几里得空间中建模的方法,该模型在与分子能量变化高度相关的黎曼流形上执行扰动与去噪过程,使几何距离与能量差更好对齐。通过引入物理启发的内坐标表示,R-DM 在多个标准数据集上实现了低于 1 kcal/mol 的能量误差,显著优于基于笛卡尔坐标的去噪模型。结果表明,该方法为高精度、低成本的分子结构优化提供了一种新的几何建模范式。

准确预测分子三维结构是药物发现、材料设计等领域的核心问题。尽管量子化学方法能够提供高精度结果,但其计算成本限制了在大规模或复杂体系中的应用。近年来,基于机器学习的分子结构预测方法取得了显著进展,其中去噪模型通过学习从噪声构象到低能构象的映射,在构象生成与优化任务中表现突出。然而,现有方法大多在欧几里得空间中操作,几何距离与真实能量变化之间存在明显失配,导致结构扰动常偏离真实势能面。研究人员因此提出,将去噪过程转移到一个与能量景观一致的黎曼流形上,以更自然地刻画分子结构变化的物理意义。
方法
R-DM 将分子结构表示为物理启发的内坐标,并在此基础上构建一个与势能面局部曲率相关的黎曼流形。在该流形上,研究人员通过指数映射生成噪声结构,并训练神经网络学习从噪声构象指向真实低能构象的向量场。模型在统一的去噪框架下兼容扩散式与流匹配式推断,使去噪过程等价于沿能量相关测地线进行的结构优化。通过这种方式,模型在保持化学合理性的同时,实现了高效、稳定的分子结构收敛。
结果
物理约束黎曼度量的有效性
研究人员比较了欧几里得空间与黎曼流形中结构距离与能量差之间的相关性。结果显示,黎曼测地距离与能量变化具有显著更高的一致性,表明该流形能够更准确反映分子构象在势能面上的真实差异。

图 1|欧几里得空间与黎曼空间在分子结构优化中的对比分析。
噪声采样分布的物理合理性
在黎曼流形上生成的噪声结构与欧几里得噪声在几何偏差上相近,但在能量分布上显著更稳定,几乎不引入非物理的成键或断键行为。这表明黎曼噪声更贴近真实构象扰动。

图2|欧几里得空间与黎曼空间噪声分布采样所得分子结构的比较。
分子结构优化性能(QM9)
在 QM9 数据集上,R-DM 从力场初始结构出发,显著降低了结构偏差与能量误差。与欧几里得去噪模型相比,R-DM 在能量精度上提升尤为明显,平均误差达到化学精度标准。

图 3|R-DM、E-DM 与 MMFF 预测分子结构的对比分析。

计算效率与后处理成本
R-DM 生成的结构可显著减少后续量子化学优化所需的迭代次数与计算时间,在保持高精度的同时降低总体计算成本。

泛化能力评估(QM7-X)
在包含非平衡构象的 QM7-X 数据集上,R-DM 依然在结构与能量指标上全面优于基线方法,显示出良好的泛化能力,但也揭示了在高度扭转敏感构象下仍存在改进空间。

讨论
R-DM 从几何层面重新定义了分子结构优化问题,将去噪过程与能量相关的测地线对齐,从而实现了化学精度的结构预测。与直接学习势能面的机器学习力场不同,该方法通过引入物理约束的黎曼流形作为归纳偏置,以更少的数据实现高效优化。尽管当前验证主要集中在小分子体系,研究结果表明该框架具有良好的扩展潜力。未来工作可通过改进黎曼度量设计或拓展至更复杂分子体系,进一步提升模型的适用性与精度。
整理 | DrugOne团队
参考资料
Woo, J., Kim, S., Kim, J.H. et al. Riemannian denoising model for molecular structure optimization with chemical accuracy. Nat Comput Sci (2026).
https://doi.org/10.1038/s43588-025-00919-1
内容为【DrugOne】公众号原创|转载请注明来源