首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能赋能量子化学,推动药物设计的下一次飞跃

以下文章来源于智量研究所,作者智量研究所

开发有效的治疗方法始于了解类药物分子如何与生物靶标相互作用,是一个由分子动力学驱动——实时精确编排原子成键和断键的过程。几十年来,模拟这种过程一直都缓慢、昂贵且复杂。

但随着量子人工智能和基于物理的建模技术的进步,这种曾经不可能完成的“舞蹈”如今变得更快、更智能、更易于实现——彻底改变了我们设计药物、材料以及其他领域的方式。

量子化学驱动的药物设计AI模型

近日,索邦大学和Qubit Pharmaceuticals的研究人员在《ChemRxiv》上发表了题为“A Foundation Model for Accurate Atomistic Simulations in Drug Design”的论文。文章中介绍了FeNNix-Bio1这一AI 基础模型,可实现对药物发现至关重要的下一代分子模拟。

FeNNix-Bio1模型由阿贡国家实验室、EuroHPC和GENCI的超级计算机支撑。作为面向药物设计的原子模拟基础模型,该模型的核心优势在于结合机器学习与量子化学数据,而量子计算技术则是推动其精度突破和未来扩展的重要引擎。

目前,传统的分子模拟依赖于经验力场。这些复杂的公式需要计算科学家进行大量的微调,准确性和范围往往有限。另一方面,量子化学模型虽然高度准确,但速度太慢且成本太高,无法大规模实施。而FeNNix-Bio1的目标是拥有快速、可扩展的量子级精度预测。

Qubit 首席科学官兼 FeNNix-Bio1团队杰出教授Jean-Philip Piquemal表示: “FeNNIx-Bio1将 AlphaFold 在蛋白质结构预测方面的突破扩展到任何生物分子模拟。“AlphaFold 彻底改变了蛋白质结构预测;然而,它并没有捕捉到类似药物的小分子如何与这些蛋白质相互作用——这仍然是物理学重要的地方。

精准模拟药物-蛋白质相互作用不仅仅关乎更智能的算法,更关乎在大规模化学空间中探索。潜在组合的空间浩瀚无比。科学家可以设计无数类似药物的分子,每种分子都有可能以独特的方式与不同的蛋白质结合。可能的组合数以万亿计。你不可能将它们全部放入一个数据库中。“这就像试图把宇宙装进电子表格里,”Piquemal 说。

药物与蛋白质分子结合示意图

那么,如何处理数万亿种潜在的排列组合呢?答案是计算。虽然大多数早期模型都是基于数十年积累的实验数据(例如X 射线晶体学和核磁共振波谱)建立的,但 FeNNix-Bio1 的训练是基于基于第一性原理的量子化学模拟生成的合成数据。

这意味着,它依赖于物理学的基本定律(例如薛定谔方程)来模拟电子和原子在分子中的行为。这使得模型能够直接从底层物理中学习,而不是从有偏差、有噪声或不完整的实验数据集中学习。

Qubit Pharmaceuticals

——药物发现、优化与验证

“这种客观的方法并不局限于先前的发现。相反,它基于底层的物理和化学定律,学习分子应该如何行为, ”Marino 补充道。“同时,它还很灵活——只要改进基本构件,你几乎可以模拟任何事物。 ”

Robert Marino 博士,Qubit Pharmaceuticals 的首席执行官

FeNNIX-Bio1 团队没有采用通用的大语言模型(LLM),而是基于神经网络开发了定制的创新型化学和物理 AI 框架。“ LLM 在语言方面表现良好,但并非为学习化学或物理而设计, ”Piquemal 说道,“而且它们的训练成本非常高。我们的模型经济高效,而且更加专注。 ”

FeNNix-Bio1 仅需使用单张 GPU 卡即可在几天内完成训练。同类其他 AI 模型则需要数周的超级计算机时间。凭借这种更易于访问的训练环境,该模型堪比当今制药行业使用的最佳力场,甚至往往更胜一筹,同时得益于 GPU 加速推理,其可扩展性极高。

“这是一种即插即用的现有方法的替代方案,”Qubit 首席执行官 Robert Marino 表示,“早期模型的构建和实施需要五到十年的时间,而 FeNNix-Bio1 只需几天即可完成训练和实施,并且无需太多人工干预。 ”

以量子精度重构药物研发模拟新范式

为了测试FeNNix-Bio1 的性能,研究人员用分子科学中最难的任务之一——水建模——来挑战它。该模型表现出色,准确预测了水的物理特性以及小分子如何与水相互作用,超越了传统方法,同时与真实世界的实验数据高度吻合。

300K 时 Na 和 Cl 离子在水中的径向分布函数

该模型还预测了化学反应,例如丁二烯重排为环丁烯,这是传统力场模拟无法实现的,表明FeNNix-Bio1 能够理解分子行为和变化。

最令人兴奋的特性是它有可能减少物理实验,并允许探索更具创新性的生物分子,以解决具有挑战性或无法用药的靶点。“由于该模型与实验一样精确,我们可以在进入实验室之前,在计算机模拟中快速且经济高效地进行失败测试,”Piquemal 说。

环丁烯 丁二烯反应在 300K 时的平均力势与不同微调回合下 C1-C4 间距的函数关系。原始模型“(黑色曲线)对应于开箱即用的 FENNIX-Bio1(S);”第 1 轮“(蓝色曲线)对应于使用 100 个样本进行第一轮微调后的 PMF 估计值;”第 2 轮“(橙色曲线)对应于使用 137 个样本进行第二轮微调;”全部"(虚线曲线)对应于对收集到的全部 3000 个样本进行微调后的模型。

此外,FeNNix-Bio1 能够以极低的开销利用新的合成数据进行改进,并与其他结构预测基础模型兼容,从而实现 AI 驱动的端到端设计周期:预测蛋白质结构、设计候选药物以及模拟相互作用。

它与 Alphafold 类模型(采用麻省理工学院的 Boltz-1 方法)的集成,使研究人员能够从预测蛋白质结构转向精确的分子模拟,从而精确模拟药物与蛋白质的相互作用。

敲开量子人工智能的大门

这里还有一个更深层次的技术故事。

FeNNix-Bio1 打开了量子人工智能的大门,而量子人工智能是量子计算、高性能计算 (HPC) 和机器学习的融合。FeNNix-Bio1 在模拟包含数百万个原子的环境时,为速度设定了新的基准。它能够在不降低量子精度的情况下做到这一点。

虽然量子计算机仍在不断成熟,但我们仍然可以通过将量子化学与高性能计算相结合,彻底改变分子模拟的数据生成方式。“我们已经开始使用量子计算算法来生成数据,以增强我们的模型,”Piquemal 说道。利用与量子硬件公司的合作,未来将持续增加更多数据。“人们认为要到 2035 年才能实现的事情,今天已经开始发生了。 ”

在NVIDIA H100 80GB GPU 上不同系统规模下的性能(以每天百万次模拟步数为单位)。FeNNiX-Bio1、MACE 和 ANI2x 的计算均采用 FeNNol 的 JAX 模型实现。105 原子以上的系统使用 deep-HP78 模拟。如果没有明确说明,则报告单 GPU 性能。

FeNNix-Bio1正在改变我们设计、测试和理解分子的方式。这是一个战略优势,借助 FeNNix-Bio1,我们可以从对量子化学的科学好奇心转向人工智能的实际应用。首先,我们探索了一种更具成本效益的分子动力学方法,用于药物研发,并随后将其应用于工业酶、材料科学、海水淡化膜,甚至电池设计。

FeNNix-Bio1是分子设计、测试和理解领域的一次范式转变。它不仅速度更快,而且更智能、更高效,并具备可扩展性,可应用于工业领域。随着AI赋能的大规模生物学和量子计算打破物理学界限,人们期待已久的分子自动化发现愿景正在加速成为现实。

量子计算机“精度引擎”的未来

短期通过量子蒙特卡洛(QMC)数据增强突破DFT局限性,精准刻画强关联体系、带电物种相互作用及核量子效应,支撑水合自由能、蛋白-配体结合等关键药物设计参数的实验级精度模拟。

中期构建量子-经典混合架构,利用变分量子算法(VQE)等优化模型训练与不确定性量化,提升千万原子级生物系统模拟效率。

长期依托容错量子计算(FTQC)突破规模限制,实现电子-核量子耦合效应建模,开启“全量子化”药物发现时代,其与机器学习的深度协同将重构原子模拟精度天花板,有望成为未来计算化学与药物设计的核心驱动力。

参考链接

https://chemrxiv.org/engage/chemrxiv/article-details/6814f81f927d1c2e66badeea

https://www.qubit-pharmaceuticals.com/

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OramGGCiHZ60mXb9a-TOlU_g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券