首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Chem. Sci. | 数据驱动的有机合成条件优化:智能推荐试剂、温度与当量比

Chem. Sci. | 数据驱动的有机合成条件优化:智能推荐试剂、温度与当量比

作者头像
DrugAI
发布2026-01-06 12:41:23
发布2026-01-06 12:41:23
1560
举报
文章被收录于专栏:DrugAIDrugAI

DRUGONE

有机合成中,反应条件的选择对产率、选择性和实验可行性至关重要。然而,计算机辅助合成规划在条件预测方面仍存在不足。研究人员提出了 QUARC(QUAntitative Recommendation of reaction Conditions)框架,不仅预测反应所需的试剂种类和温度,还进一步提供反应物和试剂的摩尔当量。通过在专利数据库大规模反应数据上的训练,QUARC 在多个任务上优于常见的“最流行条件”和“最近邻条件”基线。其预测结果展示了模型在捕捉底物–条件关系和细致选择性方面的优势,为自动化合成和实验优化提供了有力支持。

小分子合成是药物研发、材料科学和农业的重要推动力。近年来,计算机辅助合成规划(CASP)快速发展,但其主要集中在逆合成路径设计,对反应条件预测关注不足。事实上,反应条件(包括催化剂、添加剂、溶剂、温度和当量)直接影响产物产率、杂质分布和纯化效率,是实现自动化合成的重要环节。

现有方法大多局限于预测某些单一成分(如催化剂或溶剂),或只考虑定性信息,难以提供完整可执行的实验方案。为解决这一问题,研究人员提出了 QUARC 框架,通过统一建模实现从试剂身份到温度及当量的全流程预测。

结果

框架与数据

QUARC 将条件推荐拆分为四个任务:

  • 预测试剂身份;
  • 预测反应温度;
  • 预测反应物当量;
  • 预测试剂当量。

研究人员使用 Pistachio 专利数据库,经过标准化、去重和过滤后,构建了覆盖 1376 种常见试剂的训练数据集。模型采用图神经网络(GNN)和分子指纹+前馈神经网络(FFN)两种架构,分别对比其性能。

试剂预测

QUARC 将试剂预测建模为多标签分类,并采用自回归生成策略逐一预测试剂,能够处理数量可变的试剂集合。结果显示:

  • GNN 与 FFN 模型在大多数反应类别上均优于基线;
  • 在需要敏感条件优化的反应(如 Buchwald–Hartwig 胺化)中表现尤为突出;
  • 在条件高度集中于少数协议的反应中,简单的“最流行条件”也能接近模型效果。

温度预测

研究人员将温度预测设定为分箱分类任务,范围覆盖 −100 至 200°C。结果表明:

  • FFN 与 GNN 模型的平均误差约为 ±20–30°C,显著优于基线;
  • 模型能够捕捉常见温度分布,如 −78°C(干冰)、0°C(冰浴)、室温以及 80–120°C 的加热反应区间。

反应物与试剂当量预测

研究人员分别为反应物与试剂建立了当量预测模型:

  • 反应物当量:模型在双分子反应中表现尤为显著,准确率远超基线;
  • 试剂当量:由于催化剂与溶剂的使用量差异较大,模型引入了定制化分箱,结果同样优于基线,尽管整体任务更具挑战性。

全流程评估

在端到端测试中,QUARC 将四个阶段结合,预测完整的反应条件集合。尽管严格的“完全匹配”评价标准导致整体准确率偏低,但 QUARC 在多个反应类别中均优于基线,尤其在条件多样性高的交叉偶联类反应中表现突出。

案例分析

通过案例对比发现:

  • QUARC 能够选择更温和或更适合的试剂(如在敏感底物中选择 LiBH4 而非 LiAlH4);
  • 在 Sonogashira 偶联反应中,模型识别了使用 DIPA 抑制副反应的优势;
  • 在立体敏感的酰胺化反应中,模型推荐了更合适的配体/试剂组合。

这些结果表明模型能够捕捉基线方法忽略的底物–条件相互作用。

讨论

研究人员提出的 QUARC 是首个能够同时预测试剂身份、温度和当量的框架,显著拓展了反应条件预测的范围。在基于大规模专利数据的验证中,QUARC 始终优于基线,并在条件复杂多变的反应中展现出更强优势。

未来改进方向包括:

  • 优化输入编码方式,例如为试剂引入功能相似性的先验知识;
  • 提高数据质量,减少专利数据中由于文本解析带来的错误;
  • 探索能直接生成完整条件集合的统一模型,减少阶段串联导致的误差累积。

QUARC 的发展为计算机辅助合成规划提供了更可执行的条件预测能力,既能作为自动化合成的前端工具,也能为实验优化提供智能化起点。

整理 | DrugOne团队

参考资料

Sun, Xiaoqi, Jiannan Liu, Babak Mahjour, Klavs F. Jensen, and Connor W. Coley. "Data-driven recommendation of agents, temperature, and equivalence ratios for organic synthesis." Chemical Science (2025).

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档