
DRUGONE
有机合成中,反应条件的选择对产率、选择性和实验可行性至关重要。然而,计算机辅助合成规划在条件预测方面仍存在不足。研究人员提出了 QUARC(QUAntitative Recommendation of reaction Conditions)框架,不仅预测反应所需的试剂种类和温度,还进一步提供反应物和试剂的摩尔当量。通过在专利数据库大规模反应数据上的训练,QUARC 在多个任务上优于常见的“最流行条件”和“最近邻条件”基线。其预测结果展示了模型在捕捉底物–条件关系和细致选择性方面的优势,为自动化合成和实验优化提供了有力支持。

小分子合成是药物研发、材料科学和农业的重要推动力。近年来,计算机辅助合成规划(CASP)快速发展,但其主要集中在逆合成路径设计,对反应条件预测关注不足。事实上,反应条件(包括催化剂、添加剂、溶剂、温度和当量)直接影响产物产率、杂质分布和纯化效率,是实现自动化合成的重要环节。
现有方法大多局限于预测某些单一成分(如催化剂或溶剂),或只考虑定性信息,难以提供完整可执行的实验方案。为解决这一问题,研究人员提出了 QUARC 框架,通过统一建模实现从试剂身份到温度及当量的全流程预测。
结果
框架与数据
QUARC 将条件推荐拆分为四个任务:
研究人员使用 Pistachio 专利数据库,经过标准化、去重和过滤后,构建了覆盖 1376 种常见试剂的训练数据集。模型采用图神经网络(GNN)和分子指纹+前馈神经网络(FFN)两种架构,分别对比其性能。

试剂预测
QUARC 将试剂预测建模为多标签分类,并采用自回归生成策略逐一预测试剂,能够处理数量可变的试剂集合。结果显示:

温度预测
研究人员将温度预测设定为分箱分类任务,范围覆盖 −100 至 200°C。结果表明:

反应物与试剂当量预测
研究人员分别为反应物与试剂建立了当量预测模型:

全流程评估
在端到端测试中,QUARC 将四个阶段结合,预测完整的反应条件集合。尽管严格的“完全匹配”评价标准导致整体准确率偏低,但 QUARC 在多个反应类别中均优于基线,尤其在条件多样性高的交叉偶联类反应中表现突出。

案例分析
通过案例对比发现:
这些结果表明模型能够捕捉基线方法忽略的底物–条件相互作用。

讨论
研究人员提出的 QUARC 是首个能够同时预测试剂身份、温度和当量的框架,显著拓展了反应条件预测的范围。在基于大规模专利数据的验证中,QUARC 始终优于基线,并在条件复杂多变的反应中展现出更强优势。
未来改进方向包括:
QUARC 的发展为计算机辅助合成规划提供了更可执行的条件预测能力,既能作为自动化合成的前端工具,也能为实验优化提供智能化起点。
整理 | DrugOne团队
参考资料
Sun, Xiaoqi, Jiannan Liu, Babak Mahjour, Klavs F. Jensen, and Connor W. Coley. "Data-driven recommendation of agents, temperature, and equivalence ratios for organic synthesis." Chemical Science (2025).
内容为【DrugOne】公众号原创|转载请注明来源