
AI 设计了分子,然后呢?——TerraSynth 的回答
文献来源:Terray Therapeutics 技术博文 标题:TerraSynth: Accelerating the Synthesis of AI-designed Small Molecules 发布日期:2026 年 6 月 11 日 作者团队:Miles Wang-Henderson, Zack Strater, John Parkhill, Matthew Katcher, Narbe Mardirossian 原文链接:https://www.terraytx.ai/news-and-research/terrasynth
本文介绍了 Terray Therapeutics 最新发布的生成式合成规划模型 TerraSynth,其核心创新在于将 AI 分子设计与合成路线规划融为一体,从根本上解决了药物研发 DMTA 循环中"合成"环节长期以来的效率瓶颈。
主要成果如下:
现代小分子药物研发的核心迭代机制是 DMTA 循环(Design-Make-Test-Analyze,设计—合成—测试—分析)。这一循环决定了一个项目从苗头化合物(hit)到临床前候选分子(clinical candidate)所需的时间与资源。
长期以来,"设计"(Design)步骤被视为主要瓶颈,AI 的大规模应用将其大幅加速。然而,随着设计端效率提升,一个长期被忽视的矛盾逐渐浮出水面:
AI 能在几分钟内生成数千个虚拟候选分子,但合成这些分子往往需要数周乃至数月, 甚至完全合成不了。
导致这一问题的结构性原因有三:
TerraSynth 正是为解决这一结构性矛盾而生。
理解 TerraSynth 的第一步,是明确其与传统逆合成工具的根本差异:
维度 | 逆合成搜索引擎(如 AiZynthFinder) | TerraSynth(生成式合成规划器) |
|---|---|---|
输入 | 目标分子 | 分子潜空间中的向量 |
输出 | 合成路线 | 分子 + 合成路线(联合生成) |
能否设计新分子 | ❌ 否 | ✅ 是 |
速度 | ~30 秒/分子 | ~0.05 秒/分子 |
用于优化器内循环 | ❌ 否 | ✅ 是 |
TerraSynth 是一个前向合成规划器(forward synthesis planner):它从原料出发,以"正向"的方式生成路线直至产物,而非像逆合成引擎那样从目标分子反向拆解。这一特性使其能够与分子设计优化器无缝集成。
TerraSynth 的核心架构要素如下:
(1)基础分子表示:COATI
TerraSynth 依托 Terray 自研的小分子多模态基础模型 COATI(Contrastive AI for Chemistry)。COATI 能够对 SMILES 字符串、分子图和三维点云进行联合嵌入,产出统一的分子潜向量。TerraSynth 的分子"输入"和"输出"均通过 COATI 的潜空间进行编解码。
(2)自回归解码器
TerraSynth 是一个 20 亿参数(2B) 的自回归 Transformer 解码器,以后缀表示法(post-fix notation)对合成路线进行 token 化序列建模。每条路线被表示为原料构件(building block)、反应类型(reaction)和中间产物(intermediate)的有序 token 序列,由堆栈弹出机制管理中间体的消耗与生成。
(3)数据引擎与预训练
TerraSynth 使用自研数据引擎生成约 300 亿(~30B) 高质量路线 token 进行预训练,每条合成路线最多包含 6 步反应,支持线性与收敛两种路线拓扑。数据引擎的核心约束是 260 种经工业验证的化学转化反应模板,结合可购原料库(building-block catalog)采样,确保路线的化学真实性。
(4)强化学习后训练(RL Post-training)
为进一步提升路线质量,TerraSynth 引入了基于规则的 RL 后训练,以可解释奖励函数(reward function)惩罚常见合成化学违规,重点关注三类问题:
RL 采用"轻度偏离策略(lightly off-policy)"设置:行为策略通过测试时搜索(TTS)采样高质量重建路线,再通过**遮罩重要性采样(Masked Importance Sampling, seq-MIS)**过滤似然比偏差过大的轨迹,从而在质量收益与训练稳定性之间取得平衡。
后训练在 Enamine REAL N=1,000 子集上的效果如下:
失效类型 | 基础模型均值 | 后训练后均值 | 改善幅度 |
|---|---|---|---|
路线经济性 | 0.50 | 0.14 | −72% |
化学选择性 | 0.40 | 0.30 | −25% |
位点选择性 | 0.43 | 0.28 | −35% |
TerraSynth 的设计围绕三个相互制约、缺一不可的核心维度展开:
表达力以重建率(Reconstruction Rate)衡量:给定一个目标分子,合成规划器能否输出至少一条路线使产物与目标完全匹配(精确 canonical SMILES 匹配)?
TerraSynth 在多个基准数据集上的表现如下(M=256 采样,标准变体):


数据集 | PrexSyn | SynLlama | ReaSyn | TerraSynth |
|---|---|---|---|---|
ChEMBL | 24.0% (0.43 s/mol) | 13.6% (29 s/mol) | 32.1% (413 s/mol) | 53.8% (0.41 s/mol) |
Enamine REAL | 88.6% (0.30 s/mol) | 27.1% (37 s/mol) | 95.2% (46 s/mol) | 99.0% (0.38 s/mol) |
Terray 内部候选分子 | 43.7% (0.40 s/mol) | 19.9% (26 s/mol) | 43.2% (416 s/mol) | 85.8% (0.42 s/mol) |
WuXi GalaXi | 41.6% (0.41 s/mol) | 27.7% (34 s/mol) | 55.1% (277 s/mol) | 96.5% (0.48 s/mol) |
特别值得关注的是 WuXi GalaXi 和 Terray 内部分子这两个数据集——它们代表了真实药物研发中的复杂化学结构,TerraSynth 在这两个数据集上的重建率分别为 96.5% 和 85.8%,远超所有基线。相比之下,ReaSyn 在 WuXi GalaXi 上仅为 55.1%,且推理耗时约是 TerraSynth 的 600 倍。
TerraSynth 还支持测试时扩展(Test-Time Search, TTS):通过在 COATI 条件潜空间上进行搜索,以额外计算换取更高重建率(ChEMBL 上 TTS 模式可达 57.5%)。
数据引擎的关键优势
TerraSynth 数据引擎生成的分子在化学空间分布上更接近药物化学的真实需求。通过 COATI 嵌入后 UMAP 降维可视化,TerraSynth 的预训练数据与 ChEMBL/Enamine REAL/WuXi GalaXi 的参考分布高度重合;MMD 和 FID 指标均优于同类基线(MMD: 0.023 vs PrexSyn 0.028 vs ReaSyn 0.050,以 ChEMBL 为参考)。


重建率高意味着模型能"覆盖"目标分子,但不等于输出的路线在化学上合理。TerraSynth 引入的 Solv 分级框架(来自 Terray 合作的 Syntax of Matter 文献)提供了系统性的评估维度:
TerraSynth 目前已达到 Solv-2C 和 Solv-2R 水准,并将 Solv-3 列为下一阶段目标。
RL 后训练对选择性错误的定向改善是迈向 Solv-2 的关键一步。论文展示了一个典型案例:在酰胺化反应中,预训练模型选择了含有两个羧酸的原料,导致多产物问题;经后训练后,模型自动选择仅含一个羧酸的原料,规避了位点选择性陷阱。
TerraSynth 的第三个核心优势是可嵌入设计优化器的内循环中使用。通过将 TerraSynth 替换 COATI 的无约束解码器,遗传算法(GA)优化器在搜索高活性分子的同时,自动确保每个提案分子具有合成路线。
论文以 BTK 激酶(UniProt Q06187)为靶点,使用 TerraBind(Terray 的通用效价预测模型)预测 pIC50,并以 AiZynthFinder(AZF)的独立逆合成结果作为合成可行性的无偏代理指标(unbiased proxy)进行验证:
指标 | 无约束基线(COATI 解码器) | TerraSynth |
|---|---|---|
AZF 中位路线步数 | 4 步 | 2 步 |
AZF 不可解分子比例 | 62% | 38% |
帕累托前沿(高效价 + 短路线) | 劣 | 优 |
TerraSynth 提案的分子在效价预测上与无约束基线相当,却以更短的合成路线实现,且更多分子可被独立逆合成引擎验证——这有力说明合成约束并未削弱分子质量,而是在同等质量下显著降低了合成复杂度。
性能基准之外,TerraSynth 最具说服力的证据来自 Terray 内部真实药物研发项目的前瞻性评估(prospective assessment)。
研究团队追踪了 17 个需要定制合成的项目,按时间节点分为三组:
第一组(8 个项目,N=112 个化合物)—— 无约束基线
AI 设计阶段不引入合成规划约束,分子由化学家自行评估合成可行性后推进。
第二组(5 个项目,N=72 个化合物)—— TerraSynth 初版
采用 TerraSynth 进行合成约束设计,但未做进一步工作流优化。
第三组(4 个项目,N=60 个化合物)—— TerraSynth 优化工作流
在 TerraSynth 基础上增加两项优化:
累计合成完成率对比(关键节点):

时间节点 | 无约束基线 | TerraSynth 初版 | TerraSynth 优化版 |
|---|---|---|---|
2 周 | 13% | 33%(↑ 2.5×) | 90%(↑ 7×) |
4 周 | ~35% | ~66% | 90% |
达到 50% 所需时间 | 8 周 | ~5 周 | <2 周 |
达到 90% 所需时间 | >16 周 | ~10 周 | 4 周 |
这意味着:每个 DMTA 迭代周期可节省数周乃至数月的合成等待时间。 在竞争激烈的新药研发赛道,这不仅是效率优化,更是战略性优势。
作者还特别指出,三组项目在目标靶点类别、分子量和复杂度上具有可比性,排除了混淆因素的影响,使对比具有较强的因果推断效力。
TerraSynth 的预训练数据完全来自自建的合成路线采样引擎,而非公开数据库(公开的端到端标注合成路线数据极为稀缺)。
数据引擎的核心机制:从 260 种精选反应模板库和可购原料库出发,随机拼接相互兼容的反应步骤,生成(产物分子, 合成路线)元组作为预训练数据。这一机制的关键设计选择:
论文引用并拓展了 Syntax of Matter(Morgunov et al., 2026)中的 Solv 评估框架,为整个领域提供了系统性的模型质量评估坐标系。这一框架与 LLM 数学推理领域的"验证器训练"思路高度类似:
仅仅找到"某条"到达目标的路线(Solv-1)是不够的。在"有效性时代",我们要求路线必须在化学逻辑上正确(Solv-2),并最终在实验室中真正可行(Solv-3)。
RL 后训练阶段正是从 Solv-1 向 Solv-2 跃迁的关键工程实践,其思路与 LLM 的过程奖励模型(PRM)训练有异曲同工之妙。
TerraSynth 的论文对比了四个基线:
模型 | 方法类型 | 核心特征 | 主要局限 |
|---|---|---|---|
PrexSyn | 生成式合成规划器 | 速度较快,与 COATI 速度相近 | 化学空间覆盖率显著低于 TerraSynth |
SynLlama | LLM 微调合成规划器 | 基于大语言模型 | 速度慢(~30 s/mol),重建率低 |
ReaSyn | 生成式合成规划器 | 基于 ChemProjector 数据引擎 | 速度极慢(~277–416 s/mol),数据引擎覆盖率低 |
Synformer | 生成式合成规划器 | 早期工作 | 速度与覆盖率均不及 TerraSynth |
TerraSynth 的差异化定位可概括为:在药化相关化学空间内,以最高重建率 × 最快推理速度的组合,实现嵌入优化器内循环的工程级合成规划。
作者坦诚地指出了若干尚未解决的问题:
团队公开的后续计划包括:
TerraSynth 的最深层意义,不在于某一项技术指标的提升,而在于它重新定义了 AI 辅助药物设计的工作范式:
旧范式(顺序式):
AI 设计分子 → 合成可行性评估(事后、被动)→ 筛选 → 合成 → 测试
新范式(联合式):
AI 在合成约束的潜空间中联合优化分子与路线(实时、主动)→ 直接合成 → 测试
这一转变与计算机辅助设计(CAD)领域"可制造性设计(Design for Manufacturability, DFM)"的理念高度类似——设计与制造不再是顺序流程,而是在设计阶段就将制造约束内化为设计参数。
对于药物研发行业的从业者,TerraSynth 带来了以下实践启示:
TerraSynth 是当前 AI 药物发现领域少数几个在工业内部真实项目中得到系统性前瞻验证的方法之一。它的价值不只在于技术上,更在于提供了一套可落地的合成感知分子设计闭环,并以真实的 DMTA 加速数据证明了这一路线的工程可行性。
随着 Solv-3 能力的成熟与技术报告的发布,TerraSynth 所代表的"设计语言即合成语言"范式,有望成为下一代 AI 药物发现平台的标准配置。
📚 相关延伸阅读: