首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Cell | 使用 生成式AI 设计 全新抗生素!

Cell | 使用 生成式AI 设计 全新抗生素!

作者头像
DrugIntel
发布2025-12-17 14:16:53
发布2025-12-17 14:16:53
1290
举报

在全球抗菌药物耐药性(AMR)危机持续加剧的背景下,世界卫生组织已将其列为全球十大公共卫生威胁之一。据统计,全球每年约有500万人直接或间接死于耐药菌感染,而传统抗生素研发管线持续萎缩——1980-2003年间,全球Top15药企仅开发5种新抗菌药物。在此困境下,2025年10月发表于《Cell》期刊的研究《A generative deep learning approach to de novo antibiotic design》,为生成式深度学习引导的从头抗生素设计提供了平台,为探索未知化学空间提供了可能。

一、研究背景:为何需要AI驱动的从头设计抗生素?

1. 传统抗生素研发的核心困境

传统抗菌药物研发主要依赖“现有化合物库筛选”模式,存在两大致命局限:

  • 化学空间覆盖不足:理论上,类药性化学空间约含个化合物,但目前最大虚拟化合物库仅含约个分子,仅能覆盖化学空间的极小部分,难以发现结构新颖的分子;
  • 耐药性规避困难:现有筛选依赖已知抗菌骨架,新分子与现有抗生素结构相似度高,易被细菌通过已有耐药机制(如靶点突变、外排泵增强)规避。

此外,淋病奈瑟菌(Neisseria gonorrhoeae)、金黄色葡萄球菌(Staphylococcus aureus)等“高危耐药菌”已对多数一线药物产生耐药——淋病奈瑟菌被美国CDC列为“紧急威胁”,亟需结构全新、作用机制独特的抗生素。

2. 生成式AI的技术机遇

生成式深度学习可突破现有化合物库限制,通过学习化学结构与生物活性的关联规律,直接生成符合抗菌活性、成药性要求的全新分子。本研究基于此,构建了“筛选-生成-验证-优化”的全链条AI设计策略。

二、技术框架:双路径生成式设计平台的核心逻辑

研究团队以“精准筛选优质起点+AI定向生成全新分子”为核心,构建了两种互补的设计路径——基于片段设计(Fragment-based Design)从头设计(De novo Design),并通过图神经网络(GNN)实现分子活性预测与筛选,形成完整技术闭环(图1)。

1. 基础工具:GNN活性预测模型的构建与验证

作为整个平台的“评分系统”,研究团队首先基于Chemprop框架构建GNN模型,用于预测分子的抗菌活性与细胞毒性:

  • 训练数据集:针对淋病奈瑟菌(ATCC 49226),使用38,765个化合物的体外抑菌数据(50μM浓度下的生长抑制率);针对金黄色葡萄球菌(RN4220),使用39,312个化合物的抑菌数据;同时构建 HepG2、HSkMC、IMR-90三种人源细胞的毒性预测模型,排除细胞毒性分子。
  • 模型性能验证:通过三重验证确认可靠性:①活性分子与非活性分子的预测得分存在显著差异(p<0.001);②预测得分受功能基团影响符合化学规律(如含2,3-二氯苯基的分子得分更高);③具有物种特异性(对淋病奈瑟菌活性高的分子,对金葡菌活性低,反之亦然)。

2. 路径一:基于片段设计——从 优质片段 到 完整分子

基于片段设计以 化学片段 为起点,通过“筛选-扩展-优化”三步生成抗菌分子,核心逻辑是“片段决定活性,AI优化成药性”:

(1)第一步:4.5亿片段的高通量虚拟筛选

研究团队整合三大片段库,构建含45,858,026个片段的数据库:

  • GDB-11库(26,434,571个片段):含C、N、O、F原子,最多11个原子的稳定片段;
  • GDB-13库(1,089,000个片段):补充含Cl、S原子的11原子片段;
  • Enamine REAL库(18,338,026个片段):具有良好合成可及性的商用片段。

通过GNN模型筛选并施加三重过滤:

  1. 活性过滤:GDB库片段预测得分>0.05,Enamine库片段得分>0.1(因后者合成性更好,阈值更高);
  2. 安全性过滤:三种人源细胞毒性预测得分<0.5,且不含PAINS(泛筛选干扰结构)、Brenk(毒性/代谢不稳定结构);
  3. 新颖性过滤:与559种已知抗生素的Tanimoto相似度<0.5(确保结构新颖,规避交叉耐药)。

最终获得1,156,945个针对淋病奈瑟菌的优质片段,以及259,807个针对金葡菌的优质片段。

(2)第二步:AI驱动片段扩展——CReM与F-VAE双模型协同

为将优质片段扩展为完整分子,研究团队采用两种生成模型,形成优势互补:

  • CReM(化学合理突变遗传算法):以片段为种子,通过“原子添加/替换/删除”生成新分子,每次突变均从ChEMBL库的155万个常见结构中采样,确保化学合理性;同时耦合GNN模型,仅保留抗菌活性预测得分>0.7的分子,经过5轮迭代,生成518,203个含目标片段(F1片段 图2)的分子。
  • F-VAE(基于片段变分自编码器):基于ChEMBL的168万个分子预训练,通过“图编码器-潜变量-图解码器”架构,从片段出发逐步扩展原子/键,生成6,937,677个含目标片段(F1片段 图2)的分子;解码器采用广度优先策略,确保生成分子的拓扑结构稳定。

图 4. 片段修饰对可合成性与抗菌活性的影响 (此图针对金黄色葡萄球菌的化合物设计,流程与前面类似)

(A) 由 S. aureus 抗菌活性模型确定的片段预测得分排名(上)及应用于片段的计算筛选条件(下)。 (B) 可用于实测的化合物(50 μM)片段(上)与化合物(下)的预测得分排名。 (C) 片段 F2 及其对应活性化合物的结构,活性片段在 EN1 中高亮标出。 (D) EN1 的 MIC 和 CC₅₀ 值。n = 2,* 表示 >64 μg/mL。 (E) 片段 F2 与其截短片段 F2′ 的结构,以及 F-CReM 与 F-VAE 模型生成的分子数量。 (F) 对基于片段 F2′ 下筛选出的化合物应用的计算筛选条件。 (G) F-CReM 与 F-VAE 模型使用片段 F2 与 F2′ 生成分子的 RAscore。 (H) 由 ASKCOS 计算的 F-CReM 与 F-VAE 使用片段 F2 与 F2′ 生成分子的逆合成预测成功率。 (I) 来自 Enamine REAL 空间的 12 个含 F2 片段的化合物,以及 16 个基于 F2′ 片段设计并合成的新化合物在 S. aureus RN4220 中的 MIC。 另见图 S4。

(3)第三步:合成筛选——从海量分子到候选化合物

对生成分子施加进一步过滤:①合成可行性(RAscore>0.8,SAscore<3);②结构多样性(分子间Tanimoto相似度<0.4);③无β-内酰胺等已知抗菌骨架。筛选出80个化合物,并由商业化学合成供应商进行评估。最终选择27个分子尝试合成,成功获得2个高纯度(>95%)化合物——NG1与NG2(均来自F-VAE模型)。

其中NG1对多重耐药和致病性淋病奈瑟菌菌株具有抗菌活性。

3. 路径二:从头设计——无片段依赖的全新分子生成

为完全摆脱现有片段限制,研究团队构建“无起点”生成模式:

  • CReM从头设计:以氨、甲烷、水等简单小分子为起点,通过突变生成分子,共产生106,557个分子;
  • JT-VAE(连接树变分自编码器):无需任何起点,直接学习分子的“骨架-官能团”关联规律,生成28,534,490个分子。

通过与基于片段设计相同的过滤标准,得到4,831种分子,经人工检查后筛选至90种化合物,再由化学合成供应商审查。最终采购22个JT-VAE生成的分子,其中6个(DN1-DN6)表现出抗菌活性,成功率达27.3%。

三、核心成果:两大先导化合物的抗菌活性与临床潜力

研究最终得到24个AI设计分子,7个表现出选择性抗菌活性,其中NG1(针对淋病奈瑟菌)DN1(针对金葡菌) 为核心先导化合物,其体外活性、耐药性、体内疗效均达到临床前候选药物标准。

1. NG1:靶向LptA的淋病奈瑟菌精准抑制剂

(1)体外抗菌活性——强效抗耐药
  • 抗敏感株:对淋病奈瑟菌ATCC 49226的MIC为0.5μg/mL,是头孢曲松(MIC=0.008μg/mL)的62.5倍,但远优于现有二线药物阿奇霉素(MIC=0.25μg/mL,部分耐药株已达8μg/mL);
  • 抗耐药株:对CDC-FDA耐药菌库中的8株多重耐药淋病奈瑟菌(包括对头孢曲松、阿奇霉素、环丙沙星全耐药菌株)的MIC均≤4μg/mL,无交叉耐药;
  • 窄谱选择性:仅抑制致病性奈瑟菌(淋病奈瑟菌、脑膜炎奈瑟菌),对人共生奈瑟菌(黏膜奈瑟菌、灰色奈瑟菌)及其他革兰氏阳性/阴性菌(如大肠杆菌、肺炎克雷伯菌)无抑制作用,可避免破坏肠道菌群。

图 3. 化合物 NG1 的作用机制研究与体内疗效.(A) NG1 对野生型及抗生素耐药株 N. gonorrhoeae 的最低抑菌浓度(MIC,具体菌株列于表 S4)。每个数据点代表重复两次的生物学实验结果。(B) NG1 与阿奇霉素(azithromycin)处理 ATCC 49226 株的时间杀菌曲线。数据以平均值 ± 标准差(Mean ± SD)表示,n = 2。(C) NG1 在 ATCC 49226 株中的最小杀菌浓度(MBC)。Mean ± SD;n = 2。(D) NG1(64 μg/mL)及对照化合物处理 ATCC 49226 后的细胞膜刚性变化,通过 Laurdan 通用极化度(GP)测定。Mean ± SD;n = 2。(E) NG1 与 DMSO 处理 ATCC 49226 后的膜完整性损伤情况,通过疏水性荧光探针 1-N-苯基萘胺(NPN)摄取量测定。Mean ± SD;n = 2。(F) NG1 或 Triton X-100 处理 ATCC 49226 后的膜通透性变化,表现为 SYTOX green 荧光信号随时间增加,并相对于未处理对照归一化。Mean ± SD;n = 2。(G) FA 1090 细胞裂解液经 NG1 处理后的 PISA 分析火山图,与载体对照相比。最显著受影响的蛋白 LptA 以紫色标出。(H) NG1(4× MIC)处理 FA 1090 后 lptA 基因的表达水平,以 log₂ counts-per-million(CPM)表示。(I) NG1 与多黏菌素 B(PMB)在 ARB #0187 菌株中的棋盘式联合实验,显示协同效应。数据为两次独立生物学重复结果。(J) NG1 在 N. gonorrhoeae 阴道感染模型中的体内研究示意图,使用 ATCC 49226 菌株。给药方案为阴道内分别给予载体、NG1 或头孢曲松,共 5 次。(K) 阴道冲洗液中的细菌滴度。横线表示 log₁₀ CFU/mL 的中位数。数据分别代表载体对照(n = 8)、NG1(n = 9)和头孢曲松(n = 5)处理组。与载体组比较的双侧 Mann-Whitney U 检验:*p ≤ 0.05,**p ≤ 0.01。横线为中位数。(L) NG1 的构效关系(SAR)分析总结。另见图 S2 和图 S3。

(2)作用机制——靶向未被开发的LptA蛋白

通过PISA(蛋白质组整体溶解度分析)、RNA-seq、冷冻电镜等技术,证实NG1的作用靶点为LptA(脂寡糖输出系统蛋白)

  • 靶点验证:NG1处理后,LptA蛋白稳定性显著下降(p=1.9×10⁻⁷,log2折叠变化=-2.4),且lptA基因表达呈剂量依赖性上调(4×MIC处理后,表达量增加2.3倍);
  • 作用方式:LptA是淋病奈瑟菌外膜合成的关键蛋白,负责将脂寡糖(LOS)从内膜转运至外膜;NG1结合LptA后,可能抑制其转运功能,导致外膜完整性破坏——表现为NPN(疏水荧光探针)摄取增加3.2倍,SYTOX Green(DNA染料)渗透增加2.8倍;
  • 协同作用:与多粘菌素B(靶向脂质A)联用,FIC指数<0.5,呈显著协同效应,进一步证实外膜损伤机制。
(3)体内疗效与安全性
  • 动物模型验证:在卵巢切除雌鼠淋病奈瑟菌阴道感染模型中,1% NG1局部给药5次(24小时内),阴道细菌载量降低3个数量级(p=0.012),疗效与0.1%头孢曲松相当;
  • 安全性:对HEK293、HepG2、HSkMC细胞的CC₅₀为25-128μg/mL,治疗指数(TI=CC₅₀/MIC)达50-256;无溶血活性(64μg/mL下溶血率<5%),无致突变性(Ames试验阴性),局部给药无黏膜刺激。

2. DN1:广谱抗革兰氏阳性菌的膜活性抗生素

(1)体外抗菌活性——覆盖多重耐药株
  • 抗金葡菌:对MSSA(RN4220)、MRSA(BAA1556)的MIC均为4μg/mL,优于万古霉素(MIC=2μg/mL,但部分VISA菌株已达8μg/mL);
  • 抗其他革兰氏阳性菌:对枯草芽孢杆菌、粪肠球菌(万古霉素敏感株)的MIC≤8μg/mL;对CDC-FDA耐药菌库中的VISA(万古霉素中介金葡菌)、ATR(氨基糖苷/四环素耐药菌)、TLZD(恶唑烷酮耐药菌)的MIC均≤8μg/mL,无耐药株逃逸;
  • 抗淋病奈瑟菌:虽基于金葡菌模型设计,但对淋病奈瑟菌ATCC 49226的MIC=8μg/mL,展现跨物种活性。

图 6. 新设计化合物 DN1–DN6 的表征

(A) 化合物对 S. aureus RN4220、耐甲氧西林金黄色葡萄球菌(MRSA, BAA1556)、N. gonorrhoeae ATCC 49226 的 MIC 以及在三种人源细胞中的 CC₅₀ 值。n = 2,* 表示 >128 μg/mL。 (B) 对多种革兰氏阳性菌(上)、革兰氏阴性菌(中)及与亚抑菌浓度多黏菌素 B 九肽联合(下)的 MIC。n = 2。另见表 S4。 (C) S. aureus RN4220 经 DN1–DN6、缬氨霉素(阳性对照)及 DMSO(阴性对照)处理后的 DiSC₃(5) 荧光变化。 (D) B. subtilis 168 细胞经活性新设计化合物处理(2× MIC,2 小时)后的显微图像。DAPI 染色为蓝色,FM4-64 染色为红色。 (E) 未处理与化合物处理(2× MIC)下 B. subtilis 细胞面积比较;n 为定量细胞数,****p ≤ 0.0001,采用双侧 Mann-Whitney U 检验。 (F) RN4220 经 DN1(32 μg/mL)及对照化合物处理后的膜刚性变化,通过 Laurdan 通用极化度(GP)测定。Mean ± SD;n = 2。 (G) 未处理及 DN1(4× MIC)处理的 S. aureus 的冷冻透射电子显微(Cryo-TEM)图像。 (H) S. aureus 的膜厚度定量分析(未处理 n = 14;DN1 n = 11),****p ≤ 0.0001,采用双侧 Mann-Whitney U 检验。另见图 S6。

(2)作用机制——破坏细菌膜电位与完整性

DN1通过非靶点依赖的膜活性机制发挥作用,与现有抗生素无交叉耐药:

  • 膜电位干扰:DN1处理后,金葡菌的DiSC₃(5)荧光显著增加,表明细胞膜电位(ΔΨ) dissipation;而pH梯度(ΔpH)无变化,提示其特异性破坏膜电位;
  • 膜流动性改变:Laurdan染色显示,DN1处理后金葡菌膜流动性降低(GP值增加0.3),导致膜蛋白功能紊乱;
  • 形态学变化:冷冻电镜显示,DN1处理后金葡菌细胞膜增厚(从10nm增至13nm)、周长增加15%;淋病奈瑟菌出现膜脱落、细胞肿胀,证实膜损伤是杀菌核心机制。
(3)体内疗效与耐药性
  • 动物模型验证:在中性粒细胞减少小鼠MRSA皮肤感染模型中,1% DN1局部给药6次(25小时内),皮肤细菌载量降低10倍(p=0.0043),疗效与0.25%夫西地酸(临床常用药)相当;
  • 低耐药风险:自发耐药频率<9.6×10⁻⁹(4×MIC下无耐药菌落生长),连续传代30次后MIC无显著升高,远优于万古霉素(传代10次后MIC可升高4倍)。

四、结构优化:基于SAR的分子活性提升

为进一步验证AI设计分子的可优化性,研究团队针对NG1与DN1开展结构-活性关系(SAR)分析,为后续临床开发提供方向:

1. NG1的SAR规律

合成74个NG1类似物,重点修饰吡咯烷环的R1基团与胺基的R2基团,发现:

  • R1基团影响活性:含2,3-二氯苯基的类似物(如NG1-164)MIC=4μg/mL,优于2,4-二氯苯基(MIC=16μg/mL)及单氯苯基(MIC=32μg/mL);
  • R2基团影响选择性:含1,2,3-三唑环的类似物对人细胞毒性更低(CC₅₀>128μg/mL),TI提升至>32;
  • 核心片段必需性:删除F1片段后,分子完全丧失抗菌活性,证实片段是活性核心。

2. DN1的SAR规律

合成19个DN1类似物,修饰芳环卤素位置与中心吡咯烷环,发现:

  • 卤素位置关键:芳环间位(meta)Cl/F取代的类似物(如DN1-164)MIC=2μg/mL,优于邻位(ortho)取代(MIC=8μg/mL);
  • 环大小容忍性:中心吡咯烷环可替换为4-6元含氮杂环(如哌啶环),活性无显著下降(MIC=4μg/mL);
  • 羧基必需性:删除羧基后,分子MIC>128μg/mL,证实羧基是与膜结合的关键基团。

五、研究创新点与局限性

1. 三大核心创新

  • 技术创新:实现“片段筛选-AI生成-体内验证”的全流程从头设计,两种生成路径(基于片段/无起点)覆盖不同应用场景,为抗菌药物研发提供可复用平台;
  • 机制创新:发现首个候选药物以淋病奈瑟菌的LptA为抗菌靶点,打破现有靶点局限;DN1的膜活性机制为对抗“泛耐药菌”提供新思路;
  • 效率创新:AI生成分子的活性成功率达29.2%(7/24),远高于传统筛选的0.1%-1%,且从设计到合成验证仅需6个月,大幅缩短研发周期。

2. 现存局限性

  • 合成可及性挑战:AI生成的3600万分子中,仅80个进入合成阶段,最终成功合成24个,合成成功率不足0.001%;
  • 体内给药途径局限:NG1与DN1目前仅验证局部给药(阴道/皮肤),需进一步优化水溶性、代谢稳定性,以实现全身给药(如静脉注射);
  • 长期耐药性监测:动物模型仅验证短期疗效,需长期传代实验与大动物模型验证耐药性进化规律。

总结

本文通过生成式深度学习技术,打破了传统抗生素研发的 化学空间局限 与 耐药性困境 ,实现从 片段/简单分子 到 临床前候选化合物 的全流程AI设计,并通过靶点验证、体内疗效证实其可行性。这项研究不仅为耐药菌感染治疗提供了两款潜在新药,更建立了一套可复用的AI抗菌药物研发策略——未来,随着多目标优化、合成技术的突破,生成式AI有望成为抗菌药物研发的核心工具。

参考文献:Krishnan A, Valeri J A, Jin W, et al. A generative deep learning approach to de novo antibiotic design[J]. Cell, 2025.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugIntel 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、研究背景:为何需要AI驱动的从头设计抗生素?
    • 1. 传统抗生素研发的核心困境
    • 2. 生成式AI的技术机遇
  • 二、技术框架:双路径生成式设计平台的核心逻辑
    • 1. 基础工具:GNN活性预测模型的构建与验证
    • 2. 路径一:基于片段设计——从 优质片段 到 完整分子
      • (1)第一步:4.5亿片段的高通量虚拟筛选
      • (2)第二步:AI驱动片段扩展——CReM与F-VAE双模型协同
      • (3)第三步:合成筛选——从海量分子到候选化合物
    • 3. 路径二:从头设计——无片段依赖的全新分子生成
  • 三、核心成果:两大先导化合物的抗菌活性与临床潜力
    • 1. NG1:靶向LptA的淋病奈瑟菌精准抑制剂
      • (1)体外抗菌活性——强效抗耐药
      • (2)作用机制——靶向未被开发的LptA蛋白
      • (3)体内疗效与安全性
    • 2. DN1:广谱抗革兰氏阳性菌的膜活性抗生素
      • (1)体外抗菌活性——覆盖多重耐药株
      • (2)作用机制——破坏细菌膜电位与完整性
      • (3)体内疗效与耐药性
  • 四、结构优化:基于SAR的分子活性提升
    • 1. NG1的SAR规律
    • 2. DN1的SAR规律
  • 五、研究创新点与局限性
    • 1. 三大核心创新
    • 2. 现存局限性
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档