
DRUGONE
科学发现通常依赖于“观察—假设生成—实验验证—数据分析—再假设”的循环过程。然而,尽管近年来人工智能在生物医学中的应用迅速发展,目前仍缺乏能够完整自动化这一科学流程的系统。本文中,研究人员提出了Robin——首个能够同时自动完成“假设生成”和“实验数据分析”的多智能体科学发现系统。Robin通过整合文献检索智能体与数据分析智能体,实现了从科学文献推理、实验方案提出,到实验结果解释和下一轮假设更新的连续闭环,从而构建出一种“半自主化”的科学发现模式。
研究人员将Robin应用于干性年龄相关性黄斑变性(dry AMD)的治疗药物发现。Robin首先提出“增强视网膜色素上皮(RPE)细胞吞噬功能”这一治疗策略,并进一步筛选出ripasudil和KL001两个潜在候选药物。其中,ripasudil是一种已获临床批准的ROCK抑制剂,但此前从未被提出用于治疗干性AMD。随后,Robin又自主建议开展RNA-seq实验,并分析结果,发现ABCA1脂质外排泵在ROCK抑制后显著上调,从而进一步揭示潜在机制。值得注意的是,论文中的主要假设、实验方向、数据分析以及图表生成均由Robin自动完成。研究人员认为,这标志着AI首次在“实验室闭环”框架中实现自主科学发现与实验验证。

随着生物学测量技术、扰动技术以及计算建模能力的快速发展,人类积累的生物医学知识呈指数级增长。然而,与数据获取能力相比,研究人员在“知识整合与科学推理”方面的发展相对滞后。如何从海量文献中快速提炼规律、提出新假设并推动实验验证,已经成为现代科学研究的重要瓶颈。
大型语言模型(LLMs)的出现为自动化科学推理带来了新的可能。由于LLM能够同时学习跨领域知识,因此理论上能够突破单个研究者知识范围的限制,从已有文献中发现隐藏关联。研究人员指出,药物再利用(drug repurposing)尤其适合作为AI科学发现的应用场景,因为大量药物机制其实早已存在于文献中,但由于知识分散,人类研究人员往往需要多年后才能建立联系。
例如,BRAF抑制剂dabrafenib在2010年前后已经被充分研究,但其保护听力的作用直到十年后才被发现;类似现象还存在于ketamine、leucovorin以及KarXT等药物中。这说明,大量潜在药物再利用机会实际上隐藏在已有知识之中,而LLM有望通过跨领域知识综合发现这些“低垂果实”。
尽管此前已经出现一些AI科学家系统与自动假设生成框架,但这些系统大多只能完成科学流程中的某一个步骤,例如文献总结、假设提出或药物性质预测,尚无法完整覆盖“提出假设—实验分析—更新假设”的闭环过程。
因此,研究人员提出Robin系统,希望通过多智能体协同,将文献搜索、科学推理、实验分析与结果反馈整合到统一框架中,从而真正实现AI驱动的自动化科学发现。
方法
Robin由多个专门化语言智能体组成,包括负责文献搜索的Crow与Falcon,以及负责实验数据分析的Finch。Crow用于快速文献检索与总结,Falcon用于更深入的科学推理与候选药物评估,而Finch则能够自动分析RNA-seq、流式细胞术等实验数据。
在假设生成阶段,Robin首先根据疾病名称自动提出一系列关键科学问题,并调用Crow检索相关文献。随后,系统自动总结潜在疾病机制、设计体外实验模型,并通过LLM judge对不同机制进行排序。接着,Robin进一步提出候选药物,并由Falcon生成详细药物评估报告,包括作用机制、潜在风险与药理依据。
在实验分析阶段,研究人员将流式细胞术原始数据或RNA-seq数据上传至Robin。系统随后调用Finch自动生成Jupyter Notebook分析流程,并执行统计分析、差异表达分析以及富集分析。由于语言模型具有随机性,Robin会同时运行8条独立分析轨迹,再利用meta-analysis综合得到最终一致性结果。
整个系统形成了一个“实验室闭环(lab-in-the-loop)”科学发现流程:Robin提出假设,人类研究人员执行实验,再由Robin自动分析结果并提出下一轮假设。
结果
Robin构建自动化科学发现多智能体框架
研究人员首先介绍了Robin整体架构。该系统通过Crow、Falcon与Finch三个智能体协同工作,实现从文献检索、科学推理到实验分析的连续闭环。
其中,Crow负责快速文献检索与摘要生成,Falcon负责深度文献分析与候选药物评估,而Finch则能够自动生成数据分析代码并执行实验数据处理。研究人员指出,Robin能够在30分钟内自动综合551篇论文,而人类完成相同工作预计需要540小时以上。
研究人员进一步估算,Robin能够将整个科学发现流程的人类认知劳动时间从872–937小时缩短至不到2小时,实现约200倍效率提升。

图1: Robin多智能体科学发现系统整体架构与工作流程。
Robin自动提出干性AMD治疗策略并完成首轮实验分析
研究人员随后将Robin应用于干性年龄相关性黄斑变性(dAMD)治疗药物发现。Robin首先检索151篇相关文献,并提出10种潜在疾病机制。经过自动排序后,Robin最终选择“增强RPE吞噬功能”作为治疗策略。
随后,Robin进一步分析约400篇与RPE吞噬和AMD治疗相关文献,并提出30种候选药物。系统最终筛选出Exendin-4、Fingolimod、MFGE8、Y-27632以及AICAR+TUDCA等候选分子进行实验验证。
研究人员利用ARPE-19细胞与pHrodo吞噬实验验证这些候选药物。实验完成后,Robin自动调用Finch分析流式细胞术数据,并生成门控策略、统计检验以及可视化图表。结果显示,ROCK抑制剂Y-27632能够显著增强RPE细胞吞噬功能。
研究人员指出,此前已有研究表明ROCK抑制能够恢复RPE吞噬能力,因此Robin通过文献综合成功重新发现了这一重要生物学机制。

图2: Robin自动生成治疗假设并分析RPE吞噬实验数据。
Robin自主提出RNA-seq实验并发现ABCA1机制
在完成第一轮吞噬实验分析后,Robin进一步建议开展RNA-seq实验,以研究ROCK抑制后RPE细胞的转录组变化。
研究人员随后利用Y-27632处理RPE细胞,并开展bulk RNA测序。Finch自动完成差异表达分析,并生成火山图与GO富集分析结果。
结果显示,ROCK抑制不仅影响F-actin细胞骨架重构,还显著调控自噬相关通路与小GTP酶信号通路。更重要的是,Finch发现ABCA1在Y-27632处理后上调约3倍。
研究人员指出,ABCA1是关键脂质外排泵,与胆固醇转运和RPE健康密切相关,而其脂质受体ApoE此前已经被证明与AMD遗传易感性相关。因此,Robin不仅提出了候选药物,还进一步发现了潜在机制靶点。

图3: Robin自动开展RNA-seq分析并发现ABCA1相关机制。
Robin通过迭代实验进一步优化药物候选物
在完成第一轮实验后,Robin继续开展第二轮候选药物生成,并提出ripasudil等新候选物。
研究人员随后测试10种新候选药物,结果显示,ripasudil能够将RPE吞噬能力提高约1.89倍,表现优于Y-27632。剂量反应实验进一步证明,ripasudil在ARPE-19细胞中具有更高效力。
由于ripasudil已经在日本获批用于青光眼治疗,因此其已具备成熟安全性资料,相较实验化合物Y-27632更具临床转化潜力。
研究人员进一步在老年患者来源RPE干细胞(RPE-SC)中验证结果。结果显示,ripasudil与Y-27632均能增强RPE吞噬功能,其中ripasudil效果更强,并且未观察到明显细胞毒性。
此外,Robin还提出KL001这一昼夜节律调节剂。研究人员指出,此前从未有人提出KL001能够增强RPE吞噬功能。

图4: Robin通过迭代实验发现并验证ripasudil与KL001。
讨论
本研究提出了Robin——首个能够同时自动完成“科学假设生成”与“实验数据分析”的多智能体科学发现系统。研究结果表明,Robin不仅能够快速综合海量科学文献,还能够基于实验反馈持续优化假设,从而形成真正意义上的“AI科学家闭环”。
在干性AMD案例中,Robin提出了“增强RPE吞噬功能”的治疗策略,并成功发现ripasudil与KL001两个潜在治疗候选物。其中,ripasudil此前从未被提出用于干性AMD治疗,而KL001则代表一种全新的吞噬增强机制。
研究人员认为,Robin最大的价值在于其能够自动完成“组合式知识综合(combinatorial synthesis)”,即从多个彼此分散的科学领域中建立非显而易见的联系。这种能力尤其适用于药物再利用、材料科学以及复杂系统研究。
不过,研究人员也指出,目前Robin仍然存在一些局限。例如,系统尚不能自动生成精确实验操作协议;Finch仍依赖专家设计prompt;复杂多步骤生物信息学任务的稳定性也仍有待提高。
总体而言,Robin展示了一种全新的AI驱动科学研究范式。研究人员认为,未来随着基础模型能力提升,多智能体系统有望显著加速药物研发与科学发现进程,并重新定义人类开展科学研究的方式。
整理 | DrugOne团队
参考资料
Ghareeb, A.E., Chang, B., Mitchener, L. et al. A multi-agent system for automating scientific discovery. Nature (2026).
https://doi.org/10.1038/s41586-026-10652-y
内容为【DrugOne】公众号原创|转载请注明来源