
本文作者:丁科炎(浙江大学)、喻靖(浙江大学)、黄俊杰(浙江大学)、杨宇晨(浙江大学)、张强(浙江大学)、陈华钧(浙江大学)
发表期刊:Nature Computational Science
论文链接:https://www.nature.com/articles/s43588-025-00849-y
代码链接:https://github.com/HICAI-ZJU/SciToolAgent
欢迎转载,转载请注明出处

导
读
在生物、化学、材料等领域,科学研究日益依赖于各种专业计算工具。然而,面对数量庞杂的工具和复杂的科学问题,如何让非计算机专业背景的研究者也能高效、可靠地完成任务,成为亟需解决的难题。近日,浙江大学研究团队提出的SciToolAgent,为此提供了全新的智能解决方案。SciToolAgent利用知识图谱的结构化信息,增强大模型智能体对于复杂任务规划能力,提高其调用科学(包括生物、化学、材料等)工具的准确性,在蛋白质设计、化学反应预测、分子合成、MOF材料筛选等广泛的场景进行了验证。近日该工作已被《Nature Computational Science》接收。
一、研究方法
SciToolAgent旨在提升大语言模型智能体在复杂科学问题中的工具调度与协同能力。为此,团队围绕科学工具的系统收集、科学工具知识图谱的构建、基于LLM的多智能体架构设计、自动化安全检测机制的集成、跨模型兼容性测试以及高效模型训练策略等方面进行了系统性探索与创新。

3. 多模型兼容性与训练策略
SciToolAgent支持包括开源大模型(如Qwen2.5-72B、Qwen2.5-7B、DeepSeek-R1)和商业大模型(如GPT-4o、OpenAI o1)在内的多种主流大语言模型。针对实际科研场景下的计算资源、部署需求和成本考量,用户可灵活选择基础模型。
考虑到资源受限或私有化部署场景对于使用开源小模型的需求,和开源小参数模型在理解复杂任务、工具链规划等方面的能力存在短板,之间的冲突。研究团队引入了基于科学工具知识图谱(SciToolKG)的自动化高质量指令合成方法。合成数据涵盖工具链规划、工具调用、错误处理、答案总结等多种情境。通过监督微调(SFT)技术,对Qwen2.5-7B进行训练,使其在工具理解、规划、调用等方面的能力显著增强,有效缩小与商用大模型在复杂场景下的差距。
二、实验结果与案例分析
该工作系统评估了SciToolAgent在单/多工具自动规划与调用的能力。详细比较了SciToolAgent与主流方法(包括ReAct、Reflexion、ChemCrow和CACTUS)在多种评价指标下的性能。主要指标包括:任务通过率(Pass Rate)、工具规划准确率(Tool Planning Accuracy)和最终答案准确率(Final Answer Accuracy),分别反映了系统的整体完成能力、工具链规划能力以及最终结果的正确性。
实验结果显示,SciToolAgent在所有指标和任务难度层级上均大幅优于现有方法,特别是在多工具协同(Level-2)任务中。SciToolAgent的最终答案准确率达到94%,相较于其他智能体提升10%,充分证明了基于知识图谱驱动的工具链规划对于复杂科学任务的巨大优势。此外,不同LLM下的消融实验也表明,经过指令微调的Qwen2.5-7B-Instruct亦具备了较强的工具理解和执行能力,验证了SciToolAgent的兼容性。 总体来看,实验结果表明SciToolAgent在自动化、多工具、高安全性的科学任务执行方面表现出色,为科研智能体的实际应用奠定了坚实基础。

SciToolAgent蛋白质设计案例
SciToolAgent自动生成的工具链包括:蛋白序列生成(design_protein_CATH)、结构预测(ESM_fold)、力学与动态稳定性分析(calculate_unfold_force_energy ...)等关键环节,无需人工干预,实现高效、全流程的蛋白设计与分析。

SciToolAgent化学反应预测案例
SciToolAgent通过自动集成分子指纹、电学描述符等多种分子特征(generate_RDK_fingerprints...),并结合不同机器学习算法(MLP_classifier, AdaBoost_classifier..),能够高效预测化学反应。实验结果显示,SciToolAgent不仅能够筛选出最佳特征和最优算法(如随机森林),还大幅提升了反应活性预测的准确性和自动化程度,显著优于传统智能体方法。

SciToolAgent分子合成案例
SciToolAgent能够自动串联反应产物预测(如RXN-for-Chemistry)、分子结构转换(SMILES/SELFIES)、产物文本描述(BioT5+)、专利检索(SureChEMBL数据库)和安全性评估(PubChem数据库及内置安全检查模块)等多种工具,完成从反应预测到产物分析与风险预警的全流程自动化。系统不仅能高效生成反应结果,还能自动识别潜在有害产物(如4-氯苯酚)并发出安全预警。

SciToolAgent MOF材料筛选的案例
SciToolAgent能够自动整合一系列专业工具,实现MOF材料的高效筛选与分析。具体流程包括:利用模型预测材料的热稳定性(mof_stability_predict),借助RASPA2软件评估CO₂吸附能力(mof_adsorption_predict),并结合分子结构转换(mof_to_smiles, smiles_to_cas)和数据库检索工具(mof_price_search),自动获取材料的市场价格。通过这一自动化流程,系统能够根据用户设定的性能和价格标准,快速筛选出最优MOF候选材料。

三、总结
SciToolAgent创新性的提出知识图谱驱动的多工具集成智能体。通过科学工具收集、科学工具知识图谱构建、知识图谱检索算法、多智能体协同框架等技术,提升了智能体解决复杂科学问题的能力。通过在SciToolEval上的实验结果,和蛋白设计与分析、化学反应预测、化学分子合成、MOF材料筛选四大真实科研任务案例,系统展示了SciToolAgent在多工具联动、复杂流程管理和安全把控等方面的强大能力。