论文题目:SciToolAgent: a knowledge-graph-driven scientific agent for multitool integration

本文作者:丁科炎(浙江大学)、喻靖(浙江大学)、黄俊杰(浙江大学)、杨宇晨(浙江大学)、张强(浙江大学)、陈华钧(浙江大学)

发表期刊:Nature Computational Science

论文链接:https://www.nature.com/articles/s43588-025-00849-y

代码链接:https://github.com/HICAI-ZJU/SciToolAgent

欢迎转载,转载请注明出处****

在生物、化学、材料等领域,科学研究日益依赖于各种专业计算工具。然而,面对数量庞杂的工具和复杂的科学问题,如何让非计算机专业背景的研究者也能高效、可靠地完成任务,成为亟需解决的难题。近日,浙江大学研究团队提出的SciToolAgent,为此提供了全新的智能解决方案。SciToolAgent利用知识图谱的结构化信息,增强大模型智能体对于复杂任务规划能力,提高其调用科学(包括生物、化学、材料等)工具的准确性,在蛋白质设计、化学反应预测、分子合成、MOF材料筛选等广泛的场景进行了验证。近日该工作已被《Nature Computational Science》接收。

一、研究方法 SciToolAgent旨在提升大语言模型智能体在复杂科学问题中的工具调度与协同能力。为此,团队围绕科学工具的系统收集、科学工具知识图谱的构建、基于LLM的多智能体架构设计、自动化安全检测机制的集成、跨模型兼容性测试以及高效模型训练策略等方面进行了系统性探索与创新。

科研工具的系统性收集与梳理 研究团队围绕生物、化学、材料科学等领域,系统性收集和整理了500余种主流科研工具,涵盖分子模拟、蛋白结构预测、材料性能筛选、分子指纹生成等核心任务。 研究团队针对每一项工具明确了其功能描述、输入输出格式、支持的数据类型、依赖关系、可靠性级别、工具来源等核心属性。此外,针对部分涉及化学品合成、蛋白质生成、有害物质分析等高风险工具,还对其安全级别与潜在风险进行了特别标注,为后续知识图谱建模和安全机制设计提供了坚实基础。 1. 科学工具知识图谱(SciToolKG)构建 团队将每一个科研工具及其关键属性(如功能、输入输出、数据格式、安全等级等)存储为图中的节点,同时,将工具间的功能依赖、输入输出数据流、兼容性关系、顺序执行关系等作为有向边进行建模。按照“实体-关系-实体”三元组形式,将工具之间的各种关联(如“工具A—输出—数据类型1”)逐一填充进知识图谱(SciToolKG)中。例如,一个蛋白质生成工具的输出是蛋白质序列,可以作为蛋白质性质预测工具的输入,这种前后依赖关系就在图中被明确标注。此外,对于工具之间的并行关系、条件执行关系等复杂依赖,也通过图结构进行拓扑描述。 LLM驱动的多智能体系统架构设计 为实现复杂科研任务的自动化与智能化,SciToolAgent采用了LLM驱动的多智能体架构。整个系统由任务规划(Planner)、工具执行(Executor)和结果整合(Summarizer)三大核心模块协同工作,各自承担着不同阶段的决策。该分层架构极大提升了系统的可扩展性、鲁棒性与处理效率。 (1)任务规划模块(Planner) 知识图谱检索增强的工具链规划 Planner模块基于LLM,结合科学工具知识图谱(SciToolKG),实现对用户复杂科学问题的理解、拆解与自动规划。具体流程为:首先,系统解析用户问题,根据语义相似度进行全图检索,随后根据语义相似度和工具之间的依赖关系进行子图检索,返回最相关的若干工具。 随后Planner对候选工具进行排序和依赖性分析,并合理规划工具间的数据流转和执行顺序,组合出工具链(Chain-of-Tools)。该模块不仅能处理单工具简单任务,更能够支持多工具协同、多阶段复杂任务的自动分解和全流程优化,大幅减少人工参与,提高任务执行效率和科学性。 (2) 工具执行模块(Executor)

输入参数准备与API调用 Executor模块负责将Planner输出的工具链计划转化为具体的执行动作。模块内部利用LLM自动解析各工具的输入要求和上下文,完成参数填充、数据格式转换、文件路径定位等准备工作,确保调用接口时满足工具规范。 过程监控与错误处理 在工具调用过程中,Executor自动捕捉并诊断输入异常、工具故障等问题。遇到执行失败或结果异常时,Executor会进行智能重试、输入修正或错误反馈,从而提升整体流程的鲁棒性。 集成自动化安全检查 针对高风险工具和潜在有害输出,Executor内嵌知识库驱动的安全检测模块,能够实时比对化学品、蛋白等结果与有害物质数据库,自动识别并阻断危险结果输出,并向用户和Summarizer发出安全预警,有效保障科研活动的合规性与安全性。 (3)结果整合模块(Summarizer) 多工具结果整合 Summarizer模块聚合并分析多个工具的输出结果,基于LLM对数据进行去噪、信息提炼和逻辑一致性检查。对于多阶段、跨领域的任务,该模块能够消除工具间数据冲突,确保输出结果的完整性与科学性。 智能反馈与流程自优化 当发现结果不合理或未满足预期目标时,Summarizer能主动将失败原因或优化建议反馈给Planner,SciToolAgent将重新规划工具链、完成执行,直至获得最优解。这一机制实现了系统内的闭环自动优化,大幅提升科研任务的自动化水平和鲁棒性。

  1. 多模型兼容性与训练策略 SciToolAgent支持包括开源大模型(如Qwen2.5-72B、Qwen2.5-7B、DeepSeek-R1)和商业大模型(如GPT-4o、OpenAI o1)在内的多种主流大语言模型。针对实际科研场景下的计算资源、部署需求和成本考量,用户可灵活选择基础模型。 考虑到资源受限或私有化部署场景对于使用开源小模型的需求,和开源小参数模型在理解复杂任务、工具链规划等方面的能力存在短板,之间的冲突。研究团队引入了基于科学工具知识图谱(SciToolKG)的自动化高质量指令合成方法。合成数据涵盖工具链规划、工具调用、错误处理、答案总结等多种情境。通过监督微调(SFT)技术,对Qwen2.5-7B进行训练,使其在工具理解、规划、调用等方面的能力显著增强,有效缩小与商用大模型在复杂场景下的差距。 二、实验结果与案例分析

该工作系统评估了SciToolAgent在单/多工具自动规划与调用的能力。详细比较了SciToolAgent与主流方法(包括ReAct、Reflexion、ChemCrow和CACTUS)在多种评价指标下的性能。主要指标包括:任务通过率(Pass Rate)、工具规划准确率(Tool Planning Accuracy)和最终答案准确率(Final Answer Accuracy),分别反映了系统的整体完成能力、工具链规划能力以及最终结果的正确性。 实验结果显示,SciToolAgent在所有指标和任务难度层级上均大幅优于现有方法,特别是在多工具协同(Level-2)任务中。SciToolAgent的最终答案准确率达到94%,相较于其他智能体提升10%,充分证明了基于知识图谱驱动的工具链规划对于复杂科学任务的巨大优势。此外,不同LLM下的消融实验也表明,经过指令微调的Qwen2.5-7B-Instruct亦具备了较强的工具理解和执行能力,验证了SciToolAgent的兼容性。 总体来看,实验结果表明SciToolAgent在自动化、多工具、高安全性的科学任务执行方面表现出色,为科研智能体的实际应用奠定了坚实基础。

SciToolAgent蛋白质设计案例 SciToolAgent自动生成的工具链包括:蛋白序列生成(design_protein_CATH)、结构预测(ESM_fold)、力学与动态稳定性分析(calculate_unfold_force_energy ...)等关键环节,无需人工干预,实现高效、全流程的蛋白设计与分析。

SciToolAgent化学反应预测案例 SciToolAgent通过自动集成分子指纹、电学描述符等多种分子特征(generate_RDK_fingerprints...),并结合不同机器学习算法(MLP_classifier, AdaBoost_classifier..),能够高效预测化学反应。实验结果显示,SciToolAgent不仅能够筛选出最佳特征和最优算法(如随机森林),还大幅提升了反应活性预测的准确性和自动化程度,显著优于传统智能体方法。

SciToolAgent分子合成案例 SciToolAgent能够自动串联反应产物预测(如RXN-for-Chemistry)、分子结构转换(SMILES/SELFIES)、产物文本描述(BioT5+)、专利检索(SureChEMBL数据库)和安全性评估(PubChem数据库及内置安全检查模块)等多种工具,完成从反应预测到产物分析与风险预警的全流程自动化。系统不仅能高效生成反应结果,还能自动识别潜在有害产物(如4-氯苯酚)并发出安全预警。

SciToolAgent MOF材料筛选的案例 SciToolAgent能够自动整合一系列专业工具,实现MOF材料的高效筛选与分析。具体流程包括:利用模型预测材料的热稳定性(mof_stability_predict),借助RASPA2软件评估CO₂吸附能力(mof_adsorption_predict),并结合分子结构转换(mof_to_smiles, smiles_to_cas)和数据库检索工具(mof_price_search),自动获取材料的市场价格。通过这一自动化流程,系统能够根据用户设定的性能和价格标准,快速筛选出最优MOF候选材料。

三、总结

SciToolAgent创新性的提出知识图谱驱动的多工具集成智能体。通过科学工具收集、科学工具知识图谱构建、知识图谱检索算法、多智能体协同框架等技术,提升了智能体解决复杂科学问题的能力。通过在SciToolEval上的实验结果,和蛋白设计与分析、化学反应预测、化学分子合成、MOF材料筛选四大真实科研任务案例,系统展示了SciToolAgent在多工具联动、复杂流程管理和安全把控等方面的强大能力。

成为VIP会员查看完整内容
1

相关内容

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
ACL 2025 | 大模型结构化知识提示的泛化能力研究
专知会员服务
28+阅读 · 8月10日
ACL 2025 | 弹性可伸缩知识图谱嵌入
专知会员服务
10+阅读 · 6月13日
ACL 2025 | 高效样本利用的大模型人类评估方法
专知会员服务
14+阅读 · 5月22日
NAACL 2025 | 知识增强下的智能体规划
专知会员服务
37+阅读 · 3月25日
AAAI 2025 | 基于模态分词的细粒度实体表示学习框架
专知会员服务
26+阅读 · 2024年12月26日
NeurIPS 2024 | WKM: 增强智能体规划的世界知识模型
专知会员服务
29+阅读 · 2024年10月24日
ACL 2024 | 基于自我规划的自动化问答智能体学习
专知会员服务
23+阅读 · 2024年7月28日
IJCAI 2024 | 持续多模态知识图谱构建
专知会员服务
31+阅读 · 2024年6月6日
IEEE Proc.|基于知识图谱的少样本和零样本学习综述
专知会员服务
49+阅读 · 2024年2月2日
Relation Networks for Object Detection 论文笔记
统计学习与视觉计算组
16+阅读 · 2018年4月18日
SRGAN论文笔记
统计学习与视觉计算组
109+阅读 · 2018年4月12日
Mask R-CNN 论文笔记
统计学习与视觉计算组
11+阅读 · 2018年3月22日
论文 | YOLO(You Only Look Once)目标检测
七月在线实验室
14+阅读 · 2017年12月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
Arxiv
80+阅读 · 2023年3月26日
Arxiv
176+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
Arxiv
11+阅读 · 2018年7月31日
VIP会员
相关VIP内容
ACL 2025 | 大模型结构化知识提示的泛化能力研究
专知会员服务
28+阅读 · 8月10日
ACL 2025 | 弹性可伸缩知识图谱嵌入
专知会员服务
10+阅读 · 6月13日
ACL 2025 | 高效样本利用的大模型人类评估方法
专知会员服务
14+阅读 · 5月22日
NAACL 2025 | 知识增强下的智能体规划
专知会员服务
37+阅读 · 3月25日
AAAI 2025 | 基于模态分词的细粒度实体表示学习框架
专知会员服务
26+阅读 · 2024年12月26日
NeurIPS 2024 | WKM: 增强智能体规划的世界知识模型
专知会员服务
29+阅读 · 2024年10月24日
ACL 2024 | 基于自我规划的自动化问答智能体学习
专知会员服务
23+阅读 · 2024年7月28日
IJCAI 2024 | 持续多模态知识图谱构建
专知会员服务
31+阅读 · 2024年6月6日
IEEE Proc.|基于知识图谱的少样本和零样本学习综述
专知会员服务
49+阅读 · 2024年2月2日
相关资讯
Relation Networks for Object Detection 论文笔记
统计学习与视觉计算组
16+阅读 · 2018年4月18日
SRGAN论文笔记
统计学习与视觉计算组
109+阅读 · 2018年4月12日
Mask R-CNN 论文笔记
统计学习与视觉计算组
11+阅读 · 2018年3月22日
论文 | YOLO(You Only Look Once)目标检测
七月在线实验室
14+阅读 · 2017年12月12日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
45+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员