近年来,人工智能(AI)领域取得了显著进展,特别是在诸如 OpenAI-o1 和 DeepSeek-R1 等大型语言模型(LLMs)方面,已在逻辑推理和实验编程等复杂领域展现出卓越的能力。受这些进展的启发,众多研究开始探索 AI 在创新过程中的应用,尤其是在科学研究背景下的潜力。这些 AI 技术的核心目标,是构建能够在广泛科学学科中自主执行研究流程的系统。尽管该领域取得了重要进展,但关于“AI for Research(AI4Research)”的系统性综述仍然缺失,这在一定程度上限制了人们的整体理解,并阻碍了该方向的进一步发展。 为填补这一空白,我们提出了一项全面的综述工作,并提供了关于 AI4Research 的统一视角。具体而言,我们的主要贡献如下: 1. 系统性任务分类:我们首先提出了一种系统的分类方法,用于归纳 AI4Research 中的五类主流任务; 1. 研究前沿与挑战:接着,我们识别了当前研究中的关键空白,并重点讨论了未来的潜在方向,特别是在自动化实验的严谨性、可扩展性以及其社会影响方面; 1. 丰富的应用与资源:最后,我们整理了大量相关资源,包括多学科应用案例、数据语料库及工具,便于研究者快速获取并加以利用。
我们希望本项工作能够为研究社区提供高效的资源入口,并激发 AI4Research 领域的创新性突破。
近年来,人工智能(AI)尤其是大型语言模型(LLMs)的兴起,如 DeepSeekR1 [263],极大地推动了推理领域的研究。这些技术突破显著提升了模型在多个领域中的表现,包括数学推理、编程以及跨学科知识处理等方面 [724, 748, 616, 931, 947, 110]。其中一些模型甚至已通过图灵测试 [352],标志着 AI 发展的一个重要里程碑。 受此启发,一系列研究开始探索用于创新任务的先进 AI 系统,尤其是在科学发现方面的潜力 [863, 887, 847, 948]。早期的研究中,AI Scientist [507] 提出了“全自动 AI 科研系统”的概念,将科研流程划分为三个关键阶段:创意挖掘、实验执行与学术写作。该系统首先生成并评估新的想法与假设;一旦假设形成,便自动执行实验,输出包括数值数据与可视化结果在内的研究成果。这些结果通过表格和图像呈现,并附有合理解释,最终生成一份 LaTeX 报告。在最后阶段,AI Scientist 还会自动生成评审意见,用于完善项目并为后续科学发现提供反馈。 类似地,其他经典模型如 Carl [330] 和 Zochi [12] 也采用了类似的流程。值得注意的是,AgentArxiv [665] 和 AgentLab [666] 引入了多智能体协作机制,模拟科研团队中的分工协作,涵盖了同行评审、学术综述等功能,从而实现了半自动甚至全自动的协同研究过程,而非依赖单一智能体 [478, 870, 112, 658, 53]。 尽管上述工作取得了显著进展,目前仍缺乏对 AI 驱动科研的系统性综述,无法全面分析其中的关键因素与最新发展,严重制约了该领域的持续推进。
为弥补这一空白,我们首次系统定义并综述了“AI for Research”(AI4Research)这一领域。如图 1 所示,我们提出了 AI4Research 的系统性任务分类,重点涵盖以下五个方面: 1. 面向科学理解的 AI:AI 系统提取科研文献中相关信息的能力至关重要; 1. 面向学术综述的 AI:利用 AI 技术系统性地回顾与总结科研文献; 1. 面向科学发现的 AI:基于现有科学知识生成假设、理论或模型; 1. 面向学术写作的 AI:辅助研究人员撰写、编辑与排版科研论文; 1. 面向学术评审的 AI:用于评估与反馈科研论文的质量。
面对庞大的文献规模,我们特别强调了 AI4Research 的潜在研究前沿。未来的研究应优先发展能够融合多学科知识的跨领域 AI 模型,以促进跨学科协作;同时,解决 AI 系统中的伦理问题与偏差对于确保科研的公平性与透明度至关重要;提升模型可解释性、开发具备自适应能力的实时 AI 系统,以应对动态科学实验,也将成为推动 AI 在科研中发挥更大作用的关键。 此外,我们还总结了 AI4Research 中的关键应用与重要资源,包括代表性的多学科应用案例、开源框架与数据集仓库,以支持未来的深入研究。我们分别介绍了 AI 在自然科学、应用科学与工程、以及社会科学领域的研究实践。最后,我们回顾了模型开发中的关键工具与公开评测基准,这些都为训练与实验提供了丰富的数据支持。 本工作的主要贡献如下: * 科研 AI 的系统性分类方法:本文提出了一套完整的分类体系,涵盖科学理解、学术综述、科学发现、学术写作和学术评审五大方面,系统梳理了能够增强甚至自动执行科研各阶段任务的 AI 工具; * 新兴的未来研究方向:本文识别了 AI 在学术界的重要未来研究方向,包括发展跨学科 AI 模型、应对伦理与偏差问题、提升模型可解释性,以及探索用于动态科学实验的自适应 AI 系统; * 关键应用与丰富资源:我们系统汇总了 AI4Research 在自然科学、应用科学与社会科学领域的典型应用场景,并梳理了支撑科研流程的关键资源,包括开源框架、公共数据集、协作平台、云端 AI 服务与学术工具,涵盖科研发现管理、数据处理和 AI 驱动研究等多个方面。