大型语言模型(LLM)的出现极大地革新了网页搜索。 基于 LLM 的搜索智能体的兴起,标志着信息检索向更深层次、更动态、更自主化方向的关键转变。这类智能体能够理解用户意图和环境上下文,并通过动态规划执行多轮检索,将搜索能力扩展到远超传统网页搜索的范围。 以 OpenAI 的 Deep Research 为代表的前沿案例,凸显了它们在深度信息挖掘和真实世界应用中的巨大潜力。 本文首次对搜索智能体进行了系统性分析,从体系结构、优化方法、应用场景和评测方式四个维度,对现有研究进行了全面的分析与分类,最终识别出该领域中的关键开放挑战,并提出了有前景的未来研究方向。 我们的资料库可在以下地址获取:https://github.com/YunjiaXi/Awesome-Search-Agent-Papers。
1 引言
**
**
大型语言模型(LLM)的出现,开启了自然语言处理的新纪元,并从根本上改变了包括网页搜索在内的众多领域(Wang et al., 2024b; Zhao et al., 2023; Hadi et al., 2023; Xi et al., 2025c; Lin et al., 2025a, 2024; Xi et al., 2025b, 2024a)。如图 1 所示,传统网页搜索需要用户在结果列表中手动筛选和整合相关信息(Lin et al., 2021; Dai et al., 2021; Fu et al., 2023)。随着 LLM 的兴起,出现了LLM 增强搜索这一新范式,其中 LLM 会改写用户查询以提升搜索准确性(Ma et al., 2023b; Liu and Mozafari, 2024; Xi et al., 2024b),或对搜索结果进行摘要以加快理解过程,即传统的检索增强生成(RAG)(Gao et al., 2023; Fan et al., 2024)。然而,这种集成方式往往是静态的,因为 LLM 依赖于单轮或基于规则的迭代搜索,难以有效处理复杂且动态变化的上下文。
LLM 智能体的出现带来了关键转变,催生了搜索智能体(Zhang et al., 2024b)。借助自主性,搜索智能体能够掌控整个搜索流程,更有效地利用上下文进行自适应推理与动态检索。在这一范式中,搜索成为一种主动行为,不再局限于网页,而是扩展到更广泛的信息源,例如私有数据库以及智能体内部的经验。具体而言,搜索智能体可定义为:一种能够理解用户意图与环境上下文、自动规划搜索策略、从多样化来源执行多轮动态检索,并整合信息以提供全面洞见的 LLM 智能体。业界领先的解决方案,如 OpenAI 的 Deep Research(OpenAI, 2025)、Gemini(Gemini, 2025)以及 Perplexity(Perplexity, 2025),充分展示了搜索智能体在深度信息挖掘与商业化方面的潜力。
鉴于这些快速发展,本文从多个视角对搜索智能体进行首次系统性综述,围绕如何搜索、如何优化、如何应用以及如何评测四个维度展开分析。与近期仅聚焦于特定子领域或单一视角的综述不同,例如强调从大量信息检索生成专业报告的 Deep Research(Xu and Peng, 2025; Huang et al., 2025b)或关注推理与 RAG 结合的研究(Liang et al., 2025; Gao et al., 2025),我们的工作全面剖析了搜索智能体的全流程,包括其搜索结构、优化方法、应用场景、评测体系及面临的挑战,并对各部分的代表性工作与发展趋势进行了深入分析。
本文结构如下:第 2 节介绍搜索智能体的任务定义;第 3 节“如何搜索”探讨智能体如何扩展搜索轮次并利用复杂的搜索结构(如并行、顺序与混合)来确定查询内容;第 4 节“如何优化”讨论搜索智能体的多种优化方法,包括调参与无调参手段;第 5 节“如何应用”阐述搜索智能体的广泛应用领域,涵盖智能体内部增强(如推理、记忆与工具使用)与外部应用(如数学、医学与金融);第 6 节“如何评测”介绍搜索智能体的评测方法,包括相关数据集与指标;最后,第 7 节总结当前的挑战并展望未来的研究方向。