信息获取系统已经深度嵌入人类社会的“毛细血管”之中,成为连接人类与信息的关键工具。许多信息获取系统依赖静态工作流,即对所有用户查询采用固定的执行流程。然而,这种“一刀切”的方式限制了系统在复杂现实场景中对用户查询进行因地制宜处理的能力。为突破这一限制,已有研究探索了基于智能体工作流的信息获取方法,在该范式中,一个或多个自主智能体可根据每个用户查询动态调整执行路径。 本论文聚焦于优化信息获取的智能体工作流,针对以下三个核心组成部分的局限性展开研究:人机混合策略规划、排序策略规划以及排序结果反映。 * 论文第一部分致力于优化人机混合策略规划。本部分包含一个章节,聚焦于解决系统主动行为预测范围过窄的问题。为应对该问题,本章提出并建模了一个新任务:系统主动行为预测(System Initiative Prediction,SIP),从而拓宽系统主动行为的定义与预测能力。 * 第二部分旨在优化排序策略规划,其中包含一个章节,重点研究面向单条查询的动态重排序深度预测这一关键任务。考虑到在大语言模型(LLM)支持的重排序背景下,该任务尚未被充分研究,本章在这一新场景中系统地探索了该问题。 * 第三部分则聚焦于优化排序结果反映,共包含两个章节,核心任务为查询性能预测(Query Performance Prediction,QPP)——这是排序结果反映中长期存在的重要研究方法。尽管QPP在信息检索中具有重要意义,但目前在对话式搜索中的研究较少,且鲜有工作探索利用LLM能力提升QPP准确性。该部分的第一章将传统为临时性搜索(ad-hoc search)设计的QPP方法扩展至对话式搜索场景;第二章则进一步利用LLM能力提升QPP预测精度。
总的来说,本论文旨在通过系统优化策略规划与结果评估机制,推动信息获取中智能体工作流的效能与实用性提升。