推理是一种基础的认知过程,使智能体具备逻辑推理、问题求解与决策制定的能力。随着大语言模型(Large Language Models,简称 LLM)的快速发展,推理能力已成为先进人工智能系统区别于传统聊天机器人模型的关键特征。 在本综述中,我们从两个正交维度对现有方法进行分类: 1. 推理范式(Regimes):指推理发生的阶段,分为推理时刻(inference-time)专门训练(dedicated training); 1. 推理架构(Architectures):指参与推理过程的系统结构,涵盖独立的 LLM引入外部工具的智能体系统(agentic systems),以及**多智能体协作(multi-agent collaboration)**等不同类型。

在每个维度下,我们进一步从两个关键视角展开分析: * 输入层面(Input level):研究如何构造高质量提示(prompts),使 LLM 基于良好的条件进行推理; * 输出层面(Output level):聚焦于如何优化多次采样的候选输出,以提升推理质量。

该分类框架系统性地梳理了 LLM 推理能力的发展图谱,揭示了几个关键演进趋势,例如: * 从“推理扩展(inference scaling)”向“学习推理能力(learning to reason)”的转变(如 DeepSeek-R1); * 向“智能体式工作流(agentic workflows)”的过渡(如 OpenAI Deep Research、Manus Agent)。

此外,本文还覆盖了广泛的学习算法,包括从监督微调(supervised fine-tuning)强化学习(如 PPO 与 GRPO),以及用于训练推理器(reasoners)验证器(verifiers)的多种机制。 我们还回顾了智能体式工作流的关键设计模式,从经典的生成-评估器结构(generator-evaluator)LLM 辩论机制(LLM debate),到最新的创新框架。 最后,我们指出了当前研究中的新兴趋势,例如面向特定领域的推理系统,以及亟待解决的开放问题,如评估标准与数据质量控制。 本综述旨在为人工智能研究人员与实践者提供一个全面的理论与方法基础,以进一步推动大语言模型中的推理能力发展,为构建更加复杂、可靠的 AI 系统铺平道路。

成为VIP会员查看完整内容
1

相关内容

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。2023年,大语言模型及其在人工智能领域的应用已成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语言的复杂性。在过去的一年里,大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟,它将不断拓展其应用范围,为人类提供更加智能化和个性化的服务,进一步改善人们的生活和生产方式。
博弈论与大语言模型的结合:系统性综述
专知会员服务
50+阅读 · 2月14日
以人为中心的基础模型:感知、生成与代理建模
专知会员服务
24+阅读 · 2月13日
关于多生成智能体系统的综述:最新进展与新前沿
专知会员服务
48+阅读 · 2024年12月29日
迈向可信的人工智能:伦理和稳健的大型语言模型综述
专知会员服务
36+阅读 · 2024年7月28日
大规模语言模型中的知识机制:综述与展望
专知会员服务
52+阅读 · 2024年7月26日
从数据中心视角看多模态大型语言模型的综述
专知会员服务
55+阅读 · 2024年5月28日
超越思维链:大型语言模型的X链范式综述
专知会员服务
50+阅读 · 2024年4月28日
大型语言模型的模型压缩与高效推理:综述
专知会员服务
88+阅读 · 2024年2月17日
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
14+阅读 · 2020年9月9日
用Attention玩转CV,一文总览自注意力语义分割进展
论文浅尝 | 区分概念和实例的知识图谱嵌入方法
开放知识图谱
17+阅读 · 2019年1月19日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
机器学习(23)之GBDT详解
机器学习算法与Python学习
12+阅读 · 2017年10月25日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
A Survey of Large Language Models
Arxiv
452+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
166+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
博弈论与大语言模型的结合:系统性综述
专知会员服务
50+阅读 · 2月14日
以人为中心的基础模型:感知、生成与代理建模
专知会员服务
24+阅读 · 2月13日
关于多生成智能体系统的综述:最新进展与新前沿
专知会员服务
48+阅读 · 2024年12月29日
迈向可信的人工智能:伦理和稳健的大型语言模型综述
专知会员服务
36+阅读 · 2024年7月28日
大规模语言模型中的知识机制:综述与展望
专知会员服务
52+阅读 · 2024年7月26日
从数据中心视角看多模态大型语言模型的综述
专知会员服务
55+阅读 · 2024年5月28日
超越思维链:大型语言模型的X链范式综述
专知会员服务
50+阅读 · 2024年4月28日
大型语言模型的模型压缩与高效推理:综述
专知会员服务
88+阅读 · 2024年2月17日
相关资讯
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
14+阅读 · 2020年9月9日
用Attention玩转CV,一文总览自注意力语义分割进展
论文浅尝 | 区分概念和实例的知识图谱嵌入方法
开放知识图谱
17+阅读 · 2019年1月19日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
机器学习(23)之GBDT详解
机器学习算法与Python学习
12+阅读 · 2017年10月25日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
微信扫码咨询专知VIP会员