AI进入推理模型时代，一文带你读懂思维链

近段时间，推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道，该模型在输出最终回答之前，会先输出一段思维链内容。这样做可以提升最终答案的准确性。

今天这篇文章将带你了解思维链（CoT）的相关研究和技术。

（图注）某些形式的推理技巧。

思维链（CoT）已经存在了相当长的一段时间。从技术上讲，它是一种高级提示工程。各种形式的 CoT 通常都是强迫大型语言模型进行推理。

2024 年 9 月，OpenAI 发布了其模型 o1 的预览版后，我们看到围绕 CoT 的炒作愈演愈烈。

除了 OpenAI，没有人完全知道 o1 是如何工作的，它是否是一个组合系统，用什么样的数据进行了微调，是否使用了强化学习，或者是否有几个模型在一起工作。

也许一个模型负责计划，另一个模型负责思考，第三个模型负责评分。但我们知道，它们都采用了某种逐步推理的方式。

关于这一点，已经有很多公开的研究。这篇文章将介绍现有的研究成果，让你知道自己可以使用什么。我也会对不同的技术进行测试，看看我们能否实现真正的改进。

研究者们在过去两年中发表了很多论文。你可以在下图中看到他们所谈到的推理技术。

过去两年讨论较多的 CoT 技术。

大部分工作直接来自 DeepMind 或普林斯顿大学。为他们的开源工作点赞。

CoT 这个词是 DeepMind 在 2022 年提出的，只在提示中使用。最新的论文探索了结合蒙特卡洛搜索（Monte Carlo Search）和无需提示的 CoT 的「思维树」（ToT）。

接下来将介绍简单的思维链 (CoT)、CoT链、贪婪解码、CoT-SC、解码 CoT 以及结合蒙特卡洛树搜索的「思维树」。

成为VIP会员查看完整内容

相关内容

从o1-mini到DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

专知会员服务

39+阅读 · 2月25日

CVPR 2023开会了！东京大学等最新《神经搜索实战》教程，附300多页ppt

专知会员服务

35+阅读 · 2023年6月21日

ChatGPT大模型work三个要点是什么？谷歌JasonWei最新《大型语言模型的缩放、涌现和推理》报告，附Slides与视频

专知会员服务

100+阅读 · 2023年4月14日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知会员服务

88+阅读 · 2022年11月17日

深度学习和因果如何结合？北交最新《深度因果模型》综述论文，31页pdf涵盖216页pdf详述41个深度因果模型

专知会员服务

128+阅读 · 2022年9月21日

从数学推导开始，7万字一定带你学会支持向量机（附118PDF下载）

专知会员服务

56+阅读 · 2022年7月20日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

106+阅读 · 2022年6月17日

符号还是神经？AAAI2022Mila唐建团队《知识图谱推理进展》教程，150页ppt全面讲解符号逻辑神经推理方法

专知会员服务

98+阅读 · 2022年2月25日

如何持续深度学习？看这份《DNN2GP: 从深度神经网络到高斯过程》45页ppt和论文提供新思路

专知会员服务

57+阅读 · 2020年5月15日

图神经网络推理，27页ppt精炼讲解

专知会员服务

117+阅读 · 2020年4月24日

专知

10+阅读 · 2022年11月17日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

66+阅读 · 2019年9月26日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

RoBERTa中文预训练模型，你离中文任务的「SOTA」只差个它

机器之心

40+阅读 · 2019年9月5日

3分钟看懂史上最强NLP模型BERT

新智元

23+阅读 · 2019年2月27日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

ELMo的朋友圈：预训练语言模型真的一枝独秀吗？

机器之心

10+阅读 · 2019年1月1日

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

GAN生成式对抗网络

15+阅读 · 2018年8月11日

入门 | 从零开始，了解元学习

机器之心

17+阅读 · 2018年5月6日

目标检测101：一文带你读懂深度学习框架下的目标检测

大数据文摘

23+阅读 · 2017年9月27日

中国地区生产率差距研究——基于异质性企业、劳动力与产业空间分布的视角

国家自然科学基金

1+阅读 · 2015年12月31日

创造力的负效应及机制研究：社会网络的视角

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

小微企业互联网平台融资模式研究—基于双向拍卖和信号博弈双重视角

国家自然科学基金

4+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

2+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

企业内正式与非正式网络互动及其对组织适应性影响和权变机理研究：CAS视角的分析

国家自然科学基金

1+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

169+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

79+阅读 · 2023年4月4日

A Survey of Large Language Models

Arxiv

457+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

142+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

168+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

49+阅读 · 2023年3月22日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

83+阅读 · 2023年3月21日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日