通过逻辑推理赋能大语言模型：综述 - 专知VIP

会员服务 ·

0

大语言模型 · 逻辑推理 ·

通过逻辑推理赋能大语言模型：综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大语言模型（LLMs）在各类自然语言任务中取得了显著的成功。然而，近期研究发现，LLMs 在逻辑推理能力上仍面临着一些显著的挑战。本文总结并将这些挑战分类为两个方面：（1）逻辑问答，LLMs 常常无法在复杂的逻辑问题中生成正确答案，这类问题需要根据一组前提和约束进行复杂的推理，包括演绎推理、归纳推理或溯因推理；（2）逻辑一致性，LLMs 容易在不同问题中生成自相矛盾的回答。例如，一个最先进的 Macaw 问答型 LLM 对问题“喜鹊是鸟吗？”和“鸟有翅膀吗？”的回答均为“是”，但对问题“喜鹊有翅膀吗？”的回答却为“否”。为了促进这一研究方向的发展，我们全面调查了当前最前沿的方法，并提出了这些方法的详细分类。具体而言，为了准确回答复杂的逻辑问题，现有方法可以根据是否依赖外部求解器、提示（prompt）、预训练以及微调进行分类。为了避免逻辑矛盾，我们讨论了多种逻辑一致性的概念和解决方案，包括蕴涵、否定、传递性、事实一致性及其组合。此外，我们还回顾了常用的基准数据集和评估指标，并讨论了有前景的研究方向，如扩展模态逻辑以应对不确定性，以及满足多个逻辑一致性的高效算法。

成为VIP会员查看完整内容

1

相关内容

大语言模型

大语言模型

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本，还能够深入理解文本含义，处理各种自然语言任务，如文本摘要、问答、翻译等。2023年，大语言模型及其在人工智能领域的应用已成为全球科技研究的热点，其在规模上的增长尤为引人注目，参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处，更加深入地理解人类语言的复杂性。在过去的一年里，大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟，它将不断拓展其应用范围，为人类提供更加智能化和个性化的服务，进一步改善人们的生活和生产方式。

大语言模型中的逻辑推理：综述

大语言模型中的逻辑推理：综述

专知会员服务

34+阅读 · 2月15日

博弈论与大语言模型的结合：系统性综述

博弈论与大语言模型的结合：系统性综述

专知会员服务

34+阅读 · 2月14日

大型概念模型：在句子表示空间中的语言建模

大型概念模型：在句子表示空间中的语言建模

专知会员服务

18+阅读 · 2024年12月14日

大型语言模型遇上自然语言处理：综述

大型语言模型遇上自然语言处理：综述

专知会员服务

37+阅读 · 2024年5月23日

时间序列基础模型综述：用大型语言模型推广时间序列表征

时间序列基础模型综述：用大型语言模型推广时间序列表征

专知会员服务

64+阅读 · 2024年5月11日

多语言大型语言模型：资源、分类和前沿综述

多语言大型语言模型：资源、分类和前沿综述

专知会员服务

49+阅读 · 2024年4月9日

大模型如何处理知识冲突？清华等《大型语言模型中的知识冲突》综述

大模型如何处理知识冲突？清华等《大型语言模型中的知识冲突》综述

专知会员服务

60+阅读 · 2024年3月14日

大型语言模型的模型压缩与高效推理：综述

大型语言模型的模型压缩与高效推理：综述

专知会员服务

84+阅读 · 2024年2月17日

《大型语言模型归因》综述

《大型语言模型归因》综述

专知会员服务

71+阅读 · 2023年11月8日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

21+阅读 · 2021年4月15日

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

37+阅读 · 2023年4月13日

基于模型的强化学习综述

基于模型的强化学习综述

专知

34+阅读 · 2022年7月13日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知

10+阅读 · 2020年8月12日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

17+阅读 · 2020年6月26日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器学习研究会

12+阅读 · 2017年12月24日

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

炼数成金订阅号

26+阅读 · 2017年7月10日

MNIST入门：贝叶斯方法

MNIST入门：贝叶斯方法

Python程序员

23+阅读 · 2017年7月3日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

8+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

16+阅读 · 2015年12月31日

基于稳健估计方程的复杂纵向数据研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

1+阅读 · 2014年12月31日

基于关系语义的空间场景信息理解

国家自然科学基金

5+阅读 · 2014年12月31日

基于对合否定的SBL公理化扩张系统的程度化推理及逻辑控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

36+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

194+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

431+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

136+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

60+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

73+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

157+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

22+阅读 · 2023年3月17日

VIP会员

相关主题

大语言模型

相关VIP内容

大语言模型中的逻辑推理：综述

大语言模型中的逻辑推理：综述

专知会员服务

34+阅读 · 2月15日

博弈论与大语言模型的结合：系统性综述

博弈论与大语言模型的结合：系统性综述

专知会员服务

34+阅读 · 2月14日

大型概念模型：在句子表示空间中的语言建模

大型概念模型：在句子表示空间中的语言建模

专知会员服务

18+阅读 · 2024年12月14日

大型语言模型遇上自然语言处理：综述

大型语言模型遇上自然语言处理：综述

专知会员服务

37+阅读 · 2024年5月23日

时间序列基础模型综述：用大型语言模型推广时间序列表征

时间序列基础模型综述：用大型语言模型推广时间序列表征

专知会员服务

64+阅读 · 2024年5月11日

多语言大型语言模型：资源、分类和前沿综述

多语言大型语言模型：资源、分类和前沿综述

专知会员服务

49+阅读 · 2024年4月9日

大模型如何处理知识冲突？清华等《大型语言模型中的知识冲突》综述

大模型如何处理知识冲突？清华等《大型语言模型中的知识冲突》综述

专知会员服务

60+阅读 · 2024年3月14日

大型语言模型的模型压缩与高效推理：综述

大型语言模型的模型压缩与高效推理：综述

专知会员服务

84+阅读 · 2024年2月17日

《大型语言模型归因》综述

《大型语言模型归因》综述

专知会员服务

71+阅读 · 2023年11月8日

【WWW2021】实体自适应语义依赖图立场检测

专知会员服务

21+阅读 · 2021年4月15日

热门VIP内容

开通专知VIP会员享更多权益服务

AI”+系列军工专题报告之一：Deepseek冲击波：硅基防线，AI铸剑

【新书】学习 LangChain：使用 LangChain 和 LangGraph 构建 AI 和大语言模型应用，404页pdf

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

【ICLR2025】为多模态图像-文本表示可解释性缩小信息瓶颈理论

相关资讯

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

37+阅读 · 2023年4月13日

基于模型的强化学习综述

基于模型的强化学习综述

专知

34+阅读 · 2022年7月13日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

26+阅读 · 2021年1月25日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知

10+阅读 · 2020年8月12日

【CVPR 2020 Oral】小样本类增量学习

【CVPR 2020 Oral】小样本类增量学习

专知

17+阅读 · 2020年6月26日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器翻译新时代：Facebook 开源无监督机器翻译模型和大规模训练语料

机器学习研究会

12+阅读 · 2017年12月24日

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

语义分割中的深度学习方法全解：从FCN、SegNet到DeepLab

炼数成金订阅号

26+阅读 · 2017年7月10日

MNIST入门：贝叶斯方法

MNIST入门：贝叶斯方法

Python程序员

23+阅读 · 2017年7月3日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

8+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

16+阅读 · 2015年12月31日

基于稳健估计方程的复杂纵向数据研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

1+阅读 · 2014年12月31日

基于关系语义的空间场景信息理解

国家自然科学基金

5+阅读 · 2014年12月31日

基于对合否定的SBL公理化扩张系统的程度化推理及逻辑控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

2+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

165+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

36+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

98+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

194+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

431+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

136+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

60+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

73+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

157+阅读 · 2023年3月24日

Data-centric Artificial Intelligence: A Survey

Arxiv

22+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员