带入您自己的知识：大型语言模型（LLM）知识扩展方法综述 - 专知VIP

会员服务 ·

23

大型语言模型 · 知识扩展 ·

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

将大型语言模型（LLM）适应于新的多样化知识，对于其在实际应用中的长期有效性至关重要。本综述概述了扩展LLM知识的最先进方法，重点介绍了整合多种知识类型的方法，包括事实信息、领域专业知识、语言能力和用户偏好。我们探讨了持续学习、模型编辑和基于检索的显式适应等技术，同时讨论了知识一致性和可扩展性等挑战。本综述旨在为研究人员和实践者提供指导，阐明了将LLM发展为可适应且强大的知识系统的机会。 https://arxiv.org/abs/2502.12598

1 引言

随着大型语言模型（LLM）在实际应用中的逐渐普及，它们适应不断变化的知识的能力对于保持相关性和准确性变得至关重要。然而，LLM 通常只进行一次训练，因此它们的知识更新仅限于某个截止日期，限制了它们与新信息保持同步的能力。本综述全面概述了使 LLM 能够整合各种类型新知识的方法，包括事实知识、领域特定知识、语言知识和用户偏好知识。我们调查了适应策略，包括持续学习、模型编辑和基于检索的方法，并旨在为研究人员和实践者提供指导。为了保持有效性，LLM 需要在多个维度上进行更新。事实知识包括一般真理和实时信息，而领域知识则涉及特定领域，如医学或法律。语言知识增强了多语言能力，偏好知识使模型的行为与用户的期望和价值观保持一致。确保 LLM 能够在这些维度上整合更新对于其持续的实用性至关重要。现有的 LLM 适应方法在方法和应用上有所不同。持续学习使得模型的参数化知识能够进行增量更新，减轻灾难性遗忘（McCloskey 和 Cohen，1989），同时确保长期表现。模型编辑允许精确修改已学习的知识，提供受控的更新，而不需要完全重新训练。与这些隐式知识扩展方法不同，基于检索的方法在推理过程中显式地动态访问外部信息，从而减少对静态参数化知识的依赖。不同知识类型的这些方法的适用性和一般性已在表 1 中总结。通过利用这些策略，LLM 可以保持准确性、上下文意识，并适应新信息。在第二节中，我们将我们的工作置于背景中（第 2 节），并在第三节中定义本文涉及的知识类型。我们还概述了不同的知识扩展方法，如图 1 所示。因此，本工作综述了多种研究努力，并可作为研究人员和实践者开发和应用可适应且强大的 LLM 的指南。我们强调了研究机会，并提供了优化适应技术以应对各种实际应用的见解。

成为VIP会员查看完整内容

36

相关内容

大型语言模型

大型语言模型

定制化大型语言模型的图检索增强生成综述

定制化大型语言模型的图检索增强生成综述

专知会员服务

35+阅读 · 1月28日

强化学习增强的大型语言模型：综述

强化学习增强的大型语言模型：综述

专知会员服务

49+阅读 · 2024年12月17日

小型语言模型综述

小型语言模型综述

专知会员服务

50+阅读 · 2024年10月29日

生成式信息检索综述

生成式信息检索综述

专知会员服务

34+阅读 · 2024年6月5日

基础模型视频理解综述

基础模型视频理解综述

专知会员服务

31+阅读 · 2024年5月8日

多语言大型语言模型：资源、分类和前沿综述

多语言大型语言模型：资源、分类和前沿综述

专知会员服务

52+阅读 · 2024年4月9日

大型语言模型增强强化学习综述:概念、分类和方法

大型语言模型增强强化学习综述:概念、分类和方法

专知会员服务

57+阅读 · 2024年4月4日

《大型语言模型自然语言生成评估》综述

《大型语言模型自然语言生成评估》综述

专知会员服务

71+阅读 · 2024年1月20日

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

专知会员服务

95+阅读 · 2023年9月11日

面向自然语言处理的知识图谱嵌入:从理论到实践

面向自然语言处理的知识图谱嵌入:从理论到实践

专知会员服务

53+阅读 · 2022年10月16日

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

46+阅读 · 2022年11月5日

【干货书】知识图谱:基础，技术与应用，568页pdf

【干货书】知识图谱:基础，技术与应用，568页pdf

专知

12+阅读 · 2022年8月18日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

19+阅读 · 2021年12月3日

深度学习自然语言处理概述，116页ppt，Jiří Materna

深度学习自然语言处理概述，116页ppt，Jiří Materna

专知

37+阅读 · 2020年3月10日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

IBM-小样本学习（Few-shot Learning）State of the art 方法及论文讲解

IBM-小样本学习（Few-shot Learning）State of the art 方法及论文讲解

专知

105+阅读 · 2019年4月15日

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

数据分析

12+阅读 · 2019年4月14日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

大型语言模型

相关VIP内容

定制化大型语言模型的图检索增强生成综述

定制化大型语言模型的图检索增强生成综述

专知会员服务

35+阅读 · 1月28日

强化学习增强的大型语言模型：综述

强化学习增强的大型语言模型：综述

专知会员服务

49+阅读 · 2024年12月17日

小型语言模型综述

小型语言模型综述

专知会员服务

50+阅读 · 2024年10月29日

生成式信息检索综述

生成式信息检索综述

专知会员服务

34+阅读 · 2024年6月5日

基础模型视频理解综述

基础模型视频理解综述

专知会员服务

31+阅读 · 2024年5月8日

多语言大型语言模型：资源、分类和前沿综述

多语言大型语言模型：资源、分类和前沿综述

专知会员服务

52+阅读 · 2024年4月9日

大型语言模型增强强化学习综述:概念、分类和方法

大型语言模型增强强化学习综述:概念、分类和方法

专知会员服务

57+阅读 · 2024年4月4日

《大型语言模型自然语言生成评估》综述

《大型语言模型自然语言生成评估》综述

专知会员服务

71+阅读 · 2024年1月20日

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

大模型如何可解释？新泽西理工学院等最新《大型语言模型可解释性》综述

专知会员服务

95+阅读 · 2023年9月11日

面向自然语言处理的知识图谱嵌入:从理论到实践

面向自然语言处理的知识图谱嵌入:从理论到实践

专知会员服务

53+阅读 · 2022年10月16日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

【2022新书】机器学习中的统计建模:概念和应用，398页pdf

专知

46+阅读 · 2022年11月5日

【干货书】知识图谱:基础，技术与应用，568页pdf

【干货书】知识图谱:基础，技术与应用，568页pdf

专知

12+阅读 · 2022年8月18日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【干货书】高维统计学，572页pdf

【干货书】高维统计学，572页pdf

专知

19+阅读 · 2021年12月3日

深度学习自然语言处理概述，116页ppt，Jiří Materna

深度学习自然语言处理概述，116页ppt，Jiří Materna

专知

37+阅读 · 2020年3月10日

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

ICCV 2019教程《面向计算机视觉的可解释机器学习》，附280页PPT下载

专知

33+阅读 · 2019年11月1日

层级强化学习概念简介

层级强化学习概念简介

CreateAMind

19+阅读 · 2019年6月9日

IBM-小样本学习（Few-shot Learning）State of the art 方法及论文讲解

IBM-小样本学习（Few-shot Learning）State of the art 方法及论文讲解

专知

105+阅读 · 2019年4月15日

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

推荐：使用Python实现机器学习特征选择的4种方法（附代码）

数据分析

12+阅读 · 2019年4月14日

深度学习超参数搜索实用指南

深度学习超参数搜索实用指南

云栖社区

28+阅读 · 2018年10月14日

相关基金

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

33+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

13+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

174+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员