将大型语言模型(LLM)适应于新的多样化知识,对于其在实际应用中的长期有效性至关重要。本综述概述了扩展LLM知识的最先进方法,重点介绍了整合多种知识类型的方法,包括事实信息、领域专业知识、语言能力和用户偏好。我们探讨了持续学习、模型编辑和基于检索的显式适应等技术,同时讨论了知识一致性和可扩展性等挑战。本综述旨在为研究人员和实践者提供指导,阐明了将LLM发展为可适应且强大的知识系统的机会。 https://arxiv.org/abs/2502.12598

1 引言

随着大型语言模型(LLM)在实际应用中的逐渐普及,它们适应不断变化的知识的能力对于保持相关性和准确性变得至关重要。然而,LLM 通常只进行一次训练,因此它们的知识更新仅限于某个截止日期,限制了它们与新信息保持同步的能力。本综述全面概述了使 LLM 能够整合各种类型新知识的方法,包括事实知识、领域特定知识、语言知识和用户偏好知识。我们调查了适应策略,包括持续学习、模型编辑和基于检索的方法,并旨在为研究人员和实践者提供指导。 为了保持有效性,LLM 需要在多个维度上进行更新。事实知识包括一般真理和实时信息,而领域知识则涉及特定领域,如医学或法律。语言知识增强了多语言能力,偏好知识使模型的行为与用户的期望和价值观保持一致。确保 LLM 能够在这些维度上整合更新对于其持续的实用性至关重要。 现有的 LLM 适应方法在方法和应用上有所不同。持续学习使得模型的参数化知识能够进行增量更新,减轻灾难性遗忘(McCloskey 和 Cohen,1989),同时确保长期表现。模型编辑允许精确修改已学习的知识,提供受控的更新,而不需要完全重新训练。与这些隐式知识扩展方法不同,基于检索的方法在推理过程中显式地动态访问外部信息,从而减少对静态参数化知识的依赖。不同知识类型的这些方法的适用性和一般性已在表 1 中总结。通过利用这些策略,LLM 可以保持准确性、上下文意识,并适应新信息。 在第二节中,我们将我们的工作置于背景中(第 2 节),并在第三节中定义本文涉及的知识类型。我们还概述了不同的知识扩展方法,如图 1 所示。因此,本工作综述了多种研究努力,并可作为研究人员和实践者开发和应用可适应且强大的 LLM 的指南。我们强调了研究机会,并提供了优化适应技术以应对各种实际应用的见解。

成为VIP会员查看完整内容
11

相关内容

定制化大型语言模型的图检索增强生成综述
专知会员服务
26+阅读 · 1月28日
强化学习增强的大型语言模型:综述
专知会员服务
42+阅读 · 2024年12月17日
小型语言模型综述
专知会员服务
46+阅读 · 2024年10月29日
生成式信息检索综述
专知会员服务
32+阅读 · 2024年6月5日
基础模型视频理解综述
专知会员服务
30+阅读 · 2024年5月8日
多语言大型语言模型:资源、分类和前沿综述
专知会员服务
49+阅读 · 2024年4月9日
大型语言模型增强强化学习综述:概念、分类和方法
专知会员服务
55+阅读 · 2024年4月4日
《大型语言模型自然语言生成评估》综述
专知会员服务
70+阅读 · 2024年1月20日
面向自然语言处理的知识图谱嵌入:从理论到实践
专知会员服务
53+阅读 · 2022年10月16日
基于模型的强化学习综述
专知
34+阅读 · 2022年7月13日
【干货书】高维统计学,572页pdf
专知
16+阅读 · 2021年12月3日
层级强化学习概念简介
CreateAMind
18+阅读 · 2019年6月9日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
431+阅读 · 2023年3月31日
Arxiv
72+阅读 · 2023年3月26日
Arxiv
157+阅读 · 2023年3月24日
Arxiv
22+阅读 · 2023年3月17日
VIP会员
相关VIP内容
定制化大型语言模型的图检索增强生成综述
专知会员服务
26+阅读 · 1月28日
强化学习增强的大型语言模型:综述
专知会员服务
42+阅读 · 2024年12月17日
小型语言模型综述
专知会员服务
46+阅读 · 2024年10月29日
生成式信息检索综述
专知会员服务
32+阅读 · 2024年6月5日
基础模型视频理解综述
专知会员服务
30+阅读 · 2024年5月8日
多语言大型语言模型:资源、分类和前沿综述
专知会员服务
49+阅读 · 2024年4月9日
大型语言模型增强强化学习综述:概念、分类和方法
专知会员服务
55+阅读 · 2024年4月4日
《大型语言模型自然语言生成评估》综述
专知会员服务
70+阅读 · 2024年1月20日
面向自然语言处理的知识图谱嵌入:从理论到实践
专知会员服务
53+阅读 · 2022年10月16日
相关资讯
基于模型的强化学习综述
专知
34+阅读 · 2022年7月13日
【干货书】高维统计学,572页pdf
专知
16+阅读 · 2021年12月3日
层级强化学习概念简介
CreateAMind
18+阅读 · 2019年6月9日
深度学习超参数搜索实用指南
云栖社区
28+阅读 · 2018年10月14日
相关基金
国家自然科学基金
27+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员