大规模语言模型(LLM)的个性化近年来变得越来越重要,拥有广泛的应用前景。尽管这一领域重要且取得了进展,大多数现有的个性化 LLM 研究主要集中于 (a) 个性化文本生成,或 (b) 利用 LLM 用于与个性化相关的下游应用(如推荐系统)。在本研究中,我们首次弥合了这两大研究方向之间的差距,通过引入个性化 LLM 使用的分类体系,概述了关键差异与挑战。我们正式化了个性化 LLM 的基础,整合并拓展了 LLM 个性化的概念,定义并讨论了个性化、使用方法和个性化 LLM 的理想特性等新颖方面。接着,我们通过提出系统的分类方法,将这些多样化的研究领域和使用场景统一起来,包括个性化的粒度、个性化技术、数据集、评估方法和个性化 LLM 的应用。最后,我们指出了尚需解决的挑战和重要的开放性问题。通过使用所提出的分类体系统一并综述近期研究,我们旨在为现有文献和 LLM 个性化的不同方面提供清晰的指导,助力研究人员和实践者。
大规模语言模型(LLM)已成为能够执行广泛自然语言处理(NLP)任务的强大工具,并展现了出色的能力(例如,Radford 等,2018;Devlin 等,2019;Lewis 等,2019;Radford 等,2019;Brown 等,2020;Raffel 等,2020;Achiam 等,2023;Touvron 等,2023;Groeneveld 等,2024)。实证上,这些模型已展示出作为通用模型的能力,使其能够准确地完成诸如文本生成、翻译、摘要和问答等多种任务。值得注意的是,LLM 在零样本或少样本环境中也能有效工作,即使没有任务特定的训练数据,它们也能够理解并执行复杂的指令(Bommasani 等,2021;Liu 等,2023c)。这一能力消除了对模型参数进行广泛微调的需求,使人与机器的交互通过简单的输入提示大大简化。例如,用户可以以对话形式与 LLM 互动,使交互更加直观易用。LLM 的这种强大且多才多艺的能力已催生了诸多应用,包括通用人工智能助手(AutoGPT,2024)、协同工具(微软,2024)以及基于个人的 LLM 代理(Li 等,2024f)。这些应用可以帮助用户执行写邮件、生成代码、撰写报告等各种任务。
LLM 的个性化近来获得了大量关注(Salemi 等,2023;Tseng 等,2024)。然而,现有的个性化 LLM 研究通常分为两个类别:(a) 个性化文本生成,主要关注在个性化上下文中生成单轮或多轮文本,以及 (b) 在下游个性化任务(如推荐系统)中应用 LLM。这两个领域的大量研究往往独立发展,缺乏一个统一的视角。此外,现有综述(Chen,2023;Chen 等,2024b;2024c)通常仅聚焦于其中一个方面,缺乏系统定义关键组成部分并整合两个个性化 LLM 维度洞见的综合视角。尽管这两个领域在特征和目标上有所不同,但统一的视角对于弥合这些研究社区之间的差距至关重要,以促进协作和知识共享,从而开发出更具通用性和多功能性的系统。例如,用户特定文本生成的进展可以通过对话互动为推荐系统提供更个性化和可解释的建议。通过整合这两个领域的洞见,研究人员可以开发不仅能够生成符合个体偏好的文本,还能在各种应用中提升用户满意度的 LLM。此跨学科方法可促进更全面的解决方案,以互补方式兼顾个性化和性能。 在本研究中,我们通过为个性化 LLM 的个性化粒度、技术、评估、数据集和使用场景提出直观的分类体系,统一了来自不同领域的文献。本文的关键贡献如下:
在本文的剩余部分,我们首先提出个性化 LLM 使用的统一视角和分类体系(第二节),然后深入探讨个性化 LLM 的理论基础(第三节)。接着,探讨 LLM 个性化的粒度(第四节),并对个性化 LLM 技术进行全面的综述与分类(第五节)。然后,我们对个性化 LLM 的评估指标和方法进行分类(第六节),并对个性化 LLM 的数据集进行详细的分类(第七节)
尽管先前的研究(Yang & Flek,2021;Chen 等,2024c;b)探讨了个性化 LLM 的定义并分析了其各个方面,但仍缺乏一个全面的理论框架来理解和形式化这些模型中的个性化。在本节中,我们旨在填补这一空白,通过建立基础原则、定义和形式结构来形式化 LLM 中的个性化问题。我们系统地发展必要的符号和概念框架,以形式化该问题和评估,为深入理解个性化如何在 LLM 中有效实施和分析奠定基础。以下小节结构如下: §LLM 的一般原则:我们首先概述构成 LLM 基础的核心原则。这为理解这些模型的功能及其能力驱动的基本机制提供了重要背景。 §LLM 中个性化的定义:我们在 LLM 的特定上下文中定义“个性化”这一术语,为后续讨论奠定明确的理解基础。 §个性化数据概述:我们提供当前用于个性化的数据概述,强调数据源的不同格式。 §个性化生成的形式化:我们形式化个性化生成的概念空间,为理解如何实现个性化提供结构化框架。 §个性化标准的分类体系:我们引入一个全面的个性化标准分类体系,分类影响个性化输出的各种因素。