随着大型语言模型(LLMs)在文本交互中表现得越来越像人类,越来越多的研究人员开始对LLMs中的人格进行研究。然而,心理学人格研究的多样性以及LLMs的快速发展导致了这一跨学科领域的研究呈现出广泛而零散的局面。在不同研究焦点、不同人格心理测量学和不同LLMs之间的大量研究,使得全面了解这一领域变得具有挑战性,并进一步增加了将研究成果应用于现实世界的难度。**在本文中,我们通过根据LLMs中人格的内在特征和外在表现将当前研究分类为三个研究问题:自我评估、表现和识别,来呈现一个全面的综述。**对于每个问题,我们提供了详细的分析,并对其相应的解决方案进行了深入的比较。此外,我们总结了当前研究的发现和未解决的挑战,并进一步讨论了其潜在原因。我们还收集了大量公开可用的资源,以便感兴趣的研究人员和开发者使用。最后,我们讨论了潜在的未来研究方向和应用场景。我们的论文是关于LLMs人格的最新文献的首个全面综述。通过呈现明确的分类法、深入的分析、充满希望的未来方向和丰富的资源集合,我们旨在提供更好的理解并促进这一新兴领域的进一步发展。
大型语言模型(LLMs)展现出了令人印象深刻的语言理解和生成能力,使其能够与用户进行连贯、类人对话。这些显著进展引发了广泛的应用(Chen et al., 2023; Zheng et al., 2023; He et al., 2023),并激发了越来越多的研究人员对LLMs中人格的探索兴趣。 人格被描述为塑造个体思想、情感和行为的持久特征(Mischel et al., 2007)。在LLMs的背景下,研究人员对LLMs是否具有内在的人格特质或LLMs在交互中处理与人格相关任务的能力感到好奇。这些研究有助于理解LLMs的心理描绘(Huang et al., 2023b),并进一步构建更加透明、安全和可信的AI系统(Safdari et al., 2023)。 鉴于此,过去两年中在这个跨学科领域涌现了大量研究,如附录A所示。然而,心理学人格研究的多样性(Hodo, 2006)和LLMs的快速发展使得不仅难以全面了解这一研究领域,还难以比较不同方法、得出一般性结论并将研究成果应用于实际应用。具体而言,当前研究在以下方面表现出混乱:
研究焦点:LLMs中的人格主题涵盖了各种方面,如LLMs的人格评估或LLMs对用户人格的认知。尽管范围广泛,但大多数研究仅关注某些特定方面。
心理测量学:不同研究集中于不同的人格模型(如五大人格特质模型(Digman, 1990)和迈尔斯-布里格斯类型指标(MBTI; Myers, 1962))。即使对于相同的人格模型,研究人员在其工作中也可能采用不同的心理测量方法。
研究的LLMs:在过去两年中,发布了大量的LLMs。尽管研究人员共同关注LLMs中的人格,但他们研究的LLMs却各不相同。
为填补这一研究空白,我们对关于LLMs人格的最新研究进行了全面综述。我们首先提出了一个分层分类法(在研究问题层面和方法层面)来清晰地组织现有研究,如图1所示。具体而言,我们根据内在特征和外在表现将LLMs中的人格分为三个研究问题:(1)自我评估,衡量LLMs的内在人格,(2)表现,控制LLMs展现指定人格,以及(3)识别,从文本内容中识别人格特质。对于每个研究问题,我们进一步根据其提出的方法对现有解决方案进行细分。 在具体章节中,我们对每个问题进行了详细分析,包括问题陈述、动机和意义。然后,我们对相应方法进行了深入调查和比较。此外,我们整合了研究发现并确定了当前研究中揭示的未解决的挑战。为方便研究人员和开发者,我们还收集了公开可用的资源,包括人格量表、代码库和数据集。最后,我们讨论了LLMs人格的潜在未来研究方向和实际应用场景。 总结而言,我们工作的主要贡献如下:
首个全面综述:据我们所知,这是首个关于LLMs人格最新研究的全面综述。
清晰的分层分类法:我们提出了一个分层分类法,以清晰地在研究问题层面和方法层面组织文献。
广泛的资源收集:我们收集并总结了大量公开可用的资源,以方便研究人员和开发者,包括人格量表、代码库和数据集,如附录B所示。
有前景的未来趋势:我们总结了当前研究中的研究发现和未解决的挑战,并进一步讨论了LLMs人格的有前景的未来研究趋势和潜在应用场景。