随着大型语言模型(LLMs)在文本交互中表现得越来越像人类,越来越多的研究人员开始对LLMs中的人格进行研究。然而,心理学人格研究的多样性以及LLMs的快速发展导致了这一跨学科领域的研究呈现出广泛而零散的局面。在不同研究焦点、不同人格心理测量学和不同LLMs之间的大量研究,使得全面了解这一领域变得具有挑战性,并进一步增加了将研究成果应用于现实世界的难度。**在本文中,我们通过根据LLMs中人格的内在特征和外在表现将当前研究分类为三个研究问题:自我评估、表现和识别,来呈现一个全面的综述。**对于每个问题,我们提供了详细的分析,并对其相应的解决方案进行了深入的比较。此外,我们总结了当前研究的发现和未解决的挑战,并进一步讨论了其潜在原因。我们还收集了大量公开可用的资源,以便感兴趣的研究人员和开发者使用。最后,我们讨论了潜在的未来研究方向和应用场景。我们的论文是关于LLMs人格的最新文献的首个全面综述。通过呈现明确的分类法、深入的分析、充满希望的未来方向和丰富的资源集合,我们旨在提供更好的理解并促进这一新兴领域的进一步发展。

大型语言模型(LLMs)展现出了令人印象深刻的语言理解和生成能力,使其能够与用户进行连贯、类人对话。这些显著进展引发了广泛的应用(Chen et al., 2023; Zheng et al., 2023; He et al., 2023),并激发了越来越多的研究人员对LLMs中人格的探索兴趣。 人格被描述为塑造个体思想、情感和行为的持久特征(Mischel et al., 2007)。在LLMs的背景下,研究人员对LLMs是否具有内在的人格特质或LLMs在交互中处理与人格相关任务的能力感到好奇。这些研究有助于理解LLMs的心理描绘(Huang et al., 2023b),并进一步构建更加透明、安全和可信的AI系统(Safdari et al., 2023)。 鉴于此,过去两年中在这个跨学科领域涌现了大量研究,如附录A所示。然而,心理学人格研究的多样性(Hodo, 2006)和LLMs的快速发展使得不仅难以全面了解这一研究领域,还难以比较不同方法、得出一般性结论并将研究成果应用于实际应用。具体而言,当前研究在以下方面表现出混乱:

研究焦点:LLMs中的人格主题涵盖了各种方面,如LLMs的人格评估或LLMs对用户人格的认知。尽管范围广泛,但大多数研究仅关注某些特定方面。

心理测量学:不同研究集中于不同的人格模型(如五大人格特质模型(Digman, 1990)和迈尔斯-布里格斯类型指标(MBTI; Myers, 1962))。即使对于相同的人格模型,研究人员在其工作中也可能采用不同的心理测量方法。

研究的LLMs:在过去两年中,发布了大量的LLMs。尽管研究人员共同关注LLMs中的人格,但他们研究的LLMs却各不相同。

为填补这一研究空白,我们对关于LLMs人格的最新研究进行了全面综述。我们首先提出了一个分层分类法(在研究问题层面和方法层面)来清晰地组织现有研究,如图1所示。具体而言,我们根据内在特征和外在表现将LLMs中的人格分为三个研究问题:(1)自我评估,衡量LLMs的内在人格,(2)表现,控制LLMs展现指定人格,以及(3)识别,从文本内容中识别人格特质。对于每个研究问题,我们进一步根据其提出的方法对现有解决方案进行细分。 在具体章节中,我们对每个问题进行了详细分析,包括问题陈述、动机和意义。然后,我们对相应方法进行了深入调查和比较。此外,我们整合了研究发现并确定了当前研究中揭示的未解决的挑战。为方便研究人员和开发者,我们还收集了公开可用的资源,包括人格量表、代码库和数据集。最后,我们讨论了LLMs人格的潜在未来研究方向和实际应用场景。 总结而言,我们工作的主要贡献如下:

首个全面综述:据我们所知,这是首个关于LLMs人格最新研究的全面综述。

清晰的分层分类法:我们提出了一个分层分类法,以清晰地在研究问题层面和方法层面组织文献。

广泛的资源收集:我们收集并总结了大量公开可用的资源,以方便研究人员和开发者,包括人格量表、代码库和数据集,如附录B所示。

有前景的未来趋势:我们总结了当前研究中的研究发现和未解决的挑战,并进一步讨论了LLMs人格的有前景的未来研究趋势和潜在应用场景。

成为VIP会员查看完整内容
37

相关内容

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译等。2023年,大语言模型及其在人工智能领域的应用已成为全球科技研究的热点,其在规模上的增长尤为引人注目,参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处,更加深入地理解人类语言的复杂性。在过去的一年里,大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟,它将不断拓展其应用范围,为人类提供更加智能化和个性化的服务,进一步改善人们的生活和生产方式。
生成型大型语言模型的自动事实核查:一项综述
大规模语言模型的人类偏好学习综述
专知会员服务
36+阅读 · 6月19日
大型语言模型中的数字遗忘:遗忘方法的综述
专知会员服务
29+阅读 · 4月8日
可解释人工智能中基于梯度的特征归因技术综述
专知会员服务
25+阅读 · 3月20日
大型语言模型图表示学习:技术的全面综述
专知会员服务
44+阅读 · 2月14日
大型语言模型在表格推理中的应用综述
专知会员服务
35+阅读 · 2月14日
大型语言模型幻觉缓解技术的全面综述
专知会员服务
61+阅读 · 1月3日
时空数据挖掘:综述
专知
23+阅读 · 2022年6月30日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【CVPR 2020 Oral】小样本类增量学习
专知
16+阅读 · 2020年6月26日
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
18+阅读 · 2019年10月28日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
现代情感分析方法
算法与数学之美
13+阅读 · 2018年1月12日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 7月18日
Arxiv
0+阅读 · 7月17日
A Survey of Large Language Models
Arxiv
362+阅读 · 2023年3月31日
Arxiv
60+阅读 · 2023年3月26日
VIP会员
相关VIP内容
生成型大型语言模型的自动事实核查:一项综述
大规模语言模型的人类偏好学习综述
专知会员服务
36+阅读 · 6月19日
大型语言模型中的数字遗忘:遗忘方法的综述
专知会员服务
29+阅读 · 4月8日
可解释人工智能中基于梯度的特征归因技术综述
专知会员服务
25+阅读 · 3月20日
大型语言模型图表示学习:技术的全面综述
专知会员服务
44+阅读 · 2月14日
大型语言模型在表格推理中的应用综述
专知会员服务
35+阅读 · 2月14日
大型语言模型幻觉缓解技术的全面综述
专知会员服务
61+阅读 · 1月3日
相关资讯
时空数据挖掘:综述
专知
23+阅读 · 2022年6月30日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
【CVPR 2020 Oral】小样本类增量学习
专知
16+阅读 · 2020年6月26日
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
18+阅读 · 2019年10月28日
基于Tacotron模型的语音合成实践
深度学习每日摘要
15+阅读 · 2018年12月25日
现代情感分析方法
算法与数学之美
13+阅读 · 2018年1月12日
相关基金
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员