随着人类-智能体团队(HAT)研究的不断发展,模拟 HAT 行为和衡量 HAT 效果的计算方法也在不断发展。其中一种正在兴起的方法涉及使用人类数字孪生(HDT)来近似模拟人工智能驱动的智能体团队成员的人类行为和社会情感认知反应(Barricelli & Fogli, 2024)。本文将探讨与使用数字孪生为 HAT 建立信任模型相关的三个研究问题。首先,为了解决如何通过 HDT HAT 实验对 HAT 信任进行适当建模和操作的问题,对团队交流数据进行了因果分析,以了解移情、社会认知和情感建构对信任形成的影响。此外,还反思了HAT信任科学的现状,讨论了HAT信任必须通过HDT才能复制的特征,如信任倾向的个体差异(如信任倾向,Jessup等人,2019年)、新兴信任模式(如信任侵犯和修复,Wildman等人,2024年)以及对这些特征的适当测量(如增长建模,Abramov等人,2020年)。其次,为了解决人类发展工具信任的测量方法在近似人类对 HATs 信任方面的有效性问题,讨论了人类发展工具信任的特性:自我报告测量方法、基于互动的测量方法和遵从型行为测量方法。此外,还分享了初步模拟的结果,其中比较了用于生成 HDT 通信的不同 LLM 模型,并分析了它们复制类人信任动态的能力。第三,针对 HAT 实验操作将如何扩展到人类数字孪生研究,分享了实验设计,重点关注 HDT 的信任倾向与人工智能体的透明度和基于能力的信任。
将人工智能(AI)融入作战环境在各个领域变得越来越重要,从根本上改变了人类与机器合作实现共同目标的方式。在过去十年中,人类与人工智能团队(HAT)研究已成为一个重要领域,学者们运用认知科学原理来理解这些新型合作关系的复杂性。这一不断增长的研究成果反映了了解人类和人工智能如何有效、安全、高效地合作的紧迫性。
随着 HAT 文献的扩展和人工智能能力的进步,出现了研究这些互动的创新方法。其中一种很有前景的方法是使用人类数字双胞胎(HDTs)--旨在复制人类在 HAT 环境中的反应和行为的计算模型。这些 HDTs 可以进行配置,以模拟基于状态的反应(如瞬时认知和情感反应)和基于特征的特性(包括性格上的个体差异),为传统的人类受试者研究提供了一个多功能的替代方案[1, 2]。
人类发展工具在人类活动能力研究中的优势是显著的。除了解决人类受试者研究的实际限制(如成本和招募挑战)外,HDT 还提供了前所未有的实验变量控制和快速测试多种情景的能力。这种能力对于研究复杂的团队现象尤为重要,而信任则是一个关键的重点领域。信任--愿意对另一个智能体的行动处于弱势--是 HAT 有效性和成功的基本决定因素。
然而,使用人类发展工具来研究 HAT 中的信任动态是否有效,还需要仔细研究。
本文探讨了在信任研究中实施 HDT 的三个关键问题:
通过研究这些问题,我们旨在建立一个框架,用于在 HAT 信任研究中验证和实施 HDT,最终促进我们对人类与人工智能协作和信任发展的理解。
图 1:移情建构如何影响 HAT 信任度的因果分析结果。