凝聚力是人类-自主性编队功能和效率的一个重要方面，但目前还需要更有力的方法来充分衡量这一结构。本报告记录了开发和验证新团队凝聚力量表的过程，该量表专门用于人类-自主团队。我们在此描述了开发过程的各个阶段，包括条目开发、量表条目评估、内容验证以及在线量表验证研究，以进一步减少条目数量。综合来看，这些分析的结果凸显了几个具有非常好测量属性的条目，尤其是用于评估互补性、士气、领导方向和效能感的条目。然而，一些具有出色测量属性的条目仍然属于存在明显问题的测量量表。总之，这些结果将有助于为未来人类自主团队凝聚力的测量提供指导性建议。

引言

由于人类-自主性团队（HAT）文献的基础是建立在人际团队或人类团队的基础之上（Morrow 和 Fiore，2012 年），因此我们在此将团队的人际定义扩展到 HAT，即 "两个或多个[团队成员]朝着共同的、有价值的目标、目的或任务进行动态、相互依赖和适应性的互动，......各自被分配执行特定的角色或功能，并且成员的跨度有限"（Salas 等，1992 年，第 4 页）。在本研究范围内，HAT 由一个或多个人类队友与一个或多个自主系统或智能体（IAs）组成，通过协作完成任务或目标（Demir 等人，2019 年）。

在这种新的团队动态基础上，人工智能的最新进展赋予了自主系统和其他 IAs 更强的独立性和相互依存性，从而使技术从仅以有限的方式支持或增强人类表现的角色，转变为作为真正的团队成员，真正扩展整体团队动态和能力的角色（Phillips 等人，2011 年；Demir 等人，2019 年）。在这种情况下，IAs 是自主实体，有能力观察环境并采取行动，还能开展活动以实现个人和集体目标（Russell 和 Norvig，2010 年）。IAs 可以是基于计算机的实体（即嵌入式智能体），也可以是物理实体（即嵌入式智能体，又称机器人）。在嵌入式和嵌入式智能体系统中，可以使用多种类型和级别的自主性执行多种任务，这使得人类队友很难理解智能体的行动或决策过程。因此，作为团队成员的人类和自主系统的成功融合需要双方理解对方的推理、行动和意图（Chen 等人，2018 年；Schaefer 等人，2017 年）。这种共同理解是团队合作以及信任和凝聚力等关键团队状态发展的基础。

1.1 团队凝聚力的定义和人类自主性团队中的差距

团队凝聚力被视为团队成功的最重要决定因素（Carron 和 Brawley，2000 年）。研究表明，团队凝聚力可通过提高绩效来提高团队的生产力，并对团队成员产生积极的心理影响（Beal 等人，2003 年；Mathieu 等人，2015 年；Neubauer 等人，2016 年）。虽然对人类团队进行了深入研究，但团队凝聚力尚未在 HATs 中得到探索，尽管在过去的十年中，人们对人类与机器人或自主系统的团队合作产生了浓厚的兴趣，尤其是在军事领域（Barnes 和 Evans，2010 年）。与人与人之间的团队相比，在 HATs 中，沟通、组织层级和协作的方式有所不同（Lakhmani 等人，2022 年）。这可能会对有效合作以及开发关键团队流程构成挑战。因此，有必要了解团队凝聚力的哪些方面与 HAT 有关，以及如何对其进行衡量。

凝聚力的实际定义是 "促使团队成员待在一起并愿意一起工作的共同纽带/吸引力"（Salas 等，2015 年）。了解凝聚力还要求我们 "了解信任的程度，从而提高使用率和人类与机器人的有效互动"（Schaefer，2016 年，第 216 页）。作为一种建构，由于凝聚力的扩展性，将其分为因子和子维度是最有效的方法（Griffith 1988; Zaccaro 1991; Griffith and Vaitkus 1999; Dion 2000; Salas et al.）因此，我们对人类团队凝聚力进行了全面的文献综述，并将凝聚力分为几个维度和子维度，这些维度和子维度在文献中被普遍认为是凝聚力的因素（Lakhmani 等人，2022 年）。这些因素是主观量表的基础，专门用于测量 HAT 中凝聚力的独特特征。

在 HATs 中，凝聚力的处理和定义应不同于人类团队，因为人类与自主代理之间的社会互动是独特的，并在团队协调中发挥着重要作用（Walliser，2019 年）。因此，HAT 必须保持足够水平的团队凝聚力，才能使团队在任务成功方面表现出色，并保持心理健康。团队凝聚力和团结是使团队能够更好地执行任务的重要因素（Mudrack，1989 年；Beal 等人，2003 年；Chiocchio 和 Essiembre，2009 年）。当我们寻求将人类和自主系统 "组队 "时，这些因素都是需要考虑的重要因素。随着技术渗透到我们生活的方方面面，我们必须学会如何利用技术的优势，同时尽量减少其弱点。在这一研究方向中，同样重要的是要扩展以前开发的凝聚力衡量标准，以确定以前使用的人际团队凝聚力衡量标准是否仍然适用，或者是否需要进行调整，以更好地适应 HAT 内不断变化的动态。

关于凝聚力测量方法，虽然现有的方法可以评估团队凝聚力，但目前还没有专门针对 HAT 的自我报告量表。因此，当前工作的目标是开发一种新的主观凝聚力量表，使我们能够评估团队凝聚力、团结以及其他有助于提高 HAT 效能的因素。本报告记录了量表开发过程，该过程遵循 Boateng 等人（2018 年）概述的三阶段方法。在第 1 阶段的项目开发中，生成了量表项目，并由主题专家 (SME) 对内容进行了验证。在第 2 阶段，根据 SME 的反馈创建量表；在第 3 阶段，开展在线研究以评估量表的信度和效度。我们评估的项目使我们能够确定哪些因素在维持高功能团队中发挥了最大作用。

1.2 量表开发过程

量表开发过程可分为三个阶段： 1）条目开发；2）量表开发；3）量表评估（见图 1）。

1.2.1 第 1 阶段：条目开发

条目开发包括两个部分：初始条目库生成和内容验证。

条目生成是研究人员为初始条目库建立理论支持的方式（Morgado 等人，2018 年）。使用的方法有演绎法和归纳法两种。演绎法包括在广泛的文献回顾和已有量表的基础上生成条目（Morgado 等人，2018 年）。归纳法包括根据从专家目标人群收集的意见中获得的有关构建的定性信息进行条目开发（Morgado 等人，2018 年）。在这项工作中，最初开发的条目库取自现有的人类凝聚力量表，共产生 134 个项目，用于内容验证实验。

图 1 量表开发和验证的三个阶段和九个步骤概览（Boateng 等人，2018 年）

为了更准确地理解团队凝聚力这一概念，我们进行了一次全面的文献综述。经过这一努力，我们发现有些方法认为凝聚力由两个维度组成：凝聚力的方向--纵向（上下级关系）或横向（同伴关系）；以及凝聚力的功能--工具性（基于任务）或情感性（与人际支持有关）（格里菲斯，1988 年；迪昂，2000 年）。另一种方法来自军事凝聚力，它将凝聚力划分为四个相关的组成部分，由主要（如纵向和横向凝聚力）和次要（如组织和社会凝聚力）等级组成部分组成（Siebold，2006 年）。在对这些凝聚力模型进行汇总的基础上（Lakhmani 等人，2022 年），我们设计了一个凝聚力框架来组织我们的条目库（见图 2）。

图 2 当前 HAT 凝聚力量表所使用的凝聚力五维模型的可视化。凝聚力的每个维度下都列出了子维度。

根据这些多维表征，我们设计的量表包括以下五个凝聚力因素：功能凝聚力、结构凝聚力、人际凝聚力、团队互补感和团队应变能力。这些因子及相关子因子或维度的描述如下：

基于功能的任务凝聚力

工具或任务凝聚力以行动为导向或积极主动，被定义为一个团体对团体任务或目标的共同承诺或吸引力，或团体的团队合作能力（Siebold，1999 年）。此外，它还是对团体任务和目标的共同理解和承诺（Beal 等人，2003 年）。这也许最直接适用于与智能代理的团队合作，因为这种类型的团队合作需要一定程度的共同任务参数和目标。

结构凝聚力（四个子维度）

a. 排他性

根据自我归类理论，排他性反映了个人（通过态度、行为）遵守群体规范的程度，这些规范是内群体的特征，并将个人与外群体区分开来（Hogg，1992 年）。不同群体的成员如果认为自己属于一个上级群体，就会越来越多地把以前的外群体成员视为一个更大、更具包容性的群体的一部分（Gaertner 和 Dovidio，2009 年）。然而，如果上层群体不承认次群体的差异，次群体成员就会更加维护自己的群体，而牺牲其他群体的利益（Crisp 等，2006 年）。

b. 对团队的吸引力/对离开团队的抵触情绪

人际吸引是指对群体成员的共同喜爱或依恋；但需要注意的是，喜欢群体成员与喜欢群体并不是一回事（Beale 等人，2003 年；Abrams 和 Rosenthal-von der putte，2020 年）。相反，喜欢群体与凝聚力的另一个组成部分：群体自豪感更密切相关。人际间的吸引力一直被认为是小群体凝聚力的核心，以至于一些单维度的凝聚力概念将两者等同起来（Dion，2000 年；Lott 和 Lott，1965 年）。虽然这种方法已经过时，但人际吸引已被证明与绩效有着重要的相关性（Beal 等人，2003 年）。

c. 规范

规范是评价一个团体中哪些行为可以接受、哪些行为不可以接受的标准，用以确定对团队成员的期望（Forsyth，1999 年）。规范与任务凝聚力是相辅相成的，因为规范可用于集中团队成员的力量完成小组任务（Carron 和 Spink，1993 年）。由于规范可用于提高（或降低）绩效，因此它们在凝聚力与团体绩效之间的关系中起着调节作用（Carron 和 Spink，1993 年；Langfred，1998 年）。

d. 凝聚力的领导方向

凝聚力的主要维度，即凝聚力的方向，强调等级制度在团队凝聚力中的作用（格里菲斯，1988 年）。就目前的工作而言，这一维度是上下级关系的对比（Siebold 和 Kelly，1988 年；Dion，2000 年）。这种区分经常被纳入对军队凝聚力的研究中（Siebold 和 Kelly，1988 年；Grossman，2014 年）。

人际凝聚力（四个子维度）

a. 团队自豪感

团队荣誉感，即对团体信念和团体代表的支持，似乎是凝聚力中一个以情感为基础的重要组成部分。它是指团体成员对团体所支持或代表的地位或意识形态的喜爱程度（Beal 等人，2003 年）。它也被定义为作为群体成员的共同重要性，在凝聚力文献中长期占据重要地位（Mullen 和 Copper，1994 年）。在凝聚力与绩效的关系中，群体成员会因为属于一个地位高、成功的群体而更加努力地工作，但在凝聚力与绩效的关系中，它并不是一个预测因素（Mullen 和 Copper，1994 年）。作为一个因素，群体自豪感在凝聚力文献中的地位似乎不像以前那么突出了；因此，我们认为它与 HAT 的凝聚力并不特别相关，尤其是当自主性变得越来越普遍时（这就不再是一种潜在的地位象征）。

b. 社会凝聚力

社会凝聚力被认为是凝聚力的另一个主要功能（Griffith 和 Vaitkus，1999 年；Dion，2000 年）。社会凝聚力也被称为人际凝聚力，是指群体成员对群体的吸引或喜爱以及对群体成员的信任（Evans 和 Jarvis，1980 年；Siebold，1999 年；Craig 和 Kelly，1999 年）。个人层面的社会凝聚力指标包括以下几个方面： (a) 个人的成员态度（他们留在群体中的愿望或意图，他们对群体的认同或忠诚，以及对群体或其成员的其他态度）；(b) 个人的成员行为：他们决定断绝、削弱、保持或加强其在群体中的成员身份或参与，他们对人际影响的敏感性，以及对群体的承诺和依恋的其他行为指标（Friedkin 2004: 410）。

社会凝聚力被认为是运作良好的群体不可或缺的一个方面（Ahronson 和 Cameron，2007 年）。然而，研究人员描述了凝聚力在功能或方向维度之外的其他组成部分，其要素可归入社会凝聚力，如归属感或士气（Dion，2000 年；Grossman，2014 年）。

c. 归属感

源于 Bollen 和 Hoyle（1990 年）的研究，归属感是指群体成员相互吸引的程度（Salas 等人，2015 年）。归属感基于群体成员对自己在群体中归属程度的认知评价以及对这种评价的情感反应（Bollen 和 Hoyle，1990 年；Grossman，2014 年）。凝聚力的这一方面被认为是群体存在的根本，因此，群体归属感是任何其他群体特征的先决条件（Bollen 和 Hoyle，1990 年）。对归属感的研究表明，它与社会结果和社会自尊相关（Dion，2000 年）。

d. 士气

士气与归属感都源于 Bollen 和 Hoyle（1990 年）关于感知凝聚力的研究。士气是指与群体相关的积极或消极的整体情感反应（Bollen 和 Hoyle，1990 年）。士气也可定义为个人对群体成员的忠诚度以及为群体承受挫折的意愿（Salas 等人，2015 年）。这一因素还具有时间性，因为它决定了群体成员对冲突或挫折的反应（Dion，2000 年；Grossman，2014 年）。虽然这一因素与归属感高度相关，但它实际上是有区别的；说明这一区别的一个例子是，自然灾害袭击一个城市，可能会增加人们对该城市的归属感，同时降低士气（Bollen 和 Hoyle，1990 年）。

感知团队

互补性互补性是指小组成员为大团队带来的技能组合的多样性，以及这些技能组合如何满足环境需求（Muchinsky 和 Monahan，1987 年）。互补性是最近推测的凝聚力维度（Lakhmani 等人，2022 年），由一些社会凝聚力和任务凝聚力组成（例如，机器人/自主系统必须拥有能够补充/增强团队技能或能力的技能，以完成所需的任务）。假设当团队成员表现出不同但互补的技能时，团队就会变得有凝聚力，使一些团队成员能够弥补其他团队成员的弱点。

团队应变能力（三个子维度）

当团队遇到环境和团队压力时，恢复力是团队凝聚力和后续成功的基础（Berg 等人，2021 年）。团队复原力被定义为 "一个多阶段的过程，在这一过程中，团队成员有意识地集体运用技能、能力和资源，通过计划和预测不利事件，使团队做好应对逆境的准备；通过承受或适应压力源，成功应对挑战性事件；以及在事件发生后进行恢复，这涉及到团队通过事件后的学习和成长，恢复到平衡状态（如反弹）或改善状态"（Cato 等，2018 年，第 53 页）。

此外，可以说复原力是发展高度凝聚和信任的人类团队的一个关键特征（Gittell 等人，2006 年；Norris 等人，2008 年）。事实上，复原力有时被视为团队状态的组合，包括集体效能、共享心智模式和熟悉度（Bowers 等人，2017 年）。这一领域的工作与极端环境下的团队尤为相关，在极端环境下，团队凝聚力受到的影响不同于正常条件下的团队（Salas 等人，2017 年）。例如，在极端环境中工作的个人倾向于夸大问题，这可能会导致团体受损，因为紧张加剧和对团队问题的感知会对团队凝聚力产生负面影响（Stuster，1996 年）。然而，军事单位的凝聚力已被证明可以抵消这些极端环境压力（Williams 等人，2016 年）。近年来，人们一直在推动将机器人系统作为团队成员整合到军事行动中，以提高效率并降低作战人员的风险（Barnes 和 Evans，2010 年）。这些 HAT 对开放式的复杂条件尤其有效，因为在这种条件下，任务的各个方面并不总是有规划或计划（例如，作战情况；Chen 和 Barnes，2014 年），HAT 可协助信息规划、任务规划和分配以及团队运作（Sycara 和 Sukthankar，2006 年）。然而，最重要的是要了解将机器人系统融入人类团队可能会如何破坏团队的同质性以及随后的凝聚力和复原力（O'Reilly III 等人，1989 年；Smith 等人，1994 年）。

1.2.2 初始项目库

为了开发本量表，我们对现有的团队凝聚力量表进行了全面的文献回顾，以调整最适合本框架的条目（Berg 等，2021 年）。我们的结果是建立了一个包含以下维度的 134 个条目的初始条目库：基于功能的任务凝聚力、结构凝聚力（格里菲斯，1988 年）、人际凝聚力（萨拉斯等，2015 年）、感知团队互补性（皮亚森汀和查普曼，2007 年）以及团队复原力（卡托等，2018 年）。其中许多维度在人类团队凝聚力文献中都是众所周知的；然而，在目前的量表开发工作中，还考虑增加两个因素（即与互补性和恢复力维度相关的条目）。在这种情况下，有观点认为，当 "个人拥有的独特特征被认为与他人的特征不同，但又对组织有价值 "时，就会产生互补性（Piasentin 和 Chapman，2007 年，第 234 页）。在感知互补性方面，我们采用了 Oosterhof 等人（2009 年）和 Piasentin 与 Chapman（2007 年）的 18 个条目。关于团队复原力的子维度，我们改编了 Sharma 和 Sharma（2016 年）的 20 个量表项目（关于项目改编的更多信息，请参阅 Berg 等人，2021 年）。

内容验证。条目开发的第二步包括理论分析。在这一步骤中，需要进行内容效度评估，因为推论是基于最终的量表条目做出的（Morgado 等人，2018 年）。这一评估包括主题专家或用户群的意见。

我们的初始条目库被发送给 11 位来自学术界和政府机构的主题专家，他们以研究团队凝聚力和/或 HAT 而闻名。这些主题专家完成了内容验证程序，使用 3 点顺序量表对 134 个条目中的每个条目进行评分（0 ="不应纳入量表"；1 ="必须纳入量表"；2 ="必须纳入量表"）。此外，主题专家还为项目提供了定性的书面反馈和建议。条目分析采用了 Lawshe（1975 年）概述的内容效度比率和程序。条目级主题专家同意度的计算公式得出的数值从 +1 到 -1 不等；正值表示至少有一半的主题专家将该条目评为 "极其重要"。在有 11 位主题专家参与的情况下，条目删除的临界值被确定为 0.59，以确保主题专家的一致性不太可能是由于偶然因素造成的，这导致条目从 134 个减少到 82 个（附录 A），这些条目将在第二阶段的在线研究中进行评估。

1.2.3 第二阶段：量表开发

第二阶段的目标是减少条目库，并确定量表中的潜在因子。这一过程有四个步骤：预测试、量表管理和样本量、条目缩减分析和因子提取（详见 Boateng 等人，2018 年）。预测试通过剔除无关或措辞不当的条目，修改剩余条目使其易于被目标人群理解，从而确保条目对目标人群有意义。本量表的预试是在前面提到的主题专家审查期间进行的。部分定性反馈包括对原 134 个量表条目的修订，以使其更好地符合 HAT 凝聚力的背景。

一旦主题专家的反馈意见得到落实，我们就开始进行数据收集，采取调查管理和建立足够样本量的步骤。第 2 节将介绍这一过程。这一数据收集也是测试-重测设置的初始基线，在评估阶段需要进行有效的可靠性测试。

数据收集完成后，我们开始了条目还原分析步骤，在这一步骤中，我们结合使用了确认性和探索性因素分析方法。首先，我们使用确证分析法来检验为测量不同构念而设计的条目是否符合一系列单因素模型。如果模型拟合度不高，我们就会删除条目，直到得到一个拟合度较高的模型，然后对模型进行纵向不变性测试。在进行不变量测试时，我们可以检查条目反应在不同情境下是否具有相同的因子结构，我们还可以确定特定项目是否不具有不变量，是否应该删除。第 3 节将详细讨论这一过程。最后，我们对缩减后的量表进行了探索性因子分析，以检验新项目是否加载到我们的团队凝聚力标准测量中--如果项目与既定量表聚类，则考虑将其删除；如果项目聚类到一个不同的因子上，则保留这些项目以测量该新的子维度。