《增强现实和虚拟现实培训效果框架：开发知识库》美国国防分析研究所73页报告

关于增强现实（AR）和虚拟现实（VR）在培训和提高绩效方面的有效性的广泛断言过于简单化，忽略了影响研究结果的使用和可推广性的重要因素。有效性取决于所使用的 AR 或 VR 技术类型、所提供的虚拟内容、用户以及要完成的任务类型等因素。此外，来自不同学科的研究因强调不同的因素而使研究结果的推广变得更加复杂。本报告介绍了组织研究的框架开发、其在可搜索知识库中的应用，以及现在和将来可能满足用户需求的结果类型。

培训背景

AR/VR 培训和性能提升

之前对 AR/VR 的分析评论主要依赖于荟萃分析和叙述性评论。叙述性综述侧重于作者感兴趣的特定主题，是一种组织研究的主观方式。荟萃分析是一种将多项研究数据结合起来的系统方法，可以确定共同效应或差异原因。二者都没有充分说明影响 AR/VR 效果的使用和可推广性的因素。

AR/VR有效性的考虑因素

虽然 AR/VR 具有培训价值，但重要的是要考虑哪些因素和情况会影响成功。一般来说，与其他方法相比，AR/VR 所需的时间更短、学到的知识更多，而且可能导致的错误更少。此外，用户普遍表示更喜欢 AR/VR。然而，通过更有针对性的研究，我们可以确定影响培训效果的重要因素，以及用户的教育水平和学习领域如何成为影响培训效果的调节因素。总之，要确定 AR/VR 技术的相关性并成功地将其融入培训中，还有许多微妙之处。

许多研究都强调了技术特点，尤其是显示技术，因为它们可以调节 AR/VR 的有效性。此外，还有其他一些技术特点也可能有利于培训。例如，许多 AR/VR 系统会跟踪用户。这包括用户在看什么（如头部方向、眼球跟踪）、他们在用手做什么，或者他们在环境中的位置。这样的跟踪信息对于通过了解专家在某种情况下的行为以及如何将其教授给新手来开展培训都很有用。正如以上几个例子所示，AR/VR 的实用性取决于多种因素。

组织该领域工作的一部分就是制定一个框架--一个分类系统，在该系统中，各组件根据特定特征被分为不同的组或类型。该框架的开发支持一种系统化的方法和格式，使设计者和其他用户能够获取和理解他们所需的信息。

AR/VR 框架方法和程序

框架的组成部分

有效性框架包括四个方面和一个结果类别，每个 AR/VR 研究都要回答具体问题，作为知识库的条目。这些维度和成果类别以及相关问题是

1.技术--被评估的 AR/VR 系统和组件：使用的设备或系统是什么？

2.技能/任务或领域--用户学习的任务/工作的特征：培训或执行的任务是什么？

3.培训--技术整合--技术如何用于培训的特点：技术如何在情境/课程中使用或整合或培训？培训方法是什么？

4.用户--描述受训者的特征、技术的用户：表演者/受训者是谁？用户在完成任务和使用技术之前的技能水平如何？

5.结果--评估方法：使用了哪些指标来衡量效果？AR/VR 在支持绩效方面的效果如何？

使用该框架开发知识库

根据该框架对 AR/VR 实证研究进行评估，并将其用于填充 Microsoft Access 知识库。知识库可通过具体描述（如微软 HoloLens；F-14 在航母上着陆）或更一般的特征（如透视头戴式显示器 (HMD)；眼手协调）进行查询。知识库的最终目标是帮助用户以更细致、更系统的方式探究 AR/VR 的有效性证据。

除了框架中的叙述性描述外，有关研究的每个框架类别都标有特定代码，以便对其进行分类。例如，研究中使用的技术可以是计算机显示器上的视觉显示（标签 = visual_computer），也可以是闭塞的 HMD 设备（标签 = visual_HMD_occluded）。标签有助于标注知识库中研究的共同特征。

知识库的成果

这项工作的总体成果是建立了一个可扩展的知识库，这是一个支持查询的培训效果研究资料库。它支持多种搜索策略，以找到与用户特定需求最相关的经验证据。例如，用户可以提出一个一般性问题，如 "AR/VR 系统对培训有效吗？结果将确定与传统培训相比更有效（22 项）、混合有效（15 项）或效果较差（4 项）的研究。此外，有 23 项研究对 AR/VR 系统组件进行了评估，以确定哪些功能组合会影响效果。这种方法可以让用户关注哪些研究更有效或更无效，以及改变和完善系统组件会如何影响有效性。

AR/VR 技术

知识库的一种方法是搜索技术组件，以找到有大量证据（即在许多研究中使用）的技术以及证据不足的技术。知识库中最常见的技术是遮蔽式 HMD。其他视觉显示技术包括电脑显示器、透视 HMD、表面投影和手持平板电脑。知识库中还有一些非显示技术，如跟踪用户手部、头部或用户位置的技术。通过按技术对研究进行分类，知识库可以帮助用户找到感兴趣的特定技术的研究。此外，知识库查询还可以帮助确定证据中存在的空白（即研究很少甚至没有）。

技能/任务领域

在知识库中，有代表许多不同技能/任务培训领域的研究。与潜在用户的讨论表明，他们的首次知识库查询可能是针对他们计划培训的技能/任务。最常培训的技能/任务是维护和装配任务以及医疗技能，在这些领域，AR/VR 技术已经进行了多次有效演示。此外，还有关于飞行训练和军事任务的研究，但这些领域的研究较少，而且结果参差不齐，这表明该领域仍在研究如何更好地使用 AR/VR 技术。通过使用通用技能/任务描述符进行搜索，用户可以找到直接感兴趣或具有某些共同特征的研究。

培训与技术整合

如何将 AR/VR 系统融入培训情境是知识库区分不同研究的另一种方法。最常见的一组研究是将 AR/VR 技术用作练习环境，让用户反复练习培训任务。其次，最常见的培训用途是在视觉显示屏上叠加额外的符号或信息，为用户提供提示或信息。在提供反馈方面，有两大类，一类是关于用户表现水平的自动反馈，另一类是教师反馈。此外，有些系统还超出了培训的范围，有望在工作中作为辅助工具使用。

用户特征

了解用户（即受训者）在培训前的初始状态非常重要，因为使用虚拟环境和相关技术的经验会与随后的表现相互影响。要了解一项研究的结构是否合理、是否具有相关性，用户在培训任务方面的经验水平是一个重要的考虑因素。此外，还需要对参与者进行描述，以确定研究结果是否具有普遍性。研究中存在的一个相当大的空白是，有大量研究（略少于一半）没有提供关于用户经验水平的信息。

评估指标

知识库用户也可以从不同的角度来看待成果及其度量标准。经常出现的六组度量类型包括：身体表现、表现评分（如李克特量表）、认知表现（如多项选择知识测试）、可用性（如系统可用性量表）、工作量（如美国国家航空航天局（NASA）任务负荷指数）和意见。在知识库中，研究通常使用一种以上的度量方法来更好地透视系统的有效性。例如，体能显示了技能的学习效果，而可用性和工作量则影响了用户使用系统的积极性。此外，意见还能提供改进技术的建议，尤其是在系统比较结果参差不齐的情况下。

框架组件的交叉

知识库查询的一个强大优势是可以跨越用户指定的框架组件。查询不仅可以显示 AR/VR 研究中包含的技术范围，还可以更深入地了解作为培训系统的一部分，特定技术如何与特定培训方法配合使用。例如，知识库用户可以确定隐蔽式头戴可视显示器（即特定技术）如何与自动反馈整合到培训中。他们可以通过技术类型、培训或执行的技能/任务、培训用途和用户的交叉途径，结合知识库的多个不同维度来查询知识库。

可用性测试

该框架和由此产生的知识库的实际效用取决于可用性测试，以显示其效果如何以及需要做出哪些改变。第一次知识征集、设计、开发和可用性测试于 2022 年 6 月完成。测试的知识库包括搜索、排序和过滤功能。五个候选最终用户的样本是现役军人、国防部（DoD）文职人员和承包商，他们的工作角色各不相同，包括教学设计师/开发人员、图形设计师、游戏设计师、研究科学家、软件工程师和领域主题专家。

用户的任务是 1) 从知识库中搜索并下载一篇文章，以及 2) 上传并注释知识库中的条目。在用户执行任务时，他们被要求大声说话。主要衡量标准是研究后系统可用性问卷（PSSUQ）。PSSUQ 是一个由 16 个项目组成的可用性量表，用于测量用户对系统的满意度。问题主要涉及系统/流程的质量、系统提供的信息以及界面。

对结果的分析显示出一些一致的模式。首先，除了一个项目（"系统提供的错误信息清楚地告诉我如何解决问题"）之外，所有项目的平均值都优于量表中点值 4.0。其次，用户对门户网站的态度良好。对用户定性评论的分析包括希望术语更加清晰，从而导致知识库的改变。

结论

AR/VR 技术有效性研究的现状是零散而无序的。本报告中记录的框架有助于整理已发布的信息，并填充一个包含一系列信息类别的知识库。该知识库使用户能够过滤和查找 AR/VR 研究和信息，以满足其特定需求。可用性测试的反馈意见指导改进了知识库的界面设计和内容。最初的知识库包含 64 项研究，可以不断扩大，为用户提供不断完善的资源，帮助他们了解 AR/VR 如何发挥功效。