自20世纪下半叶的第三次工业革命以来,功能和过程、工具和技术系统的自动化持续而普遍地增加[BvD+14, PLF16]。在很大程度上,自动化的目标是实现完全自主的状态[Bai82, Lam13]。然而,直到今天,工业工厂或车辆仍然需要人类操作员或司机来监督自动化的性能[End17]。因此,这些系统已经成为具有广泛自动化功能的工具。人类只有在必要时才与这些工具互动,并开启和关闭它们。
然而,这种形式的互动有一些主要的缺点。其中之一是 "环外性能问题"[End17],它描述了人类无法对自动化的性能降低作出适当的反应。这是由于人类在只具有监督作用的情况下缺乏对情况的认识[GDLB13]。Bainbridge把这个问题和相关问题总结为 "自动化的讽刺"[Bai82]。一个密切相关的缺点是在人的表现优于自动化的情况下,无视人的有益行动[VGLH11]。另一个缺点是开发全自动系统的成本很高,它变得越来越复杂,包括越来越多必须自动化的功能[Bil96,第47-51页]。
为了克服这些缺点,工程师们在第四次工业革命的背景下开始关注人机协作系统[EK99]。这意味着将人重新引入自动化过程或生产中,从而使她或他处于循环中,而不是将她或他分配到一个单独的监督位置[FWBB16, FDM+20]。研究表明,人机协作创造了性能上的协同效应,例如,通过结合人的优势(抽象思维和情况识别)和机器的优势(耐力、稳定的准确性和精确性)[VGLH11],并增加人类对技术系统的信任和接受[FCA+17, ACM+18, Fla19, NSWS20]。此外,人机协作也允许通过逐步提高自动化程度来逐步实现工作技术系统的自动化[PSW00]。因此,工程师们实施的系统中,人和机器同时分享或依次交换对各自流程或生产任务的控制[PLF16, FCA+17, OGD17, ACM+18]。例如,部分自主车辆的高级驾驶辅助系统[DvA+10, AMB12, LHFH18, Fla19, SWS19, WCW19],人和机器密切协作的工业生产[MLK+12, Lam13],以及用于搜救场景的机器人远程操作[CHS21]或手术[RHS11]。
所有这些例子以及事实上目前大多数的人机协作系统都考虑了人和机器的密切物理互动:人和机器在同一个工件上操作[MLM+11, MLK+12]或通过方向盘或操纵杆共同控制一辆车[DvA+10, AMB12, Fla19, SWS19]或机器人[NFA08, CHS21]。在所有这些情况下,人机交流是基于物理力和触觉反馈(以及潜在的视觉和听觉反馈)。
然而,这种通信形式只允许有限的人机协作范围,因为交互和界面是根据具体的用例和应用领域定制的,例如[ACM+18, Fla19, FDM+20]。其原因是触觉通信的沟通能力有限。规避这个问题的方法之一是开发补充性的通信渠道,例如脑机接口,例如[CD13]。然而,这些界面需要大量的技术努力,至今只在特殊情况下对特定的大脑信号起作用,而且总的来说还不方便用户使用。
此外,任务和过程的日益自动化意味着人类和机器能够进行交流和互动的抽象程度的提高[FAI+16, FWBB16, ACM+18]。这允许更丰富的通信符号,并最终允许更大范围的人机合作系统[ACM+18]。因此,未来具有高度自主性的协作型人机系统需要适当的交互设计,最重要的是对任务执行的更高层次的合作有一个整体的看法[FAI+16, PLF16]。
在任务执行方面,人机合作的下一个更高层次是所谓的决策层次[PLI15]: 目前的合作系统大多通过合作跟踪给定的参考轨迹[NC15, LHFH18, Fla19]进行互动[FWBB16, ACM+18]。只有少数方法考虑了任务执行过程中的决策情况。这些方法中的绝大多数(隐含地)实现了以人类为唯一决策者的领导者-追随者范式,例如[GR86, SBP+18, TW19],或者以决策支持系统的形式,例如[DvA+10, BAMF14, WWM+19]。一些方法动态地将决策权转移给自动化,如果它的决定与人类的决定一致,例如[Khe11, MLK+12, MLH15, ABH+16]。然而,在决策冲突的情况下,人类仍然是最终的决策者。
以人类为主导的领导者-追随者范式的实施有一些弊端。例如,考虑到一个高度自动化的驾驶场景,车辆的自动化可能拥有更多通过车对车通信获得的关于未来驾驶情况的信息。在这种情况下,如果人类处于主导地位,自动驾驶系统对动作选择的合理反对意见可能会被忽略。此外,人类可能只剩下太少的信息用于决策,或者太多的信息用于处理。这两种情况都会导致无益的互动和潜在的次优决策结果。类似的问题也出现在自动驾驶的反面场景中,例如,如果人类对眼前的交通状况的感知超过了车辆的状况识别,例如由于传感器受阻。
为了创造协同效应和规避上述例子中领导者-追随者模式的缺点,如果人类有能力凭直觉说服车辆的自动化系统跟随她或他的领导,例如在机动选择方面,这将是有益的。然而,如果自动化有充分的理由不同意人类的机动选择,例如安全问题,自动化应该能够以一种可理解的方式沟通。这将导致人类和机器以平等的权利和权力参与一个直观的合作决策过程。因此,人和机器将成为解放的合作伙伴。此外,他们所参与的过程的目标是平衡个人选择的意义,同时平等对待两个合作伙伴,并导致双方达成协议。
因此,如果两个合作伙伴在个人决策方面具有同样的表现,并且能够参与协作决策过程,努力实现决策层面上的解放型人机协作会带来好处:与传统的领导者-追随者方法相比,它允许通过信息融合或通过协作平衡和协商个人决策的意义来提高合作决策的协同效应。此外,在协作环境中平等分配权力已经被类似的、成功的人机协作概念证明是有益的,在较低层次的任务执行中[NC15, Fla19]。除此之外,在协作环境中平等分配权力仍然允许普遍应用的范式,即人类能够关闭自动化。
为了推动对人机协作系统的研究,使其走向解放的协作决策,本论文的目标是建立第一个能够参与明确的解放的人机协作决策的自动化设计和评估自动化设计的潜在好处。出于可推广性和可重用性的考虑,自动化设计应该是基于模型的,应该适合人类在协作决策中的让步行为,以增加用户的接受度和信任。
本论文的第一个贡献是在第2章中对人机协作进行了系统的分类,以精确地限定本论文的重点。为此,介绍了一个新的人机协作分类模型,即蝴蝶模型。此外,第2章更详细地讨论了关于人机协作在决策方面的现有文献,从而揭示了相应的研究空白。随后在第2.4节中规定的研究问题涉及到
1)对解放后的人机协作决策过程进行适当的数学建模,重点关注人类的让步行为、
2)在这些模型的基础上适当地设计自动化,提供直观的互动,以及
3)通过针对合作决策方面的定制实验设计,适当地评估和比较新的自动化设计与最先进的方法。
为了给这些问题提供答案,本论文的研究得出了第一个解放的人机协作决策理论,强调并考虑了人类的决策和让步行为。通过引入合作决策的数学模型,实现了自动化设计并进行了实验评估,证明了其实际意义。综上所述,本论文所报告的研究的主要贡献是:
1)第3章介绍了第一个解放的人机合作决策的行为元模型,随后提出了两个源自谈判理论和博弈理论的数学行为模型。这两个新的数学行为模型旨在缩小领导者-追随者方法的两个极端之间在控制权方面的差距,即人类在领导方面有最终的控制权,而自动化只允许提供协助,反之亦然。对这两种数学行为模型进行了理论分析,并就其保证协议的能力进行了比较。
第4章报告了关于这两种数学行为模型是否适合代表人类的特许行为的研究。此外,基于所提出的模型,介绍了两种自动化设计,并讨论了其实际应用的关键方面。
第5章建立了一个侧重于人机协作决策的一般实验设计,以及评估客观合作性能和人类主观感知的适当措施。在此基础上,在同一章中提出了两个能够进行人机协作决策的自动化设计的实验评估。实验是在远程操作具有多级自主权的移动机器人和引导高度自动化车辆的背景下进行的。这些实验评估首次证明了解放后的人机协作在决策层面的客观和主观效益。
剩余论文的结果结构如图1.1所示。