技术的进步为自主系统提供了希望,使其形成比其单个成员更有能力的人机编队。了解自主系统的内部运作,特别是当机器学习(ML)方法被广泛地应用于这些系统的设计时,对与它们一起工作的人来说已经变得越来越具有挑战性。定量ML方法的 "黑箱"性质,对人们理解机器学习系统的态势感知(SA)构成了阻碍,往往导致采用机器学习算法的自主系统被废弃或过度依赖。人机互动的研究表明,透明通信可以提高队友的安全意识,促进信任关系,并提高人机团队的绩效。本文中将研究智能体透明度模型对人类与使用自动解释基于ML的智能体互动的影响。我们将讨论一种特殊的ML方法--强化学习(RL)在基于部分可观察马尔可夫决策过程(POMDP)智能体中的应用,以及POMDP中RL的解释算法设计。