【牛津大学博士论文】多模态概率推理的机器学习预测与协调，173页pdf

在这篇论文中，我们考虑了多模态在机器学习决策和协调问题中的作用。我们提出使用一系列多模态概率方法，使用(有限)混合模型的扩展来解决时间序列预测的挑战，神经网络中的高效不确定性量化，对抗模型和多智能体协调。在论文的第一部分中，我们关注多模态不确定性估计在时间序列预测中的应用，表明这种方法提供了易于操作的、有益的替代点估计方法，点估计仍然是预测的普遍选择方法。我们讨论了多模态不确定性的意义，并展示了更熟练的方法估计后验目标分布的必要性。我们提出了一系列计算高效，但有能力的方法来估计丰富的多模态后验分布。我们将我们的模型与用点测量或单峰分布估计不确定性的技术进行了比较，并在生成对抗网络的启发下，对所开发的方法进行了扩展，以此结束本部分。我们表明，该方法对加性噪声提供了最先进的鲁棒性，使其特别适用于包含大量未知随机的数据集。

在本工作的第二部分，我们研究了协作多智能体系统(CMASs)的多模态模型的重要性，并将我们的工作扩展到采用概率方法。到目前为止，这一领域的大多数研究都局限于考虑自玩范式，即使这些方法解决了各种具有挑战性的问题。虽然这些进步是重要的，但在自玩中使用任意约定会导致当智能体在此设置之外玩时的协调问题。我们考虑了特殊的CMAS设置，远离了自玩框架。这是机器学习中一个特别具有挑战性的领域，也是近年来备受关注的一个领域，为AI智能体在现实世界中能够与人类(和其他智能体)有效交互提供了希望。我们通过在其他主体的策略上建立后验信念来解决特别协调问题。这是通过吉布斯抽样的扩展来实现的，以获得接近最优的即席性能。我们在具有挑战性的游戏Hanabi上测试了我们的算法，Hanabi是合作多智能体强化学习中最著名的测试平台之一，近年来已成为一个具有发展势头的基准。我们表明，我们的方法可以实现强大的交叉游戏，即使与看不到的合作伙伴，实现成功的临时协调，无需预先了解合作伙伴的战略。