近年来,关于单智能体和多智能体自主决策的研究工作层出不穷。现在,许多IT专家正在打造自动驾驶汽车和医疗机器人,开发先进的自主决策系统已经是一个数十亿美元的产业。这些新技术提供了监督、先进的自动化和自动仪器,能够适应不断变化的情况、知识和约束。然而,将新技术引入我们的技术和社会基础设施具有深远的影响,需要建立对其行为的信心,以避免潜在的风险和伤害。因此,自主决策系统的有效性和更广泛的可接受性依赖于他们做出“风险规避”决策的能力,这也被称为“风险规避”。人工智能(AI)系统的风险规避能力是人机交互的关键要求,也是实现人工智能的全范围社会和工业效益的关键。这一行业有广泛的实际失败-昂贵的应用,如控制、机器人、电子商务、自动驾驶和医疗。
本教程围绕以下问题介绍了自主系统最先进的风险规避方法 (1) 风险到底是什么,风险规避的数学公式是什么? (2) 如何设计规避风险的方法?我们需要从头开始吗?或者,我们能否通过一些简单的调整,将现有的风险无关算法转变为风险规避算法?
本教程将介绍近年来开发的各种风险规避技术和算法。强化学习和数学规划(优化)的介绍性材料将包括在教程中,因此对参与者没有必要的知识。在介绍了基本的数学框架之后,我们将描述用于计算对偶性、块坐标上升和信息论下界的新颖优化方法。最后,我们将强调在这一领域未来工作的许多机会,包括令人兴奋的新领域和基本的理论和算法挑战。