近年来,关于单智能体和多智能体自主决策的研究工作层出不穷。现在,许多IT专家正在打造自动驾驶汽车和医疗机器人,开发先进的自主决策系统已经是一个数十亿美元的产业。这些新技术提供了监督、先进的自动化和自动仪器,能够适应不断变化的情况、知识和约束。然而,将新技术引入我们的技术和社会基础设施具有深远的影响,需要建立对其行为的信心,以避免潜在的风险和伤害。因此,自主决策系统的有效性和更广泛的可接受性依赖于他们做出“风险规避”决策的能力,这也被称为“风险规避”。人工智能(AI)系统的风险规避能力是人机交互的关键要求,也是实现人工智能的全范围社会和工业效益的关键。这一行业有广泛的实际失败-昂贵的应用,如控制、机器人、电子商务、自动驾驶和医疗。

本教程围绕以下问题介绍了自主系统最先进的风险规避方法 (1) 风险到底是什么,风险规避的数学公式是什么? (2) 如何设计规避风险的方法?我们需要从头开始吗?或者,我们能否通过一些简单的调整,将现有的风险无关算法转变为风险规避算法?

本教程将介绍近年来开发的各种风险规避技术和算法。强化学习和数学规划(优化)的介绍性材料将包括在教程中,因此对参与者没有必要的知识。在介绍了基本的数学框架之后,我们将描述用于计算对偶性、块坐标上升和信息论下界的新颖优化方法。最后,我们将强调在这一领域未来工作的许多机会,包括令人兴奋的新领域和基本的理论和算法挑战。

成为VIP会员查看完整内容
26

相关内容

谷歌大脑《自动强化学习》教程,81页ppt!
专知会员服务
66+阅读 · 2022年8月15日
斯坦福大学最新【强化学习】2022课程,含ppt
专知会员服务
124+阅读 · 2022年2月27日
专知会员服务
124+阅读 · 2021年8月25日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
122+阅读 · 2021年3月30日
【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战,80页ppt
【ICML2020】基于模型的强化学习方法教程,279页ppt
专知会员服务
125+阅读 · 2020年7月20日
谷歌大脑《自动强化学习》教程,81页ppt!
专知
0+阅读 · 2022年8月15日
【实用书】强化学习实战:Python,110页pdf
【微软亚研130PPT教程】强化学习简介
专知
36+阅读 · 2018年10月26日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年10月17日
Arxiv
22+阅读 · 2021年12月19日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
11+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员