【UAI2022】规避风险强化学习:算法和元算法，120页ppt - 专知VIP

会员服务 ·

16

UAI 2022 · 强化学习 · 元算法 ·

2022 年 9 月 3 日

【UAI2022】规避风险强化学习:算法和元算法，120页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，关于单智能体和多智能体自主决策的研究工作层出不穷。现在，许多IT专家正在打造自动驾驶汽车和医疗机器人，开发先进的自主决策系统已经是一个数十亿美元的产业。这些新技术提供了监督、先进的自动化和自动仪器，能够适应不断变化的情况、知识和约束。然而，将新技术引入我们的技术和社会基础设施具有深远的影响，需要建立对其行为的信心，以避免潜在的风险和伤害。因此，自主决策系统的有效性和更广泛的可接受性依赖于他们做出“风险规避”决策的能力，这也被称为“风险规避”。人工智能(AI)系统的风险规避能力是人机交互的关键要求，也是实现人工智能的全范围社会和工业效益的关键。这一行业有广泛的实际失败-昂贵的应用，如控制、机器人、电子商务、自动驾驶和医疗。

本教程围绕以下问题介绍了自主系统最先进的风险规避方法 (1) 风险到底是什么，风险规避的数学公式是什么? (2) 如何设计规避风险的方法?我们需要从头开始吗?或者，我们能否通过一些简单的调整，将现有的风险无关算法转变为风险规避算法?

本教程将介绍近年来开发的各种风险规避技术和算法。强化学习和数学规划(优化)的介绍性材料将包括在教程中，因此对参与者没有必要的知识。在介绍了基本的数学框架之后，我们将描述用于计算对偶性、块坐标上升和信息论下界的新颖优化方法。最后，我们将强调在这一领域未来工作的许多机会，包括令人兴奋的新领域和基本的理论和算法挑战。

成为VIP会员查看完整内容

27

相关内容

UAI 2022

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知会员服务

105+阅读 · 2022年9月1日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知会员服务

156+阅读 · 2022年8月24日

谷歌大脑《自动强化学习》教程，81页ppt!

谷歌大脑《自动强化学习》教程，81页ppt!

专知会员服务

67+阅读 · 2022年8月15日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

麻省理工MIT2020深度学习导论课程6.S191，10大前沿主题：序列建模、生成模型、强化学习、GNN、对抗学习等，不得不看

麻省理工MIT2020深度学习导论课程6.S191，10大前沿主题：序列建模、生成模型、强化学习、GNN、对抗学习等，不得不看

专知会员服务

148+阅读 · 2020年2月2日

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

专知

5+阅读 · 2022年9月28日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

不可错过！康奈尔大学最新《机器人学习与决策》课程，讲述最新技术，附视频与Slides

不可错过！康奈尔大学最新《机器人学习与决策》课程，讲述最新技术，附视频与Slides

专知

1+阅读 · 2022年8月29日

谷歌大脑《自动强化学习》教程，81页ppt!

谷歌大脑《自动强化学习》教程，81页ppt!

专知

0+阅读 · 2022年8月15日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知

2+阅读 · 2022年7月12日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

有色冶金过程系统的不确定动态优化算法

国家自然科学基金

0+阅读 · 2014年12月31日

风险企业价值评估与风险投资决策动态优化

国家自然科学基金

2+阅读 · 2013年12月31日

复杂不确定环境下鲁棒投资组合优化模型及决策研究

国家自然科学基金

4+阅读 · 2012年12月31日

Markov状态转换下的跳扩散风险理论的新模型与新算法

国家自然科学基金

1+阅读 · 2012年12月31日

低碳约束下电动汽车产业风险评估研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于有限理性行为的风险投资多阶段组合选择模型

国家自然科学基金

0+阅读 · 2012年12月31日

可重构环境下软硬件协同设计的算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

保险风险模型、投资组合及相关课题研究

国家自然科学基金

0+阅读 · 2009年12月31日

食品安全危机下的消费者风险评估与购买决策：基于神经营销学的研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

Analysis of Distributed Ledger Technologies for Industrial Manufacturing

Arxiv

0+阅读 · 2022年10月18日

Contact-Implicit Planning and Control for Non-Prehensile Manipulation Using State-Triggered Constraints

Arxiv

0+阅读 · 2022年10月18日

Mobile Robot Manipulation using Pure Object Detection

Arxiv

0+阅读 · 2022年10月17日

Cross-modal Semantic Enhanced Interaction for Image-Sentence Retrieval

Arxiv

0+阅读 · 2022年10月17日

Invariance-adapted decomposition and Lasso-type contrastive learning

Arxiv

0+阅读 · 2022年10月13日

Synthesis of Proactive Sensor Placement In Probabilistic Attack Graphs

Arxiv

0+阅读 · 2022年10月13日

Beyond Just Vision: A Review on Self-Supervised Representation Learning on Multimodal and Temporal Data

Arxiv

28+阅读 · 2022年6月8日

Introduction to Online Convex Optimization

Arxiv

23+阅读 · 2021年12月19日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

A Survey on Neural Recommendation: From Collaborative Filtering to Content and Context Enriched Recommendation

Arxiv

25+阅读 · 2021年4月27日

VIP会员

相关主题

相关VIP内容

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知会员服务

105+阅读 · 2022年9月1日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知会员服务

156+阅读 · 2022年8月24日

谷歌大脑《自动强化学习》教程，81页ppt!

谷歌大脑《自动强化学习》教程，81页ppt!

专知会员服务

67+阅读 · 2022年8月15日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

【经典书】强化学习算法，98页pdf

专知会员服务

130+阅读 · 2021年8月25日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知会员服务

59+阅读 · 2020年12月9日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

麻省理工MIT2020深度学习导论课程6.S191，10大前沿主题：序列建模、生成模型、强化学习、GNN、对抗学习等，不得不看

麻省理工MIT2020深度学习导论课程6.S191，10大前沿主题：序列建模、生成模型、强化学习、GNN、对抗学习等，不得不看

专知会员服务

148+阅读 · 2020年2月2日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能治理的未来

模态感知的特征匹配：单一模态与跨模态技术的全面综述

无监督行人重识别研究综述

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

相关资讯

【干货书】强化学习Python真实数据与实例应用，110页pdf

【干货书】强化学习Python真实数据与实例应用，110页pdf

专知

9+阅读 · 2022年10月13日

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

【牛津大学博士论文】深度迁移学习贝叶斯推断，157页pdf

专知

5+阅读 · 2022年9月28日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

不可错过！康奈尔大学最新《机器人学习与决策》课程，讲述最新技术，附视频与Slides

不可错过！康奈尔大学最新《机器人学习与决策》课程，讲述最新技术，附视频与Slides

专知

1+阅读 · 2022年8月29日

谷歌大脑《自动强化学习》教程，81页ppt!

谷歌大脑《自动强化学习》教程，81页ppt!

专知

0+阅读 · 2022年8月15日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知

2+阅读 · 2022年7月12日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

AACL2020最新《可解释人工智能与自然语言处理可解释性》教程，附159页ppt与视频

专知

25+阅读 · 2020年12月6日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

相关基金

有色冶金过程系统的不确定动态优化算法

国家自然科学基金

0+阅读 · 2014年12月31日

风险企业价值评估与风险投资决策动态优化

国家自然科学基金

2+阅读 · 2013年12月31日

复杂不确定环境下鲁棒投资组合优化模型及决策研究

国家自然科学基金

4+阅读 · 2012年12月31日

Markov状态转换下的跳扩散风险理论的新模型与新算法

国家自然科学基金

1+阅读 · 2012年12月31日

低碳约束下电动汽车产业风险评估研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于有限理性行为的风险投资多阶段组合选择模型

国家自然科学基金

0+阅读 · 2012年12月31日

可重构环境下软硬件协同设计的算法研究

国家自然科学基金

0+阅读 · 2011年12月31日

保险风险模型、投资组合及相关课题研究

国家自然科学基金

0+阅读 · 2009年12月31日

食品安全危机下的消费者风险评估与购买决策：基于神经营销学的研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

Analysis of Distributed Ledger Technologies for Industrial Manufacturing

Arxiv

0+阅读 · 2022年10月18日

Contact-Implicit Planning and Control for Non-Prehensile Manipulation Using State-Triggered Constraints

Arxiv

0+阅读 · 2022年10月18日

Mobile Robot Manipulation using Pure Object Detection

Arxiv

0+阅读 · 2022年10月17日

Cross-modal Semantic Enhanced Interaction for Image-Sentence Retrieval

Arxiv

0+阅读 · 2022年10月17日

Invariance-adapted decomposition and Lasso-type contrastive learning

Arxiv

0+阅读 · 2022年10月13日

Synthesis of Proactive Sensor Placement In Probabilistic Attack Graphs

Arxiv

0+阅读 · 2022年10月13日

Beyond Just Vision: A Review on Self-Supervised Representation Learning on Multimodal and Temporal Data

Arxiv

28+阅读 · 2022年6月8日

Introduction to Online Convex Optimization

Arxiv

23+阅读 · 2021年12月19日

Contrastive Spatio-Temporal Pretext Learning for Self-supervised Video Representation

Arxiv

11+阅读 · 2021年12月16日

A Survey on Neural Recommendation: From Collaborative Filtering to Content and Context Enriched Recommendation

Arxiv

25+阅读 · 2021年4月27日

微信扫码咨询专知VIP会员