【ICML2021】在线与非随机控制，普林斯顿等教程，82页ppt - 专知VIP

会员服务 ·

4

非随机控制 ·

2021 年 7 月 28 日

【ICML2021】在线与非随机控制，普林斯顿等教程，82页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

近年来，在控制和强化学习中出现了新的方法，这些方法结合了遗憾(regret )最小化和在线凸优化技术。由此产生的理论为控制和强化学习中一些长期存在的问题提供了可证明的保证:对数后悔和快速速率，没有系统知识的端到端LQG-LQR，带有对抗噪声的卡尔曼滤波，具有可证明的有限时间保证的黑盒控制，系统识别的紧下界，等等。

这些结果的主要创新之处在于在线控制模型将随机扰动替换为对抗性扰动，并以后悔最小为最优控制目标。我们将描述设置，以及基于梯度和依赖于新的凸松弛的新方法。

https://icml.cc/media/icml-2021/Slides/10838_XuEBWTU.pdf

成为VIP会员查看完整内容

20

相关内容

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【ICML2021】深度架构持续学习，127页ppt

专知会员服务

77+阅读 · 2021年7月21日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【WWW2021】高效的非抽样知识图谱嵌入

专知会员服务

38+阅读 · 2021年4月25日

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

专知会员服务

42+阅读 · 2020年12月10日

【普林斯顿】机器学习数学视角，63页ppt

【普林斯顿】机器学习数学视角，63页ppt

专知会员服务

88+阅读 · 2020年11月6日

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

205+阅读 · 2020年5月22日

【教程】场景优化理论讲座资料，60页pdf跟踪最新领域进展

【教程】场景优化理论讲座资料，60页pdf跟踪最新领域进展

专知会员服务

38+阅读 · 2020年5月21日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

手把手教你学习神经网络的数学原理（代码和教程）

手把手教你学习神经网络的数学原理（代码和教程）

专知

60+阅读 · 2019年7月16日

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

AI科技评论

7+阅读 · 2019年3月1日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

一文读懂神经网络(附PPT、视频)

一文读懂神经网络(附PPT、视频)

数据派THU

17+阅读 · 2018年3月25日

【资源】15个在线机器学习课程和教程

【资源】15个在线机器学习课程和教程

专知

8+阅读 · 2017年12月22日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

基于LDA的主题模型实践（二）MCMC--吉布斯采样

基于LDA的主题模型实践（二）MCMC--吉布斯采样

机器学习深度学习实战原创交流

25+阅读 · 2015年9月17日

Constructing bounded degree graphs with prescribed degree and neighbor degree sequences

Arxiv

0+阅读 · 2021年9月27日

Expressing High-Level Scientific Claims with Formal Semantics

Expressing High-Level Scientific Claims with Formal Semantics

Arxiv

0+阅读 · 2021年9月27日

Group Evacuation on a Line by Agents with Different Communication Abilities

Arxiv

0+阅读 · 2021年9月26日

Waypoint Routing on Bounded Treewidth Graphs

Arxiv

0+阅读 · 2021年9月24日

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Arxiv

3+阅读 · 2020年3月17日

Compositional Generalization in Image Captioning

Compositional Generalization in Image Captioning

Arxiv

3+阅读 · 2019年9月16日

End-to-End Video Captioning with Multitask Reinforcement Learning

End-to-End Video Captioning with Multitask Reinforcement Learning

Arxiv

3+阅读 · 2019年1月1日

Attacking Visual Language Grounding with Adversarial Examples: A Case Study on Neural Image Captioning

Arxiv

4+阅读 · 2018年5月22日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

VIP会员

相关主题

非随机控制

相关VIP内容

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【ICML2021】深度架构持续学习，127页ppt

专知会员服务

77+阅读 · 2021年7月21日

【ICML2021】策略梯度贝叶斯鲁棒优化的模仿学习

专知会员服务

25+阅读 · 2021年6月15日

【WWW2021】高效的非抽样知识图谱嵌入

专知会员服务

38+阅读 · 2021年4月25日

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

NeurIPS2020最新《深度对话人工智能》教程，130页ppt

专知会员服务

42+阅读 · 2020年12月10日

【普林斯顿】机器学习数学视角，63页ppt

【普林斯顿】机器学习数学视角，63页ppt

专知会员服务

88+阅读 · 2020年11月6日

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

【PKDD2020教程】机器学习不确定性，附88页ppt与视频

专知会员服务

95+阅读 · 2020年10月18日

【ICML2020】基于模型的强化学习方法教程，279页ppt

【ICML2020】基于模型的强化学习方法教程，279页ppt

专知会员服务

129+阅读 · 2020年7月20日

少标签数据学习，54页ppt

少标签数据学习，54页ppt

专知会员服务

205+阅读 · 2020年5月22日

【教程】场景优化理论讲座资料，60页pdf跟踪最新领域进展

【教程】场景优化理论讲座资料，60页pdf跟踪最新领域进展

专知会员服务

38+阅读 · 2020年5月21日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体强化学习：全景综述

《城市滨海地区：理解复杂多变环境下的指挥控制框架》50页报告

【伯克利博士论文】从推理服务到训练：面向大规模 LLM 智能体的高效系统

美空军“顶点2025”实验：推进AI在C2、动态目标锁定与联盟集成中的应用

相关资讯

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

手把手教你学习神经网络的数学原理（代码和教程）

手把手教你学习神经网络的数学原理（代码和教程）

专知

60+阅读 · 2019年7月16日

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

干货 | 强化学习中，如何从稀疏和不明确的反馈中学习泛化

AI科技评论

7+阅读 · 2019年3月1日

ICML2018 模仿学习教程

ICML2018 模仿学习教程

专知

6+阅读 · 2018年7月14日

一文读懂神经网络(附PPT、视频)

一文读懂神经网络(附PPT、视频)

数据派THU

17+阅读 · 2018年3月25日

【资源】15个在线机器学习课程和教程

【资源】15个在线机器学习课程和教程

专知

8+阅读 · 2017年12月22日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

基于LDA的主题模型实践（二）MCMC--吉布斯采样

基于LDA的主题模型实践（二）MCMC--吉布斯采样

机器学习深度学习实战原创交流

25+阅读 · 2015年9月17日

相关论文

Constructing bounded degree graphs with prescribed degree and neighbor degree sequences

Arxiv

0+阅读 · 2021年9月27日

Expressing High-Level Scientific Claims with Formal Semantics

Expressing High-Level Scientific Claims with Formal Semantics

Arxiv

0+阅读 · 2021年9月27日

Group Evacuation on a Line by Agents with Different Communication Abilities

Arxiv

0+阅读 · 2021年9月26日

Waypoint Routing on Bounded Treewidth Graphs

Arxiv

0+阅读 · 2021年9月24日

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Video2Commonsense: Generating Commonsense Descriptions to Enrich Video Captioning

Arxiv

3+阅读 · 2020年3月17日

Compositional Generalization in Image Captioning

Compositional Generalization in Image Captioning

Arxiv

3+阅读 · 2019年9月16日

End-to-End Video Captioning with Multitask Reinforcement Learning

End-to-End Video Captioning with Multitask Reinforcement Learning

Arxiv

3+阅读 · 2019年1月1日

Attacking Visual Language Grounding with Adversarial Examples: A Case Study on Neural Image Captioning

Arxiv

4+阅读 · 2018年5月22日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

Generating Adversarial Examples with Adversarial Networks

Arxiv

10+阅读 · 2018年1月15日

微信扫码咨询专知VIP会员