牛津大学、谷歌等十余位学者《自动强化学习》撰文综述 - 专知VIP

会员服务 ·

32

自动强化学习 · 综述论文 ·

2022 年 2 月 11 日

牛津大学、谷歌等十余位学者《自动强化学习》撰文综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

来自牛津大学、弗莱堡大学、谷歌研究院等机构的十余位研究者撰文综述 AutoRL。

强化学习 (RL) 与深度学习的结合带来了一系列令人印象深刻的成果，许多人认为（深度）强化学习提供了通向通用智能体的途径。然而，RL 智能体的成功通常对训练过程中的设计选择高度敏感，可能需要繁琐且容易出错的手动调整。这使得将 RL 用于新问题具有挑战性，同时也限制了 RL 的全部潜力。

在机器学习的许多其他领域，AutoML 已经表明可以自动化此类设计选择，并且在应用于 RL 时也产生了有希望的初步结果。然而，自动强化学习 (AutoRL) 不仅涉及 AutoML 的标准应用，还包括 RL 独有的额外挑战，这使得研究者自然而然地产生了一些不同的方法。

AutoRL 已成为 RL 研究的一个重要领域，为从 RNA 设计到围棋等游戏的各种应用提供了希望。由于 RL 中考虑的方法和环境具有多样性，因此许多研究都是在不同的子领域进行的。来自牛津大学、弗莱堡大学、谷歌研究院等机构的十余位研究者撰文试图统一 AutoRL 领域，并提供了通用分类法，该研究详细讨论了每个领域并提出未来研究人员可能感兴趣的问题。

成为VIP会员查看完整内容

57

相关内容

自动强化学习

自动强化学习

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

专知会员服务

33+阅读 · 2022年2月1日

牛津大学发布60页最新《强化学习金融应用进展》综述论文

牛津大学发布60页最新《强化学习金融应用进展》综述论文

专知会员服务

116+阅读 · 2021年12月12日

联邦学习智慧医疗综述

联邦学习智慧医疗综述

专知会员服务

122+阅读 · 2021年11月27日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

121+阅读 · 2020年4月6日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

搞强化学习还不了解AutoRL？牛津大学、谷歌等十余位学者撰文综述

搞强化学习还不了解AutoRL？牛津大学、谷歌等十余位学者撰文综述

PaperWeekly

1+阅读 · 2022年2月13日

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

机器之心

2+阅读 · 2022年2月10日

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

专知

1+阅读 · 2022年2月1日

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

深度强化学习实验室

0+阅读 · 2022年1月12日

伦敦大学学院、UC伯克利联手，撰文综述深度强化学习泛化研究

伦敦大学学院、UC伯克利联手，撰文综述深度强化学习泛化研究

机器之心

1+阅读 · 2022年1月3日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于数据挖掘方法及不确定性分析对公共建筑冷水机组群控策略的识别、评估和优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

建筑生命周期评价的时间有效性研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于密文的安全多方计算研究

国家自然科学基金

0+阅读 · 2012年12月31日

中国建筑理论学者及其主要建筑创作理论的系统性研究（1980-2010）

国家自然科学基金

0+阅读 · 2012年12月31日

Stretchable Cells Help DARTS Search Better

Arxiv

0+阅读 · 2022年4月18日

BA-Net: Bridge Attention for Deep Convolutional Neural Networks

Arxiv

0+阅读 · 2022年4月18日

Animal Kingdom: A Large and Diverse Dataset for Animal Behavior Understanding

Arxiv

0+阅读 · 2022年4月18日

Adjoined Networks: A Training Paradigm with Applications to Network Compression

Arxiv

0+阅读 · 2022年4月15日

Paradigm Shift in Natural Language Processing

Arxiv

28+阅读 · 2021年9月26日

VIP会员

相关主题

自动强化学习

相关VIP内容

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

专知会员服务

33+阅读 · 2022年2月1日

牛津大学发布60页最新《强化学习金融应用进展》综述论文

牛津大学发布60页最新《强化学习金融应用进展》综述论文

专知会员服务

116+阅读 · 2021年12月12日

联邦学习智慧医疗综述

联邦学习智慧医疗综述

专知会员服务

122+阅读 · 2021年11月27日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

121+阅读 · 2020年4月6日

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

【元学习 | 论文】CoRL19，元世界:多任务和元强化学习的基准和评估，伯克利分校，Google

专知会员服务

27+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于AI的动态任务分配策略实现多智能体系统有意义人类控制》报告

《超越连接：AI驱动网络未来愿景》最新报告

人工智能赋能多域作战：能力与挑战

《战场空间决策优势：AI基础与应用研究》总结报告

相关资讯

搞强化学习还不了解AutoRL？牛津大学、谷歌等十余位学者撰文综述

搞强化学习还不了解AutoRL？牛津大学、谷歌等十余位学者撰文综述

PaperWeekly

1+阅读 · 2022年2月13日

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

搞强化学习还不了解AutoRL，牛津大学、谷歌等十余位学者撰文综述

机器之心

2+阅读 · 2022年2月10日

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学等发布AutoRL综述，还在手动调参吗？你已经落后了

专知

1+阅读 · 2022年2月1日

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

【47页综述】牛津大学联合7家单位发布AutoRL综述，还在手动调参吗？你已经落后了

深度强化学习实验室

0+阅读 · 2022年1月12日

伦敦大学学院、UC伯克利联手，撰文综述深度强化学习泛化研究

伦敦大学学院、UC伯克利联手，撰文综述深度强化学习泛化研究

机器之心

1+阅读 · 2022年1月3日

相关基金

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于数据挖掘方法及不确定性分析对公共建筑冷水机组群控策略的识别、评估和优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

建筑生命周期评价的时间有效性研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于密文的安全多方计算研究

国家自然科学基金

0+阅读 · 2012年12月31日

中国建筑理论学者及其主要建筑创作理论的系统性研究（1980-2010）

国家自然科学基金

0+阅读 · 2012年12月31日

相关论文

Stretchable Cells Help DARTS Search Better

Arxiv

0+阅读 · 2022年4月18日

BA-Net: Bridge Attention for Deep Convolutional Neural Networks

Arxiv

0+阅读 · 2022年4月18日

Animal Kingdom: A Large and Diverse Dataset for Animal Behavior Understanding

Arxiv

0+阅读 · 2022年4月18日

Adjoined Networks: A Training Paradigm with Applications to Network Compression

Arxiv

0+阅读 · 2022年4月15日

Paradigm Shift in Natural Language Processing

Arxiv

28+阅读 · 2021年9月26日

微信扫码咨询专知VIP会员