谷歌大脑《自动强化学习》教程，81页ppt! - 专知

会员服务 ·

0

谷歌大脑《自动强化学习》教程，81页ppt!

2022 年 8 月 15 日 专知

训练强化学习(RL)系统在实际任务中表现良好是困难的，原因有很多。一个重要的原因是，工程师和应用研究人员面临着大量的设计选择，旨在将现实世界的问题表示为部分可观察马尔可夫决策(POMDP)抽象，这不足以捕捉问题的所有方面。因此，工程师通过试验和错误，优化RL系统设计，直到达到令人满意的性能。这是一个累人、耗时和低效的过程。learn to learn和Auto RL将这个过程的部分自动化，允许用户专注于更高层次的设计问题。在本教程中，我们将回顾当前建立的技术，如环境、算法、表示和奖励学习，并讨论可用的工具、它们如何以及为什么工作，以及它们何时会失败。最后，由于这是一个新兴的领域，我们将总结该领域的未来前景和面临的开放问题。

https://automl.cc/tutorials/

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“ARL81” 就可以获取《谷歌大脑《自动强化学习》教程，81页ppt!》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

0

相关内容

自动强化学习

自动强化学习

《机器学习的最优传输》教程，63页PPT

《机器学习的最优传输》教程，63页PPT

专知会员服务

63+阅读 · 2022年4月30日

【UAI2021教程】贝叶斯最优学习，65页ppt

【UAI2021教程】贝叶斯最优学习，65页ppt

专知会员服务

65+阅读 · 2021年8月7日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

《元强化学习》最新，70页ppt

《元强化学习》最新，70页ppt

专知

2+阅读 · 2022年9月16日

【KDD2022教程】多模态自动机器学习教程，130页ppt

【KDD2022教程】多模态自动机器学习教程，130页ppt

专知

2+阅读 · 2022年8月19日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

5+阅读 · 2022年7月27日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

不同晶面TiO2-C界面结构的构建及其在可见光催化过程中的行为研究

国家自然科学基金

0+阅读 · 2013年12月31日

新型微孔结构氧化物薄膜功能材料:“自上而下”设计、表征与应用

国家自然科学基金

0+阅读 · 2013年12月31日

纳米层状有序结构中弹性波的传播特性研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

SRTGAN: Triplet Loss based Generative Adversarial Network for Real-World Super-Resolution

Arxiv

0+阅读 · 2022年11月22日

Unsupervised Domain Adaptation via Deep Hierarchical Optimal Transport

Arxiv

0+阅读 · 2022年11月21日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Crossing Generative Adversarial Networks for Cross-View Person Re-identification

Arxiv

10+阅读 · 2018年1月4日

VIP会员

相关主题

自动强化学习

相关VIP内容

《机器学习的最优传输》教程，63页PPT

《机器学习的最优传输》教程，63页PPT

专知会员服务

63+阅读 · 2022年4月30日

【UAI2021教程】贝叶斯最优学习，65页ppt

【UAI2021教程】贝叶斯最优学习，65页ppt

专知会员服务

65+阅读 · 2021年8月7日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

79+阅读 · 2021年7月23日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

《元强化学习》最新，70页ppt

《元强化学习》最新，70页ppt

专知

2+阅读 · 2022年9月16日

【KDD2022教程】多模态自动机器学习教程，130页ppt

【KDD2022教程】多模态自动机器学习教程，130页ppt

专知

2+阅读 · 2022年8月19日

IJCAI2022《对抗序列决策》教程，164页ppt

IJCAI2022《对抗序列决策》教程，164页ppt

专知

5+阅读 · 2022年7月27日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知

1+阅读 · 2022年7月22日

【牛津大学&DeepMind】自监督学习教程，141页ppt

【牛津大学&DeepMind】自监督学习教程，141页ppt

专知

16+阅读 · 2020年5月29日

相关基金

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

不同晶面TiO2-C界面结构的构建及其在可见光催化过程中的行为研究

国家自然科学基金

0+阅读 · 2013年12月31日

新型微孔结构氧化物薄膜功能材料:“自上而下”设计、表征与应用

国家自然科学基金

0+阅读 · 2013年12月31日

纳米层状有序结构中弹性波的传播特性研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

相关论文

SRTGAN: Triplet Loss based Generative Adversarial Network for Real-World Super-Resolution

Arxiv

0+阅读 · 2022年11月22日

Unsupervised Domain Adaptation via Deep Hierarchical Optimal Transport

Arxiv

0+阅读 · 2022年11月21日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

Crossing Generative Adversarial Networks for Cross-View Person Re-identification

Arxiv

10+阅读 · 2018年1月4日

大家都在搜

朱克爱德华兹家族

大型语言模型

蓝牙安全攻防

滴滴司机调度系统实践

微信扫码咨询专知VIP会员