主题: Model-Based Reinforcement Learning:Theory and Practice

摘要: 强化学习系统可以通过两种方式之一做出决策。在基于模型的方法中,系统使用世界的预测模型来提问“如果我做x会发生什么?”?“选择最好的x1。在另一种无模型方法中,建模步骤被完全忽略,有利于直接学习控制策略。尽管在实践中,这两种技术之间的界限可能变得模糊,但作为一种粗略的指导,它对于划分算法可能性的空间是有用的。

嘉宾简介: Michael Janner,伯克利人工智能研究实验室的一名博士生。

成为VIP会员查看完整内容
34

相关内容

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支。
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
论强化学习的根本缺陷
AI科技评论
11+阅读 · 2018年7月24日
Reinforcement Learning: An Introduction 2018第二版 500页
CreateAMind
11+阅读 · 2018年4月27日
【深度强化学习】深度强化学习揭秘
产业智能官
20+阅读 · 2017年11月13日
Arxiv
9+阅读 · 2019年4月19日
Image Captioning based on Deep Reinforcement Learning
Arxiv
11+阅读 · 2018年7月8日
VIP会员
相关VIP内容
深度强化学习策略梯度教程,53页ppt
专知会员服务
176+阅读 · 2020年2月1日
相关论文
Arxiv
9+阅读 · 2019年4月19日
Image Captioning based on Deep Reinforcement Learning
Arxiv
11+阅读 · 2018年7月8日
微信扫码咨询专知VIP会员