深度强化学习 (DRL) 是一种使用深度学习技术扩展传统强化学习方法的一种机器学习方法。 传统强化学习方法的主要任务是使得主体根据从环境中获得的奖赏能够学习到最大化奖赏的行为。然而,传统无模型强化学习方法需要使用函数逼近技术使得主体能够学习出值函数或者策略。在这种情况下,深度学习强大的函数逼近能力自然成为了替代人工指定特征的最好手段并为性能更好的端到端学习的实现提供了可能。
DeepMind后继有人,图式网络通用性完胜AlphaGo?
专访 || 大佬Pieter Abbeel谈深度强化学习
深度强化学习实验室
1+阅读 · 2020年2月2日
视频 | 进化策略让AI开挂,玩游戏不断给自己续命
TensorFlow 2.0深度强化学习指南
云栖社区
18+阅读 · 2019年2月1日
浅析强化学习及使用Policy Network实现自动化控制
人工智能学家
6+阅读 · 2017年10月2日
重磅 | CS 294 2018 今日开课!双语字幕独家上线!
AI研习社
2+阅读 · 2018年12月20日
参考链接
父主题
微信扫码咨询专知VIP会员