深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理,并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后,对深度强化学习的算法和应用进行展望,针对一些未来的研究方向和研究热点给出了建议。

成为VIP会员查看完整内容
136

相关内容

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支。
专知会员服务
133+阅读 · 2021年2月17日
专知会员服务
95+阅读 · 2021年2月6日
深度强化学习在智能制造中的应用展望综述
专知会员服务
96+阅读 · 2021年1月28日
专知会员服务
111+阅读 · 2020年12月31日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
多智能体深度强化学习的若干关键科学问题
专知会员服务
188+阅读 · 2020年5月24日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
专知会员服务
208+阅读 · 2019年8月30日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
「中文文献」目标跟踪算法综述
专知
3+阅读 · 2019年7月25日
综述 | 近5年基于深度学习的目标检测算法
计算机视觉life
38+阅读 · 2019年4月18日
计算机视觉方向简介 | 目标检测最新进展总结与展望
计算机视觉life
9+阅读 · 2018年10月28日
深度学习时代的目标检测算法综述
AI前线
11+阅读 · 2017年9月22日
Arxiv
0+阅读 · 2021年3月7日
Arxiv
24+阅读 · 2021年1月25日
Arxiv
136+阅读 · 2018年10月8日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
11+阅读 · 2018年4月25日
VIP会员
相关VIP内容
专知会员服务
133+阅读 · 2021年2月17日
专知会员服务
95+阅读 · 2021年2月6日
深度强化学习在智能制造中的应用展望综述
专知会员服务
96+阅读 · 2021年1月28日
专知会员服务
111+阅读 · 2020年12月31日
多模态视觉语言表征学习研究综述
专知会员服务
191+阅读 · 2020年12月3日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
153+阅读 · 2020年9月20日
多智能体深度强化学习的若干关键科学问题
专知会员服务
188+阅读 · 2020年5月24日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
172+阅读 · 2020年2月8日
专知会员服务
208+阅读 · 2019年8月30日
相关论文
Arxiv
0+阅读 · 2021年3月7日
Arxiv
24+阅读 · 2021年1月25日
Arxiv
136+阅读 · 2018年10月8日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Deep Learning
Arxiv
6+阅读 · 2018年8月3日
Arxiv
11+阅读 · 2018年4月25日
微信扫码咨询专知VIP会员