深度强化学习算法与应用研究现状综述 - 专知VIP

会员服务 ·

44

人工智能 · 深度强化学习 · 值函数 · 策略梯度 · 导航 ·

2021 年 1 月 13 日

深度强化学习算法与应用研究现状综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

深度强化学习主要被用来处理感知-决策问题，已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法，详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理，并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后，对深度强化学习的算法和应用进行展望，针对一些未来的研究方向和研究热点给出了建议。

成为VIP会员查看完整内容

相关内容

人工智能

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支。

强化学习的自动驾驶控制技术研究进展

专知会员服务

139+阅读 · 2021年2月17日

生成对抗网络及其在图像生成中的应用研究综述

专知会员服务

96+阅读 · 2021年2月6日

深度强化学习在智能制造中的应用展望综述

深度强化学习在智能制造中的应用展望综述

专知会员服务

98+阅读 · 2021年1月28日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

114+阅读 · 2020年12月31日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

194+阅读 · 2020年12月3日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

193+阅读 · 2020年5月24日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

187+阅读 · 2020年5月5日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

「中文文献」目标跟踪算法综述

「中文文献」目标跟踪算法综述

专知

3+阅读 · 2019年7月25日

综述 | 近5年基于深度学习的目标检测算法

综述 | 近5年基于深度学习的目标检测算法

计算机视觉life

38+阅读 · 2019年4月18日

基于深度学习的目标检测算法近5年发展历史（综述）

基于深度学习的目标检测算法近5年发展历史（综述）

极市平台

9+阅读 · 2019年4月7日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

专知

19+阅读 · 2018年12月4日

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉life

9+阅读 · 2018年10月28日

深度学习时代的目标检测算法综述

深度学习时代的目标检测算法综述

AI前线

12+阅读 · 2017年9月22日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

Greedy Multi-step Off-Policy Reinforcement Learning

Arxiv

0+阅读 · 2021年3月7日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Arxiv

34+阅读 · 2019年10月24日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Deep Learning

Arxiv

6+阅读 · 2018年8月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Adapt: Meta-Learning for Model-Based Control

Arxiv

9+阅读 · 2018年3月30日

Safety-aware Adaptive Reinforcement Learning with Applications to Brushbot Navigation

Arxiv

4+阅读 · 2018年1月29日

VIP会员

相关主题

深度强化学习

相关VIP内容

强化学习的自动驾驶控制技术研究进展

专知会员服务

139+阅读 · 2021年2月17日

生成对抗网络及其在图像生成中的应用研究综述

专知会员服务

96+阅读 · 2021年2月6日

深度强化学习在智能制造中的应用展望综述

深度强化学习在智能制造中的应用展望综述

专知会员服务

98+阅读 · 2021年1月28日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

114+阅读 · 2020年12月31日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

194+阅读 · 2020年12月3日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

193+阅读 · 2020年5月24日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

187+阅读 · 2020年5月5日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

《文本分类大综述：从浅层到深度学习》最新2020版35页pdf

专知

59+阅读 · 2020年8月6日

「中文文献」目标跟踪算法综述

「中文文献」目标跟踪算法综述

专知

3+阅读 · 2019年7月25日

综述 | 近5年基于深度学习的目标检测算法

综述 | 近5年基于深度学习的目标检测算法

计算机视觉life

38+阅读 · 2019年4月18日

基于深度学习的目标检测算法近5年发展历史（综述）

基于深度学习的目标检测算法近5年发展历史（综述）

极市平台

9+阅读 · 2019年4月7日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

基于深度学习的NLP 32页最新进展综述，190篇参考文献

基于深度学习的NLP 32页最新进展综述，190篇参考文献

专知

19+阅读 · 2018年12月4日

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉方向简介 | 目标检测最新进展总结与展望

计算机视觉life

9+阅读 · 2018年10月28日

深度学习时代的目标检测算法综述

深度学习时代的目标检测算法综述

AI前线

12+阅读 · 2017年9月22日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

相关论文

Greedy Multi-step Off-Policy Reinforcement Learning

Arxiv

0+阅读 · 2021年3月7日

Curriculum Learning: A Survey

Arxiv

24+阅读 · 2021年1月25日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Arxiv

34+阅读 · 2019年10月24日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Hierarchical Deep Multiagent Reinforcement Learning

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Deep Learning

Arxiv

6+阅读 · 2018年8月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Adapt: Meta-Learning for Model-Based Control

Arxiv

9+阅读 · 2018年3月30日

Safety-aware Adaptive Reinforcement Learning with Applications to Brushbot Navigation

Arxiv

4+阅读 · 2018年1月29日

微信扫码咨询专知VIP会员