【综述】自动驾驶领域中的强化学习，附18页论文下载 - 专知

会员服务 ·

0

【综述】自动驾驶领域中的强化学习，附18页论文下载

2020 年 2 月 9 日 专知

【简介】随着深度表示学习的发展，强化学习（RL）已经成为了一个强大的学习框架，其可以在高维度空间中学习复杂的规则。这篇综述总结了深度强化学习（DRL）算法，提供了采用强化学习的自动驾驶任务的分类方法，重点介绍了算法上的关键挑战和在现实世界中将强化学习部署在自动驾驶方面的作用，以及最终评估，测试和加强强化学习和模仿学习健壮性的现有解决方案。

论文链接：

https://arxiv.org/abs/2002.00444

介绍：

自动驾驶(AD)系统由多个感知级任务组成，由于采用了深度学习架构，这些任务现在已经达到了很高的精度。除了感知任务之外，自主驾驶系统还包含多个其他任务，传统的监督学习方法已经不再适用。首先，当对agent行为的预测发生变化时，从自动驾驶agent所处的环境中接收到的未来传感器观察到的结果，例如获取市区最佳驾驶速度的任务。其次，监督信号（如碰撞时间（TTC），相对于agent最佳轨迹的侧向误差）表示agent的动态变化以及环境中的不确定性。这些问题都需要定义随机损失函数来使其最大化。最后，agent需要学习当前环境新的配置参数，预测其所处的环境中每一时刻的最优决策。这表明在观察agent和其所处环境的情况下，一个高维度的空间能够给出大量唯一的配置参数。在这些场景中，我们的目标是解决一个连续决策的问题。在这篇综述中，我们将介绍强化学习的概念，强化学习是一种很有前景的解决方案和任务分类方法，特别是在驱动策略、预测感知、路径规划以及低层控制器设计等领域。我们还重点回顾了强化学习在自动驾驶领域当中各种现实的应用。最后，我们通过阐述应用当前诸如模仿学习和Q学习等强化学习算法时所面临的算力挑战和风险来激励使用者对强化学习作出改进。

章节目录：

section2: 介绍一个典型的自动驾驶系统及其各个组件。

section3: 对深度强化学习进行介绍，并简要讨论关键概念。

section4: 探讨在强化学习基本框架上对其进行更深层次，更加复杂的扩展。

section5: 对强化学习用于自动驾驶领域的所面临的问题提供一个概述。

section6: 介绍将强化学习部署到真实世界自动驾驶系统中所面临的挑战。

section7: 总结

论文便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“DRLADS” 就可以获取《自动驾驶中的深度强化学习综述》PDF专知下载链接

部分论文展示：

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资料

登录查看更多

2

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

最新《深度学习自动驾驶》技术综述论文，28页pdf

最新《深度学习自动驾驶》技术综述论文，28页pdf

专知会员服务

155+阅读 · 2020年6月14日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

192+阅读 · 2020年5月24日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

186+阅读 · 2020年5月5日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知会员服务

132+阅读 · 2020年4月23日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

120+阅读 · 2020年4月6日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

165+阅读 · 2020年2月27日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

274+阅读 · 2020年1月1日

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

专知会员服务

107+阅读 · 2019年10月17日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

212+阅读 · 2019年8月30日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

极市平台

23+阅读 · 2020年1月2日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

近期强化学习领域论文导读（附源码）

近期强化学习领域论文导读（附源码）

人工智能前沿讲习班

7+阅读 · 2019年6月15日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

智能交通大数据最新论文综述-附PDF下载

智能交通大数据最新论文综述-附PDF下载

专知

22+阅读 · 2019年1月21日

自动驾驶最新综述论文（31页PDF下载）

自动驾驶最新综述论文（31页PDF下载）

专知

119+阅读 · 2019年1月15日

63页【深度CNN-目标检测】综述【PDF下载】

63页【深度CNN-目标检测】综述【PDF下载】

机器学习算法与Python学习

4+阅读 · 2018年10月18日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Continual Unsupervised Representation Learning

Continual Unsupervised Representation Learning

Arxiv

7+阅读 · 2019年10月31日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Meta Learning for Task-Driven Video Summarization

Arxiv

6+阅读 · 2019年7月29日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Arxiv

4+阅读 · 2018年7月30日

Relational Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年6月5日

Collaborative Learning for Weakly Supervised Object Detection

Arxiv

9+阅读 · 2018年2月10日

VIP会员

相关主题

深度强化学习

相关VIP内容

最新《深度学习自动驾驶》技术综述论文，28页pdf

最新《深度学习自动驾驶》技术综述论文，28页pdf

专知会员服务

155+阅读 · 2020年6月14日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

192+阅读 · 2020年5月24日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

186+阅读 · 2020年5月5日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知会员服务

132+阅读 · 2020年4月23日

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

最新《经济学中的强化学习》2020大综述，42页pdf128篇文献

专知会员服务

120+阅读 · 2020年4月6日

综述：NLP中的深度学习优势，附21页论文下载

专知会员服务

104+阅读 · 2020年3月12日

【综述】金融领域中的深度学习，附52页论文下载

【综述】金融领域中的深度学习，附52页论文下载

专知会员服务

165+阅读 · 2020年2月27日

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

专知会员服务

274+阅读 · 2020年1月1日

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

专知会员服务

107+阅读 · 2019年10月17日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

212+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

[ICCV2025]EAMamba：面向图像恢复的高效全能视觉状态空间模型

ICCV 2025 | 超越π0，无界智慧提出A0，首个空间可供性感知的通用操作模型

【博士论文】大规模人工智能中的强化学习智能体：高效训练与更严谨分析

大语言模型推理系统综述

相关资讯

2019->2020必看的十篇「深度学习领域综述」论文

2019->2020必看的十篇「深度学习领域综述」论文

极市平台

23+阅读 · 2020年1月2日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

近期强化学习领域论文导读（附源码）

近期强化学习领域论文导读（附源码）

人工智能前沿讲习班

7+阅读 · 2019年6月15日

迁移自适应学习最新综述，附21页论文下载

迁移自适应学习最新综述，附21页论文下载

专知

34+阅读 · 2019年3月13日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

智能交通大数据最新论文综述-附PDF下载

智能交通大数据最新论文综述-附PDF下载

专知

22+阅读 · 2019年1月21日

自动驾驶最新综述论文（31页PDF下载）

自动驾驶最新综述论文（31页PDF下载）

专知

119+阅读 · 2019年1月15日

63页【深度CNN-目标检测】综述【PDF下载】

63页【深度CNN-目标检测】综述【PDF下载】

机器学习算法与Python学习

4+阅读 · 2018年10月18日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

【强化学习】「ICML教程」深度强化学习，决策与控制（117 PPT）

产业智能官

41+阅读 · 2017年8月11日

相关论文

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Continual Unsupervised Representation Learning

Continual Unsupervised Representation Learning

Arxiv

7+阅读 · 2019年10月31日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Meta Learning for Task-Driven Video Summarization

Arxiv

6+阅读 · 2019年7月29日

Reverse Attention for Salient Object Detection

Arxiv

11+阅读 · 2019年4月15日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design

Arxiv

4+阅读 · 2018年7月30日

Relational Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年6月5日

Collaborative Learning for Weakly Supervised Object Detection

Arxiv

9+阅读 · 2018年2月10日

大家都在搜

大型语言模型

斯坦福博士论文

无人机系统

软件无线电

无人机航拍交通事故现场勘查处置系统——行业第一的警用事故处理软件

微信扫码咨询专知VIP会员