【综述】自动驾驶领域中的强化学习,附18页论文下载

2020 年 2 月 9 日 专知

【简介】随着深度表示学习的发展,强化学习(RL)已经成为了一个强大的学习框架,其可以在高维度空间中学习复杂的规则。这篇综述总结了深度强化学习(DRL)算法,提供了采用强化学习的自动驾驶任务的分类方法,重点介绍了算法上的关键挑战和在现实世界中将强化学习部署在自动驾驶方面的作用,以及最终评估,测试和加强强化学习和模仿学习健壮性的现有解决方案。


论文链接:

https://arxiv.org/abs/2002.00444

介绍:

自动驾驶(AD)系统由多个感知级任务组成,由于采用了深度学习架构,这些任务现在已经达到了很高的精度。除了感知任务之外,自主驾驶系统还包含多个其他任务,传统的监督学习方法已经不再适用。首先,当对agent行为的预测发生变化时,从自动驾驶agent所处的环境中接收到的未来传感器观察到的结果,例如获取市区最佳驾驶速度的任务。其次,监督信号(如碰撞时间(TTC),相对于agent最佳轨迹的侧向误差)表示agent的动态变化以及环境中的不确定性。这些问题都需要定义随机损失函数来使其最大化。最后,agent需要学习当前环境新的配置参数,预测其所处的环境中每一时刻的最优决策。这表明在观察agent和其所处环境的情况下,一个高维度的空间能够给出大量唯一的配置参数。在这些场景中,我们的目标是解决一个连续决策的问题。在这篇综述中,我们将介绍强化学习的概念,强化学习是一种很有前景的解决方案和任务分类方法,特别是在驱动策略、预测感知、路径规划以及低层控制器设计等领域。我们还重点回顾了强化学习在自动驾驶领域当中各种现实的应用。最后,我们通过阐述应用当前诸如模仿学习和Q学习等强化学习算法时所面临的算力挑战和风险来激励使用者对强化学习作出改进。

章节目录:

section2: 介绍一个典型的自动驾驶系统及其各个组件。

section3: 对深度强化学习进行介绍,并简要讨论关键概念。

section4: 探讨在强化学习基本框架上对其进行更深层次,更加复杂的扩展。

section5: 对强化学习用于自动驾驶领域的所面临的问题提供一个概述。

section6: 介绍将强化学习部署到真实世界自动驾驶系统中所面临的挑战。

section7: 总结


论文便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DRLADS” 就可以获取自动驾驶中的深度强化学习综述》PDF专知下载链接


部分论文展示:


专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资料
登录查看更多
2

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
最新《深度学习自动驾驶》技术综述论文,28页pdf
专知会员服务
153+阅读 · 2020年6月14日
多智能体深度强化学习的若干关键科学问题
专知会员服务
177+阅读 · 2020年5月24日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【综述】交通流量预测,附15页论文下载
专知会员服务
128+阅读 · 2020年4月23日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
专知会员服务
102+阅读 · 2020年3月12日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
162+阅读 · 2020年2月27日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
269+阅读 · 2020年1月1日
专知会员服务
199+阅读 · 2019年8月30日
2019->2020必看的十篇「深度学习领域综述」论文
极市平台
23+阅读 · 2020年1月2日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
29+阅读 · 2019年7月7日
近期强化学习领域论文导读(附源码)
人工智能前沿讲习班
7+阅读 · 2019年6月15日
迁移自适应学习最新综述,附21页论文下载
智能交通大数据最新论文综述-附PDF下载
专知
20+阅读 · 2019年1月21日
自动驾驶最新综述论文(31页PDF下载)
专知
118+阅读 · 2019年1月15日
63页【深度CNN-目标检测】综述【PDF下载】
机器学习算法与Python学习
4+阅读 · 2018年10月18日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
Continual Unsupervised Representation Learning
Arxiv
7+阅读 · 2019年10月31日
Arxiv
6+阅读 · 2019年7月29日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
135+阅读 · 2018年10月8日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
5+阅读 · 2018年6月5日
VIP会员
相关VIP内容
最新《深度学习自动驾驶》技术综述论文,28页pdf
专知会员服务
153+阅读 · 2020年6月14日
多智能体深度强化学习的若干关键科学问题
专知会员服务
177+阅读 · 2020年5月24日
最新《智能交通系统的深度强化学习》综述论文,22页pdf
【综述】交通流量预测,附15页论文下载
专知会员服务
128+阅读 · 2020年4月23日
最新《经济学中的强化学习》2020大综述,42页pdf128篇文献
专知会员服务
102+阅读 · 2020年3月12日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
162+阅读 · 2020年2月27日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
269+阅读 · 2020年1月1日
专知会员服务
199+阅读 · 2019年8月30日
相关资讯
2019->2020必看的十篇「深度学习领域综述」论文
极市平台
23+阅读 · 2020年1月2日
自动驾驶技术解读——自动驾驶汽车决策控制系统
智能交通技术
29+阅读 · 2019年7月7日
近期强化学习领域论文导读(附源码)
人工智能前沿讲习班
7+阅读 · 2019年6月15日
迁移自适应学习最新综述,附21页论文下载
智能交通大数据最新论文综述-附PDF下载
专知
20+阅读 · 2019年1月21日
自动驾驶最新综述论文(31页PDF下载)
专知
118+阅读 · 2019年1月15日
63页【深度CNN-目标检测】综述【PDF下载】
机器学习算法与Python学习
4+阅读 · 2018年10月18日
一文了解强化学习
AI100
15+阅读 · 2018年8月20日
相关论文
Continual Unsupervised Representation Learning
Arxiv
7+阅读 · 2019年10月31日
Arxiv
6+阅读 · 2019年7月29日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
135+阅读 · 2018年10月8日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
5+阅读 · 2018年6月5日
Top
微信扫码咨询专知VIP会员