DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习) - 专知

会员服务 ·

0

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

2020 年 8 月 15 日 深度强化学习实验室

深度强化学习实验室

作者: DeepRL

来源：华为诺亚方舟实验室

竞赛简介

自动驾驶是人工智能最重要的应用之一。从消除人为错误导致的交通事故到大幅减少停车占地，自动驾驶可以在很多方面改变我们的日常生活。随着深度强化学习（DRL）的兴起，相关技术在自动驾驶领域的应用得到了广泛关注。然而，自动驾驶领域的大型研究竞赛和基线标准侧重于感知和预测，而不是规划和决策。为了拓展自动驾驶的前沿研究，激发对驾驶中多智能体交互的关注，在今年的分布式人工智能大会（DAI 2020）上，华为诺亚方舟实验室和上海交通大学APEX数据与知识管理实验室联合举办自动驾驶挑战赛（DAI 2020 SMARTS Autonomous Driving Competition），旨在以自动驾驶中的交互难题，激励人工智能算法和模型创新，助力强化学习（RL）在自动驾驶领域的应用，提升自动驾驶的决策性能。

竞赛仿真平台

DAI自动驾驶挑战赛基于华为自研的SMARTS (Scalable Multi-agent Reinforcement Learning Training School) 自动驾驶仿真平台。SMARTS平台聚焦自动驾驶中的动态交互，提供了丰富的交通场景，有效支持多智能体强化学习（MARL），让MARL的研究更加贴近现实中的自动驾驶场景。

竞赛内容

竞赛官网：

https://www.drive-ml.com

参与者需要开发自动驾驶规划和控制解决方案，以应对SMARTS仿真平台提供的复杂交互式交通场景。比赛鼓励参赛者使用强化学习训练车辆，实现在多种地图和多样化交通流下的智能驾驶。与此同时，参赛者还需要考虑提升模型的泛化性和鲁棒性，以适应未知的测试场景。比赛分为单智能体和多智能体两个赛道。

【赛道1】

赛道 1参赛网址：

https://competitions.codalab.org/competitions/26007

赛道1是单智能体赛道，聚焦单智能体多车道巡航，参赛者需要训练模型控制一辆车完成复杂城市道路和车流下的智能驾驶。场景中包含直行道、路口、匝道、环岛等。车辆需要遵循预设的路线，在保证安全的前提下，尽可能快的从起点出发达到终点。

复杂城市道路示意图

【赛道2】

赛道 2参赛网址：

https://competitions.codalab.org/competitions/26013

赛道2是多智能体赛道，聚焦多车协同驾驶。参赛者提交的模型需要控制多辆车完成不同任务下的协同驾驶，包括匝道、路口、环岛等。车辆需要在保证安全的前提下，尽快达到各自的目标位置。

竞赛平台codalab将对参赛选手提交的驾驶模型进行自动评估。为减少评估误差，每个场景将以不同的随机种子运行多次。评估指标会综合考虑驾驶的安全性、行驶速度和行驶距离等。华为云服务器支撑竞赛平台对提交的模型进行性能评测。同时，华为云也为本次大赛提供了一定的计算资源用于参赛选手模型的训练。

竞赛日程

8月14日：比赛启动

8月14日—10月14日：参赛者提交模型，竞赛平台对模型进行评估

10月25日：每个赛道排名前5的参赛选手将获邀在 DAI 2020 上进行方案展示

最终排名综合竞赛平台自动评分、解决方案的技术优势和方案展示的质量共同决定。

竞赛奖励

针对每个赛道，主办方都提供了丰厚的奖金，并授予获奖证书。

竞赛委员会

组织委员会：

郝建业 (华为诺亚方舟实验室)

张伟楠 (上海交通大学)

汪军 (University College London, 华为诺亚方舟实验室)

罗军 (华为诺亚方舟实验室)

刘武龙 (华为诺亚方舟实验室)

张洪波 (华为诺亚方舟实验室)

陈奇 (华为智能汽车事业部)

邵坤 (华为诺亚方舟实验室)

周铭 (上海交通大学)

缪佳宇 (上海交通大学)

李丽 (华为诺亚方舟实验室)

杨耀东 (华为诺亚方舟实验室)

学术委员会：

邓小铁 (北京大学)

Matthew Taylor (University of Alberta)

Steve Waslander (University of Toronto)

高阳 (南京大学)

赵冬斌 (中科院自动化所)

安波 (南洋理工大学)

俞扬 (南京大学)

唐平中 (清华大学)

David Meger (McGill University)

张海峰 (中科院自动化所)

RLChina课程slide

【RLChina2020公开课课件】 Lecture-0/1.pdf

【RLChina2020公开课课件】 Lecture-2.pdf

【RLChina2020公开课课件】 Lecture-3.pdf

【RLChina2020公开课课件】 Lecture-4.pdf

【RLChina2020公开课课件】 Lecture-7.pdf

【RLChina2020公开课课件】Lecture-8.pdf

【RLChina2020公开课课件】 Lecture-9.pdf

【RLChina2020公开课课件】 Lecture-10.pdf

【RLChina2020公开课课件】Lecture-11.pdf

完

总结1：周志华 || AI领域如何做研究-写高水平论文

总结2：全网首发最全深度强化学习资料(永更)

总结3: 《强化学习导论》代码/习题答案大全

总结4：30+个必知的《人工智能》会议清单

总结5：2019年-57篇深度强化学习文章汇总

总结6: 万字总结 || 强化学习之路

总结7：万字总结 || 多智能体强化学习(MARL)大总结

总结8：经验 || 深度强化学习理论、模型及编码调参技巧

完

第74篇：【中文公益公开课】RLChina2020

第73篇：Tensorflow2.0实现29种深度强化学习算法

第72篇：【万字长文】解决强化学习"稀疏奖励"

第71篇：【公开课】高级强化学习专题

第70篇：DeepMind发布"离线强化学习基准“

第69篇：深度强化学习【Seaborn】绘图方法

第68篇：【DeepMind】多智能体学习231页PPT

第67篇：126篇ICML2020会议"强化学习"论文汇总

第66篇：分布式强化学习框架Acme，并行性加强

第65篇：DQN系列(3): 优先级经验回放(PER)

第64篇：UC Berkeley开源RAD来改进强化学习算法

第63篇：华为诺亚方舟招聘 || 强化学习研究实习生

第62篇：ICLR2020- 106篇深度强化学习顶会论文

第61篇：David Sliver 亲自讲解AlphaGo、Zero

第60篇：滴滴主办强化学习挑战赛:KDD Cup-2020

第59篇：Agent57在所有经典Atari 游戏中吊打人类

第58篇：清华开源「天授」强化学习平台

第57篇：Google发布"强化学习"框架"SEED RL"

第56篇：RL教父Sutton实现强人工智能算法的难易

第55篇：内推 || 阿里2020年强化学习实习生招聘

第54篇：顶会 || 65篇"IJCAI"深度强化学习论文

第53篇：TRPO/PPO提出者John Schulman谈科研

第52篇：《强化学习》可复现性和稳健性，如何解决？

第51篇：强化学习和最优控制的《十个关键点》

第50篇：微软全球深度强化学习开源项目开放申请

第49篇：DeepMind发布强化学习库 RLax

第48篇：AlphaStar过程详解笔记

第47篇：Exploration-Exploitation难题解决方法

第46篇：DQN系列(2): Double DQN 算法

第45篇：DQN系列(1): Double Q-learning

第44篇：科研界最全工具汇总

第43篇：起死回生|| 如何rebuttal顶会学术论文?

第42篇：深度强化学习入门到精通资料综述

第41篇：顶会征稿 || ICAPS2020: DeepRL

第40篇：实习生招聘 || 华为诺亚方舟实验室

第39篇：滴滴实习生|| 深度强化学习方向

第38篇：AAAI-2020 || 52篇深度强化学习论文

第37篇：Call For Papers# IJCNN2020-DeepRL

第36篇：复现"深度强化学习"论文的经验之谈

第35篇：α-Rank算法之DeepMind及Huawei改进

第34篇：从Paper到Coding, DRL挑战34类游戏

第33篇：DeepMind-102页深度强化学习PPT

第32篇：腾讯AI Lab强化学习招聘(正式/实习)

第31篇：强化学习，路在何方？

第30篇：强化学习的三种范例

第29篇：框架ES-MAML：进化策略的元学习方法

第28篇：138页“策略优化”PPT--Pieter Abbeel

第27篇：迁移学习在强化学习中的应用及最新进展

第26篇：深入理解Hindsight Experience Replay

第25篇：10项【深度强化学习】赛事汇总

第24篇：DRL实验中到底需要多少个随机种子？

第23篇：142页"ICML会议"强化学习笔记

第22篇：通过深度强化学习实现通用量子控制

第21篇：《深度强化学习》面试题汇总

第20篇：《深度强化学习》招聘汇总(13家企业）

第19篇：解决反馈稀疏问题之HER原理与代码实现

第18篇："DeepRacer" —顶级深度强化学习挑战赛

第17篇：AI Paper | 几个实用工具推荐

第16篇：AI领域：如何做优秀研究并写高水平论文？

第15篇： DeepMind开源三大新框架！

第14篇： 61篇NIPS2019DeepRL论文及部分解读

第13篇： OpenSpiel(28种DRL环境+24种DRL算法)

第12篇：模块化和快速原型设计Huskarl DRL框架

第11篇： DRL在Unity自行车环境中配置与实践

第10篇：解读72篇DeepMind深度强化学习论文

第9篇：《AutoML》：一份自动化调参的指导

第8篇： ReinforceJS库（动态展示DP、TD、DQN）

第7篇： 10年NIPS顶会DRL论文(100多篇)汇总

第6篇： ICML2019-深度强化学习文章汇总

第5篇：深度强化学习在阿里巴巴的技术演进

第4篇：深度强化学习十大原则

第3篇： “超参数”自动化设置方法---DeepHyper

第2篇：深度强化学习的加速方法

第1篇：深入浅出解读"多巴胺（Dopamine）论文"、环境配置和实例分析

第14期论文: 2020-02-10(8篇)

第13期论文：2020-1-21(共7篇)

第12期论文：2020-1-10(Pieter Abbeel一篇,共6篇)

第11期论文：2019-12-19(3篇，一篇OpennAI)

第10期论文：2019-12-13(8篇)

第9期论文：2019-12-3(3篇)

第8期论文：2019-11-18(5篇)

第7期论文：2019-11-15(6篇)

第6期论文：2019-11-08(2篇)

第5期论文：2019-11-07(5篇，一篇DeepMind发表)

第4期论文：2019-11-05(4篇)

第3期论文：2019-11-04(6篇)

第2期论文：2019-11-03(3篇)

第1期论文：2019-11-02(5篇)

登录查看更多

15

相关内容

华为诺亚方舟实验室

华为诺亚方舟实验室

诺亚方舟实验室是华为公司设立在香港的实验室成立于2012年，主要从事人工智能学习——数据挖掘研究。

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

186+阅读 · 2020年5月5日

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

专知会员服务

80+阅读 · 2020年3月4日

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

专知会员服务

62+阅读 · 2020年2月17日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

专知会员服务

34+阅读 · 2019年12月25日

【CVPR 2019 | tutorial】阿波罗，开放式自主驾驶平台：Apollo， Open Autonomous Driving Platform

【CVPR 2019 | tutorial】阿波罗，开放式自主驾驶平台：Apollo， Open Autonomous Driving Platform

专知会员服务

32+阅读 · 2019年11月28日

【麻省理工学院课程】MIT 6.S094: Deep Learning for Self-Driving Cars，深度学习和自动驾驶课程

【麻省理工学院课程】MIT 6.S094: Deep Learning for Self-Driving Cars，深度学习和自动驾驶课程

专知会员服务

52+阅读 · 2019年11月1日

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

专知会员服务

107+阅读 · 2019年10月17日

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

专知会员服务

62+阅读 · 2019年8月10日

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

专知会员服务

65+阅读 · 2019年8月8日

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

多轮对话阅读理解新突破，追一科技登顶CoQA榜单

多轮对话阅读理解新突破，追一科技登顶CoQA榜单

高榕资本

7+阅读 · 2019年9月12日

2019 IROS—终生机器视觉数据集全球挑战赛

2019 IROS—终生机器视觉数据集全球挑战赛

PaperWeekly

7+阅读 · 2019年9月6日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

CVPR 2019 | 百度无人车实现全球首个基于深度学习的激光点云自定位技术

CVPR 2019 | 百度无人车实现全球首个基于深度学习的激光点云自定位技术

机器之心

8+阅读 · 2019年4月20日

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

GAN生成式对抗网络

9+阅读 · 2018年6月11日

全网独家！2018 MIT 6.S094 中文译版「深度学习和自动驾驶课」

全网独家！2018 MIT 6.S094 中文译版「深度学习和自动驾驶课」

AI科技评论

7+阅读 · 2018年4月13日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

【观点】薛建儒：无人车的场景理解与自主运动

【观点】薛建儒：无人车的场景理解与自主运动

中国自动化学会

8+阅读 · 2018年1月24日

【智能驾驶】史上最全自动驾驶系统解析

【智能驾驶】史上最全自动驾驶系统解析

产业智能官

25+阅读 · 2017年8月21日

Autonomous Driving with Deep Learning: A Survey of State-of-Art Technologies

Autonomous Driving with Deep Learning: A Survey of State-of-Art Technologies

Arxiv

12+阅读 · 2020年6月10日

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Arxiv

10+阅读 · 2020年3月12日

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Arxiv

17+阅读 · 2019年9月9日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

Arxiv

8+阅读 · 2018年7月10日

Hierarchical Reinforcement Learning with Deep Nested Agents

Arxiv

3+阅读 · 2018年5月18日

Understanding Humans in Crowded Scenes: Deep Nested Adversarial Learning and A New Benchmark for Multi-Human Parsing

Arxiv

3+阅读 · 2018年4月10日

Towards a Continuous Knowledge Learning Engine for Chatbots

Arxiv

6+阅读 · 2018年2月24日

VIP会员

相关主题

华为诺亚方舟实验室

诺亚方舟实验室

深度强化学习

相关VIP内容

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

186+阅读 · 2020年5月5日

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

【综述】联邦学习的威胁，Threats to Federated Learning: A Survey

专知会员服务

80+阅读 · 2020年3月4日

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

MIT-深度学习Deep Learning State of the Art in 2020，87页ppt

专知会员服务

62+阅读 · 2020年2月17日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

深度学习在自动车辆控制中的应用研究综述（A Survey of Deep Learning Applications to Autonomous Vehicle Control）

专知会员服务

34+阅读 · 2019年12月25日

【CVPR 2019 | tutorial】阿波罗，开放式自主驾驶平台：Apollo， Open Autonomous Driving Platform

【CVPR 2019 | tutorial】阿波罗，开放式自主驾驶平台：Apollo， Open Autonomous Driving Platform

专知会员服务

32+阅读 · 2019年11月28日

【麻省理工学院课程】MIT 6.S094: Deep Learning for Self-Driving Cars，深度学习和自动驾驶课程

【麻省理工学院课程】MIT 6.S094: Deep Learning for Self-Driving Cars，深度学习和自动驾驶课程

专知会员服务

52+阅读 · 2019年11月1日

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

【综述】arXiv最新论文：自动驾驶中深度学习综述，附38页PDF

专知会员服务

107+阅读 · 2019年10月17日

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

【IJCAI 2019】人工智能在交通中的应用（Artificial Intelligence in Transportation），滴滴AI实验室研究员王征博士，秦志伟博士

专知会员服务

62+阅读 · 2019年8月10日

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

【KDD 2019|Tutorial】应用在交通中的强化学习 Deep Reinforcement Learning with Applications in Transportation，滴滴 AI Labs

专知会员服务

65+阅读 · 2019年8月8日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

多轮对话阅读理解新突破，追一科技登顶CoQA榜单

多轮对话阅读理解新突破，追一科技登顶CoQA榜单

高榕资本

7+阅读 · 2019年9月12日

2019 IROS—终生机器视觉数据集全球挑战赛

2019 IROS—终生机器视觉数据集全球挑战赛

PaperWeekly

7+阅读 · 2019年9月6日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

CVPR 2019 | 百度无人车实现全球首个基于深度学习的激光点云自定位技术

CVPR 2019 | 百度无人车实现全球首个基于深度学习的激光点云自定位技术

机器之心

8+阅读 · 2019年4月20日

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

GAN生成式对抗网络

9+阅读 · 2018年6月11日

全网独家！2018 MIT 6.S094 中文译版「深度学习和自动驾驶课」

全网独家！2018 MIT 6.S094 中文译版「深度学习和自动驾驶课」

AI科技评论

7+阅读 · 2018年4月13日

基于计算机视觉的自动驾驶算法研究综述 | 厚势

基于计算机视觉的自动驾驶算法研究综述 | 厚势

厚势

10+阅读 · 2018年2月8日

【观点】薛建儒：无人车的场景理解与自主运动

【观点】薛建儒：无人车的场景理解与自主运动

中国自动化学会

8+阅读 · 2018年1月24日

【智能驾驶】史上最全自动驾驶系统解析

【智能驾驶】史上最全自动驾驶系统解析

产业智能官

25+阅读 · 2017年8月21日

相关论文

Autonomous Driving with Deep Learning: A Survey of State-of-Art Technologies

Autonomous Driving with Deep Learning: A Survey of State-of-Art Technologies

Arxiv

12+阅读 · 2020年6月10日

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Heterogeneous Relational Reasoning in Knowledge Graphs with Reinforcement Learning

Arxiv

10+阅读 · 2020年3月12日

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Arxiv

17+阅读 · 2019年9月9日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

Arxiv

8+阅读 · 2018年7月10日

Hierarchical Reinforcement Learning with Deep Nested Agents

Arxiv

3+阅读 · 2018年5月18日

Understanding Humans in Crowded Scenes: Deep Nested Adversarial Learning and A New Benchmark for Multi-Human Parsing

Arxiv

3+阅读 · 2018年4月10日

Towards a Continuous Knowledge Learning Engine for Chatbots

Arxiv

6+阅读 · 2018年2月24日

大家都在搜

国防科技创新

大型语言模型

CMU博士论文

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员