【CORL2020最佳系统论文奖】可扩展多智能体强化学习学校 - 专知

会员服务 ·

0

【CORL2020最佳系统论文奖】可扩展多智能体强化学习学校

2020 年 11 月 30 日 专知

《SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for Autonomous Driving》.

获奖理由：

本文提出了一个完善且经过深思熟虑的系统，对自动驾驶社区具有巨大的潜在影响。

论文简介：

多智能体交互是现实世界中自动驾驶的基础，尽管人们已经进行了十多年的研究和发展，但如何在各种情况下与各种道路车辆（智能体）进行有效交互的问题仍未解决。Learning的方法可以为解决这个问题提供很多帮助，但是这一方法需要一个现实的多智能体模拟器，该模拟器会产生多种多样且有效的驾驶交互。为了满足这一需求，我们开发了一个专用的仿真平台：SMARTS (Scalable Multi-Agent RL Training School)：可扩展多智能体强化学习学校。

上图是SMARTS 模型架构，其交互方案是使用特定领域语言（DSL）定义的。Social智能体是从“ Social智能体Zoo”中实例化而来。橙色车辆由学智能体控制、深蓝色车辆由 Social智能体控制、浅蓝色车辆由交通服务提供商控制。原则上，所有提供程序和智能体都可以在自己的进程中运行，也可以远程运行。SMARTS支持训练、积累和使用道路用户的各种行为模型，这些反过来又可以用于创建越来越现实和多样化的交互，从而可以对多智能体交互进行更深入、更广泛的研究。在本文中，我们描述了SMARTS的设计目标，解释了SMARTS的基本体系架构和关键功能，并通过在交互场景中进行具体的多智能体实验来说明其用法。

最后，我们开源了SMARTS平台以及相关的基准测试任务和性能评估指标，以鼓励和支持针对自动驾驶的多智能体学习的研究。

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“SMARTS” 就可以获取《【CORL2020最佳系统论文奖】可扩展多智能体强化学习学校》专知下载链接

专知，专业可信的人工智能知识分发，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取5000+AI主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取5000+AI主题知识资源

登录查看更多

0

相关内容

多智能体

【CoRL2020最佳论文】学习潜在表示以影响多智能体交互作用

【CoRL2020最佳论文】学习潜在表示以影响多智能体交互作用

专知会员服务

28+阅读 · 2020年11月20日

【NeurIPS2020】控制原语的持续学习:通过重置发现技能

专知会员服务

10+阅读 · 2020年11月12日

【CIKM2020】学习表示解决可解释推荐系统

【CIKM2020】学习表示解决可解释推荐系统

专知会员服务

49+阅读 · 2020年9月6日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

193+阅读 · 2020年5月24日

【硬核书】可扩展机器学习：并行分布式方法

【硬核书】可扩展机器学习：并行分布式方法

专知会员服务

86+阅读 · 2020年5月23日

【论文扩展】欧洲语言网格:概述

【论文扩展】欧洲语言网格:概述

专知会员服务

8+阅读 · 2020年3月31日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

深度强化学习实验室

15+阅读 · 2020年8月15日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

37+阅读 · 2020年3月15日

《Python代码》人工智能：计算智能体的基础

《Python代码》人工智能：计算智能体的基础

专知

6+阅读 · 2019年5月28日

OpenAI发布Neural MMO ：大型多智能体游戏环境

OpenAI发布Neural MMO ：大型多智能体游戏环境

大数据文摘

6+阅读 · 2019年3月5日

开源星际争霸2多智能体挑战smac

开源星际争霸2多智能体挑战smac

专知

17+阅读 · 2019年2月13日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【RecSys2018】130页序列推荐系统教程重磅发布（附论文、代码、PPT）

【RecSys2018】130页序列推荐系统教程重磅发布（附论文、代码、PPT）

专知

43+阅读 · 2018年10月4日

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

GAN生成式对抗网络

9+阅读 · 2018年6月11日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

A Blockchain-based Trust System for Decentralised Applications: When trustless needs trust

Arxiv

0+阅读 · 2021年1月26日

Transparent Contribution Evaluation for Secure Federated Learning on Blockchain

Arxiv

0+阅读 · 2021年1月26日

Online and Scalable Model Selection with Multi-Armed Bandits

Arxiv

0+阅读 · 2021年1月25日

Agents.jl: A performant and feature-full agent based modelling software of minimal code complexity

Agents.jl: A performant and feature-full agent based modelling software of minimal code complexity

Arxiv

0+阅读 · 2021年1月25日

Addressing Some Limitations of Transformers with Feedback Memory

Arxiv

0+阅读 · 2021年1月25日

Trinational Automated Mobility

Arxiv

0+阅读 · 2021年1月22日

Decision process for blockchain architectures based on requirements

Arxiv

0+阅读 · 2021年1月22日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

Multilingual Training and Cross-lingual Adaptation on CTC-based Acoustic Model

Arxiv

7+阅读 · 2018年1月23日

VIP会员

相关主题

多智能体强化学习

相关VIP内容

【CoRL2020最佳论文】学习潜在表示以影响多智能体交互作用

【CoRL2020最佳论文】学习潜在表示以影响多智能体交互作用

专知会员服务

28+阅读 · 2020年11月20日

【NeurIPS2020】控制原语的持续学习:通过重置发现技能

专知会员服务

10+阅读 · 2020年11月12日

【CIKM2020】学习表示解决可解释推荐系统

【CIKM2020】学习表示解决可解释推荐系统

专知会员服务

49+阅读 · 2020年9月6日

多智能体深度强化学习的若干关键科学问题

多智能体深度强化学习的若干关键科学问题

专知会员服务

193+阅读 · 2020年5月24日

【硬核书】可扩展机器学习：并行分布式方法

【硬核书】可扩展机器学习：并行分布式方法

专知会员服务

86+阅读 · 2020年5月23日

【论文扩展】欧洲语言网格:概述

【论文扩展】欧洲语言网格:概述

专知会员服务

8+阅读 · 2020年3月31日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

【伯克利博士论文】如何让机器人多技能？通过最大熵强化学习(107页pdf)

专知会员服务

78+阅读 · 2019年10月27日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

【综述】多智能体深度强化学习综述，附49页PDF

专知会员服务

213+阅读 · 2019年8月30日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

深度强化学习实验室

15+阅读 · 2020年8月15日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

37+阅读 · 2020年3月15日

《Python代码》人工智能：计算智能体的基础

《Python代码》人工智能：计算智能体的基础

专知

6+阅读 · 2019年5月28日

OpenAI发布Neural MMO ：大型多智能体游戏环境

OpenAI发布Neural MMO ：大型多智能体游戏环境

大数据文摘

6+阅读 · 2019年3月5日

开源星际争霸2多智能体挑战smac

开源星际争霸2多智能体挑战smac

专知

17+阅读 · 2019年2月13日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【RecSys2018】130页序列推荐系统教程重磅发布（附论文、代码、PPT）

【RecSys2018】130页序列推荐系统教程重磅发布（附论文、代码、PPT）

专知

43+阅读 · 2018年10月4日

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

【学界】对抗强化学习最新研究：可用于自动驾驶汽车「碰撞避免机制」检测

GAN生成式对抗网络

9+阅读 · 2018年6月11日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

相关论文

A Blockchain-based Trust System for Decentralised Applications: When trustless needs trust

Arxiv

0+阅读 · 2021年1月26日

Transparent Contribution Evaluation for Secure Federated Learning on Blockchain

Arxiv

0+阅读 · 2021年1月26日

Online and Scalable Model Selection with Multi-Armed Bandits

Arxiv

0+阅读 · 2021年1月25日

Agents.jl: A performant and feature-full agent based modelling software of minimal code complexity

Agents.jl: A performant and feature-full agent based modelling software of minimal code complexity

Arxiv

0+阅读 · 2021年1月25日

Addressing Some Limitations of Transformers with Feedback Memory

Arxiv

0+阅读 · 2021年1月25日

Trinational Automated Mobility

Arxiv

0+阅读 · 2021年1月22日

Decision process for blockchain architectures based on requirements

Arxiv

0+阅读 · 2021年1月22日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

Multilingual Training and Cross-lingual Adaptation on CTC-based Acoustic Model

Arxiv

7+阅读 · 2018年1月23日

大家都在搜

大型语言模型

CMU博士论文

软件无线电

再见，TD-SCDMA！

微信扫码咨询专知VIP会员