【CMU博士论文】分布式强化学习自动驾驶，100页pdf - 专知VIP

会员服务 ·

22

CMU · 博士论文 · 强化学习 · 自动驾驶 · AI与交通 ·

2023 年 4 月 17 日

【CMU博士论文】分布式强化学习自动驾驶，100页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

由于自动驾驶的复杂性和安全性关键性，最近的工作通常在为推进自动驾驶研究而设计的模拟器上测试他们的想法。尽管将自动驾驶建模为轨迹优化问题很方便，但这些方法中很少有借助在线强化学习(RL)来解决具有挑战性的驾驶场景。这主要是因为经典的在线RL算法最初是为诸如Atari游戏之类的玩具问题设计的，这些问题可以在几个小时内解决。相比之下，由于模拟耗时和问题本身的难度，使用这些在线强化学习方法可能需要几周或几个月的时间才能在自动驾驶任务上获得令人满意的结果。因此，一个有前途的自动驾驶在线强化学习流程应该是效率驱动的。

本文研究了由于昂贵的模拟成本，直接将通用单智能体或分布式RL算法应用于CARLA自动驾驶管道的低效性。本文提出两种异步分布式强化学习方法，多并行SAC (off-policy)和多并行PPO (on-policy)，致力于通过一个专门的分布式框架来加速CARLA模拟器上的在线强化学习训练，该框架建立进程间和进程内并行。所提出的分布式多智能体强化学习算法在各种CARLA自动驾驶任务上以更短和合理的时间实现了最先进的性能。

自动驾驶的许多进展都集中在模块化方法上，其中整个任务被划分为多个子任务，如感知、规划和控制[12,46,54,61,63,94]。虽然这种范式在典型的trac场景中表现良好，但在没有为边缘情况精心设计的特殊程序的情况下，它很难处理分布外驾驶情况。为了应对这个问题，强化学习(RL)受到了关注，因为自动驾驶可以自然地视为一个轨迹优化问题，我们需要对驾驶过程进行最优控制。经验证据表明，强化学习方法能够以高度自动化的方式实现这一目标，而不需要手动处理具有挑战性的长尾和罕见情况。它们的成功已经在许多决策任务中得到了证明，例如玩策略游戏或操纵机器人[8,60,74,78,79,81,88]。

成为VIP会员查看完整内容

37

相关内容

CMU

【明尼苏达大学博士论文】自动化运输系统的规划、操作和管理:控制理论的方法，192页pdf

【明尼苏达大学博士论文】自动化运输系统的规划、操作和管理:控制理论的方法，192页pdf

专知会员服务

15+阅读 · 2023年3月16日

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

专知会员服务

78+阅读 · 2023年2月13日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

73+阅读 · 2023年1月14日

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

专知会员服务

54+阅读 · 2023年1月4日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

48+阅读 · 2022年6月23日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

57+阅读 · 2021年10月16日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

专知

0+阅读 · 2022年11月25日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【博士论文】鲁棒深度学习自动驾驶，160页pdf

【博士论文】鲁棒深度学习自动驾驶，160页pdf

专知

6+阅读 · 2022年11月17日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知

7+阅读 · 2022年11月2日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

专知

9+阅读 · 2022年10月25日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知

3+阅读 · 2022年9月3日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于结构建模的语音理解及应用研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于行为模型和超图匹配的多目标跟踪技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于动态多维特征的网络行为模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于稀疏感知学习的高光谱遥感影像分类

国家自然科学基金

1+阅读 · 2012年12月31日

概率并发理论

国家自然科学基金

1+阅读 · 2011年12月31日

复杂环境下智能轮椅的感知与控制

国家自然科学基金

3+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

第三代无线网络规划新的优化模型及其可信智能优化方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

Offline Meta Reinforcement Learning with In-Distribution Online Adaptation

Arxiv

1+阅读 · 2023年6月1日

Reliable Off-Policy Learning for Dosage Combinations

Arxiv

0+阅读 · 2023年5月31日

RelationMatch: Matching In-batch Relationships for Semi-supervised Learning

Arxiv

0+阅读 · 2023年5月30日

Coin Sampling: Gradient-Based Bayesian Inference without Learning Rates

Arxiv

0+阅读 · 2023年5月30日

Spatio-Temporal Wildfire Prediction using Multi-Modal Data

Arxiv

0+阅读 · 2023年5月30日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Model-Contrastive Federated Learning

Arxiv

10+阅读 · 2021年3月30日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Arxiv

34+阅读 · 2019年10月24日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

VIP会员

相关主题

相关VIP内容

【明尼苏达大学博士论文】自动化运输系统的规划、操作和管理:控制理论的方法，192页pdf

【明尼苏达大学博士论文】自动化运输系统的规划、操作和管理:控制理论的方法，192页pdf

专知会员服务

15+阅读 · 2023年3月16日

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

【CMU博士论文】强化学习泛化性与效率研究，206页pdf

专知会员服务

72+阅读 · 2023年2月23日

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

专知会员服务

78+阅读 · 2023年2月13日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

73+阅读 · 2023年1月14日

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

【CMU博士论文】解决现代强化学习中的挑战: 长规划时界，大状态空间，175页pdf

专知会员服务

54+阅读 · 2023年1月4日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【CMU博士论文】通过记忆的元强化学习，118页pdf

【CMU博士论文】通过记忆的元强化学习，118页pdf

专知会员服务

48+阅读 · 2022年6月23日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【CMU博士论文】通过记忆的元强化学习

【CMU博士论文】通过记忆的元强化学习

专知会员服务

57+阅读 · 2021年10月16日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】扩展可扩展会话推荐的边界

别想太多：高效 R1 风格大型推理模型综述

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应

智能体网络：用AI智能体编织下一代网络

相关资讯

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

【CMU博士论文】基于可编程光幕的主动机器人感知，120页pdf

专知

0+阅读 · 2022年11月25日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【博士论文】鲁棒深度学习自动驾驶，160页pdf

【博士论文】鲁棒深度学习自动驾驶，160页pdf

专知

6+阅读 · 2022年11月17日

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

【牛津大学博士论文】深度多智能体强化学习中的协调与沟通，223页pdf

专知

7+阅读 · 2022年11月2日

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

【剑桥大学博士论文】计算机系统中的端到端深度强化学习，188页pdf

专知

6+阅读 · 2022年10月31日

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

如何确保强化学习可靠？苏黎世联邦理工Turchetta, Matteo博士论文《强化学习中的安全性和鲁棒性》，218页pdf

专知

9+阅读 · 2022年10月25日

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知

10+阅读 · 2022年10月20日

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

《即时战略游戏和工业应用的安全深度强化学习》2022最新博士论文

专知

3+阅读 · 2022年9月3日

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

【CMU博士论文】多视图上下文理解的知识增强表示学习，179页pdf

专知

5+阅读 · 2022年8月11日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知

22+阅读 · 2021年12月19日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

基于结构建模的语音理解及应用研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于行为模型和超图匹配的多目标跟踪技术研究

国家自然科学基金

3+阅读 · 2012年12月31日

基于动态多维特征的网络行为模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于稀疏感知学习的高光谱遥感影像分类

国家自然科学基金

1+阅读 · 2012年12月31日

概率并发理论

国家自然科学基金

1+阅读 · 2011年12月31日

复杂环境下智能轮椅的感知与控制

国家自然科学基金

3+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

第三代无线网络规划新的优化模型及其可信智能优化方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Offline Meta Reinforcement Learning with In-Distribution Online Adaptation

Arxiv

1+阅读 · 2023年6月1日

Reliable Off-Policy Learning for Dosage Combinations

Arxiv

0+阅读 · 2023年5月31日

RelationMatch: Matching In-batch Relationships for Semi-supervised Learning

Arxiv

0+阅读 · 2023年5月30日

Coin Sampling: Gradient-Based Bayesian Inference without Learning Rates

Arxiv

0+阅读 · 2023年5月30日

Spatio-Temporal Wildfire Prediction using Multi-Modal Data

Arxiv

0+阅读 · 2023年5月30日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

473+阅读 · 2023年3月31日

Model-Contrastive Federated Learning

Arxiv

10+阅读 · 2021年3月30日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinforcement Learning

Arxiv

34+阅读 · 2019年10月24日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

微信扫码咨询专知VIP会员