强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt - 专知VIP

会员服务 ·

18

强化学习 · 自动驾驶 · 模仿学习 ·

2022 年 5 月 6 日

强化学习与模仿学习的自动驾驶，CMU-Xinshuo Weng博士生，57页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

来自CMU博士生Xinshuo Weng《强化学习与模仿学习的自动驾驶》报告与视频，值得关注！

https://www.xinshuoweng.com/

成为VIP会员查看完整内容

32

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

《机器学习的最优传输》教程，63页PPT

《机器学习的最优传输》教程，63页PPT

专知会员服务

63+阅读 · 2022年4月30日

NeurIPS 2021教程|OpenAI-Lilian Weng等：自监督学习与对比学习，105页ppt，

NeurIPS 2021教程|OpenAI-Lilian Weng等：自监督学习与对比学习，105页ppt，

专知会员服务

78+阅读 · 2021年12月10日

Mila唐建博士最新《图神经网络:算法与应用》研究进展，附44页ppt

Mila唐建博士最新《图神经网络:算法与应用》研究进展，附44页ppt

专知会员服务

76+阅读 · 2021年8月11日

【ICML2021】深度架构持续学习，127页ppt

专知会员服务

76+阅读 · 2021年7月21日

【DeepMind】多模态预训练模型概述，37页ppt

【DeepMind】多模态预训练模型概述，37页ppt

专知会员服务

95+阅读 · 2021年7月2日

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

专知会员服务

84+阅读 · 2020年11月27日

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

专知会员服务

66+阅读 · 2020年8月22日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

专知会员服务

68+阅读 · 2020年7月12日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

专知

1+阅读 · 2022年4月19日

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

专知

22+阅读 · 2022年4月12日

OpenAI-Lilian Weng等：自监督学习与对比学习，NeurIPS 2021教程|105页ppt

OpenAI-Lilian Weng等：自监督学习与对比学习，NeurIPS 2021教程|105页ppt

专知

1+阅读 · 2021年12月10日

【ICML2021】基于观察的跨域模仿学习

【ICML2021】基于观察的跨域模仿学习

专知

2+阅读 · 2021年8月30日

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

专知

19+阅读 · 2020年12月17日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

71+阅读 · 2020年2月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

专知

11+阅读 · 2019年7月14日

ICML2019《元学习》教程与必读论文列表

ICML2019《元学习》教程与必读论文列表

专知

42+阅读 · 2019年6月16日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

基于随机有限集的视频目标跟踪算法与应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于锥模型拟牛顿公式的大规模优化方法及其应用

国家自然科学基金

0+阅读 · 2011年12月31日

非负二次函数锥规划研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于谓词规划树的规划方法的研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于损失函数的统计机器学习算法及其应用研究

国家自然科学基金

7+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

自适应动态规划及在城市交通信号优化控制中的应用

国家自然科学基金

0+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

Prompting Decision Transformer for Few-Shot Policy Generalization

Arxiv

5+阅读 · 2022年6月27日

Indecision Trees: Learning Argument-Based Reasoning under Quantified Uncertainty

Arxiv

0+阅读 · 2022年6月23日

Robust Task Scheduling for Heterogeneous Robot Teams under Capability Uncertainty

Arxiv

0+阅读 · 2022年6月22日

A Survey on Uncertainty Reasoning and Quantification for Decision Making: Belief Theory Meets Deep Learning

Arxiv

30+阅读 · 2022年6月12日

Multi-Modal Knowledge Graph Construction and Application: A Survey

Arxiv

79+阅读 · 2022年2月11日

Imitation Learning: Progress, Taxonomies and Opportunities

Arxiv

12+阅读 · 2021年6月23日

Transfer Learning in Deep Reinforcement Learning: A Survey

Transfer Learning in Deep Reinforcement Learning: A Survey

Arxiv

23+阅读 · 2020年9月16日

A Survey of Model Compression and Acceleration for Deep Neural Networks

Arxiv

66+阅读 · 2019年9月8日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

VIP会员

相关主题

相关VIP内容

《机器学习的最优传输》教程，63页PPT

《机器学习的最优传输》教程，63页PPT

专知会员服务

63+阅读 · 2022年4月30日

NeurIPS 2021教程|OpenAI-Lilian Weng等：自监督学习与对比学习，105页ppt，

NeurIPS 2021教程|OpenAI-Lilian Weng等：自监督学习与对比学习，105页ppt，

专知会员服务

78+阅读 · 2021年12月10日

Mila唐建博士最新《图神经网络:算法与应用》研究进展，附44页ppt

Mila唐建博士最新《图神经网络:算法与应用》研究进展，附44页ppt

专知会员服务

76+阅读 · 2021年8月11日

【ICML2021】深度架构持续学习，127页ppt

专知会员服务

76+阅读 · 2021年7月21日

【DeepMind】多模态预训练模型概述，37页ppt

【DeepMind】多模态预训练模型概述，37页ppt

专知会员服务

95+阅读 · 2021年7月2日

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

【清华大学龙明盛副教授】迁移学习理论与算法，59页ppt

专知会员服务

84+阅读 · 2020年11月27日

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

最新《模仿学习 - Imitation Learning》教程，63页ppt，微软Kamil Ciosek

专知会员服务

66+阅读 · 2020年8月22日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

专知会员服务

68+阅读 · 2020年7月12日

最新《生成式对抗网络》简介，25页ppt

最新《生成式对抗网络》简介，25页ppt

专知会员服务

175+阅读 · 2020年6月28日

热门VIP内容

开通专知VIP会员享更多权益服务

基于大语言模型的深度搜索智能体综述：范式、优化、评测与挑战

从社会学实验到行为仿真：理解基于Agent的观点动力学建模思维

【牛津博士论文】无限维空间中的广义变分推断

ACL 2025 | 大模型结构化知识提示的泛化能力研究

相关资讯

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

GNN2022研究进展如何？CMU-Yoon112页PPT《图神经网络导论》，阐述GNN基本概念原理与研究进展，附ppt与视频

专知

1+阅读 · 2022年4月19日

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

什么是多模态ML？CMU-Paul Liang170页PPT讲述《多模态机器学习》，阐述多模态深度学习5大进展，附ppt与视频

专知

22+阅读 · 2022年4月12日

OpenAI-Lilian Weng等：自监督学习与对比学习，NeurIPS 2021教程|105页ppt

OpenAI-Lilian Weng等：自监督学习与对比学习，NeurIPS 2021教程|105页ppt

专知

1+阅读 · 2021年12月10日

【ICML2021】基于观察的跨域模仿学习

【ICML2021】基于观察的跨域模仿学习

专知

2+阅读 · 2021年8月30日

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

专知

19+阅读 · 2020年12月17日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

71+阅读 · 2020年2月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

【ICME2019】智能图像视频编辑，北大教程，400多页PPT

专知

11+阅读 · 2019年7月14日

ICML2019《元学习》教程与必读论文列表

ICML2019《元学习》教程与必读论文列表

专知

42+阅读 · 2019年6月16日

【微软亚研130PPT教程】强化学习简介

【微软亚研130PPT教程】强化学习简介

专知

36+阅读 · 2018年10月26日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

基于随机有限集的视频目标跟踪算法与应用研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于锥模型拟牛顿公式的大规模优化方法及其应用

国家自然科学基金

0+阅读 · 2011年12月31日

非负二次函数锥规划研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于谓词规划树的规划方法的研究

国家自然科学基金

1+阅读 · 2009年12月31日

基于损失函数的统计机器学习算法及其应用研究

国家自然科学基金

7+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

自适应动态规划及在城市交通信号优化控制中的应用

国家自然科学基金

0+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

Prompting Decision Transformer for Few-Shot Policy Generalization

Arxiv

5+阅读 · 2022年6月27日

Indecision Trees: Learning Argument-Based Reasoning under Quantified Uncertainty

Arxiv

0+阅读 · 2022年6月23日

Robust Task Scheduling for Heterogeneous Robot Teams under Capability Uncertainty

Arxiv

0+阅读 · 2022年6月22日

A Survey on Uncertainty Reasoning and Quantification for Decision Making: Belief Theory Meets Deep Learning

Arxiv

30+阅读 · 2022年6月12日

Multi-Modal Knowledge Graph Construction and Application: A Survey

Arxiv

79+阅读 · 2022年2月11日

Imitation Learning: Progress, Taxonomies and Opportunities

Arxiv

12+阅读 · 2021年6月23日

Transfer Learning in Deep Reinforcement Learning: A Survey

Transfer Learning in Deep Reinforcement Learning: A Survey

Arxiv

23+阅读 · 2020年9月16日

A Survey of Model Compression and Acceleration for Deep Neural Networks

Arxiv

66+阅读 · 2019年9月8日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

微信扫码咨询专知VIP会员