【清华大学李升波教授】2023年《强化学习与控制》课程，RL概述（强烈推荐） - 专知VIP

会员服务 ·

41

强化学习 · 课程 · 李升波 ·

2023 年 4 月 26 日

【清华大学李升波教授】2023年《强化学习与控制》课程，RL概述（强烈推荐）

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

【前言】人工智能的快速崛起正重塑人类社会的各个领域，有望引导工业文明进入新一轮革命浪潮。以道路交通为例，汽车的智能化变革促使整个行业发生了翻天覆地的变化，包括驾驶辅助、自动驾驶、云控协同等一系列新技术如雨后春笋般涌现，它们在提升地面车辆行驶性能的同时，也为解决交通事故、排放污染、城市拥堵等问题提供了一条可行的途径。以模仿人类大脑学习机制为原理的强化学习（Reinforcement Learning）正迅速进入人们的视野，它为大规模复杂系统的学习及动态系统的高实时在线控制提供了一套极具前景的解决方案。一个引人注目的成功案例是以Alpha Go为代表的围棋智能：它利用深度强化学习算法实现围棋智能的自我进化，自我超越，打败人类最好的专业棋手。尽管强化学习具有优异的潜在优势，但是该方法的工程应用尚属于起步阶段。

课程共包括11讲。

第1讲介绍RL概况，包括发展历史、知名学者、典型应用以及主要挑战等。第2讲介绍RL的基础知识，包括定义概念、自洽条件、最优性原理问题架构等。第3讲介绍免模型学习的蒙特卡洛法，包括Monte Carlo估计，On-policy/off-policy，重要性采样等。第4讲介绍免模型学习的时序差分法，包括它衍生的Sarsa，Q-learning，Expected Sarsa等算法。第5讲介绍带模型学习的动态规划法，包括策略迭代、值迭代、收敛性原理等。第6讲介绍间接型RL的函数近似方法，包括常用近似函数，值函数近似，策略函数近似以及所衍生的Actor-critic架构等。第7讲介绍直接型RL的策略梯度法，包括各类Policy Gradient, 以及如何从优化的观点看待RL等。第8讲介绍深度强化学习，即以神经网络为载体的RL，包括深度化典型挑战、经验性处理技巧等。第9讲介绍带模型的强化学习，即近似动态规划，尤其是离散时间系统的ADP，无穷时域ADP与有限时域ADP，以及ADP与MPC的关联分析等。第10讲介绍了状态约束的处理手段以及它与可行性之间的关系，讲述了安全保障的基本机制与训练策略。第11讲介绍RL的各类拾遗，包括POMDP、鲁棒性、多智能体、元学习、逆强化学习以及训练平台等。

成为VIP会员查看完整内容

71

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

基于课程学习的深度强化学习研究综述

基于课程学习的深度强化学习研究综述

专知会员服务

58+阅读 · 2022年11月28日

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

专知会员服务

65+阅读 · 2021年9月11日

南京大学《高级机器学习》课程，李宇峰老师，附slides

南京大学《高级机器学习》课程，李宇峰老师，附slides

专知会员服务

170+阅读 · 2021年8月24日

【重磅推荐】清华大学李升波老师《强化学习与控制》

专知会员服务

100+阅读 · 2021年7月11日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

116+阅读 · 2021年1月1日

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

【波士顿大学Francesco Orabona】在线学习导论介绍，126页pdf

【波士顿大学Francesco Orabona】在线学习导论介绍，126页pdf

专知会员服务

39+阅读 · 2020年1月2日

神经网络与深度学习，复旦大学邱锡鹏老师

神经网络与深度学习，复旦大学邱锡鹏老师

专知会员服务

121+阅读 · 2019年9月24日

清华李升波教授：强化学习，让自动驾驶汽车自我进化，越开越好

清华李升波教授：强化学习，让自动驾驶汽车自我进化，越开越好

THU数据派

1+阅读 · 2022年7月29日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

【干货】强化学习介绍

【干货】强化学习介绍

人工智能学家

13+阅读 · 2018年6月24日

【教程实战】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记以及实战代码完整版

【教程实战】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记以及实战代码完整版

机器学习研究会

13+阅读 · 2017年10月31日

【David Silver 深度强化学习教程代码实战07】 DQN的实现

【David Silver 深度强化学习教程代码实战07】 DQN的实现

专知

17+阅读 · 2017年10月29日

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

专知

10+阅读 · 2017年10月21日

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

专知

17+阅读 · 2017年10月20日

《重磅消息》深度强化学习入门及进阶课程第二期开课啦

《重磅消息》深度强化学习入门及进阶课程第二期开课啦

深度学习与NLP

17+阅读 · 2017年9月4日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

四轮独立转向-独立驱动车辆转向模式动态切换原理与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

车辆动力学特性和路口交通信号影响下的车辆动态路径规划研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于强化学习与均衡决策的物联网不确定环境路由选择策略研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于监督式ADP的汽车智能巡航控制

国家自然科学基金

1+阅读 · 2012年12月31日

一类欠驱动多智能体编队系统非线性建模与鲁棒稳定控制机理研究

国家自然科学基金

0+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

专用道优先控制与公交调度协调优化方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

TreeDQN: Learning to minimize Branch-and-Bound tree

Arxiv

0+阅读 · 2023年6月9日

Robust Subtask Learning for Compositional Generalization

Arxiv

0+阅读 · 2023年6月8日

Decision S4: Efficient Sequence-Based RL via State Spaces Layers

Arxiv

0+阅读 · 2023年6月8日

Fairness-Sensitive Policy-Gradient Reinforcement Learning for Reducing Bias in Robotic Assistance

Arxiv

0+阅读 · 2023年6月7日

Reinforcement Learning-Based Control of CrazyFlie 2.X Quadrotor

Arxiv

0+阅读 · 2023年6月6日

Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

Arxiv

34+阅读 · 2022年6月30日

Multi-Task Learning for Visual Scene Understanding

Arxiv

29+阅读 · 2022年3月28日

Reinforcement Learning based Air Combat Maneuver Generation

Reinforcement Learning based Air Combat Maneuver Generation

Arxiv

91+阅读 · 2022年1月14日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

A Deep Reinforcement Learning Chatbot (Short Version)

Arxiv

13+阅读 · 2018年1月20日

VIP会员

相关主题

相关VIP内容

基于课程学习的深度强化学习研究综述

基于课程学习的深度强化学习研究综述

专知会员服务

58+阅读 · 2022年11月28日

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

131+阅读 · 2022年2月27日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

专知会员服务

65+阅读 · 2021年9月11日

南京大学《高级机器学习》课程，李宇峰老师，附slides

南京大学《高级机器学习》课程，李宇峰老师，附slides

专知会员服务

170+阅读 · 2021年8月24日

【重磅推荐】清华大学李升波老师《强化学习与控制》

专知会员服务

100+阅读 · 2021年7月11日

多Agent深度强化学习综述(中文版)，21页pdf

专知会员服务

116+阅读 · 2021年1月1日

强化学习算法与应用综述(中文版)， 13页pdf

专知会员服务

118+阅读 · 2020年12月17日

【波士顿大学Francesco Orabona】在线学习导论介绍，126页pdf

【波士顿大学Francesco Orabona】在线学习导论介绍，126页pdf

专知会员服务

39+阅读 · 2020年1月2日

神经网络与深度学习，复旦大学邱锡鹏老师

神经网络与深度学习，复旦大学邱锡鹏老师

专知会员服务

121+阅读 · 2019年9月24日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

清华李升波教授：强化学习，让自动驾驶汽车自我进化，越开越好

清华李升波教授：强化学习，让自动驾驶汽车自我进化，越开越好

THU数据派

1+阅读 · 2022年7月29日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

【干货】强化学习介绍

【干货】强化学习介绍

人工智能学家

13+阅读 · 2018年6月24日

【教程实战】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记以及实战代码完整版

【教程实战】Google DeepMind David Silver《深度强化学习》公开课教程学习笔记以及实战代码完整版

机器学习研究会

13+阅读 · 2017年10月31日

【David Silver 深度强化学习教程代码实战07】 DQN的实现

【David Silver 深度强化学习教程代码实战07】 DQN的实现

专知

17+阅读 · 2017年10月29日

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

【AlphaGo核心技术-教程学习笔记02】深度强化学习第二讲马尔科夫决策过程

专知

10+阅读 · 2017年10月21日

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

专知

17+阅读 · 2017年10月20日

《重磅消息》深度强化学习入门及进阶课程第二期开课啦

《重磅消息》深度强化学习入门及进阶课程第二期开课啦

深度学习与NLP

17+阅读 · 2017年9月4日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

四轮独立转向-独立驱动车辆转向模式动态切换原理与方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

车辆动力学特性和路口交通信号影响下的车辆动态路径规划研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于强化学习与均衡决策的物联网不确定环境路由选择策略研究

国家自然科学基金

4+阅读 · 2013年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

基于监督式ADP的汽车智能巡航控制

国家自然科学基金

1+阅读 · 2012年12月31日

一类欠驱动多智能体编队系统非线性建模与鲁棒稳定控制机理研究

国家自然科学基金

0+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

专用道优先控制与公交调度协调优化方法研究

国家自然科学基金

0+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

11+阅读 · 2008年12月31日

相关论文

TreeDQN: Learning to minimize Branch-and-Bound tree

Arxiv

0+阅读 · 2023年6月9日

Robust Subtask Learning for Compositional Generalization

Arxiv

0+阅读 · 2023年6月8日

Decision S4: Efficient Sequence-Based RL via State Spaces Layers

Arxiv

0+阅读 · 2023年6月8日

Fairness-Sensitive Policy-Gradient Reinforcement Learning for Reducing Bias in Robotic Assistance

Arxiv

0+阅读 · 2023年6月7日

Reinforcement Learning-Based Control of CrazyFlie 2.X Quadrotor

Arxiv

0+阅读 · 2023年6月6日

Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning

Arxiv

34+阅读 · 2022年6月30日

Multi-Task Learning for Visual Scene Understanding

Arxiv

29+阅读 · 2022年3月28日

Reinforcement Learning based Air Combat Maneuver Generation

Reinforcement Learning based Air Combat Maneuver Generation

Arxiv

91+阅读 · 2022年1月14日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

A Deep Reinforcement Learning Chatbot (Short Version)

Arxiv

13+阅读 · 2018年1月20日

微信扫码咨询专知VIP会员