斯坦福最新《强化学习》2023课程，Emma Brunskill主讲，附PPT下载 - 专知VIP

会员服务 ·

15

强化学习 · 课程 · 斯坦福大学 (Stanford University) ·

2023 年 1 月 17 日

斯坦福最新《强化学习》2023课程，Emma Brunskill主讲，附PPT下载

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

要实现人工智能的梦想，就需要学会做出正确决策的自主系统。**强化学习是这样做的一个强大范式，它与大量的任务相关，包括机器人、游戏、消费者建模和医疗保健。**本课程将提供强化学习领域的充实介绍，学生将学习强化学习的核心挑战和方法，包括推广和探索。通过讲课、书面作业和编码作业的结合，学生将学习RL的关键思想和技术。作业将包括强化学习的基础知识以及深度强化学习——一个结合了深度学习技术和强化学习的极具前景的新领域。

地址：

https://web.stanford.edu/class/cs234/

学生能够学习到：

定义强化学习与人工智能和非交互式机器学习的区别的关键特征。 * 给定一个应用问题(例如，计算机视觉，机器人等)，决定它是否应该被表述为RL问题;如果是，可以正式定义它(根据状态空间，行动空间，动态和奖励模型)，说明什么算法(从类)是最适合解决它，并证明你的答案。 * 在代码中实现通用的RL算法。 * 描述(列出和定义)分析RL算法的多种标准，并根据这些指标评估算法:例如遗憾度、样本复杂度、计算复杂度、经验性能、收敛性等。 * 描述探索与开发的挑战，并对至少两种解决这一挑战的方法进行比较和对比(从性能、可伸缩性、实现的复杂性和理论保证方面)。

内容目录：

Introduction to Reinforcement Learning * Tabular MDP planning * Tabular RL policy evaluation * Q-learning * RL with function approximation * Policy search * Exploration * Exploration / Exploitation * Batch Reinforcement Learning * Monte Carlo Tree Search

成为VIP会员查看完整内容

45

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

132+阅读 · 2022年2月27日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

77+阅读 · 2021年1月23日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【斯坦福大牛Chelsea Finn2020新课】深度多任务和元学习，附课程PPT下载

专知会员服务

56+阅读 · 2020年10月24日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

【课程】伯克利2019全栈深度学习课程（附下载）

【课程】伯克利2019全栈深度学习课程（附下载）

专知会员服务

57+阅读 · 2019年10月29日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

麻省理工2019年深度学习导论课程全套PPT

麻省理工2019年深度学习导论课程全套PPT

专知

14+阅读 · 2019年2月15日

腊月廿八 | 强化学习-TRPO和PPO背后的数学

腊月廿八 | 强化学习-TRPO和PPO背后的数学

AI研习社

18+阅读 · 2019年2月2日

CMU 邢波教授2019春季《概率图模型》课程开讲，带你学习PGM（含讲义PPT及视频）

CMU 邢波教授2019春季《概率图模型》课程开讲，带你学习PGM（含讲义PPT及视频）

专知

51+阅读 · 2019年1月25日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

重磅 | 经典教材 R. Sutton《增强学习导论》最新版（548PDF）

重磅 | 经典教材 R. Sutton《增强学习导论》最新版（548PDF）

新智元

10+阅读 · 2018年4月1日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

【强化学习】易忽略的强化学习知识之基础知识及MDP

【强化学习】易忽略的强化学习知识之基础知识及MDP

产业智能官

19+阅读 · 2017年12月22日

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

专知

17+阅读 · 2017年10月20日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于认知学习的智能机器人控制系统关键问题的研究

国家自然科学基金

7+阅读 · 2014年12月31日

复杂过程报警系统建模与优化

国家自然科学基金

0+阅读 · 2014年12月31日

基于元任务的数控机床运行动态可靠性评估技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

动态环境下基于概率图模型的机器人地点识别及实时语义地图构建新方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于移动网络挖掘的多维群体行为模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

仿驾驶员轨迹决策行为的无人驾驶车辆局部路径规划

国家自然科学基金

2+阅读 · 2008年12月31日

Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning

Arxiv

0+阅读 · 2023年3月8日

Latent Variable Representation for Reinforcement Learning

Arxiv

0+阅读 · 2023年3月7日

A Deep Reinforcement Learning Approach for Finding Non-Exploitable Strategies in Two-Player Atari Games

Arxiv

0+阅读 · 2023年3月7日

Evolutionary Reinforcement Learning: A Survey

Arxiv

0+阅读 · 2023年3月7日

A Survey of Meta-Reinforcement Learning

Arxiv

12+阅读 · 2023年1月19日

Deep Reinforcement Learning for Multi-Agent Interaction

Arxiv

46+阅读 · 2022年8月2日

Introduction to Online Convex Optimization

Arxiv

23+阅读 · 2021年12月19日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

A Deep Reinforcement Learning Chatbot (Short Version)

Arxiv

13+阅读 · 2018年1月20日

VIP会员

相关主题

斯坦福大学 (Stanford University)

相关VIP内容

斯坦福大学最新【强化学习】2022课程，含ppt

斯坦福大学最新【强化学习】2022课程，含ppt

专知会员服务

132+阅读 · 2022年2月27日

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

不可错过！「强化学习导论」多伦多大学2021课程，附SLIDES与140页pdf

专知会员服务

67+阅读 · 2021年3月24日

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

斯坦福最新《强化学习》2021课程，Emma Brunskill主讲，附PPT下载

专知会员服务

77+阅读 · 2021年1月23日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

48+阅读 · 2020年10月26日

【斯坦福大牛Chelsea Finn2020新课】深度多任务和元学习，附课程PPT下载

专知会员服务

56+阅读 · 2020年10月24日

深度强化学习策略梯度教程，53页ppt

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

【斯坦福新课】CS234：强化学习，附课程PPT下载

【斯坦福新课】CS234：强化学习，附课程PPT下载

专知会员服务

124+阅读 · 2020年1月15日

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

【南洋理工大学课程】deep_reinforcement_learning（深度强化学习），109页ppt

专知会员服务

105+阅读 · 2019年11月2日

【课程】伯克利2019全栈深度学习课程（附下载）

【课程】伯克利2019全栈深度学习课程（附下载）

专知会员服务

57+阅读 · 2019年10月29日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体化人工智能：架构、应用及未来发展方向的综合综述

《自主武器》365页书籍

联邦学习综述：多层次聚合技术的系统分类、实验洞察与未来前沿

人工智能在空战中的局限及其真正适用领域

相关资讯

B站学强化学习？港中文周博磊变身up主，中文课程已上线

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

麻省理工2019年深度学习导论课程全套PPT

麻省理工2019年深度学习导论课程全套PPT

专知

14+阅读 · 2019年2月15日

腊月廿八 | 强化学习-TRPO和PPO背后的数学

腊月廿八 | 强化学习-TRPO和PPO背后的数学

AI研习社

18+阅读 · 2019年2月2日

CMU 邢波教授2019春季《概率图模型》课程开讲，带你学习PGM（含讲义PPT及视频）

CMU 邢波教授2019春季《概率图模型》课程开讲，带你学习PGM（含讲义PPT及视频）

专知

51+阅读 · 2019年1月25日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

资源 | UC Berkeley CS 294深度强化学习课程（附视频、学习资料）

数据派THU

21+阅读 · 2018年4月7日

重磅 | 经典教材 R. Sutton《增强学习导论》最新版（548PDF）

重磅 | 经典教材 R. Sutton《增强学习导论》最新版（548PDF）

新智元

10+阅读 · 2018年4月1日

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

2018斯坦福CS 20深度学习Tensorflow实战课程（附PPT下载）

专知

28+阅读 · 2018年1月13日

【强化学习】易忽略的强化学习知识之基础知识及MDP

【强化学习】易忽略的强化学习知识之基础知识及MDP

产业智能官

19+阅读 · 2017年12月22日

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

【DRL教程学习笔记01】AlphaGo Zero核心技术- 深度强化学习简介

专知

17+阅读 · 2017年10月20日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

41+阅读 · 2015年12月31日

基于认知学习的智能机器人控制系统关键问题的研究

国家自然科学基金

7+阅读 · 2014年12月31日

复杂过程报警系统建模与优化

国家自然科学基金

0+阅读 · 2014年12月31日

基于元任务的数控机床运行动态可靠性评估技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

动态环境下基于概率图模型的机器人地点识别及实时语义地图构建新方法

国家自然科学基金

0+阅读 · 2012年12月31日

基于移动网络挖掘的多维群体行为模型研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于数据驱动的中文自然语言生成关键技术研究

国家自然科学基金

7+阅读 · 2012年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

仿驾驶员轨迹决策行为的无人驾驶车辆局部路径规划

国家自然科学基金

2+阅读 · 2008年12月31日

相关论文

Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning

Arxiv

0+阅读 · 2023年3月8日

Latent Variable Representation for Reinforcement Learning

Arxiv

0+阅读 · 2023年3月7日

A Deep Reinforcement Learning Approach for Finding Non-Exploitable Strategies in Two-Player Atari Games

Arxiv

0+阅读 · 2023年3月7日

Evolutionary Reinforcement Learning: A Survey

Arxiv

0+阅读 · 2023年3月7日

A Survey of Meta-Reinforcement Learning

Arxiv

12+阅读 · 2023年1月19日

Deep Reinforcement Learning for Multi-Agent Interaction

Arxiv

46+阅读 · 2022年8月2日

Introduction to Online Convex Optimization

Arxiv

23+阅读 · 2021年12月19日

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Q-value Path Decomposition for Deep Multiagent Reinforcement Learning

Arxiv

26+阅读 · 2020年2月10日

Deep Reinforcement Learning: An Overview

Deep Reinforcement Learning: An Overview

Arxiv

17+阅读 · 2018年11月26日

A Deep Reinforcement Learning Chatbot (Short Version)

Arxiv

13+阅读 · 2018年1月20日

微信扫码咨询专知VIP会员