《强化学习最新进展与神经科学应用》，DeepMind Kimberly Stachenfeld讲授，86页Slides - 专知VIP

会员服务 ·

18

强化学习 · 神经科学 · DeepMind ·

2023 年 3 月 11 日

《强化学习最新进展与神经科学应用》，DeepMind Kimberly Stachenfeld讲授，86页Slides

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在本教程的第一部分中，我们将概述强化学习中的关键概念，涵盖神经科学和机器学习中的RL的历史。我们将从早期的奖励动机行为的基本模型开始，因为它们应用于动物和机器学习。我们将讨论这些模型如何通过与丰富的特征和结构化世界模型的接口变得更加丰富，以及这些方法如何应用于复杂行为的分析和神经计算。**最后，我们将讨论这些想法如何在深度RL中最先进的方法中体现出来。**在本教程的后半部分，我们将进行一个编码练习，对RL智能体进行编码，并提取激活值，以与神经活动进行比较。

Kimberly Stachenfeld是DeepMind的研究科学家。她的研究涵盖了计算神经科学和机器学习的主题，并专注于如何学习结构化的、具有表现力的世界模型的一般问题，以实现灵活的推理。在机器学习中，她对使用图神经网络学习的前向模型的方法和应用特别感兴趣，在神经科学中，她主要研究高效、可扩展的强化学习的海马体表示数学模型。她于2018年获得普林斯顿大学计算神经科学博士学位，以及学士/学士学位2013年毕业于塔夫茨大学数学/化学和生物工程专业。

成为VIP会员查看完整内容

37

相关内容

强化学习

强化学习（RL）是机器学习的一个领域，与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外，强化学习是三种基本的机器学习范式之一。强化学习与监督学习的不同之处在于，不需要呈现带标签的输入/输出对，也不需要显式纠正次优动作。相反，重点是在探索（未知领域）和利用（当前知识）之间找到平衡。该环境通常以马尔可夫决策过程（MDP）的形式陈述，因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于，后者不假设MDP的确切数学模型，并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【多智能体学习】DeepMind教程，231页PPT

【多智能体学习】DeepMind教程，231页PPT

专知会员服务

128+阅读 · 2022年3月25日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

专知会员服务

86+阅读 · 2021年1月2日

【重磅】图神经网络新书《图表示学习》，140页pdf，William L. Hamilton-McGill University

【重磅】图神经网络新书《图表示学习》，140页pdf，William L. Hamilton-McGill University

专知会员服务

223+阅读 · 2020年8月23日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

专知会员服务

68+阅读 · 2020年7月12日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

111+阅读 · 2020年5月15日

【麻省理工学院课程】MIT 6.S191：Introduction to Deep Learning , 深度学习导论,NSF研究员Alexander Amini

【麻省理工学院课程】MIT 6.S191：Introduction to Deep Learning , 深度学习导论,NSF研究员Alexander Amini

专知会员服务

34+阅读 · 2019年11月2日

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

图与推荐

1+阅读 · 2022年8月29日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知

1+阅读 · 2022年8月10日

最新819页pdf《动⼿学深度学习》2022版本

最新819页pdf《动⼿学深度学习》2022版本

专知

5+阅读 · 2022年8月4日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

专知

13+阅读 · 2020年6月24日

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

四阶微分方程的谱和谱元方法

国家自然科学基金

0+阅读 · 2014年12月31日

关于金融高频数据的统计推断

国家自然科学基金

5+阅读 · 2013年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

抑郁症模型小鼠多种神经递质在神经环路中的相互作用机制

国家自然科学基金

0+阅读 · 2012年12月31日

视觉系统学习和适应的计算模型

国家自然科学基金

1+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

IER2在肝癌转移中的作用机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

具有复杂拓扑的几何连续样条曲面构造方法及其应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

人类视觉关于图像质量感知模型的研究

国家自然科学基金

0+阅读 · 2009年12月31日

氟西汀对抑郁模型大鼠S100B介导的信号通路ERK-NFkB的影响

国家自然科学基金

0+阅读 · 2009年12月31日

FIREBALL: A Dataset of Dungeons and Dragons Actual-Play with Structured Game State Information

Arxiv

1+阅读 · 2023年5月2日

A Survey of Methods for Converting Unstructured Data to CSG Models

Arxiv

0+阅读 · 2023年5月2日

Representations and Exploration for Deep Reinforcement Learning using Singular Value Decomposition

Arxiv

0+阅读 · 2023年5月1日

Directed hypergraph connectivity augmentation by hyperarc reorientations

Arxiv

0+阅读 · 2023年4月28日

Adversarial Policy Optimization in Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年4月27日

Adversary Aware Continual Learning

Arxiv

0+阅读 · 2023年4月27日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

475+阅读 · 2023年3月31日

How to represent part-whole hierarchies in a neural network

Arxiv

13+阅读 · 2021年2月25日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

VIP会员

相关主题

相关VIP内容

【多智能体学习】DeepMind教程，231页PPT

【多智能体学习】DeepMind教程，231页PPT

专知会员服务

128+阅读 · 2022年3月25日

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

要上手RL？406页《深度强化学习》2022新书，Leiden大学Aske Plaat教授主讲

专知会员服务

132+阅读 · 2022年1月11日

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

《强化学习导论》经典课程10讲，DeepMind大神David Silver主讲

专知会员服务

86+阅读 · 2021年1月2日

【重磅】图神经网络新书《图表示学习》，140页pdf，William L. Hamilton-McGill University

【重磅】图神经网络新书《图表示学习》，140页pdf，William L. Hamilton-McGill University

专知会员服务

223+阅读 · 2020年8月23日

【DeepMind】强化学习教程，83页ppt

【DeepMind】强化学习教程，83页ppt

专知会员服务

158+阅读 · 2020年8月7日

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

【MLSS2020】最新《深度强化学习》教程，165页ppt与视频，Mila Doina Precup

专知会员服务

68+阅读 · 2020年7月12日

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

【DeepMind硬核课】深度学习计算机视觉前沿进展，附124页ppt

专知会员服务

168+阅读 · 2020年6月30日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

Fariz Darari简明《博弈论Game Theory》介绍，35页ppt

专知会员服务

111+阅读 · 2020年5月15日

【麻省理工学院课程】MIT 6.S191：Introduction to Deep Learning , 深度学习导论,NSF研究员Alexander Amini

【麻省理工学院课程】MIT 6.S191：Introduction to Deep Learning , 深度学习导论,NSF研究员Alexander Amini

专知会员服务

34+阅读 · 2019年11月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《美陆军徒步机动作战条令手册》最新168页

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

军事后勤数字化未来展望

《美海军后勤体系整合与创新挑战》最新报告

相关资讯

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知

0+阅读 · 2022年11月2日

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

牛津Bronstein | 图机器学习的研究趋势？123页ppt+视频

图与推荐

1+阅读 · 2022年8月29日

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

图机器学习趋势？123页ppt《几何深度学习》教程，牛津大学教授Michael Bronstein主讲，附视频

专知

1+阅读 · 2022年8月10日

最新819页pdf《动⼿学深度学习》2022版本

最新819页pdf《动⼿学深度学习》2022版本

专知

5+阅读 · 2022年8月4日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

专知

13+阅读 · 2020年6月24日

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

《深度无监督学习》伯克利Pieter Abbeel新开课程（含视频PPT）

专知

21+阅读 · 2019年2月19日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

相关基金

四阶微分方程的谱和谱元方法

国家自然科学基金

0+阅读 · 2014年12月31日

关于金融高频数据的统计推断

国家自然科学基金

5+阅读 · 2013年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

抑郁症模型小鼠多种神经递质在神经环路中的相互作用机制

国家自然科学基金

0+阅读 · 2012年12月31日

视觉系统学习和适应的计算模型

国家自然科学基金

1+阅读 · 2012年12月31日

基于事件的强化学习及其在群机器人优化控制中的应用

国家自然科学基金

3+阅读 · 2012年12月31日

IER2在肝癌转移中的作用机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

具有复杂拓扑的几何连续样条曲面构造方法及其应用研究

国家自然科学基金

0+阅读 · 2009年12月31日

人类视觉关于图像质量感知模型的研究

国家自然科学基金

0+阅读 · 2009年12月31日

氟西汀对抑郁模型大鼠S100B介导的信号通路ERK-NFkB的影响

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

FIREBALL: A Dataset of Dungeons and Dragons Actual-Play with Structured Game State Information

Arxiv

1+阅读 · 2023年5月2日

A Survey of Methods for Converting Unstructured Data to CSG Models

Arxiv

0+阅读 · 2023年5月2日

Representations and Exploration for Deep Reinforcement Learning using Singular Value Decomposition

Arxiv

0+阅读 · 2023年5月1日

Directed hypergraph connectivity augmentation by hyperarc reorientations

Arxiv

0+阅读 · 2023年4月28日

Adversarial Policy Optimization in Deep Reinforcement Learning

Arxiv

0+阅读 · 2023年4月27日

Adversary Aware Continual Learning

Arxiv

0+阅读 · 2023年4月27日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

475+阅读 · 2023年3月31日

How to represent part-whole hierarchies in a neural network

Arxiv

13+阅读 · 2021年2月25日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Event Extraction with Generative Adversarial Imitation Learning

Arxiv

13+阅读 · 2018年4月21日

微信扫码咨询专知VIP会员