南大本科生NeurIPS论文！俞扬团队首次揭示强化学习「记忆池」最优利用方法

记忆池」是深度强化学习的基本部件，但多年以来如何最优利用记忆池仍然未知。

在刚刚闭幕的机器学习国际顶级会议NeurIPS 2021上，南京大学人工智能学院独立完成的工作「Regret Minimization Experience Replay in Off-Policy Reinforcement Learning」，首次揭示了深度强化学习「记忆池」的最优利用方法。

https://openreview.net/forum?id=5AixAJweEyC

该工作由俞扬教授指导，其共同第一作者，2018级本科生薛正海，是南大人工智能学院的首届本科生。

成为VIP会员查看完整内容

相关内容

NeurIPS 2021

关注 5

【NeurIPS 2021】多视角对比图聚类

专知会员服务

36+阅读 · 2021年10月31日

DeepMind、UCL新课上线，多位科学家携手打造深度强化学习课程

专知会员服务

65+阅读 · 2021年9月11日

【ICML2021】逆约束强化学习

专知会员服务

33+阅读 · 2021年9月7日

多智能体深度强化学习：综述

专知会员服务

170+阅读 · 2021年8月3日

近期必读的五篇 NeurIPS 2020【元学习】相关论文

专知会员服务

28+阅读 · 2020年12月15日

【ICML2020】北大本科生提出基于图到图翻译的分子逆合成预测框架

专知会员服务

15+阅读 · 2020年7月15日

【ICML2020】用于强化学习的对比无监督表示嵌入

专知会员服务

28+阅读 · 2020年7月6日

深度强化学习策略梯度教程，53页ppt

专知会员服务

184+阅读 · 2020年2月1日

周志华教授：如何做研究与写论文？

专知会员服务

159+阅读 · 2019年10月9日

【加州大学伯克利分校博士论文】通过自我监督预测学习泛化

专知会员服务

65+阅读 · 2019年10月9日

B站学强化学习？港中文周博磊变身up主，中文课程已上线

机器之心

18+阅读 · 2020年3月18日

强化学习 DQN 初探之2048

DataFunTalk

7+阅读 · 2019年12月10日

ICLR 2020 高质量强化学习论文汇总

极市平台

12+阅读 · 2019年11月11日

基于逆强化学习的示教学习方法综述

计算机研究与发展

16+阅读 · 2019年2月25日

逆强化学习几篇论文笔记

CreateAMind

9+阅读 · 2018年12月13日

OpenAI官方发布：强化学习中的关键论文

专知

14+阅读 · 2018年12月12日

论强化学习的根本缺陷

AI科技评论

11+阅读 · 2018年7月24日

高考状元出身的“80”后科学家，入选国家杰青，两年发四篇Nature

德先生

4+阅读 · 2018年6月6日

【强化学习】重磅 | 详解深度强化学习，搭建DQN详细指南

产业智能官

41+阅读 · 2017年8月18日

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

Deep Surrogate Q-Learning for Autonomous Driving

Arxiv

1+阅读 · 2022年2月17日

Computational Benefits of Intermediate Rewards for Goal-Reaching Policy Learning

Arxiv

1+阅读 · 2022年2月17日

Return-Based Contrastive Representation Learning for Reinforcement Learning

Arxiv

10+阅读 · 2021年2月22日

Exploration-Exploitation in Multi-Agent Learning: Catastrophe Theory Meets Game Theory

Arxiv

15+阅读 · 2020年12月15日

Robust Graph Neural Network Against Poisoning Attacks via Transfer Learning

Arxiv

6+阅读 · 2019年8月20日

Information-Directed Exploration for Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年12月18日

Hierarchical Deep Multiagent Reinforcement Learning

Arxiv

8+阅读 · 2018年9月25日

Do deep reinforcement learning agents model intentions?

Arxiv

5+阅读 · 2018年5月21日

Variance Reduction Methods for Sublinear Reinforcement Learning

Arxiv

4+阅读 · 2018年4月25日

Eigenoption Discovery through the Deep Successor Representation

Arxiv

3+阅读 · 2018年1月30日

VIP会员