【MIT】准量化强化学习，90页ppt - 专知VIP

会员服务 ·

20

强化学习 ·

2023 年 7 月 16 日

【MIT】准量化强化学习，90页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

在目标达成的强化学习（RL）中，最优价值函数具有特殊的几何形态，被称为准度量结构（也可参见这些工作）。本论文介绍了准度量强化学习（QRL），这是一种新的RL方法，利用准度量模型来学习最优价值函数。与先前的方法不同，QRL的目标特别为准度量设计，并提供强大的理论恢复保证。在实证方面，我们在离散化的MountainCar环境中进行了深入的分析，识别了QRL的属性及其相对于其他选择的优势。在离线和在线的目标达成基准测试中，无论是基于状态的还是基于图像的观察，QRL也展示了改善的样本效率和性能。

成为VIP会员查看完整内容

37

相关内容

最新《强化学习导论》教程，32页pdf

最新《强化学习导论》教程，32页pdf

专知会员服务

58+阅读 · 2023年4月5日

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知会员服务

95+阅读 · 2022年11月16日

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知会员服务

91+阅读 · 2022年9月16日

【经典书】贝叶斯强化学习概述，147页pdf

【经典书】贝叶斯强化学习概述，147页pdf

专知会员服务

114+阅读 · 2021年11月21日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

78+阅读 · 2021年7月23日

【SIGIR2021】自然语言处理图深度学习，230页ppt

【SIGIR2021】自然语言处理图深度学习，230页ppt

专知会员服务

95+阅读 · 2021年7月23日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

【普林斯顿】机器学习数学视角，63页ppt

【普林斯顿】机器学习数学视角，63页ppt

专知会员服务

88+阅读 · 2020年11月6日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

47+阅读 · 2020年10月26日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知

1+阅读 · 2022年11月16日

【干货书】高维统计概论，361页pdf

【干货书】高维统计概论，361页pdf

专知

7+阅读 · 2022年10月29日

【COLING2022教程】面向自然语言处理的知识图谱嵌入:从理论到实践，80页ppt

【COLING2022教程】面向自然语言处理的知识图谱嵌入:从理论到实践，80页ppt

专知

2+阅读 · 2022年10月16日

【简明章节书】图神经网络分子建模，67页pdf

【简明章节书】图神经网络分子建模，67页pdf

专知

2+阅读 · 2022年10月11日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

【KDD2022教程】多模态自动机器学习教程，130页ppt

【KDD2022教程】多模态自动机器学习教程，130页ppt

专知

2+阅读 · 2022年8月19日

【DeepMind】结构化数据少样本学习，51页ppt

【DeepMind】结构化数据少样本学习，51页ppt

专知

1+阅读 · 2022年8月15日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

15+阅读 · 2020年12月9日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

63+阅读 · 2020年8月31日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多组分格子波尔兹曼方法的数值分析

国家自然科学基金

0+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Gadget construction and structural convergence

Arxiv

0+阅读 · 2023年9月6日

JAX-DIPS: Neural bootstrapping of finite discretization methods and application to elliptic problems with discontinuities

Arxiv

0+阅读 · 2023年9月4日

Denture reinforcement via topology optimization

Arxiv

0+阅读 · 2023年9月1日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

101+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

213+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

472+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

VIP会员

相关主题

相关VIP内容

最新《强化学习导论》教程，32页pdf

最新《强化学习导论》教程，32页pdf

专知会员服务

58+阅读 · 2023年4月5日

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知会员服务

95+阅读 · 2022年11月16日

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知会员服务

91+阅读 · 2022年9月16日

【经典书】贝叶斯强化学习概述，147页pdf

【经典书】贝叶斯强化学习概述，147页pdf

专知会员服务

114+阅读 · 2021年11月21日

【ICML2021-教程】无监督强化学习，285页ppt

专知会员服务

78+阅读 · 2021年7月23日

【SIGIR2021】自然语言处理图深度学习，230页ppt

【SIGIR2021】自然语言处理图深度学习，230页ppt

专知会员服务

95+阅读 · 2021年7月23日

【UMASS博士论文】几何表示学习，162页pdf

专知会员服务

65+阅读 · 2021年4月11日

【普林斯顿】机器学习数学视角，63页ppt

【普林斯顿】机器学习数学视角，63页ppt

专知会员服务

88+阅读 · 2020年11月6日

【ICML2020】强化学习中基于模型的方法，279页ppt

【ICML2020】强化学习中基于模型的方法，279页ppt

专知会员服务

47+阅读 · 2020年10月26日

【ICML2020Tutorial】机器学习信号处理，100页ppt

【ICML2020Tutorial】机器学习信号处理，100页ppt

专知会员服务

113+阅读 · 2020年8月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《电磁（电子）战：英国能力》最新32页报告

《美军条令：斯特赖克步兵步枪排与班作战条令》最新450页

《美海军分布式海上作战（DMO）概念：最新情况》

《跨时空与跨模态学习事件模式构建体系（LESTAT）》57页DARPA研究报告

相关资讯

【简明书】强化学习的基础，111页pdf

【简明书】强化学习的基础，111页pdf

专知

1+阅读 · 2022年11月16日

【干货书】高维统计概论，361页pdf

【干货书】高维统计概论，361页pdf

专知

7+阅读 · 2022年10月29日

【COLING2022教程】面向自然语言处理的知识图谱嵌入:从理论到实践，80页ppt

【COLING2022教程】面向自然语言处理的知识图谱嵌入:从理论到实践，80页ppt

专知

2+阅读 · 2022年10月16日

【简明章节书】图神经网络分子建模，67页pdf

【简明章节书】图神经网络分子建模，67页pdf

专知

2+阅读 · 2022年10月11日

【NeurIPS2022】分布式自适应元强化学习

【NeurIPS2022】分布式自适应元强化学习

专知

3+阅读 · 2022年10月8日

【干货书】凸随机优化，320页pdf

【干货书】凸随机优化，320页pdf

专知

12+阅读 · 2022年9月16日

【KDD2022教程】多模态自动机器学习教程，130页ppt

【KDD2022教程】多模态自动机器学习教程，130页ppt

专知

2+阅读 · 2022年8月19日

【DeepMind】结构化数据少样本学习，51页ppt

【DeepMind】结构化数据少样本学习，51页ppt

专知

1+阅读 · 2022年8月15日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

15+阅读 · 2020年12月9日

【干货书】计算机科学离散数学，627页pdf

【干货书】计算机科学离散数学，627页pdf

专知

63+阅读 · 2020年8月31日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

44+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多组分格子波尔兹曼方法的数值分析

国家自然科学基金

0+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Gadget construction and structural convergence

Arxiv

0+阅读 · 2023年9月6日

JAX-DIPS: Neural bootstrapping of finite discretization methods and application to elliptic problems with discontinuities

Arxiv

0+阅读 · 2023年9月4日

Denture reinforcement via topology optimization

Arxiv

0+阅读 · 2023年9月1日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

101+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

213+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

472+阅读 · 2023年3月31日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

A survey and taxonomy of loss functions in machine learning

Arxiv

25+阅读 · 2023年1月13日

Geometric multimodal representation learning

Arxiv

69+阅读 · 2022年9月7日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

微信扫码咨询专知VIP会员