基于表征学习的离线强化学习方法研究综述 - 专知VIP

会员服务 ·

14

表征学习 · 离线强化学习 ·

基于表征学习的离线强化学习方法研究综述

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

强化学习 (Reinforcement learning, RL) 通过智能体与环境在线交互来学习最优策略, 近年来已成为解决复杂环境下感知决策问题的重要手段. 然而, 在线收集数据的方式可能会引发安全、时间或成本等问题, 极大限制了强化学习在实际中的应用. 与此同时, 原始数据的维度高且结构复杂, 解决复杂高维数据输入问题也是强化学习面临的一大挑战. 幸运的是, 基于表征学习的离线强化学习能够仅从历史经验数据中学习策略, 而无需与环境产生交互. 它利用表征学习技术将离线数据集中的特征表示为低维向量, 然后利用这些向量来训练离线强化学习模型. 这种数据驱动的方式为实现通用人工智能提供了新契机. 为此, 对近期基于表征学习的离线强化学习方法进行全面综述. 首先给出离线强化学习的形式化描述, 然后从方法、基准数据集、离线策略评估与超参数选择 3 个层面对现有技术进行归纳整理, 进一步介绍离线强化学习在工业、推荐系统、智能驾驶等领域中的研究动态. 最后, 对全文进行总结, 并探讨基于表征学习的离线强化学习未来所面临的关键挑战与发展趋势, 以期为后续的研究提供有益参考.

成为VIP会员查看完整内容

18

相关内容

表征学习

在机器学习中，表征学习或表示学习是允许系统从原始数据中自动发现特征检测或分类所需的表示的一组技术。这取代了手动特征工程，并允许机器学习特征并使用它们执行特定任务。在有监督的表征学习中，使用标记的输入数据来学习特征，包括监督神经网络，多层感知器和（监督）字典学习。在无监督表征学习中，特征是与未标记的输入数据一起学习的，包括字典学习，独立成分分析，自动编码器，矩阵分解和各种形式的聚类。

元强化学习研究综述

元强化学习研究综述

专知会员服务

32+阅读 · 4月23日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

34+阅读 · 2月8日

基于深度学习的类别增量学习算法综述

基于深度学习的类别增量学习算法综述

专知会员服务

38+阅读 · 2023年8月10日

逆强化学习算法、理论与应用研究综述

逆强化学习算法、理论与应用研究综述

专知会员服务

59+阅读 · 2023年8月2日

基于课程学习的深度强化学习研究综述

基于课程学习的深度强化学习研究综述

专知会员服务

55+阅读 · 2022年11月28日

基于通信的多智能体强化学习进展综述

基于通信的多智能体强化学习进展综述

专知会员服务

100+阅读 · 2022年11月12日

结合进化算法的深度强化学习方法研究综述

结合进化算法的深度强化学习方法研究综述

专知会员服务

76+阅读 · 2022年7月16日

个性化学习推荐研究综述

个性化学习推荐研究综述

专知会员服务

58+阅读 · 2022年2月2日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

20+阅读 · 2021年10月9日

多尺度目标检测的深度学习研究综述

专知会员服务

58+阅读 · 2021年5月11日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

25+阅读 · 2022年11月12日

基于模型的强化学习综述

基于模型的强化学习综述

专知

20+阅读 · 2022年7月13日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

46+阅读 · 2022年4月30日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

31+阅读 · 2020年12月10日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

23+阅读 · 2020年8月1日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

11+阅读 · 2020年7月19日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

22+阅读 · 2019年5月19日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

13+阅读 · 2019年2月25日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述

AI研习社

14+阅读 · 2018年4月25日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

38+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

19+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

网络社群嵌入性对众包式创新的作用机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

13+阅读 · 2013年12月31日

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 7月2日

Multifidelity linear regression for scientific machine learning from scarce data

Arxiv

0+阅读 · 7月1日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

144+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

152+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

353+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

103+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

54+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

125+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

41+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

VIP会员

相关主题

离线强化学习

相关VIP内容

元强化学习研究综述

元强化学习研究综述

专知会员服务

32+阅读 · 4月23日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

34+阅读 · 2月8日

基于深度学习的类别增量学习算法综述

基于深度学习的类别增量学习算法综述

专知会员服务

38+阅读 · 2023年8月10日

逆强化学习算法、理论与应用研究综述

逆强化学习算法、理论与应用研究综述

专知会员服务

59+阅读 · 2023年8月2日

基于课程学习的深度强化学习研究综述

基于课程学习的深度强化学习研究综述

专知会员服务

55+阅读 · 2022年11月28日

基于通信的多智能体强化学习进展综述

基于通信的多智能体强化学习进展综述

专知会员服务

100+阅读 · 2022年11月12日

结合进化算法的深度强化学习方法研究综述

结合进化算法的深度强化学习方法研究综述

专知会员服务

76+阅读 · 2022年7月16日

个性化学习推荐研究综述

个性化学习推荐研究综述

专知会员服务

58+阅读 · 2022年2月2日

面向移动增强现实的实时深度学习目标检测方法综述

专知会员服务

20+阅读 · 2021年10月9日

多尺度目标检测的深度学习研究综述

专知会员服务

58+阅读 · 2021年5月11日

热门VIP内容

相关资讯

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

25+阅读 · 2022年11月12日

基于模型的强化学习综述

基于模型的强化学习综述

专知

20+阅读 · 2022年7月13日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

46+阅读 · 2022年4月30日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

31+阅读 · 2020年12月10日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

23+阅读 · 2020年8月1日

实体关系抽取方法研究综述

实体关系抽取方法研究综述

专知

11+阅读 · 2020年7月19日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

22+阅读 · 2019年5月19日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

13+阅读 · 2019年2月25日

多模态多任务学习新论文

多模态多任务学习新论文

专知

46+阅读 · 2019年2月9日

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述

AI研习社

14+阅读 · 2018年4月25日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

38+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

19+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

8+阅读 · 2015年12月31日

网络社群嵌入性对众包式创新的作用机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维不平衡数据的集成学习算法研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向社会化媒体异构大数据的快速组合聚类研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

13+阅读 · 2013年12月31日

相关论文

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

Arxiv

0+阅读 · 7月2日

Multifidelity linear regression for scientific machine learning from scarce data

Arxiv

0+阅读 · 7月1日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

144+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

152+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

353+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

103+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

54+阅读 · 2023年3月29日

Knowledge Graphs: Opportunities and Challenges

Arxiv

125+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

41+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

18+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员