强化学习 (Reinforcement learning, RL) 通过智能体与环境在线交互来学习最优策略, 近年来已成为解决复杂环 境下感知决策问题的重要手段. 然而, 在线收集数据的方式可能会引发安全、时间或成本等问题, 极大限制了强化学习在实 际中的应用. 与此同时, 原始数据的维度高且结构复杂, 解决复杂高维数据输入问题也是强化学习面临的一大挑战. 幸运的 是, 基于表征学习的离线强化学习能够仅从历史经验数据中学习策略, 而无需与环境产生交互. 它利用表征学习技术将离线 数据集中的特征表示为低维向量, 然后利用这些向量来训练离线强化学习模型. 这种数据驱动的方式为实现通用人工智能 提供了新契机. 为此, 对近期基于表征学习的离线强化学习方法进行全面综述. 首先给出离线强化学习的形式化描述, 然后 从方法、基准数据集、离线策略评估与超参数选择 3 个层面对现有技术进行归纳整理, 进一步介绍离线强化学习在工业、推 荐系统、智能驾驶等领域中的研究动态. 最后, 对全文进行总结, 并探讨基于表征学习的离线强化学习未来所面临的关键挑 战与发展趋势, 以期为后续的研究提供有益参考.

成为VIP会员查看完整内容
18

相关内容

在机器学习中,表征学习或表示学习是允许系统从原始数据中自动发现特征检测或分类所需的表示的一组技术。这取代了手动特征工程,并允许机器学习特征并使用它们执行特定任务。在有监督的表征学习中,使用标记的输入数据来学习特征,包括监督神经网络,多层感知器和(监督)字典学习。在无监督表征学习中,特征是与未标记的输入数据一起学习的,包括字典学习,独立成分分析,自动编码器,矩阵分解和各种形式的聚类。
元强化学习研究综述
专知会员服务
32+阅读 · 4月23日
面向机器人系统的虚实迁移强化学习综述
专知会员服务
34+阅读 · 2月8日
基于深度学习的类别增量学习算法综述
专知会员服务
38+阅读 · 2023年8月10日
逆强化学习算法、理论与应用研究综述
专知会员服务
59+阅读 · 2023年8月2日
基于课程学习的深度强化学习研究综述
专知会员服务
55+阅读 · 2022年11月28日
基于通信的多智能体强化学习进展综述
专知会员服务
100+阅读 · 2022年11月12日
结合进化算法的深度强化学习方法研究综述
专知会员服务
76+阅读 · 2022年7月16日
个性化学习推荐研究综述
专知会员服务
58+阅读 · 2022年2月2日
专知会员服务
20+阅读 · 2021年10月9日
专知会员服务
58+阅读 · 2021年5月11日
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
20+阅读 · 2022年7月13日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
深度学习模型可解释性的研究进展
专知
23+阅读 · 2020年8月1日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
深度学习人体姿态估计算法综述
AI前线
22+阅读 · 2019年5月19日
基于逆强化学习的示教学习方法综述
计算机研究与发展
13+阅读 · 2019年2月25日
多模态多任务学习新论文
专知
46+阅读 · 2019年2月9日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2013年12月31日
Arxiv
144+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
353+阅读 · 2023年3月31日
Arxiv
125+阅读 · 2023年3月24日
Arxiv
18+阅读 · 2023年3月17日
VIP会员
相关VIP内容
元强化学习研究综述
专知会员服务
32+阅读 · 4月23日
面向机器人系统的虚实迁移强化学习综述
专知会员服务
34+阅读 · 2月8日
基于深度学习的类别增量学习算法综述
专知会员服务
38+阅读 · 2023年8月10日
逆强化学习算法、理论与应用研究综述
专知会员服务
59+阅读 · 2023年8月2日
基于课程学习的深度强化学习研究综述
专知会员服务
55+阅读 · 2022年11月28日
基于通信的多智能体强化学习进展综述
专知会员服务
100+阅读 · 2022年11月12日
结合进化算法的深度强化学习方法研究综述
专知会员服务
76+阅读 · 2022年7月16日
个性化学习推荐研究综述
专知会员服务
58+阅读 · 2022年2月2日
专知会员服务
20+阅读 · 2021年10月9日
专知会员服务
58+阅读 · 2021年5月11日
相关资讯
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
20+阅读 · 2022年7月13日
基于深度学习的数据融合方法研究综述
专知
31+阅读 · 2020年12月10日
深度学习模型可解释性的研究进展
专知
23+阅读 · 2020年8月1日
实体关系抽取方法研究综述
专知
11+阅读 · 2020年7月19日
深度学习人体姿态估计算法综述
AI前线
22+阅读 · 2019年5月19日
基于逆强化学习的示教学习方法综述
计算机研究与发展
13+阅读 · 2019年2月25日
多模态多任务学习新论文
专知
46+阅读 · 2019年2月9日
基于深度学习的目标检测算法综述
AI研习社
14+阅读 · 2018年4月25日
相关基金
国家自然科学基金
38+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员