学习解决顺序决策任务是困难的。人类花了数年时间,基本上以一种随机的方式探索环境,直到他们能够推理,解决困难的任务,并与他人合作实现一个共同的目标。人工智能智能体在这方面和人类很像。强化学习(RL)是一种众所周知的通过与环境的交互来训练自主智能体的技术。遗憾的是,学习过程具有很高的样本复杂性来推断一个有效的驱动策略,特别是当多个智能体同时在环境中驱动时。

然而,以前的知识可以用来加速学习和解决更难的任务。同样,人类通过关联不同的任务来构建技能并重用它们,RL代理可能会重用来自先前解决的任务的知识,以及来自与环境中其他智能体的知识交换的知识。事实上,目前RL解决的几乎所有最具挑战性的任务都依赖于嵌入的知识重用技术,如模仿学习、从演示中学习和课程学习。

本书概述了多agent RL中关于知识重用的文献。作者为重用知识定义了最先进的解决方案的统一分类,提供了该领域最近进展的全面讨论。在这本书中,读者将发现关于知识在多智能体顺序决策任务中重用的许多方法的全面讨论,以及在哪些场景中每种方法更有效。作者还提供了他们对该地区目前低垂的发展成果的看法,以及仍然开放的大问题,可能导致突破性的发展。最后,本书为想要加入这一领域或利用这些技术的研究人员提供了资源,包括会议、期刊和实现工具的列表。

这本书将对广大读者有用;并有望促进社区间的新对话和该地区的新发展。

https://www.morganclaypool.com/doi/10.2200/S01091ED1V01Y202104AIM049

成为VIP会员查看完整内容
147

相关内容

迁移学习(Transfer Learning)是一种机器学习方法,是把一个领域(即源领域)的知识,迁移到另外一个领域(即目标领域),使得目标领域能够取得更好的学习效果。迁移学习(TL)是机器学习(ML)中的一个研究问题,着重于存储在解决一个问题时获得的知识并将其应用于另一个但相关的问题。例如,在学习识别汽车时获得的知识可以在尝试识别卡车时应用。尽管这两个领域之间的正式联系是有限的,但这一领域的研究与心理学文献关于学习转移的悠久历史有关。从实践的角度来看,为学习新任务而重用或转移先前学习的任务中的信息可能会显着提高强化学习代理的样本效率。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【实用书】强化学习实战:Python,110页pdf
专知会员服务
148+阅读 · 2022年6月9日
「博弈论视角下多智能体强化学习」研究综述
专知会员服务
182+阅读 · 2022年4月30日
《多任务学习》最新综述论文,20页pdf
专知会员服务
124+阅读 · 2021年4月6日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
123+阅读 · 2021年3月30日
【硬核书】终身机器学习,145页pdf
专知会员服务
84+阅读 · 2021年3月1日
基于Python介绍算法和数据结构的在线互动书,240页pdf
专知会员服务
61+阅读 · 2021年2月3日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
156+阅读 · 2020年9月20日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
139+阅读 · 2020年3月1日
【经典书】多处理器编程艺术,562页pdf
专知
6+阅读 · 2022年7月10日
【实用书】强化学习实战:Python,110页pdf
自然语言处理常识推理综述论文,60页pdf
专知
73+阅读 · 2019年4月4日
【强化学习】强化学习入门以及代码实现
产业智能官
18+阅读 · 2017年9月4日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
47+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年8月27日
Arxiv
31+阅读 · 2021年3月29日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
26+阅读 · 2018年8月19日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
19+阅读 · 2018年3月28日
VIP会员
相关VIP内容
【实用书】强化学习实战:Python,110页pdf
专知会员服务
148+阅读 · 2022年6月9日
「博弈论视角下多智能体强化学习」研究综述
专知会员服务
182+阅读 · 2022年4月30日
《多任务学习》最新综述论文,20页pdf
专知会员服务
124+阅读 · 2021年4月6日
【斯坦福经典书】强化学习在金融应用,414页pdf
专知会员服务
123+阅读 · 2021年3月30日
【硬核书】终身机器学习,145页pdf
专知会员服务
84+阅读 · 2021年3月1日
基于Python介绍算法和数据结构的在线互动书,240页pdf
专知会员服务
61+阅读 · 2021年2月3日
最新《深度强化学习中的迁移学习》综述论文
专知会员服务
156+阅读 · 2020年9月20日
《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf
专知会员服务
139+阅读 · 2020年3月1日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
47+阅读 · 2009年12月31日
相关论文
Arxiv
0+阅读 · 2022年8月27日
Arxiv
31+阅读 · 2021年3月29日
Optimization for deep learning: theory and algorithms
Arxiv
105+阅读 · 2019年12月19日
Arxiv
22+阅读 · 2018年8月30日
Arxiv
26+阅读 · 2018年8月19日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
Arxiv
11+阅读 · 2018年4月25日
Arxiv
19+阅读 · 2018年3月28日
微信扫码咨询专知VIP会员