【硬核书】迁移学习多智能体强化学习系统，131页pdf - 专知

会员服务 ·

0

【硬核书】迁移学习多智能体强化学习系统，131页pdf

2022 年 7 月 8 日 专知

学习解决顺序决策任务是困难的。人类花了数年时间，基本上以一种随机的方式探索环境，直到他们能够推理，解决困难的任务，并与他人合作实现一个共同的目标。人工智能智能体在这方面和人类很像。强化学习(RL)是一种众所周知的通过与环境的交互来训练自主智能体的技术。遗憾的是，学习过程具有很高的样本复杂性来推断一个有效的驱动策略，特别是当多个智能体同时在环境中驱动时。

然而，以前的知识可以用来加速学习和解决更难的任务。同样，人类通过关联不同的任务来构建技能并重用它们，RL代理可能会重用来自先前解决的任务的知识，以及来自与环境中其他智能体的知识交换的知识。事实上，目前RL解决的几乎所有最具挑战性的任务都依赖于嵌入的知识重用技术，如模仿学习、从演示中学习和课程学习。

本书概述了多agent RL中关于知识重用的文献。作者为重用知识定义了最先进的解决方案的统一分类，提供了该领域最近进展的全面讨论。在这本书中，读者将发现关于知识在多智能体顺序决策任务中重用的许多方法的全面讨论，以及在哪些场景中每种方法更有效。作者还提供了他们对该地区目前低垂的发展成果的看法，以及仍然开放的大问题，可能导致突破性的发展。最后，本书为想要加入这一领域或利用这些技术的研究人员提供了资源，包括会议、期刊和实现工具的列表。

这本书将对广大读者有用;并有望促进社区间的新对话和该地区的新发展。

https://www.morganclaypool.com/doi/10.2200/S01091ED1V01Y202104AIM049

专知便捷查看

便捷下载，请关注专知公众号（点击上方蓝色专知关注）

后台回复“TMRS” 就可以获取《【硬核书】迁移学习多智能体强化学习系统，131页pdf》专知下载链接

专知，专业可信的人工智能知识分发 ，让认知协作更快更好！欢迎注册登录专知www.zhuanzhi.ai，获取100000+AI(AI与军事、医药、公安等)主题干货知识资料！

欢迎微信扫一扫加入专知人工智能知识星球群，获取最新AI专业干货知识教程资料和与专家交流咨询！

点击“ 阅读原文 ”，了解使用专知 ，查看获取100000+AI主题知识资料

登录查看更多

5

相关内容

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

图怎么用强化学习？东北大学最新《图强化学习》综述论文

图怎么用强化学习？东北大学最新《图强化学习》综述论文

专知会员服务

161+阅读 · 2022年4月14日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【硬核书】终身机器学习，145页pdf

【硬核书】终身机器学习，145页pdf

专知会员服务

85+阅读 · 2021年3月1日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

【新书】多元统计与机器学习，185页pdf

【新书】多元统计与机器学习，185页pdf

专知

7+阅读 · 2022年6月5日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

专知

3+阅读 · 2022年3月4日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

【干货书】《机器学习导论(第二版)》，348页pdf

【干货书】《机器学习导论(第二版)》，348页pdf

专知

42+阅读 · 2020年6月16日

Riemann-Hilbert 方法的一致渐近分析及其应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

行为经济学在分布式系统合作性中的研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向云计算环境的应用迁移策略及资源优化配置关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

GFCL: A GRU-based Federated Continual Learning Framework against Data Poisoning Attacks in IoV

Arxiv

0+阅读 · 2022年9月12日

Learning from All Vehicles

Arxiv

0+阅读 · 2022年9月11日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

A Survey on Bayesian Deep Learning

A Survey on Bayesian Deep Learning

Arxiv

64+阅读 · 2020年7月2日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

VIP会员

相关主题

多智能体强化学习

相关VIP内容

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

图怎么用强化学习？东北大学最新《图强化学习》综述论文

图怎么用强化学习？东北大学最新《图强化学习》综述论文

专知会员服务

161+阅读 · 2022年4月14日

【新书】分布式强化学习，280页pdf

【新书】分布式强化学习，280页pdf

专知会员服务

160+阅读 · 2021年12月19日

【硬核书】终身机器学习，145页pdf

【硬核书】终身机器学习，145页pdf

专知会员服务

85+阅读 · 2021年3月1日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

【新书】多元统计与机器学习，185页pdf

【新书】多元统计与机器学习，185页pdf

专知

7+阅读 · 2022年6月5日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

【CMU池跃洁等硬核书】满足低秩矩阵分解的非凸优化综述，69页pdf

专知

3+阅读 · 2022年3月4日

最新《知识驱动的文本生成》综述论文，44页pdf

最新《知识驱动的文本生成》综述论文，44页pdf

专知

25+阅读 · 2020年10月14日

【干货书】《机器学习导论(第二版)》，348页pdf

【干货书】《机器学习导论(第二版)》，348页pdf

专知

42+阅读 · 2020年6月16日

相关基金

Riemann-Hilbert 方法的一致渐近分析及其应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

行为经济学在分布式系统合作性中的研究

国家自然科学基金

1+阅读 · 2013年12月31日

面向云计算环境的应用迁移策略及资源优化配置关键技术研究

国家自然科学基金

0+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

21+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

相关论文

GFCL: A GRU-based Federated Continual Learning Framework against Data Poisoning Attacks in IoV

Arxiv

0+阅读 · 2022年9月12日

Learning from All Vehicles

Arxiv

0+阅读 · 2022年9月11日

Learning Latent Representations to Influence Multi-Agent Interaction

Arxiv

11+阅读 · 2020年11月12日

A Survey on Bayesian Deep Learning

A Survey on Bayesian Deep Learning

Arxiv

64+阅读 · 2020年7月2日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

大家都在搜

大型语言模型

朱克爱德华兹家族

蓝牙安全攻防

冷启动，0预算，如何借助分销裂变引爆私域用户增长？

微信扫码咨询专知VIP会员