【硬核书】迁移学习多智能体强化学习系统，131页pdf - 专知VIP

会员服务 ·

79

迁移学习 · 强化学习 · 多智能体 · 书籍 ·

2022 年 7 月 8 日

【硬核书】迁移学习多智能体强化学习系统，131页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

学习解决顺序决策任务是困难的。人类花了数年时间，基本上以一种随机的方式探索环境，直到他们能够推理，解决困难的任务，并与他人合作实现一个共同的目标。人工智能智能体在这方面和人类很像。强化学习(RL)是一种众所周知的通过与环境的交互来训练自主智能体的技术。遗憾的是，学习过程具有很高的样本复杂性来推断一个有效的驱动策略，特别是当多个智能体同时在环境中驱动时。

然而，以前的知识可以用来加速学习和解决更难的任务。同样，人类通过关联不同的任务来构建技能并重用它们，RL代理可能会重用来自先前解决的任务的知识，以及来自与环境中其他智能体的知识交换的知识。事实上，目前RL解决的几乎所有最具挑战性的任务都依赖于嵌入的知识重用技术，如模仿学习、从演示中学习和课程学习。

本书概述了多agent RL中关于知识重用的文献。作者为重用知识定义了最先进的解决方案的统一分类，提供了该领域最近进展的全面讨论。在这本书中，读者将发现关于知识在多智能体顺序决策任务中重用的许多方法的全面讨论，以及在哪些场景中每种方法更有效。作者还提供了他们对该地区目前低垂的发展成果的看法，以及仍然开放的大问题，可能导致突破性的发展。最后，本书为想要加入这一领域或利用这些技术的研究人员提供了资源，包括会议、期刊和实现工具的列表。

这本书将对广大读者有用;并有望促进社区间的新对话和该地区的新发展。

https://www.morganclaypool.com/doi/10.2200/S01091ED1V01Y202104AIM049

成为VIP会员查看完整内容

相关内容

迁移学习

迁移学习（Transfer Learning）是一种机器学习方法，是把一个领域（即源领域）的知识，迁移到另外一个领域（即目标领域），使得目标领域能够取得更好的学习效果。迁移学习（TL）是机器学习（ML）中的一个研究问题，着重于存储在解决一个问题时获得的知识并将其应用于另一个但相关的问题。例如，在学习识别汽车时获得的知识可以在尝试识别卡车时应用。尽管这两个领域之间的正式联系是有限的，但这一领域的研究与心理学文献关于学习转移的悠久历史有关。从实践的角度来看，为学习新任务而重用或转移先前学习的任务中的信息可能会显着提高强化学习代理的样本效率。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知会员服务

70+阅读 · 2022年8月29日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

《多任务学习》最新综述论文，20页pdf

《多任务学习》最新综述论文，20页pdf

专知会员服务

125+阅读 · 2021年4月6日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【硬核书】终身机器学习，145页pdf

【硬核书】终身机器学习，145页pdf

专知会员服务

85+阅读 · 2021年3月1日

基于Python介绍算法和数据结构的在线互动书，240页pdf

基于Python介绍算法和数据结构的在线互动书，240页pdf

专知会员服务

61+阅读 · 2021年2月3日

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

专知会员服务

40+阅读 · 2021年1月8日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

17+阅读 · 2022年7月30日

【经典书】多处理器编程艺术，562页pdf

【经典书】多处理器编程艺术，562页pdf

专知

6+阅读 · 2022年7月10日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

专知

1+阅读 · 2022年6月4日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

谷歌发布生态系统RLDS，可在强化学习中生成、共享和使用数据集

谷歌发布生态系统RLDS，可在强化学习中生成、共享和使用数据集

AI前线

0+阅读 · 2021年12月21日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

【强化学习】强化学习入门以及代码实现

【强化学习】强化学习入门以及代码实现

产业智能官

18+阅读 · 2017年9月4日

基于非凸控制区域的倒向重随机控制系统最优控制必要条件的研究

国家自然科学基金

0+阅读 · 2015年12月31日

大气[CO2]升高对稻田生态系统中厌氧氨氧化和厌氧甲烷氧化微生物的影响

国家自然科学基金

0+阅读 · 2015年12月31日

随机递归最优控制及其在金融中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的聚类一致问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于生成模型的迁移学习算法研究及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

视觉系统学习和适应的计算模型

国家自然科学基金

1+阅读 · 2012年12月31日

亚热带稻田生态系统碳氮循环耦合机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

内蒙古典型草原植物对资源脉冲的响应策略

国家自然科学基金

0+阅读 · 2009年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

Psychophysical Machine Learning

Arxiv

0+阅读 · 2022年8月27日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Arxiv

17+阅读 · 2019年9月9日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

A Survey on Deep Transfer Learning

A Survey on Deep Transfer Learning

Arxiv

11+阅读 · 2018年8月6日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

VIP会员

相关主题

相关VIP内容

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

190页pdf伯克利博士论文《自适应持续的具身智能体》，系统全面阐述机器人技术

专知会员服务

70+阅读 · 2022年8月29日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知会员服务

148+阅读 · 2022年6月9日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知会员服务

184+阅读 · 2022年4月30日

《多任务学习》最新综述论文，20页pdf

《多任务学习》最新综述论文，20页pdf

专知会员服务

125+阅读 · 2021年4月6日

【斯坦福经典书】强化学习在金融应用，414页pdf

【斯坦福经典书】强化学习在金融应用，414页pdf

专知会员服务

127+阅读 · 2021年3月30日

【硬核书】终身机器学习，145页pdf

【硬核书】终身机器学习，145页pdf

专知会员服务

85+阅读 · 2021年3月1日

基于Python介绍算法和数据结构的在线互动书，240页pdf

基于Python介绍算法和数据结构的在线互动书，240页pdf

专知会员服务

61+阅读 · 2021年2月3日

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

电子科大最新《基于深度神经网络的关系提取》综述论文，20页pdf

专知会员服务

40+阅读 · 2021年1月8日

最新《深度强化学习中的迁移学习》综述论文

最新《深度强化学习中的迁移学习》综述论文

专知会员服务

157+阅读 · 2020年9月20日

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

《强化学习—使用 Open AI、TensorFlow和Keras实现》174页pdf

专知会员服务

139+阅读 · 2020年3月1日

热门VIP内容

开通专知VIP会员享更多权益服务

扩散语言模型综述

《美陆军徒步机动作战条令手册》最新168页

【博士论文】理解神经网络的训练动态：从局部优化轨迹与特征学习视角

军事后勤数字化未来展望

相关资讯

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

17+阅读 · 2022年7月30日

【经典书】多处理器编程艺术，562页pdf

【经典书】多处理器编程艺术，562页pdf

专知

6+阅读 · 2022年7月10日

【实用书】强化学习实战：Python，110页pdf

【实用书】强化学习实战：Python，110页pdf

专知

9+阅读 · 2022年6月9日

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

专知

1+阅读 · 2022年6月4日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

57+阅读 · 2022年4月30日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知

3+阅读 · 2022年4月19日

谷歌发布生态系统RLDS，可在强化学习中生成、共享和使用数据集

谷歌发布生态系统RLDS，可在强化学习中生成、共享和使用数据集

AI前线

0+阅读 · 2021年12月21日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

36+阅读 · 2020年5月2日

自然语言处理常识推理综述论文，60页pdf

自然语言处理常识推理综述论文，60页pdf

专知

73+阅读 · 2019年4月4日

【强化学习】强化学习入门以及代码实现

【强化学习】强化学习入门以及代码实现

产业智能官

18+阅读 · 2017年9月4日

相关基金

基于非凸控制区域的倒向重随机控制系统最优控制必要条件的研究

国家自然科学基金

0+阅读 · 2015年12月31日

大气[CO2]升高对稻田生态系统中厌氧氨氧化和厌氧甲烷氧化微生物的影响

国家自然科学基金

0+阅读 · 2015年12月31日

随机递归最优控制及其在金融中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

多智能体系统的聚类一致问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于生成模型的迁移学习算法研究及其应用

国家自然科学基金

0+阅读 · 2012年12月31日

视觉系统学习和适应的计算模型

国家自然科学基金

1+阅读 · 2012年12月31日

亚热带稻田生态系统碳氮循环耦合机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

内蒙古典型草原植物对资源脉冲的响应策略

国家自然科学基金

0+阅读 · 2009年12月31日

基于多Agent的通信交互式动态影响图研究及应用

国家自然科学基金

2+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

相关论文

Psychophysical Machine Learning

Arxiv

0+阅读 · 2022年8月27日

A Survey on Multi-Task Learning

Arxiv

31+阅读 · 2021年3月29日

Optimization for deep learning: theory and algorithms

Optimization for deep learning: theory and algorithms

Arxiv

106+阅读 · 2019年12月19日

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Arxiv

17+阅读 · 2019年9月9日

Notes on Deep Learning for NLP

Arxiv

22+阅读 · 2018年8月30日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

A Survey on Deep Transfer Learning

A Survey on Deep Transfer Learning

Arxiv

11+阅读 · 2018年8月6日

Compositional GAN: Learning Conditional Image Composition

Compositional GAN: Learning Conditional Image Composition

Arxiv

31+阅读 · 2018年7月19日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

End-to-End Multi-Task Learning with Attention

Arxiv

19+阅读 · 2018年3月28日

微信扫码咨询专知VIP会员