Traditional approaches to the design of multi-agent navigation algorithms consider the environment as a fixed constraint, despite the obvious influence of spatial constraints on agents' performance. Yet hand-designing improved environment layouts and structures is inefficient and potentially expensive. The goal of this paper is to consider the environment as a decision variable in a system-level optimization problem, where both agent performance and environment cost can be accounted for. We begin by proposing a novel environment optimization problem. We show, through formal proofs, under which conditions the environment can change while guaranteeing completeness (i.e., all agents reach their navigation goals). Our solution leverages a model-free reinforcement learning approach. In order to accommodate a broad range of implementation scenarios, we include both online and offline optimization, and both discrete and continuous environment representations. Numerical results corroborate our theoretical findings and validate our approach.


翻译:设计多试剂导航算法的传统方法将环境视为固定的制约因素,尽管空间限制对代理人的性能有明显的影响。然而,手工设计改进的环境布局和结构效率低,而且可能昂贵。本文件的目的是将环境视为系统一级优化问题中的一个决定变量,其中可以计算代理人的性能和环境成本。我们首先提出一个新的环境优化问题。我们通过正式证明表明环境在何种条件下可以改变,同时又能保证完整性(即所有代理人都达到其导航目标)。我们的解决办法利用了一种无模型的强化学习方法。为了适应广泛的执行设想,我们包括了在线和离线优化以及离散和连续的环境表现。数字结果证实了我们的理论结论并证实了我们的做法。

0
下载
关闭预览

相关内容

专知会员服务
44+阅读 · 2020年12月14日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
40+阅读 · 2019年10月17日
强化学习最新教程,17页pdf
专知会员服务
118+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
78+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
29+阅读 · 2019年10月9日
VCIP 2022 Call for Special Session Proposals
CCF多媒体专委会
1+阅读 · 4月1日
IEEE TII Call For Papers
CCF多媒体专委会
2+阅读 · 3月24日
AIART 2022 Call for Papers
CCF多媒体专委会
0+阅读 · 2月13日
Hierarchically Structured Meta-learning
CreateAMind
16+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
12+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
35+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
10+阅读 · 2018年12月24日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
【推荐】RNN/LSTM时序预测
机器学习研究会
24+阅读 · 2017年9月8日
【推荐】SVM实例教程
机器学习研究会
16+阅读 · 2017年8月26日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Arxiv
0+阅读 · 10月30日
VIP会员
相关资讯
VCIP 2022 Call for Special Session Proposals
CCF多媒体专委会
1+阅读 · 4月1日
IEEE TII Call For Papers
CCF多媒体专委会
2+阅读 · 3月24日
AIART 2022 Call for Papers
CCF多媒体专委会
0+阅读 · 2月13日
Hierarchically Structured Meta-learning
CreateAMind
16+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
12+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
35+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
10+阅读 · 2018年12月24日
Capsule Networks解析
机器学习研究会
10+阅读 · 2017年11月12日
【推荐】RNN/LSTM时序预测
机器学习研究会
24+阅读 · 2017年9月8日
【推荐】SVM实例教程
机器学习研究会
16+阅读 · 2017年8月26日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员