Collision avoidance algorithms are of central interest to many drone applications. In particular, decentralized approaches may be the key to enabling robust drone swarm solutions in cases where centralized communication becomes computationally prohibitive. In this work, we draw biological inspiration from flocks of starlings (Sturnus vulgaris) and apply the insight to end-to-end learned decentralized collision avoidance. More specifically, we propose a new, scalable observation model following a biomimetic topological interaction rule that leads to stable learning and robust avoidance behavior. Additionally, prior work primarily focuses on invoking a separation principle, i.e. designing collision avoidance independent of specific tasks. By applying a general reinforcement learning approach, we propose a holistic learning-based approach to integrating collision avoidance with various tasks and dynamics. To validate the generality of this approach, we successfully apply our methodology to a number of configurations. Our learned policies are tested in simulation and subsequently transferred to real-world drones to validate their real-world applicability.


翻译:避免碰撞的算法是许多无人机应用的核心利益。 特别是,在中央通信在计算上变得令人望而却步的情况下,分散的方法可能是使强健的无人机群群解解决办法的关键。 在这项工作中,我们从星群(Sturnus brugiis)中汲取生物灵感,并运用这种洞察力来避免从端到端的分散碰撞。更具体地说,我们提出了一个新的、可扩缩的观测模型,遵循生物模拟的地形学互动规则,导致稳定的学习和稳健的避免行为。此外,先前的工作主要侧重于援引分离原则,即设计独立于具体任务的避免碰撞原则。我们通过采用一般强化学习方法,提出了一种基于整体学习的办法,将避免碰撞与各种任务和动态结合起来。为了验证这种方法的普遍性,我们成功地将我们的方法应用于一些配置。我们所学过的政策在模拟中经过测试,随后被转移到现实世界的无人机,以验证其真实世界适用性。

0
下载
关闭预览

相关内容

【斯坦福大学】Gradient Surgery for Multi-Task Learning
专知会员服务
46+阅读 · 2020年1月23日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
91+阅读 · 2019年10月16日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Arxiv
0+阅读 · 2021年6月18日
Arxiv
3+阅读 · 2018年10月5日
Arxiv
8+阅读 · 2018年7月12日
Arxiv
5+阅读 · 2018年6月5日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
RL 真经
CreateAMind
5+阅读 · 2018年12月28日
spinningup.openai 强化学习资源完整
CreateAMind
6+阅读 · 2018年12月17日
OpenAI丨深度强化学习关键论文列表
中国人工智能学会
17+阅读 · 2018年11月10日
【OpenAI】深度强化学习关键论文列表
专知
11+阅读 · 2018年11月10日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Top
微信扫码咨询专知VIP会员