We have observed significant progress in visual navigation for embodied agents. A common assumption in studying visual navigation is that the environments are static; this is a limiting assumption. Intelligent navigation may involve interacting with the environment beyond just moving forward/backward and turning left/right. Sometimes, the best way to navigate is to push something out of the way. In this paper, we study the problem of interactive navigation where agents learn to change the environment to navigate more efficiently to their goals. To this end, we introduce the Neural Interaction Engine (NIE) to explicitly predict the change in the environment caused by the agent's actions. By modeling the changes while planning, we find that agents exhibit significant improvements in their navigational capabilities. More specifically, we consider two downstream tasks in the physics-enabled, visually rich, AI2-THOR environment: (1) reaching a target while the path to the target is blocked (2) moving an object to a target location by pushing it. For both tasks, agents equipped with an NIE significantly outperform agents without the understanding of the effect of the actions indicating the benefits of our approach.


翻译:我们观察到了内装物剂在视觉导航方面的显著进步。 视觉导航研究的一个共同假设是环境是静止的; 这是一个有限的假设。 智能导航可能涉及与环境的相互作用, 不仅仅是向前/ 后向后和向左/ 右。 有时, 最佳导航方式是将某些东西推出方向。 在本文中, 我们研究了交互式导航问题, 即代理人学会改变环境以更高效地向目标方向航行。 为此, 我们引入了神经互动引擎( NIE), 以明确预测由代理人的行动造成的环境变化。 通过模拟这些变化, 我们发现代理人的导航能力有了显著的改善。 更具体地说, 我们考虑的是物理学驱动的、 视觉上丰富的、 AI2-THHOR 环境中的两个下游任务:(1) 达到目标, 而通往目标的路径被阻断了(2) 将一个物体推向目标地点。 对于这两项任务, 我们引入了神经互动引擎(NIE) 以明确预测由代理人的行为造成的环境变化。 通过在规划中进行模拟, 我们发现代理人的导航能力有显著的改进。 。 。 更具体地说, 我们考虑的是, 在物理学驱动下游环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境环境的特征, 。

0
下载
关闭预览

相关内容

IFIP TC13 Conference on Human-Computer Interaction是人机交互领域的研究者和实践者展示其工作的重要平台。多年来,这些会议吸引了来自几个国家和文化的研究人员。官网链接:http://interact2019.org/
Stabilizing Transformers for Reinforcement Learning
专知会员服务
58+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
151+阅读 · 2019年10月12日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
意识是一种数学模式
CreateAMind
3+阅读 · 2019年6月24日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
carla 学习笔记
CreateAMind
9+阅读 · 2018年2月7日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
【推荐】直接未来预测:增强学习监督学习
机器学习研究会
6+阅读 · 2017年11月24日
【推荐】用Python/OpenCV实现增强现实
机器学习研究会
15+阅读 · 2017年11月16日
Autonomous Navigation System for a Delivery Drone
Arxiv
0+阅读 · 2021年6月16日
Arxiv
5+阅读 · 2018年10月15日
Phrase-Based & Neural Unsupervised Machine Translation
Arxiv
6+阅读 · 2018年6月21日
VIP会员
相关资讯
意识是一种数学模式
CreateAMind
3+阅读 · 2019年6月24日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
carla 学习笔记
CreateAMind
9+阅读 · 2018年2月7日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
【推荐】直接未来预测:增强学习监督学习
机器学习研究会
6+阅读 · 2017年11月24日
【推荐】用Python/OpenCV实现增强现实
机器学习研究会
15+阅读 · 2017年11月16日
Top
微信扫码咨询专知VIP会员