在过去的十年里,机器学习的突破导致了“数字智能”,即机器学习模型能够从大量标记数据中学习,以执行一些数字任务,如语音识别、人脸识别、机器翻译等。这篇论文的目标是在设计能够“物理智能”的算法方面取得进展,即构建智能自主导航代理,能够学习在物理世界中执行复杂的导航任务,包括视觉感知、自然语言理解、推理、规划、还有顺序决策。尽管在过去的几十年里,经典的导航方法有了一些进步,但是当前的导航代理在长期的语义导航任务上仍然很挣扎。在论文的第一部分,我们讨论了我们使用端到端强化学习来解决诸如回避障碍、语义感知、语言基础和推理等挑战的短期导航工作。在第二部分,我们提出了一种新的导航方法,基于模块化学习和结构化显式地图表示,它利用了经典和端到端学习方法的优势,以解决长期的导航任务。我们证明了这些方法能够有效地解决诸如定位、映射、长期规划、探索和学习语义先验等挑战。这些模块化学习方法能够长期理解空间和语义,并在各种导航任务中获得最先进的结果。
链接: https://www.zhuanzhi.ai/paper/833a5e3cfe6401566bdde2b30d574d09