本文是对浙江大学和加州大学圣巴巴拉分校合作完成的,被CVPR 2020收录的论文《Unsupervised Reinforcement Learning of Transferable Meta-Skills for Embodied Navigation》进行解读,相关工作已经开源。
论文:https://arxiv.org/abs/1911.07450
视觉导航任务要求智能体能够智能地导航到指定的目标。当前基于深度强化学习的方法往往需要大量的训练数据,而构建丰富的3D仿真环境以及提供任务相关标注是十分昂贵的。本文关注于在低资源的设定下完成视觉导航任务。本文通过提出无监督强化学习方法来获得具有迁移能力的子策略,使得模型能够快速迁移到视觉导航任务。在AI2-THOR环境中,我们的方法实现了最佳的性能,进一步的实验分析证明我们的方法学习到了一些具备迁移能力的元技能,从而帮助模型实现更好的泛化。
李俊成,浙江大学2019级博士,研究方向为Embodied Agent和vison-and-language understanding。两篇相关工作分别发表于ACM MM2019和CVPR2020。
CVPR 2020 系列报道
相关报道:
CVPR 2020接收论文公布:录用1470篇,接收率“二连降”,仅22% !
论文集:
01. 17篇入选CVPR 2020,腾讯优图 9 篇精选论文详解
02. 22篇入选,百度 15 篇 CVPR 2020 精选论文详解
论文解读: