分享背景:深度学习的泛化能力一直为人诟病,在新兴的视觉语言导航领域尤甚。三维环境重建和数据收集过程费时费力。我们旨在提出有效的方法解决视觉语言导航的泛化和数据稀缺问题。
分享提纲:
环境不可知的多任务导航学习框架;
用于反事实导航的对抗数据增强方法;
基于多模态文字风格转换的迁移导航学习。