Grounding referring expressions in RGBD image has been an emerging field. We present a novel task of 3D visual grounding in single-view RGBD image where the referred objects are often only partially scanned due to occlusion. In contrast to previous works that directly generate object proposals for grounding in the 3D scenes, we propose a bottom-up approach to gradually aggregate context-aware information, effectively addressing the challenge posed by the partial geometry. Our approach first fuses the language and the visual features at the bottom level to generate a heatmap that coarsely localizes the relevant regions in the RGBD image. Then our approach conducts an adaptive feature learning based on the heatmap and performs the object-level matching with another visio-linguistic fusion to finally ground the referred object. We evaluate the proposed method by comparing to the state-of-the-art methods on both the RGBD images extracted from the ScanRefer dataset and our newly collected SUNRefer dataset. Experiments show that our method outperforms the previous methods by a large margin (by 11.2% and 15.6% Acc@0.5) on both datasets.


翻译:RGBD 图像中的地面参照表达式是一个新兴领域。 我们在单视图 RGBD 图像中展示了一个新的任务, 即3D 视觉地面定位, 被指对象往往由于隔热而仅部分扫描。 与先前直接生成立体场落地对象提案的工程相比, 我们提议了一种自下而上的方法, 逐步汇总背景意识信息, 有效地应对部分几何构成的挑战。 我们的方法首先在底层将语言和视觉特征结合到一个热映像中, 以产生一种热映像, 使 RGBD 图像中的相关区域局部化。 然后, 我们的方法根据热映进行适应性特征学习, 并进行对象级的匹配, 与另一个面语言融合匹配, 以最终覆盖被指对象。 我们通过比较从 Scamprefer 数据集提取的 RGBD 图像和我们新收集的 SUNRefer 数据集上的最新艺术方法, 评估了拟议方法。 实验显示, 我们的方法在两个数据设置上都以大边距( 11. 和 15. 15. cc@ 0. 5) 将先前的方法比了前方法。

0
下载
关闭预览

相关内容

近期必读的7篇 CVPR 2019【视觉问答】相关论文和代码
专知会员服务
37+阅读 · 2020年1月10日
专知会员服务
87+阅读 · 2019年12月13日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
92+阅读 · 2019年10月16日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
汇总 | VIO、激光SLAM相关论文分类集锦
计算机视觉life
7+阅读 · 2019年1月28日
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
【推荐】SLAM相关资源大列表
机器学习研究会
10+阅读 · 2017年8月18日
Arxiv
4+阅读 · 2017年11月4日
VIP会员
Top
微信扫码咨询专知VIP会员