Prior work on 6-DoF object pose estimation has largely focused on instance-level processing, in which a textured CAD model is available for each object being detected. Category-level 6-DoF pose estimation represents an important step toward developing robotic vision systems that operate in unstructured, real-world scenarios. In this work, we propose a single-stage, keypoint-based approach for category-level object pose estimation that operates on unknown object instances within a known category using a single RGB image as input. The proposed network performs 2D object detection, detects 2D keypoints, estimates 6-DoF pose, and regresses relative bounding cuboid dimensions. These quantities are estimated in a sequential fashion, leveraging the recent idea of convGRU for propagating information from easier tasks to those that are more difficult. We favor simplicity in our design choices: generic cuboid vertex coordinates, single-stage network, and monocular RGB input. We conduct extensive experiments on the challenging Objectron benchmark, outperforming state-of-the-art methods on the 3D IoU metric (27.6% higher than the MobilePose single-stage approach and 7.1% higher than the related two-stage approach).


翻译:对6-DoF 对象的先前估计主要侧重于实例级处理,其中每个被检测对象都有一个纹理的 CAD 模型。类别级 6-DoF 的估算是朝着开发在无结构、现实世界情景下运作的机器人视觉系统迈出的重要一步。在这项工作中,我们建议对类别级物体采用单一阶段的、基于关键点的估算方法,该方法在已知的类别内对未知的物体进行操作,使用单一的 RGB 图像作为输入。拟议网络对具有挑战性的天体基准进行2D 检测、检测2D 关键点、估计 6-DoF 构成和反向相对约束幼虫尺寸。这些数量是按顺序估算的,利用最新的 convGRU 理念将信息从较容易的任务传播到较困难的任务传播到较困难的任务。我们赞成我们的设计选择简单性:通用的幼鸟脊椎坐标、单级网络和单级RGB 输入。我们在3D IOU 高的IoU 度指标(27.6%) 和两级比移动Pose- 相关步骤7.1 方法高得多)。

0
下载
关闭预览

相关内容

专知会员服务
15+阅读 · 2021年4月3日
专知会员服务
60+阅读 · 2020年3月19日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
TCN v2 + 3Dconv 运动信息
CreateAMind
4+阅读 · 2019年1月8日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【ECCV2018】24篇论文代码实现
专知
17+阅读 · 2018年9月10日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
Arxiv
12+阅读 · 2019年1月24日
VIP会员
相关VIP内容
专知会员服务
15+阅读 · 2021年4月3日
专知会员服务
60+阅读 · 2020年3月19日
相关资讯
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
CVPR2019 | Stereo R-CNN 3D 目标检测
极市平台
27+阅读 · 2019年3月10日
TCN v2 + 3Dconv 运动信息
CreateAMind
4+阅读 · 2019年1月8日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
【ECCV2018】24篇论文代码实现
专知
17+阅读 · 2018年9月10日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Top
微信扫码咨询专知VIP会员