We propose a method for annotating images of a hand manipulating an object with the 3D poses of both the hand and the object, together with a dataset created using this method. There is a current lack of annotated real images for this problem, as estimating the 3D poses is challenging, mostly because of the mutual occlusions between the hand and the object. To tackle this challenge, we capture sequences with one or several RGB-D cameras, and jointly optimizes the 3D hand and object poses over all the frames simultaneously. This method allows us to automatically annotate each frame with accurate estimates of the poses, despite large mutual occlusions. With this method, we created HO-3D, the first markerless dataset of color images with 3D annotations of both hand and object. This dataset is currently made of 80,000 frames, 65 sequences, 10 persons, and 10 objects, and growing. We also use it to train a deepnet to perform RGB-based single frame hand pose estimation and provide a baseline on our dataset.


翻译:我们建议一种方法来说明手动操纵物体的3D形状的图像,以及使用此方法创建的数据集。目前缺乏这一问题的附加说明的真实图像,因为估计3D姿势具有挑战性,主要是因为手与物体之间相互隔绝。为了应对这一挑战,我们用一个或几个 RGB-D 相机来捕捉序列,同时将3D 手和物体的配置优化到所有框架。这种方法使我们能够自动为每个框架作说明,准确估计其姿势,尽管存在大量相互隔离现象。我们用这种方法创建了HO-3D,这是第一个带有手和物体3D说明的颜色图像无标记数据集。这个数据集目前由80 000个框架、65个序列、10个人和10个对象组成,并不断增长。我们还利用它来训练一个深网来进行基于 RGB 的单框架手的估算,并提供我们数据集的基线。

0
下载
关闭预览

相关内容

【Manning新书】现代Java实战,592页pdf
专知会员服务
101+阅读 · 2020年5月22日
专知会员服务
110+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
开源书:PyTorch深度学习起步
专知会员服务
51+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
196+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
计算机视觉领域顶会CVPR 2018 接受论文列表
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
【推荐】用Tensorflow理解LSTM
机器学习研究会
36+阅读 · 2017年9月11日
Single-frame Regularization for Temporally Stable CNNs
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
VIP会员
相关VIP内容
【Manning新书】现代Java实战,592页pdf
专知会员服务
101+阅读 · 2020年5月22日
专知会员服务
110+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
50+阅读 · 2020年2月26日
开源书:PyTorch深度学习起步
专知会员服务
51+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
196+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
Top
微信扫码咨询专知VIP会员