In this paper, we propose a novel structure-aware 3D hourglass network for hand pose estimation from a single depth image, which achieves state-of-the-art results on MSRA and NYU datasets. Compared to existing works that perform image-to-coordination regression, our network takes 3D voxel as input and directly regresses 3D heatmap for each joint. To be specific, we use hourglass network as our backbone network and modify it into 3D form. We explicitly model tree-like finger bone into the network as well as in the loss function in an end-to-end manner, in order to take the skeleton constraints into consideration. Final estimation can then be easily obtained from voxel density map with simple post-processing. Experimental results show that the proposed structure-aware 3D hourglass network is able to achieve a mean joint error of 7.4 mm in MSRA and 8.9 mm in NYU datasets, respectively.


翻译:在本文中,我们提出一个全新的结构3D沙漏网络,用于亲手根据单一深度图像进行估计,从而在MSRA和NYU数据集上取得最先进的结果。与现有进行图像到协调回归的工程相比,我们的网络将3D voxel作为输入,并直接回归每个联合体的3D热映射。具体地说,我们使用沙漏网络作为主干网,将其修改为3D形式。我们明确地将树样的手指骨作为模型输入网络,并以端到端的方式在丢失功能中进行模拟,以便考虑到骨骼限制。然后,通过简单的后处理,从 voxel 密度图中很容易地获得最后的估计。实验结果表明,拟议的3D 3D 小时镜网络在MSRA 中可以分别达到7.4毫米和纽约大学数据集8.9毫米的平均联合误差。

0
下载
关闭预览

相关内容

抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
CornerNet: Detecting Objects as Paired Keypoints 论文笔记
统计学习与视觉计算组
7+阅读 · 2018年9月27日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
计算机视觉领域顶会CVPR 2018 接受论文列表
ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
全球人工智能
19+阅读 · 2017年12月17日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
Arxiv
12+阅读 · 2019年1月24日
VIP会员
相关VIP内容
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
Top
微信扫码咨询专知VIP会员