In this paper, we propose a novel graph convolutional network architecture, Graph Stacked Hourglass Networks, for 2D-to-3D human pose estimation tasks. The proposed architecture consists of repeated encoder-decoder, in which graph-structured features are processed across three different scales of human skeletal representations. This multi-scale architecture enables the model to learn both local and global feature representations, which are critical for 3D human pose estimation. We also introduce a multi-level feature learning approach using different-depth intermediate features and show the performance improvements that result from exploiting multi-scale, multi-level feature representations. Extensive experiments are conducted to validate our approach, and the results show that our model outperforms the state-of-the-art.


翻译:在本文中,我们建议为2D-3D人构成的估算任务建立一个新型的图形革命网络结构,即石墨沙漏网络。拟议结构由反复的编码器-解码器组成,其中通过三种不同的人体骨骼表层处理图形结构特征。这一多尺度结构使模型既能学习地方特征表象,也能学习全球特征表象,这对3D人构成估计至关重要。我们还采用多层次特征学习方法,采用不同深度的中间特征,并显示利用多层次多层次特征表象所产生的性能改进。进行了广泛的实验,以验证我们的方法,结果显示我们的模型超越了最新技术。

0
下载
关闭预览

相关内容

MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
【ICLR-2020】网络反卷积,NETWORK DECONVOLUTION
专知会员服务
38+阅读 · 2020年2月21日
深度强化学习策略梯度教程,53页ppt
专知会员服务
178+阅读 · 2020年2月1日
已删除
将门创投
8+阅读 · 2019年8月28日
Hierarchically Structured Meta-learning
CreateAMind
25+阅读 · 2019年5月22日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
VIP会员
Top
微信扫码咨询专知VIP会员