Human body volume estimation from a single RGB image is a challenging problem despite minimal attention from the research community. However VolNet, an architecture leveraging 2D and 3D pose estimation, body part segmentation and volume regression extracted from a single 2D RGB image combined with the subject's body height can be used to estimate the total body volume. VolNet is designed to predict the 2D and 3D pose as well as the body part segmentation in intermediate tasks. We generated a synthetic, large-scale dataset of photo-realistic images of human bodies with a wide range of body shapes and realistic poses called SURREALvols. By using Volnet and combining multiple stacked hourglass networks together with ResNeXt, our model correctly predicted the volume in ~82% of cases with a 10% tolerance threshold. This is a considerable improvement compared to state-of-the-art solutions such as BodyNet with only a ~38% success rate.


翻译:尽管研究界很少注意RGB图像,但从单一的 RGB 图像中估算人体体积仍是一个棘手的问题。 然而,VolNet 是一个利用 2D 和 3D 的架构,它提出了估计,从单一的 2D RGB 图像中提取的体分解和体积回归与主体体身高度相结合,可用于估计体积总量。VolNet 旨在预测 2D 和 3D 的体体积以及中间任务中的体积分割。我们生成了一个合成的、大型的人体体形和现实姿势图像数据集,称为 SURREALVLs。通过使用Volnet 和将多个堆叠式沙子网络与ResNeXt 相结合,我们的模型正确地预测了大约82%的病例数量,其中的容积临界值为10%。这与人体网等最先进的解决方案相比有很大的改进,只有~38%的成功率。

0
下载
关闭预览

相关内容

专知会员服务
32+阅读 · 2021年6月12日
【干货书】机器学习速查手册,135页pdf
专知会员服务
127+阅读 · 2020年11月20日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
已删除
将门创投
8+阅读 · 2019年3月18日
计算机视觉领域顶会CVPR 2018 接受论文列表
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
DPOD: Dense 6D Pose Object Detector in RGB images
Arxiv
5+阅读 · 2019年2月28日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
已删除
将门创投
8+阅读 · 2019年3月18日
计算机视觉领域顶会CVPR 2018 接受论文列表
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员