With 3D data rapidly emerging as an important form of multimedia information, 3D human mesh recovery technology has also advanced accordingly. However, current methods mainly focus on handling humans wearing tight clothing and perform poorly when estimating body shapes and poses under diverse clothing, especially loose garments. To this end, we make two key insights: (1) tailoring clothing to fit the human body can mitigate the adverse impact of clothing on 3D human mesh recovery, and (2) utilizing human visual information from large foundational models can enhance the generalization ability of the estimation. Based on these insights, we propose ClothHMR, to accurately recover 3D meshes of humans in diverse clothing. ClothHMR primarily consists of two modules: clothing tailoring (CT) and FHVM-based mesh recovering (MR). The CT module employs body semantic estimation and body edge prediction to tailor the clothing, ensuring it fits the body silhouette. The MR module optimizes the initial parameters of the 3D human mesh by continuously aligning the intermediate representations of the 3D mesh with those inferred from the foundational human visual model (FHVM). ClothHMR can accurately recover 3D meshes of humans wearing diverse clothing, precisely estimating their body shapes and poses. Experimental results demonstrate that ClothHMR significantly outperforms existing state-of-the-art methods across benchmark datasets and in-the-wild images. Additionally, a web application for online fashion and shopping powered by ClothHMR is developed, illustrating that ClothHMR can effectively serve real-world usage scenarios. The code and model for ClothHMR are available at: \url{https://github.com/starVisionTeam/ClothHMR}.


翻译:随着三维数据迅速成为重要的多媒体信息形式,三维人体网格恢复技术也相应发展。然而,现有方法主要集中于处理穿着紧身衣物的人体,在估计多样化着装(尤其是宽松服装)下的体型与姿态时表现不佳。为此,我们提出两个关键洞见:(1)将服装裁剪至贴合人体轮廓可减轻衣物对三维人体网格恢复的负面影响;(2)利用大型基础模型中的人类视觉信息可提升估计的泛化能力。基于这些洞见,我们提出ClothHMR方法,以精确恢复多样化着装人体的三维网格。ClothHMR主要包含两个模块:衣物裁剪(CT)模块与基于FHVM的网格恢复(MR)模块。CT模块通过人体语义估计与人体边缘预测对衣物进行裁剪,确保其贴合人体轮廓。MR模块通过持续对齐三维网格的中间表示与基础人类视觉模型(FHVM)推断的表示,优化三维人体网格的初始参数。ClothHMR能够准确恢复穿着多样化服装人体的三维网格,精确估计其体型与姿态。实验结果表明,ClothHMR在基准数据集和真实场景图像上均显著优于现有最先进方法。此外,基于ClothHMR开发的在线时尚购物网络应用表明,该方法能有效服务于实际应用场景。ClothHMR的代码与模型已开源:\url{https://github.com/starVisionTeam/ClothHMR}。

0
下载
关闭预览

相关内容

Deep Image Prior——图像恢复入门
中国人工智能学会
15+阅读 · 2019年2月16日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关资讯
Deep Image Prior——图像恢复入门
中国人工智能学会
15+阅读 · 2019年2月16日
SkeletonNet:完整的人体三维位姿重建方法
计算机视觉life
21+阅读 · 2019年1月21日
论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG
开放知识图谱
36+阅读 · 2018年3月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员