This paper focuses on the regression of multiple 3D people from a single RGB image. Existing approaches predominantly follow a multi-stage pipeline that first detects people in bounding boxes and then independently regresses their 3D body meshes. In contrast, we propose to Regress all meshes in a One-stage fashion for Multiple 3D People (termed ROMP). The approach is conceptually simple, bounding box-free, and able to learn a per-pixel representation in an end-to-end manner. Our method simultaneously predicts a Body Center heatmap and a Mesh Parameter map, which can jointly describe the 3D body mesh on the pixel level. Through a body-center-guided sampling process, the body mesh parameters of all people in the image are easily extracted from the Mesh Parameter map. Equipped with such a fine-grained representation, our one-stage framework is free of the complex multi-stage process and more robust to occlusion. Compared with state-of-the-art methods, ROMP achieves superior performance on the challenging multi-person benchmarks, including 3DPW and CMU Panoptic. Experiments on crowded/occluded datasets demonstrate the robustness under various types of occlusion. The released code is the first real-time implementation of monocular multi-person 3D mesh regression.


翻译:本文侧重于多个 3D 人从一个 RGB 图像中回归的问题。 现有方法主要遵循多阶段管道, 首先是在捆绑盒中检测人, 然后独立回归3D 体模模。 相反, 我们提议以一个阶段的方式将所有 3D 人( 包括 ROMP ) 的模件都以一个阶段的方式回归。 这种方法在概念上是简单的, 没有框框, 并且能够以端到端的方式学习每像素的表达方式。 我们的方法同时预测一个身体中心的热映和Mesh 参数映射, 它可以共同描述 3D 体模件在像素水平上的图。 相反, 我们建议用一个身体中心制导器将所有 3D 3D 体模子的参数都以一个阶段的方式回归。 这个方法在概念上简单简单简单化, 并且能够以最终到端的方式学习每个像素的表示。 我们的一阶段框架将摆脱复杂的多阶段进程, 并且更加坚固的封闭性。 与状态方法相比, ROMP 能够 共同描述像素水平 3D- 高压的多位模型 的模型, 的模型的模型 的模型的模型 的模型的模型 的模型 的模型 的模型 的模型的模型的模型的模型的模型的模型 的模型的模型的模型的模型的模型的模型的模型的模型的模型 。

0
下载
关闭预览

相关内容

3D是英文“Three Dimensions”的简称,中文是指三维、三个维度、三个坐标,即有长、有宽、有高,换句话说,就是立体的,是相对于只有长和宽的平面(2D)而言。
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
17+阅读 · 2021年5月3日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
专知会员服务
109+阅读 · 2020年3月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
【泡泡一分钟】3D物体的特征编码变种
泡泡机器人SLAM
4+阅读 · 2019年1月1日
【泡泡一分钟】无监督学习的立体匹配方法(ICCV-2017)
泡泡机器人SLAM
8+阅读 · 2018年10月9日
【泡泡一分钟】学习多视图相似度(ICCV-2017)
泡泡机器人SLAM
10+阅读 · 2018年10月7日
【深度】行人检测算法
GAN生成式对抗网络
29+阅读 · 2018年6月3日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
VIP会员
Top
微信扫码咨询专知VIP会员