FAIR提出人体姿势估计新模型:效果惊艳,升级版Mask-RCNN!

2018 年 2 月 9 日 德先生


本文转载自“新智元”

新智元编译

来源:densepose.org


FAIR和INRIA的合作研究提出一个在Mask-RCNN基础上改进的密集人体姿态评估模型DensePose-RCNN,适用于人体3D表面构建等,效果很赞。并且提出一个包含50K标注图像的人体姿态COCO数据集,即将开源。


论文:https://arxiv.org/abs/1802.00434

网站:http://densepose.org/


密集人体姿势估计是指将一个RGB图像中的所有人体像素点映射到人体的3D表面。


  • 我们介绍了DensePose-COCO数据集,这是一个大型ground-truth数据集,在50000张COCO的图像上手工标注了图像-人体表面(image-to-surface)的对应点。

  • 我们提出了DensePose-RCNN架构,这是Mask-RCNN的一个变体,以每秒多帧的速度在每个人体区域内密集地回归特定部位的UV坐标。




DensePose-COCO数据集

我们利用人工标注建立从二维图像到人体表面表示的密集对应。如果用常规方法,需要通过旋转来操纵表明,导致效率低下。相反,我们构建了一个包含两个阶段的标注流程,从而高效地收集到图像-表面的对应关系的标注。


如下所示,在第一阶段,我们要求标注者划定与可见的、语义上定义的身体部位相对应的区域。我们指导标注者估计被衣服遮挡住的身体部分,因此,比如说穿着一条大裙子也不会使随后的对应标注复杂化。


在第二阶段,我们用一组大致等距的点对每个部位的区域进行采样,并要求注释者将这些点与表面相对应。为了简化这个任务,我们通过提供六个相同身体部分的预渲染视图来展开身体部位的表面,并允许用户在其中任何一个视图上放置标志。这允许注释者通过从在六个选项中选择一个,而不用手动旋转表面来选择最方便的视点。


我们在数据收集过程中使用了SMPL模型SURREAL textures



两个阶段的标注过程使我们能够非常有效地收集高度准确的对应数据。部位分割(part segmentation)和对应标注( correspondence annotation)这两个任务基本是是同时进行的,考虑到后一任务更具挑战性,这很令人惊讶。我们收集了50000人的注释,收集了超过500万个人工标注的对应信息。以下是在我们的验证集中图像注释的可视化:图像(左),U(中)和V(右)是收集的注释点的值。



DensePose-RCNN系统


与DenseReg类似,我们通过划分表面来查找密集对应。对于每个像素,需要确定:


  • 它倾向于属于哪个表面部位;

  • 它对应的部位的2D参数化的位置。


下图右边说明了对表面的划分和“与一个部位上的点的对应”。



我们采用具有特征金字塔网络(FPN)的Mask-RCNN结构,以及ROI-Align池化以获得每个选定区域内的密集部位标签和坐标。


如下图所示,我们在ROI-pooling的基础上引入一个全卷积网络,目的是以下两个任务:


  • 生成每像素的分类结果以选择表面部位

  • 对每个部位回归局部坐标


在推理过程,我们的系统使用GTX1080 GPU在320x240的图像上以25fps的速度运行,在800x1100的图像上以4-5fps的速度运行。



DensePose-RCNN系统可以直接使用注释点作为监督。但是,我们通过在原本未标注的位置上“修补”监督信号的值进行取得了更好的结果。为了达到这个目的,我们采用一种基于学习的方法,首先训练一个“教师”网络:一个完全卷积神经网络(如下图),它重新构造了给定图像的ground-truth值和segmentation mask。



我们使用级联策略(cascading strategies)进一步提高了系统的性能。通过级联,我们利用来自相关任务的信息,例如已经被Mask-RCNN架构成功解决的关键点估计和实例分割。这使我们能够利用任务协同和不同监督来源的互补优势。


作者:


  • Rıza Alp Güler,INRIA, CentraleSupélec

  • Natalia Neverova,Facebook AI Research

  • Iasonas Kokkinos,Facebook AI Research




📚往期文章推荐

人工智能名人堂第49期 | 斯坦福研究院名人堂成员:Peter E. Ha

🔗埃隆·马斯克最感性专访:我期待失败,也期待真爱

🔗盘点丨国之优才!细数近年来入选长江学者的女科学家!

🔗Hinton:人类就是机器,通过生物方式制造的机器

🔗中科院王飞跃 | 社会机器:历史的起源与目标

🔗《社会机器》大咖推荐序合集 | 人机群体共生的新形态

🔗中科院王飞跃 | 神经元网络:从复杂性到智能化的特例还是一般表达形式?

🔗【内附PPT全文】王飞跃教授讲述可解释的神经元网络发展历程

🔗廖湘科院士:树立科技是核心战斗力的思想

🔗谭铁牛院士:生物识别是未来的趋势

🔗聚焦2018国家智能产业峰会 洞知未来智能产业新风向


德先生公众号 | 往期精选


在公众号会话位置回复以下关键词,查看德先生往期文章!


人工智能|机器崛起|区块链|名人堂

虚拟现实|无人驾驶|智能制造|无人机

科研创新|网络安全|数据时代|人机大战

……

更多精彩文章正在赶来,敬请期待!


点击“阅读原文”,移步求知书店,可查阅选购德先生推荐书籍。

登录查看更多
0

相关内容

专知会员服务
31+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
专知会员服务
41+阅读 · 2020年2月20日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【泡泡点云时空】基于分割方法的物体六维姿态估计
泡泡机器人SLAM
18+阅读 · 2019年9月15日
Mask-RCNN模型的实现自定义对象(无人机)检测
计算机视觉life
17+阅读 · 2019年8月12日
Facebook实时人体姿态估计:Dense Pose及其应用展望
机器之心
9+阅读 · 2019年2月10日
已删除
将门创投
8+阅读 · 2019年1月4日
Mesh R-CNN
Arxiv
4+阅读 · 2019年6月6日
Arxiv
3+阅读 · 2018年6月1日
VIP会员
相关VIP内容
专知会员服务
31+阅读 · 2020年4月24日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
专知会员服务
41+阅读 · 2020年2月20日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
Top
微信扫码咨询专知VIP会员