会员服务 ·

用DensePose，教照片里的人学跳舞，系群体鬼畜 | ECCV 2018

2018 年 9 月 10 日 量子位

栗子发自凹非寺
量子位出品 | 公众号 QbitAI

怎样让一个面朝镜头、静止不动的妹子，跳起你为她选的舞蹈，把360度身姿全面呈现？

Facebook团队，把负责感知的多人姿势识别模型DensePose，与负责生成的深度生成网络结合起来。

不管是谁的感人姿势，都能附体到妹子身上，把她单一的静态，变成丰富的动态。

这项研究成果，入选了ECCV 2018。

当然不能只有DensePose

团队把SMPL多人姿态模型，跟DensePose结合到一起。这样一来，就可以用一个成熟的表面模型来理解一张图片。

这项研究，是用基于表面的神经合成，是在闭环里渲染一张图像，生成各种新姿势。

△左为源图像，中为源图姿势，右为目标姿势

照片中人需要学习的舞姿，来自另一个人的照片，或者视频截图。

DensePose系统，负责把两张照片关联起来。具体方法是，在一个公共表面UV坐标系 (common surface coordinates) 里，给两者之间做个映射。

但如果单纯基于几何来生成，又会因为DensePose采集数据不够准确，还有图像里的自我遮挡 (比如身体被手臂挡住) ，而显得不那么真实。

△DensePose提取的质地 (左) vs 修复后的质地 (右)

那么，团队处理遮挡的方法是，在表面坐标系里，引入一个图像修复 (Impainting) 网络。把这个网络的预测结果，和一个更传统的前馈条件和成模型预测结合起来。

这些预测是各自独立进行的，然后再用一个细化模块来优化预测结果。把重构损失、对抗损失和感知损失结合起来，优势互补，得出最终的生成效果。

完整的网络结构，就如上图这般。

监督学习一下

模型的监督学习过程，是这样的：

从输入的源图像开始，先把它的每个像素对应到UV坐标系里。这一步是DensePose驱动的迁移网络完成的。

然后，负责修复图像的自编码器，就来预测照片中人的不同角度会是什么样子。这步预测，也是在扭曲的坐标系里完成的。

从右边开始，就是生成目标，同样要整合到UV坐标系中。再用损失函数 来处理 (上图红字部分) 把结果输入自编码器，帮助模型学习。

用同一人物 (同样装扮) 的多个静态姿势来作监督，替代了360度旋转的人体。

训练成果如何

先来看一下，新加入的图像修复步骤，生成的效果：

把DensePose的质地纹路，修复一下，还是有明显效果的。

再来看一下多人视频什么样子：

虽然，脸部好像烧焦的样子，但已经很鬼畜了。在下不由得想起：

另外团队用DeepFashion数据集，对比了一下自家算法和其他同行。

结果是，结构相似度 (Structural Similarity) ，以假乱真度 (Inception Score) 以及检测分 (Detection Score) 这三项指标，Facebook家的算法表现都超过了前辈。

各位请持续期待，DensePose更多鬼畜的应用吧。

论文传送门：
https://arxiv.org/pdf/1809.01995.pdf

顺便一提，教人学跳舞的算法真的不少。

比如，伯克利舞痴变舞王，优点是逼真，缺点是无法实现多人共舞：

— 完 —

活动推荐

华为云•普惠AI，让开发充满AI！

爱上你的代码，爱做 “改变世界”的行动派！

大会将首次发布AI开发框架，从AI模型训练到AI模型部署的全套开发一站式完成！让AI开发触手可及！

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

DensePose

关注 0

【CVPR2020】时序分组注意力视频超分

专知会员服务

31+阅读 · 2020年7月1日

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

【CVPR2020-Facebook】从检测到3D目标，FroDO: From Detections to 3D Objects

专知会员服务

33+阅读 · 2020年5月12日

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

专知会员服务

59+阅读 · 2020年4月4日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【ICIP 2019 Tutorials】图像到图像的转换（Image-to-Image Translation）,英伟达研究员Ming-Yu Liu

专知会员服务

27+阅读 · 2019年8月10日

让大卫雕塑跳舞、蒙娜丽莎说话，英伟达视频合成有如此多「骚操作」

机器之心

10+阅读 · 2019年10月28日

已删除

将门创投

11+阅读 · 2019年7月4日

头像神器！照片一键秒转简笔画，清华刘永进等CVPR 19 Oral研究 | 在线可玩

量子位

18+阅读 · 2019年6月16日

生成逼真3D人偶，居然不用3D形状建模，还能学会你的舞步 | 三星CVPR Oral

量子位

9+阅读 · 2019年6月10日

女神背心变内衣，只需草图画几笔 | 中山+字节跳动等新研究

量子位

5+阅读 · 2019年6月7日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

照片上的人出来了！云从3D人体重建登顶三项榜单，一张照片就能生成3D形象

量子位

4+阅读 · 2019年3月20日

ECCV 2018丨YOLO遇上OpenPose，近200FPS的高帧数多人姿态检测

量子位

9+阅读 · 2018年9月10日

DensePose：将2D图像像素映射到人体3D表面以实现高效姿态估计

论智

7+阅读 · 2018年2月5日

密集人体姿态估计：2D图像帧可实时生成UV贴图（附论文）

量子位

5+阅读 · 2018年2月4日

Look-into-Object: Self-supervised Structure Modeling for Object Recognition

Arxiv

15+阅读 · 2020年3月31日

Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Networks

Arxiv

8+阅读 · 2020年3月12日

Recurrent Event Network: Global Structure Inference over Temporal Knowledge Graph

Arxiv

7+阅读 · 2019年10月8日

Joint Face Detection and Facial Motion Retargeting for Multiple Faces

Arxiv

4+阅读 · 2019年2月27日

Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference

Arxiv

4+阅读 · 2019年2月27日

UPSNet: A Unified Panoptic Segmentation Network

Arxiv

4+阅读 · 2019年1月12日

Monocular Total Capture: Posing Face, Body, and Hands in the Wild

Arxiv

4+阅读 · 2018年12月4日

Image Captioning

Arxiv

11+阅读 · 2018年5月13日

DeSIGN: Design Inspiration from Generative Networks

Arxiv

3+阅读 · 2018年4月3日

DenseReg: Fully Convolutional Dense Shape Regression In-the-Wild

Arxiv

3+阅读 · 2018年2月1日

VIP会员

用DensePose，教照片里的人学跳舞，系群体鬼畜 | ECCV 2018

栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI

当然不能只有DensePose

△左为源图像，中为源图姿势，右为目标姿势

△DensePose提取的质地 (左) vs 修复后的质地 (右)

监督学习一下

训练成果如何

相关内容

栗子发自凹非寺
量子位出品 | 公众号 QbitAI