【学界】CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法

2019 年 4 月 27 日 GAN生成式对抗网络

CVPR2019 accepted list ID已经放出,极市已将目前收集到的公开论文总结到github上(目前已收集510篇),后续会不断更新,欢迎关注,也欢迎大家提交自己的论文:

https://github.com/extreme-assistant/cvpr2019

今天为大家推荐一篇人体姿态迁移算法~


来源 | 极市平台


今天跟大家重磅介绍华中科技大学刚刚开源的一款人体姿态迁移算法,其基于GAN思想构建,效果好到简直令人不可思议,论文《Progressive Pose Attention Transfer for Person Image Generation》已中 CVPR 2019 Oral,非常值得一读~


作者信息:


论文出自华科白翔老师组,作者单位分别为华中科技大学、微软Redmond,中兴集团。


什么是姿态迁移?

简单点说,就是给定一幅含有人物的图片和一个目标姿态,将图片内人物转换成目标姿态的样子。当然目标姿态可以是从其他图片人物中计算得来的。(所以也可以将一幅图片的人物转成另一图片内人物的姿态)


这听起来就是一项黑科技。


很显然这是一个很有趣的应用,比如给定一幅人物图像,可以将里面人物按照另一段视频里的人物变换姿态。只需要一幅你的图片,就能让你跳出优美的舞蹈~


不过,毕竟一幅图片信息有限,转换后不会惨不忍睹吧。


下图是该论文算法实现的效果(请务必点击查看大图!)。这里的目标姿态使用线段连线表示。



难以置信,图片下面6幅生成的结果图片是靠左边的一幅图生成出来的!点击大图查看,你会发现细节很清晰!

尽管只有侧颜侧身照,但不耽误我们360度看美女^_^是不是很神奇~


算法原理

首先我们先看看作者在这个过程中使用的数据,首先是一幅图片Condition image Pc,与该图片中使用姿态估计算法提取的姿态Condition Pose Sc,还有目标姿态Target Pose St。

作者提出了一种称之为Progressive Pose Attention Transfer(渐进的姿态注意力迁移)模型。


作者基于GAN思想构建算法。对于输入的人物图片和姿态,生成新的人体姿态图片和姿态,并有两个判别器,一个纹理判别器一个形状判别器,判断生成器生成的人物图片和姿态是不是真实的。


姿态迁移是由生成器完成。下图表达了作者设计的生成器的算法架构。



在Pose-Attentional Transfer Network中含有多个Pose  Attentional Block,其作用是对输入的image pathway和pose pathway按照Pose Mask进行更新,图中Mt即为Pose Mask,它引导网络将图片中人物的不同的部分按照目标姿态进行像素块迁移。

将最后一个Block中Image Pathway的数据经过解码网络,即得到了最终的生成图像。


实验结果

作者在DeepFashion与Martket-1501数据集上进行了实验。在训练阶段,分别在这两个数据集上构建了263632和101966样本对。文中评价指标不再细述。


下表是该文算法与已有算法的量化比较:



可见该文算法在绝大多数评价指标下都取得了最好的结果。


下图是与其他算法的效果图比较,可见视觉上该文算法比以往算法都更加自然。其中可见右上人物的背包保留的最为真实。



另外姿态迁移本身是不好用数值量化的,最好的评价是人眼的感知。所以作者又做了个用户调查,邀请志愿者对三种算法的生成结果进行盲评。

下表是用户调查的结果:



可见,该文算法生成的结果被认为是最为真实。


下图为参数量和速度的比较。Titan X GPU上跑的实验。



该文算法在效果最好的同时,参数量最少,速度最快!


最后作者用该文提出的算法对行人图片进行姿态迁移,为行人重识别生成训练图片。

使用这种增广样本训练的行人重识别算法获得了显著的精度提升。



用这套算法,可以为行人重识别无限扩充样本了!


作者已将代码开源!感谢作者的开源分享,欢迎大家试用并在Github上Star该工程~


论文地址:

https://arxiv.org/abs/1904.03349#

代码地址:

https://github.com/tengteng95/Pose-Transfer


高质量延伸阅读

☞ OpenPV平台发布在线的ParallelEye视觉任务挑战赛

【学界】第1届“智能车辆中的平行视觉”研讨会成功举行

【学界】生成式对抗网络:从生成数据到创造智能

【学界】OpenPV:中科院研究人员建立开源的平行视觉研究平台

【学界】基于平行视觉的特定场景下行人检测

【学界】ParallelEye:面向交通视觉研究构建的大规模虚拟图像集

【CFP】Virtual Images for Visual Artificial Intelligence

【最详尽的GAN介绍】王飞跃等:生成式对抗网络 GAN 的研究进展与展望

【智能自动化学科前沿讲习班第1期】王飞跃教授:生成式对抗网络GAN的研究进展与展望

【智能自动化学科前沿讲习班第1期】王坤峰副研究员:GAN与平行视觉

【重磅】平行将成为一种常态:从SimGAN获得CVPR 2017最佳论文奖说起

【平行讲坛】平行图像:图像生成的一个新型理论框架

【学界】基于生成对抗网络的低秩图像生成方法

【学界】Ian Goodfellow等人提出对抗重编程,让神经网络执行其他任务

【学界】六种GAN评估指标的综合评估实验,迈向定量评估GAN的重要一步

【资源】T2T:利用StackGAN和ProGAN从文本生成人脸

【学界】 CVPR 2018最佳论文作者亲笔解读:研究视觉任务关联性的Taskonomy

【业界】英特尔OpenVINO™工具包为创新智能视觉提供更多可能

【学界】ECCV 2018: 对抗深度学习: 鱼 (模型准确性) 与熊掌 (模型鲁棒性) 能否兼得 

【学界】何恺明组又出神作!最新论文提出全景分割新方法


登录查看更多
22

相关内容

CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
31+阅读 · 2020年1月10日
CVPR2019 oral | CPNet : 对应提议网络
极市平台
4+阅读 · 2019年6月17日
干货 | CVPR 2018论文:「随心所欲」换装换姿态
AI科技评论
9+阅读 · 2018年7月2日
Meta-Transfer Learning for Zero-Shot Super-Resolution
Arxiv
43+阅读 · 2020年2月27日
Knowledge Distillation from Internal Representations
Arxiv
4+阅读 · 2019年10月8日
Arxiv
4+阅读 · 2019年9月26日
Revisiting CycleGAN for semi-supervised segmentation
Arxiv
3+阅读 · 2019年8月30日
VIP会员
相关VIP内容
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
专知会员服务
109+阅读 · 2020年3月12日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
31+阅读 · 2020年1月10日
Top
微信扫码咨询专知VIP会员