会员服务 ·

视频换脸新境界：CMU不仅给人类变脸，还能给花草、天气变脸 | ECCV 2018

2018 年 9 月 12 日 量子位

圆栗子发自凹非寺
量子位报道 | 公众号 QbitAI

把一段视频里的面部动作，移植到另一段视频的主角脸上。

大家可能已经习惯这样的操作了。

就算目标主角并不是人类，大概也算不上精彩。眼睛鼻子嘴，至少零件齐全。

那么，怎样的迁移才可走出这个框框，让这个星球上的万物，都有机会领取视频改造的恩泽？

△ 按着你想要的节奏开花：中老年表情包利器

来自卡耐基梅隆大学的团队，开发了自动变身技巧，不论是花花草草，还是万千气象，都能自如转换。

△ 云，也变得急切了

或许是怀着超越大前辈Cycle-GAN (来自朱俊彦团队) 的意味，团队给自家的GAN起了个非常环保的名字，叫Recycle-GAN。

这位选手，入选了ECCV 2018。

Recycle之道，时间知道

Recycle-GAN，是一只无监督学习的AI。

用不成对的二维图像数据，来训练视频重定向 (Video Retargeting) 并不容易：

一是，如果没有成对数据，那在视频变身的优化上，给的限制就不够，容易产生不良局部极小值 (Bad Local Minima) 而影响生成效果。

二是，只依靠二维图像的空间信息，要学习视频的风格就很困难。

△ 你开花，我就开花

针对这两个问题，CMU团队提出的方法，是利用时间信息 (Temporal Information) 来施加更多的限制，不良局部极小值的现象会减少。

另外，时间、空间信息的搭配食用，也能让AI更好地学到视频的风格特征。

△ 时间信息：进度条撑不住了 (误)

重要的是，视频里的时间信息唾手可得，无需寻觅。

然后，看一下Recycle-GAN，是怎样在两段视频的图像之间，建立映射的。

△ 三位选手对比一下

Pix2Pix是有成对数据的；CycleGAN靠的是循环一致性 (Cycle Consistency) ；RecycleGAN用的是视频流的时间信息。

翻来覆去的，比CycleGAN的历程还要艰辛。好像终于感受到，Recycle-GAN这个名字是有道理的。

把对抗损失 (Adversarial Loss) ，朱俊彦团队的循环损失 (Cycle Loss) ，反复损失 (Recurrent Loss) ，以及CMU团队自己造的“再”循环损失 (Recycle Loss) 都用上，才是强大的损失函数。

效果怎么样？

似乎只有和CycleGAN比一场，才知道时间信息好不好用。

第一局，先来看看换脸的效果：

RecycleGAN用奥巴马生成的川川，除了嘴皮子，脸的角度也在跟着变化。而中间的CycleGAN，只有嘴的动作比较明显。

第二局，你见过蒲公英开花的样子么：

当RecycleGAN的蒲公英，学着菊花的动作，变成茂密的团子，CycleGAN还在慢慢地绽放。

注意，团队是预先把两种花，从初开到完全凋谢的时间调成一致。

除此之外，再看云卷云舒 (片头也出现过) ：

原本是悠然地移动。

和喷气一般的云，学习了之后，就获得了急躁的节奏。

这样一来，改变天气就不难了。团队说拍电影的成本，可以用这样的方法降下来。

代码也快来了

CMU的科学家们说，大家很快就可以看到代码了。

不过在那之前，我们还是有许多资源可以欣赏。

团队在项目主页里，提供了丰富的生成效果：
https://www.cs.cmu.edu/~aayushb/Recycle-GAN/

论文请至这里观察：
https://www.cs.cmu.edu/~aayushb/Recycle-GAN/recycle_gan.pdf

最后吐个槽

原本是日落：

看了黎明之前的视频，就跟着变了日出：

可是，日落变日出这样的操作，直接倒放不好么？

— 完 —

加入社群

量子位AI社群28群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

相关内容

Cycle-GAN

关注 0

Yoshua Bengio最新《深度学习》MLSS2020教程，附104页PPT及视频

专知会员服务

134+阅读 · 2020年7月10日

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

【CVPR 2020-人大】基于层次图推理的细粒度文本视频跨模态检索

专知会员服务

67+阅读 · 2020年4月5日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

【香港中文大学-CVPR2020】Rotate-and-Render: Unsupervised Photorealistic Face Rotation from Single-View Images

专知会员服务

22+阅读 · 2020年3月18日

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

专知会员服务

109+阅读 · 2020年2月19日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【中科大徐童】多模态语义理解与关联

专知会员服务

83+阅读 · 2019年12月7日

美图秀秀又有P图黑科技：上GAN修老照片，消除人脸马赛克，在线就能体验

量子位

6+阅读 · 2019年9月5日

已删除

将门创投

11+阅读 · 2019年8月13日

比AI视频换脸还可怕！DeepMind新AI可生成逼真视频

智东西

10+阅读 · 2019年7月23日

刷新ImageNet纪录，GAN不只会造假！DeepMind用它做图像分类，秒杀职业分类AI

量子位

8+阅读 · 2019年7月9日

GAN用于无监督表征学习，效果依然惊人……

机器之心

12+阅读 · 2019年7月9日

技术无罪？AI直接“脱掉”女性的衣服！

51CTO博客

8+阅读 · 2019年6月27日

头像神器！照片一键秒转简笔画，清华刘永进等CVPR 19 Oral研究 | 在线可玩

量子位

18+阅读 · 2019年6月16日

女神背心变内衣，只需草图画几笔 | 中山+字节跳动等新研究

量子位

5+阅读 · 2019年6月7日

用英伟达StyleGAN生成老婆吧，他生成了一百多只明日香 | 开源代码

量子位

7+阅读 · 2019年2月13日

还在PS里手动描边？AI自动抠图只需5秒

机器之心

12+阅读 · 2018年12月19日

Deformable Style Transfer

Arxiv

14+阅读 · 2020年3月24日

Joint Face Detection and Facial Motion Retargeting for Multiple Faces

Arxiv

4+阅读 · 2019年2月27日

Weakly Supervised Object Detection in Artworks

Arxiv

4+阅读 · 2018年10月5日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

4+阅读 · 2018年9月25日

The challenge of realistic music generation: modelling raw audio at scale

Arxiv

3+阅读 · 2018年6月26日

XGAN: Unsupervised Image-to-Image Translation for Many-to-Many Mappings

Arxiv

3+阅读 · 2018年4月25日

Mask-aware Photorealistic Face Attribute Manipulation

Arxiv

5+阅读 · 2018年4月24日

3D Pose Estimation and 3D Model Retrieval for Objects in the Wild

Arxiv

7+阅读 · 2018年3月30日

An Improved Evaluation Framework for Generative Adversarial Networks

Arxiv

3+阅读 · 2018年3月27日

Analysis of Wikipedia-based Corpora for Question Answering

Arxiv

7+阅读 · 2018年1月6日

VIP会员

视频换脸新境界：CMU不仅给人类变脸，还能给花草、天气变脸 | ECCV 2018

圆栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI

△ 按着你想要的节奏开花：中老年表情包利器

△ 云，也变得急切了

Recycle之道，时间知道

△ 你开花，我就开花

△ 时间信息：进度条撑不住了 (误)

△ 三位选手对比一下

效果怎么样？

代码也快来了

最后吐个槽

相关内容

圆栗子发自凹非寺
量子位报道 | 公众号 QbitAI