让玛丽莲梦露表演迪士尼动画角色，CVPR论文一阶运动模型效果Reddit超4k赞

会员服务 ·

让玛丽莲梦露表演迪士尼动画角色，CVPR论文一阶运动模型效果Reddit超4k赞

2020 年 4 月 27 日 新智元

新智元原创

编辑：元子、小智

【新智元导读】一个只有13秒的人脸视频在Reddit火了，发布一天就已超4k赞。我们分析了背后的技术原理，发现该项目使用的一阶运动模型来源于一篇NeurIPS论文（该论文目前也入选了CVPR 2020），并通过视频来对模型结果做了呈现。作者称，他们的框架在各种基准和各种对象类别上得分最高。「新智元急聘主笔、高级主任编辑，添加HR微信（Dr-wly）或扫描文末二维码了解详情。」

Reddit上一个视频突然火了。

视频左上角是个真人，一个非常可爱的TikTok（抖音海外版）网红小姐姐，当时正在表演迪士尼动漫中，女性角色的经典表情动作，后面我们会给出小姐姐的完整视频。

但在此之前，我们需要先让大家了解一下，让这个视频如此火爆背后的技术。

背后的技术驱动：一阶运动模型，效果逼真感人

该项目使用的一阶运动模型来源于下面这篇NeurIPS论文。

这个模型可以根据驱动视频的运动，对源图像中的对象进行动画处理，以生成视频序列，而无需使用任何注释或有关特定对象的先验信息。

模型采用自监督的方法将外观和运动信息分离，使用了视频中对象的关键点及其局部仿射变换进行特征表示。

可以看出模型由两个主要模块组成：运动估计模块和图像生成模块。

模型假设存在一个抽象的参考框架，然后独立地估计了两种转换：从参考到源以及从参考到驱动，这样的设计使模型能够独立处理源帧和驱动帧。

第一步，模型通过自监督方式学习的关键点获得稀疏轨迹集来近似两种转换，然后使用局部仿射变换对每个关键点附近的运动进行建模。与仅使用关键点位移相比，局部仿射可以关注更多的细节变换。在第二步中，密集运动网络会组合局部近似来获得最终的密集运动场。

除了密集的运动场之外，该网络还会输出一个掩模，该掩模可以指导生成网络应该重构哪些部分，以及修复哪些部分（从上下文中推断）。最终使用一个生成器网络根据密集运动场扭曲源图像，并修复源图像中被遮挡的部分。

我们可以使用这个模型轻松地将特朗普的讲话迁移到权游中的人物，也可以让形态相似的静态马奔跑起来，还能一键完成模特的换装，对需要制作大量换装图片的美工来说简直是神器！

来，让LeCun模仿下Hinton。

用论文做成的视频效果让我们大吃亿惊！6GB GTX 1070跑起来都不如视频中顺畅

网友StevenAU说：我看着这个网红小姐姐，就像她一辈子都在研究迪士尼的公主一样，看得我停不下来。

Zenith_N：这个小姐姐简直就是动漫本漫！

a_white_american_guy：想看小姐姐，想看完整版视频！

我知道你们也想看，满足你们！

网友Faketuxedo说，他用自己的老显卡GTX 1070试了一下，觉得还是在可以接受的范围，虽然不如视频中那么的流畅。

因为GitHub上Jupyter Notebook的体验不是太好，想尝试的小伙伴可以去下面的NBVIEWER链接查看：

https://nbviewer.jupyter.org/url/github.com/AliaksandrSiarohin/first-order-model/blob/master/demo.ipynb

当然，如果你想在线跑跑代码，网友还贴心的给了一个binder链接，可以启动你自己的Jupyter服务器尝试一下!

https://mybinder.org/v2/gh/AliaksandrSiarohin/first-order-model/master?filepath=demo.ipynb

参考链接：

http://papers.NeurIPS.cc/paper/8935-first-order-motion-model-for-image-animation
https://aliaksandrsiarohin.github.io/first-order-model-website/
https://github.com/alievk/avatarify
https://arxiv.org/abs/2003.00196v2

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

近期必读的五篇计算机视觉顶会CVPR 2020【图神经网络 (GNN) 】相关论文-Part 3

专知会员服务

90+阅读 · 2020年5月19日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

近期必读的5篇顶会CVPR 2020【图神经网络（GNN）】相关论文-Part2

专知会员服务

84+阅读 · 2020年3月17日

近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文

专知会员服务

79+阅读 · 2020年3月3日

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

专知会员服务

109+阅读 · 2020年2月19日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

近期必读的9篇 CVPR 2019【视觉目标跟踪】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

近期必读的5篇 CVPR 2019【图卷积网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【论文推荐】小样本视频合成，Few-shot Video-to-Video Synthesis

专知会员服务

24+阅读 · 2019年12月15日

NVIDIA视频合成有多「骚」，看看蒙娜丽莎你就知道了

机器学习算法与Python学习

17+阅读 · 2019年10月28日

用AI实现动画角色的姿势迁移，Adobe等提出新型「木偶动画」

机器之心

7+阅读 · 2019年10月12日

尝试混搭，告别格子衫，这个GAN帮你展示真人高清混搭效果

机器之心

9+阅读 · 2019年9月11日

还在脑补画面？这款GAN能把故事画出来

机器之心

5+阅读 · 2019年7月6日

仅训练996个剧本，迪士尼用AI自动生成动画

机器学习算法与Python学习

7+阅读 · 2019年4月20日

本周精选共读论文《姿态估计&图像生成》五篇

人工智能前沿讲习班

7+阅读 · 2019年3月25日

朱茵和杨幂被大换脸！这个“黑科技”暗藏一个大“坑”...

凤凰财经

10+阅读 · 2019年2月28日

基于姿态的人物视频生成【附PPT与视频资料】

人工智能前沿讲习班

32+阅读 · 2019年1月28日

【学界】画个草图生成2K高清视频，这份效果惊艳研究值得你跑一跑

GAN生成式对抗网络

8+阅读 · 2018年8月26日

干货 | CVPR 2018论文：「随心所欲」换装换姿态

AI科技评论

9+阅读 · 2018年7月2日

Adversarial Mutual Information for Text Generation

Arxiv

13+阅读 · 2020年6月30日

Multimodal Model-Agnostic Meta-Learning via Task-Aware Modulation

Arxiv

25+阅读 · 2019年10月30日

Efficient Tracking Proposals using 2D-3D Siamese Networks on LIDAR

Arxiv

4+阅读 · 2019年3月25日

A Comprehensive Survey on Graph Neural Networks

Arxiv

21+阅读 · 2019年1月3日

Graph2Seq: Graph to Sequence Learning with Attention-based Neural Networks

Arxiv

7+阅读 · 2018年12月3日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Towards Neural Phrase-based Machine Translation

Arxiv

3+阅读 · 2018年4月18日

PointCNN

Arxiv

8+阅读 · 2018年1月25日

Semi-supervised FusedGAN for Conditional Image Generation

Arxiv

8+阅读 · 2018年1月17日

Improved English to Russian Translation by Neural Suffix Prediction

Arxiv

4+阅读 · 2018年1月11日

VIP会员