大谷新作！AI还原「王之霸气」朱元璋，杜甫倾情献唱奥特曼主题曲

会员服务 ·

大谷新作！AI还原「王之霸气」朱元璋，杜甫倾情献唱奥特曼主题曲

2020 年 8 月 26 日 新智元

新智元报道

来源：b站

编辑：雅新、白峰

【新智元导读】近日，B站up主大谷老师再次用AI上演了一波神笔马良！杜甫激情献唱奥特曼主题曲，朱元璋尽显王之霸气，林妹妹、兵马俑、徐悲鸿都跨越时空来凑热闹了。

AI 复活「历史人物系」来一波！

兵马俑、杜甫、朱元璋、林黛玉都来凑热闹了。

还记得AI复原的100年前老北京和上海时装秀的原声录像吗？近日， B站up主 @大谷Spitzer 再次用AI「画笔」复原了尘封多年的历史。

杜甫「天眼」一开，没有吟诗，而是唱起了奥特曼主题曲《奇迹再现》，还挺有节奏。

杜甫抖起来，真没年轻人什么事了。

黎明悄悄划过天边，就像阳光穿过黑夜。

秦始皇兵马俑被誉为世界第八大奇迹。每个兵马俑的表情都是千奇百态，几千年过去了，我们很难想象出他们在秦朝的样子。

今天，大谷让这些兵俑重新焕发了生机，穿越前年来和你对话。

去过兵马俑后，大家都会对这些泥塑真人古迹的感到震撼。再看用AI复原后的兵马俑，竟变成了有血有肉的大叔。

明朝开国皇帝朱元璋复原后这一傲娇的表情，我瞬间收藏了。

网友表示，明太祖真是「英气逼人」。

天生抑郁体制的林黛玉图像复原后，让人瞬间眼前一亮。柳叶眉，樱桃唇，鹅蛋脸，一颦一笑，让人心生欢喜。

还有蒋兆和老先生的水墨画《老伴》，老爷爷和老奶奶的对话场景活灵活现。

AI复原《于阗歌舞图》，新疆的菇凉就是美！

这些活灵活现的人物究竟是如何复活的？

大谷很热心地分享了自己用到的AI模型，全是开源的GitHub项目。

只要沉下心来研究大谷的教程，你也能让杜甫舞动起来。

风格转换第一步

ArtBreeder 的是一个在线工具，可以让用户使用生成对抗性网络(GAN)来操纵人物肖像和风景。要做的很简单，登录 ArtBreeder 网站，输入自己想要风格化的图像，使用滑块进行调整就能完成，十分方便。

徐悲鸿经风格调整后的图像

如果想要特定风格的，就需要StyleGAN了，StyleGAN2是StyleGAN的升级版，可以更加精细的进行风格迁移。

StyleGAN2重新定义了无条件图像建模，无论是在现有的分布质量指标还是感知图像质量方面都达到了SOTA。StyleGAN2对上一代的StyleGAN方法进行了改进，并对模型结构和训练方法进行了调整，让图像的生成质量更好。

StyleGAN2训练的速度更快，新生成的图像受伪影的影响更小，多图像的混搭风格更好，插值更加平滑，因此看起来过渡比较平滑。

First-Order-Model，让静态人物动起来

得到特定风格的图片之后，如何让静态的人物动起来？

大谷使用了一个基于First-Order-Model的动态转换模型，该模型只需要输入一个动态视频和杜甫的静态图片，就可以让杜甫模仿出视频中人物的动作。

这个模型可以根据驱动视频的运动，对源图像中的对象进行动画处理，以生成视频序列，而无需使用任何注释或有关特定对象的先验信息。

模型采用自监督的方法将外观和运动信息分离，使用了视频中对象的关键点及其局部仿射变换进行特征表示。

First-Order-Model模型由两个主要模块组成：运动估计模块和图像生成模块。运动估计模块的目的是预测密集的运动场。我们假设存在一个抽象的参考框架，然后独立地估计了两种转换：从参考到源以及从参考到驱动，这样的设计使模型能够独立处理源帧和驱动帧。

视频不清晰不连贯？插帧、超分辨率一键搞定

模型直接生成的视频可能在动作不够连贯，这时就需要一个视频插帧的步骤，让动态图像显得更自然，大谷同样采用了一个开源视频帧插值模型DAIN。

DAIN的全称是深度感知视频帧插值，模型通过探索深度信息来显式地检测遮挡。该项目开发了一个深度感知流动投影层，优选取样更近的物体，以合成中间流插补视频帧。

此前在另一个视频中，大谷还使用了一个超分辨率工具ESRGAN。

当First-Order-Model生成的视频分辨率低，而DAIN插值后效果又不好，就可以考虑使用ESRGAN加一个超分辨率的后处理。

ESRGAN：ESRGAN改进自SRGAN ，主要用来做视频超分辨率。与SRGAN的深层模型越来越难以训练相反，更深层次的 ESRGAN 模型通过简单的训练就能达到卓越的性能，核心点在于平衡视觉质量和峰值信噪比的网络插值策略。

大谷老师的B站粉丝数已经将近9万了，如果你也想成为一个超人气AI明星，赶紧捡起你的Python吧！

‍

登录查看更多

相关内容

StyleGAN

关注 0

腾讯发布2020《腾讯人工智能白皮书：泛在智能》，46页pdf

专知会员服务

132+阅读 · 2020年7月14日

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

注意力图神经网络的多标签文本分类

专知会员服务

112+阅读 · 2020年3月28日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【清华大学】知识增强的常识性故事生成预训练模型，A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation

专知会员服务

52+阅读 · 2020年1月20日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

学习一个宫崎骏画风的图像风格转换GAN

AI科技评论

18+阅读 · 2020年3月13日

让大卫雕塑跳舞、蒙娜丽莎说话，英伟达视频合成有如此多「骚操作」

机器之心

10+阅读 · 2019年10月28日

还在脑补画面？这款GAN能把故事画出来

机器之心

5+阅读 · 2019年7月6日

四大指标超现有模型！少样本的无监督图像翻译效果逆天| 技术头条

AI100

6+阅读 · 2019年5月13日

超越Mask-RCNN：谷歌大脑的AI，自己写了个目标检测AI

量子位

3+阅读 · 2019年4月19日

最强GAN修图魔术师：美颜生发摘眼镜、草绘秒变真人脸

极市平台

6+阅读 · 2019年2月28日

用英伟达StyleGAN生成老婆吧，他生成了一百多只明日香 | 开源代码

量子位

7+阅读 · 2019年2月13日

CVPR 2018 | Spotlight论文：变分U-Net，可按条件独立变换目标的外观和形状

极市平台

6+阅读 · 2018年4月24日

女神们都下海“拍片”了？AI毛片横空出世，岛国老师们要失业？

程序猿

22+阅读 · 2017年12月24日

ST-CGAN 用GAN实现阴影检测和阴影去除

极市平台

7+阅读 · 2017年12月14日

Image Captioning with Integrated Bottom-Up and Multi-level Residual Top-Down Attention for Game Scene Understanding

Arxiv

3+阅读 · 2019年6月16日

MultiResUNet : Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation

Arxiv

8+阅读 · 2019年2月11日

Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method

Arxiv

5+阅读 · 2018年12月19日

Rethinking ImageNet Pre-training

Arxiv

8+阅读 · 2018年11月21日

Reversible Recurrent Neural Networks

Arxiv

3+阅读 · 2018年10月25日

A Restricted-Domain Dual Formulation for Two-Phase Image Segmentation

Arxiv

3+阅读 · 2018年7月30日

Relational recurrent neural networks

Arxiv

8+阅读 · 2018年6月28日

Efficient semantic image segmentation with superpixel pooling

Arxiv

6+阅读 · 2018年6月7日

One-Class Adversarial Nets for Fraud Detection

Arxiv

3+阅读 · 2018年6月5日

Combo Loss: Handling Input and Output Imbalance in Multi-Organ Segmentation

Arxiv

8+阅读 · 2018年5月22日

VIP会员