成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
大谷新作!AI还原「王之霸气」朱元璋,杜甫倾情献唱奥特曼主题曲
2020 年 8 月 26 日
新智元
新智元报道
来源:b站
编辑:雅新、白峰
【新智元导读】
近日,B站up主大谷老师再次用AI上演了一波神笔马良!杜甫激情献唱奥特曼主题曲,朱元璋尽显王之霸气,林妹妹、兵马俑、徐悲鸿都跨越时空来凑热闹了。
AI 复活「历史人物系」来一波 !
兵马俑、杜甫、朱元璋、林黛玉都来凑热闹了。
还记得AI复原的100年前老北京和上海时装秀的原声录像吗?近日,
B站up主 @大谷Spitzer 再次用AI「画笔」复原了尘封多年的历史
。
杜甫「天眼」一开,没有吟诗,而是唱起了奥特曼主题曲《奇迹再现》,还挺有节奏。
杜甫抖起来,真没年轻人什么事了。
黎明悄悄划过天边,就像阳光穿过黑夜。
秦始皇兵马俑被誉为世界第八大奇迹。
每个兵马俑的表情都是千奇百态,几千年
过去了,我们很难想象出他们在秦朝的样子。
今天,大谷让这些兵俑重新焕发了生机,穿越前年来和你对话。
去过兵马俑后,大家都会对这些泥塑真人古迹的感到震撼。再看用AI复原后的兵马俑,竟变成了有血有肉的大叔。
明朝开国皇帝朱元璋复原后这一傲娇的表情,我瞬间收藏了。
网友表示,明太祖真是「英气逼人」。
天生抑郁体制的林黛玉图像复原后,让人瞬间眼前一亮。柳叶眉,樱桃唇,鹅蛋脸,一颦一笑,让人心生欢喜。
还有蒋兆和老先生的水墨画《老伴》,老爷爷和老奶奶的对话场景活灵活现。
AI复原《于阗歌舞图》,新疆的菇凉就是美!
这些活灵活现的人物究竟是如何复活的?
大谷很热心地分享了自己用到的AI模型,全是开源的GitHub项目。
只要沉下心来研究大谷的教程,你也能让杜甫舞动起来。
风格转换第一步
ArtBreeder 的是一个在线工具,可以让用户使用生成对抗性网络(GAN)来操纵人物肖像和风景。要做的很简单,登录 ArtBreeder 网站,输入自己想要风格化的图像,使用滑块进行调整就能完成,十分方便。
徐悲鸿经风格调整后的图像
如果想要特定风格的,就需要StyleGAN了,StyleGAN2是StyleGAN的升级版,可以更加精细的进行风格迁移。
StyleGAN2重新定义了无条件图像建模,无论是在现有的分布质量指标还是感知图像质量方面都达到了SOTA。StyleGAN2对上一代的StyleGAN方法进行了改进,并对模型结构和训练方法进行了调整,让图像的生成质量更好。
StyleGAN2训练的速度更快,新生成的图像受伪影的影响更小,多图像的混搭风格更好,插值更加平滑,因此看起来过渡比较平滑。
First-Order-Model,让静态人物动起来
得到特定风格的图片之后,如何让静态的人物动起来?
大谷使用了一个基于First-Order-Model的动态转换模型,该模型只需要输入一个动态视频和杜甫的静态图片,就可以让杜甫模仿出视频中人物的动作。
这个模型可以根据驱动视频的运动,对源图像中的对象进行动画处理,以生成视频序列,而无需使用任何注释或有关特定对象的先验信息。
模型采用自监督的方法将外观和运动信息分离,使用了视频中对象的关键点及其局部仿射变换进行特征表示。
First-Order-Model模型由两个主要模块组成:运动估计模块和图像生成模块。运动估计模块的目的是预测密集的运动场。我们假设存在一个抽象的参考框架,然后独立地估计了两种转换:从参考到源以及从参考到驱动,这样的设计使模型能够独立处理源帧和驱动帧。
视频不清晰不连贯?插帧、超分辨率一键搞定
模型直接生成的视频可能在动作不够连贯,这时就需要一个视频插帧的步骤,让动态图像显得更自然,大谷同样采用了一个开源视频帧插值模型DAIN。
DAIN的全称是深度感知视频帧插值,模型通过探索深度信息来显式地检测遮挡。该项目开发了一个深度感知流动投影层,优选取样更近的物体,以合成中间流插补视频帧。
此前在另一个视频中,大谷还使用了一个超分辨率工具ESRGAN。
当First-Order-Model生成的视频分辨率低,而DAIN插值后效果又不好,就可以考虑使用ESRGAN加一个超分辨率的后处理。
ESRGAN:ESRGAN改进自SRGAN ,主要用来做视频超分辨率。与SRGAN的深层模型越来越难以训练相反,更深层次的 ESRGAN 模型通过简单的训练就能达到卓越的性能,核心点在于平衡视觉质量和峰值信噪比的网络插值策略。
大谷老师的B站粉丝数已经将近9万了,如果你也想成为一个超人气AI明星,赶紧捡起你的Python吧!
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
StyleGAN
关注
0
腾讯发布2020《腾讯人工智能白皮书:泛在智能》,46页pdf
专知会员服务
131+阅读 · 2020年7月14日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
【CVPR2020-Facebook AI】单样本自适应域脸生成,One-Shot Domain Adaptation
专知会员服务
28+阅读 · 2020年4月6日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统,Reinforced Negative Sampling
专知会员服务
60+阅读 · 2020年3月14日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【清华大学】知识增强的常识性故事生成预训练模型,A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation
专知会员服务
51+阅读 · 2020年1月20日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
学习一个宫崎骏画风的图像风格转换GAN
AI科技评论
18+阅读 · 2020年3月13日
让大卫雕塑跳舞、蒙娜丽莎说话,英伟达视频合成有如此多「骚操作」
机器之心
10+阅读 · 2019年10月28日
还在脑补画面?这款GAN能把故事画出来
机器之心
5+阅读 · 2019年7月6日
四大指标超现有模型!少样本的无监督图像翻译效果逆天| 技术头条
AI100
6+阅读 · 2019年5月13日
超越Mask-RCNN:谷歌大脑的AI,自己写了个目标检测AI
量子位
3+阅读 · 2019年4月19日
最强GAN修图魔术师:美颜生发摘眼镜、草绘秒变真人脸
极市平台
6+阅读 · 2019年2月28日
用英伟达StyleGAN生成老婆吧,他生成了一百多只明日香 | 开源代码
量子位
7+阅读 · 2019年2月13日
CVPR 2018 | Spotlight论文:变分U-Net,可按条件独立变换目标的外观和形状
极市平台
6+阅读 · 2018年4月24日
女神们都下海“拍片”了?AI毛片横空出世,岛国老师们要失业?
程序猿
22+阅读 · 2017年12月24日
ST-CGAN 用GAN实现阴影检测和阴影去除
极市平台
7+阅读 · 2017年12月14日
Image Captioning with Integrated Bottom-Up and Multi-level Residual Top-Down Attention for Game Scene Understanding
Arxiv
3+阅读 · 2019年6月16日
MultiResUNet : Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation
Arxiv
8+阅读 · 2019年2月11日
Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method
Arxiv
4+阅读 · 2018年12月19日
Rethinking ImageNet Pre-training
Arxiv
8+阅读 · 2018年11月21日
Reversible Recurrent Neural Networks
Arxiv
3+阅读 · 2018年10月25日
A Restricted-Domain Dual Formulation for Two-Phase Image Segmentation
Arxiv
3+阅读 · 2018年7月30日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Efficient semantic image segmentation with superpixel pooling
Arxiv
6+阅读 · 2018年6月7日
One-Class Adversarial Nets for Fraud Detection
Arxiv
3+阅读 · 2018年6月5日
Combo Loss: Handling Input and Output Imbalance in Multi-Organ Segmentation
Arxiv
8+阅读 · 2018年5月22日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
StyleGAN
AI
图像复原
ESRGAN
傲娇
SRGAN
相关VIP内容
腾讯发布2020《腾讯人工智能白皮书:泛在智能》,46页pdf
专知会员服务
131+阅读 · 2020年7月14日
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
35+阅读 · 2020年6月17日
【SIGGRAPH 2020】人像阴影处理,Portrait Shadow Manipulation
专知会员服务
28+阅读 · 2020年5月19日
【CVPR2020-Facebook AI】单样本自适应域脸生成,One-Shot Domain Adaptation
专知会员服务
28+阅读 · 2020年4月6日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统,Reinforced Negative Sampling
专知会员服务
60+阅读 · 2020年3月14日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【清华大学】知识增强的常识性故事生成预训练模型,A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation
专知会员服务
51+阅读 · 2020年1月20日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
32+阅读 · 2020年1月10日
【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换
专知会员服务
35+阅读 · 2019年12月15日
热门VIP内容
开通专知VIP会员 享更多权益服务
《支持 ML/AI 的下一代智能自主网络系统:性能提升与管理》177页
《飞行训练指导:夜间熟悉》152页
数据:联合作战的新弹药
《混合现实飞行模拟器中的夜视镜仿真:无缝集成真实世界》最新54页
相关资讯
学习一个宫崎骏画风的图像风格转换GAN
AI科技评论
18+阅读 · 2020年3月13日
让大卫雕塑跳舞、蒙娜丽莎说话,英伟达视频合成有如此多「骚操作」
机器之心
10+阅读 · 2019年10月28日
还在脑补画面?这款GAN能把故事画出来
机器之心
5+阅读 · 2019年7月6日
四大指标超现有模型!少样本的无监督图像翻译效果逆天| 技术头条
AI100
6+阅读 · 2019年5月13日
超越Mask-RCNN:谷歌大脑的AI,自己写了个目标检测AI
量子位
3+阅读 · 2019年4月19日
最强GAN修图魔术师:美颜生发摘眼镜、草绘秒变真人脸
极市平台
6+阅读 · 2019年2月28日
用英伟达StyleGAN生成老婆吧,他生成了一百多只明日香 | 开源代码
量子位
7+阅读 · 2019年2月13日
CVPR 2018 | Spotlight论文:变分U-Net,可按条件独立变换目标的外观和形状
极市平台
6+阅读 · 2018年4月24日
女神们都下海“拍片”了?AI毛片横空出世,岛国老师们要失业?
程序猿
22+阅读 · 2017年12月24日
ST-CGAN 用GAN实现阴影检测和阴影去除
极市平台
7+阅读 · 2017年12月14日
相关论文
Image Captioning with Integrated Bottom-Up and Multi-level Residual Top-Down Attention for Game Scene Understanding
Arxiv
3+阅读 · 2019年6月16日
MultiResUNet : Rethinking the U-Net Architecture for Multimodal Biomedical Image Segmentation
Arxiv
8+阅读 · 2019年2月11日
Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method
Arxiv
4+阅读 · 2018年12月19日
Rethinking ImageNet Pre-training
Arxiv
8+阅读 · 2018年11月21日
Reversible Recurrent Neural Networks
Arxiv
3+阅读 · 2018年10月25日
A Restricted-Domain Dual Formulation for Two-Phase Image Segmentation
Arxiv
3+阅读 · 2018年7月30日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Efficient semantic image segmentation with superpixel pooling
Arxiv
6+阅读 · 2018年6月7日
One-Class Adversarial Nets for Fraud Detection
Arxiv
3+阅读 · 2018年6月5日
Combo Loss: Handling Input and Output Imbalance in Multi-Organ Segmentation
Arxiv
8+阅读 · 2018年5月22日
大家都在搜
笛卡尔
壁画
大型语言模型
空战战术
自主系统
palantir
RE-NET
洛克菲勒
智能推荐
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top