成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
还原时代原声,AI修复老北京再次火爆全网!民俗乐队、街边地摊、剃头匠,网友:有内味儿了
2020 年 7 月 2 日
AI科技评论
作者 | 贝爽
编辑 | 丛末
凭借AI修复老北京影像火爆B站的Up主大谷兄,今天又来带我们玩穿越了!
这次是1929年的老北京,除了AI上色、补帧、扩大分辨率外,还百分百还原了时代原声,老北京的味儿太足了!
人头攒动,熙熙攘攘,有赚吆喝的、看热闹的、闲聊的,老北京集市好不热闹。
大鼓、笛子、四胡、三弦,手艺人的一曲《打新春》,有内味了。
盲人"爵士"乐队
原来理发最低不是5块,还有2块的!
听他们聊天,网友表示想看相声了。
师傅:疼不疼?
小伙:不疼。我还不哭呢外带着。
小伙:这个头好,剃得不疼,剃不好,真疼,剃好了咱还找你去。
师傅:唉
......
如果精神小伙穿越到现在,会不会是一位优秀的Up主?
精神小伙理发记
溢出屏幕的开心劲儿,看来发型很满意。在我们这年代都不用理,用不了几年就能天然形成[傲娇]
吃饭还能这么热闹吗?我们现在都是隔着两米!
惊现“地摊经济”
3min的珍贵影像资料,可谓真真切切地感受了老北京九十年前的生活状态。虽然看起来物质生活不是很富裕,但隔着屏幕都是感受到那时候人们的欢乐。准确的来说,这段影像记录的是1927-1929年的老北京,出自南卡罗莱纳大学影像库馆藏胶片。
另外,这段影像修复视频依然出自B站Up主大谷之手,此前他曾用AI修复过1920-1927年的一段老北京影像,在B站爆火,视频点击量超过了200万,还受到了央视新闻的报道。不过,从影像的修复效果过来看,显然这次在去噪和着色方面处理的更好,而且还是自带原声的影像资料。
这次的修复作品是与央视新闻联合发布的,视频上传不到30min,在B站就收获了30多万的播放量,弹幕更是爆屏。
1
AI修复是如何实现的?
据大谷介绍,这部修复作品采用了新的AI技术DeepRemaster。与此前相比,它在上色、补帧、分辨率方面都有更出色的表现。这项技术的研发者是日本建筑大学的Satoshi Iizuka和和早稻田大学的Edgar Simo-Serra。他们的论文还被计算机图形学顶会SIGG2019收录。
论文地址:http://iizuka.cs.tsukuba.ac.jp/projects/remastering/en/index.html
我们知道以前的影像资料一般都是黑白的,而且像素、质量比较低。如果修复的话,需要提高分辨率、去除噪声和增强对比度的处理。基于这些任务,作者中提出了一个DeepRemaster模型。
它基于时间卷积神经网络,在视频上训练注意力机制(Source-Reference),这种注意力机制可以处理任意数量的彩色图像,同时不需要对长视频进行分割,因此保持时间的一致性。经过定量分析表明,DeepRemaster的模型性能可以随着视频长度和彩色图像的增加而提高,远优于现有的修复模型。
DeepRemater模型的内部架构
在模型Input端输入黑白图像,经过时间卷积网络的预处理和Source-Reference注意力机制的深度训练后,可以结合任意数量的彩色图像来生成最终的色度信道。在这一过程中, Source-Reference注意力机制允许模型再给视频上色时,参考彩色图像(Reference Images)中的相似区域。
基于递归的卷积神经网络,在传播信息时,通常是逐帧传播,不能进行并行处理,并形成依赖关系。因此,在参考彩色图像时,图像会反复重新开始,这样时间上的相关性就会丢失。而基于Source-Reference注意力机制的卷积神经网络在处理任何帧时能够并行使用所有的参考信息。
以下是DeepRemaster修复的效果图:(右侧为参考彩色图像)
2
修复方法比较
Zhang、Yu和Vondrick等人曾对世界经典电影和和Youtube视频进行AI修复试验,结果取得了不错的效果。作者为验证DeepMaster的修复性能,与之进行了对比。
首先是与Zhang、Yu的比较。作者从Youtube的300视频数据集中随机抽取了一段8M视频作为修复目标,其中所用到参考彩色图像,取自源视频,并每隔60帧截取一次。
噪声处理:从修复结果来看,当前的方法在去噪处理方面,显然优势明显。第一列为存在噪声瑕疵的原图像,前两种几乎没有对齐进行修复,第四列可以看到在高保真的状态下,噪声被处理的很好,与第四列真实图像几乎没有差异。
着色处理:图中第一列为原始图像,后三列为不同方法的处理着色处理结果,最后一列为参考彩色图形。可以看出第三列的颜色处理与第四列几乎无差异。因此,基于Source-Reference注意力机制的模型着色效果更好。
另外,作者将Zhang和Vondrick的修复方法结合,并进行了比较。上部图像为参考彩色图像,分别对第5、85、302帧的图像进行了修复,结果可以看出目前的方法在着色效果上更好。
更多论文详细内容参考:
http://iizuka.cs.tsukuba.ac.jp/projects/remastering/data/remastering_siggraphasia2019.pdf
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
穿越
关注
3
穿越到古代。
【ECCV2020】EfficientFCN:语义分割中的整体引导解码器
专知会员服务
15+阅读 · 2020年8月23日
【ICML2020-西电】用于语言生成的递归层次主题引导RNN
专知会员服务
21+阅读 · 2020年6月30日
【IJCAI2020-Facebook】利用弱标记数据对声音进行大规模的视听学习
专知会员服务
17+阅读 · 2020年6月3日
【CVPR2020-Oral】自监督单目场景流量估计,Self-Supervised Monocular SFE
专知会员服务
22+阅读 · 2020年4月9日
【CVPR2020-斯坦福】知识蒸馏时空图的视频描述,Spatio-Temporal Graph
专知会员服务
33+阅读 · 2020年4月2日
【CVPR2020-哈工大-京东】自监督结构建模的目标识别,Self-supervised Structure Modeling
专知会员服务
42+阅读 · 2020年4月1日
自回归模型:PixelCNN
专知会员服务
26+阅读 · 2020年3月21日
近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文
专知会员服务
78+阅读 · 2020年3月3日
【图解自监督学习】《The Illustrated Self-Supervised Learning》by Amit Chaudhary
专知会员服务
42+阅读 · 2020年2月25日
【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别
专知会员服务
50+阅读 · 2020年2月16日
框一下就能从视频隐身,这是现实版的「隐身衣」?
机器之心
5+阅读 · 2019年7月9日
AI还原半世纪前的黑白电影和照片:效果惊艳在线可玩,网友大呼“鹅妹子嘤”
量子位
11+阅读 · 2019年5月7日
消失的千人计划
算法与数学之美
13+阅读 · 2019年4月30日
13款vlog剪辑App真实测评!原来当网红这么费钱
新榜
4+阅读 · 2019年3月11日
AI换脸朱茵变杨幂,技术背后细思极恐
大数据技术
7+阅读 · 2019年3月1日
朱茵和杨幂被大换脸!这个“黑科技”暗藏一个大“坑”...
凤凰财经
10+阅读 · 2019年2月28日
为了修复打码女神脸,他们提出二阶段生成对抗网络EdgeConnect
机器之心
4+阅读 · 2019年1月6日
华为Mate20系列4款新机发布,售价最高超一万六
DeepTech深科技
3+阅读 · 2018年10月17日
MIT谷歌伯克利三强联手 ,AI创造超现实主义3D运动雕塑
新智元
5+阅读 · 2018年9月23日
125位画师用7年制作了一部油画电影,交给人工智能会如何?
钛媒体
4+阅读 · 2017年12月4日
Bivariate Beta LSTM
Arxiv
5+阅读 · 2019年10月7日
Good News, Everyone! Context driven entity-aware captioning for news images
Arxiv
6+阅读 · 2019年4月2日
Building Knowledge Graphs About Political Agents in the Age of Misinformation
Arxiv
5+阅读 · 2019年1月29日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
A Tidy Data Model for Natural Language Processing using cleanNLP
Arxiv
4+阅读 · 2018年5月3日
Cross-Domain Adversarial Auto-Encoder
Arxiv
4+阅读 · 2018年4月17日
DAiSEE: Towards User Engagement Recognition in the Wild
Arxiv
5+阅读 · 2018年4月12日
IEOPF: An Active Contour Model for Image Segmentation with Inhomogeneities Estimated by Orthogonal Primary Functions
Arxiv
10+阅读 · 2018年1月20日
Integrating semi-supervised label propagation and random forests for multi-atlas based hippocampus segmentation
Arxiv
3+阅读 · 2017年12月31日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
穿越
AI
注意力机制
央视新闻
傲娇
去噪
相关VIP内容
【ECCV2020】EfficientFCN:语义分割中的整体引导解码器
专知会员服务
15+阅读 · 2020年8月23日
【ICML2020-西电】用于语言生成的递归层次主题引导RNN
专知会员服务
21+阅读 · 2020年6月30日
【IJCAI2020-Facebook】利用弱标记数据对声音进行大规模的视听学习
专知会员服务
17+阅读 · 2020年6月3日
【CVPR2020-Oral】自监督单目场景流量估计,Self-Supervised Monocular SFE
专知会员服务
22+阅读 · 2020年4月9日
【CVPR2020-斯坦福】知识蒸馏时空图的视频描述,Spatio-Temporal Graph
专知会员服务
33+阅读 · 2020年4月2日
【CVPR2020-哈工大-京东】自监督结构建模的目标识别,Self-supervised Structure Modeling
专知会员服务
42+阅读 · 2020年4月1日
自回归模型:PixelCNN
专知会员服务
26+阅读 · 2020年3月21日
近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文
专知会员服务
78+阅读 · 2020年3月3日
【图解自监督学习】《The Illustrated Self-Supervised Learning》by Amit Chaudhary
专知会员服务
42+阅读 · 2020年2月25日
【上海交大-ICASSP2020】Transformer端到端的多说话人语音识别
专知会员服务
50+阅读 · 2020年2月16日
热门VIP内容
开通专知VIP会员 享更多权益服务
【博士论文】ࣞ动态三维人体的隐式神经表示方法研究
大语言模型训练数据
【新书】动力系统的收缩理论,258页pdf
适应性异常检测在识别网络物理系统攻击中的应用:系统性文献综述
相关资讯
框一下就能从视频隐身,这是现实版的「隐身衣」?
机器之心
5+阅读 · 2019年7月9日
AI还原半世纪前的黑白电影和照片:效果惊艳在线可玩,网友大呼“鹅妹子嘤”
量子位
11+阅读 · 2019年5月7日
消失的千人计划
算法与数学之美
13+阅读 · 2019年4月30日
13款vlog剪辑App真实测评!原来当网红这么费钱
新榜
4+阅读 · 2019年3月11日
AI换脸朱茵变杨幂,技术背后细思极恐
大数据技术
7+阅读 · 2019年3月1日
朱茵和杨幂被大换脸!这个“黑科技”暗藏一个大“坑”...
凤凰财经
10+阅读 · 2019年2月28日
为了修复打码女神脸,他们提出二阶段生成对抗网络EdgeConnect
机器之心
4+阅读 · 2019年1月6日
华为Mate20系列4款新机发布,售价最高超一万六
DeepTech深科技
3+阅读 · 2018年10月17日
MIT谷歌伯克利三强联手 ,AI创造超现实主义3D运动雕塑
新智元
5+阅读 · 2018年9月23日
125位画师用7年制作了一部油画电影,交给人工智能会如何?
钛媒体
4+阅读 · 2017年12月4日
相关论文
Bivariate Beta LSTM
Arxiv
5+阅读 · 2019年10月7日
Good News, Everyone! Context driven entity-aware captioning for news images
Arxiv
6+阅读 · 2019年4月2日
Building Knowledge Graphs About Political Agents in the Age of Misinformation
Arxiv
5+阅读 · 2019年1月29日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
A Tidy Data Model for Natural Language Processing using cleanNLP
Arxiv
4+阅读 · 2018年5月3日
Cross-Domain Adversarial Auto-Encoder
Arxiv
4+阅读 · 2018年4月17日
DAiSEE: Towards User Engagement Recognition in the Wild
Arxiv
5+阅读 · 2018年4月12日
IEOPF: An Active Contour Model for Image Segmentation with Inhomogeneities Estimated by Orthogonal Primary Functions
Arxiv
10+阅读 · 2018年1月20日
Integrating semi-supervised label propagation and random forests for multi-atlas based hippocampus segmentation
Arxiv
3+阅读 · 2017年12月31日
大家都在搜
PRML
无人艇
大型语言模型
无人机蜂群
自主系统
RE-NET
智能推荐
壁画
笛卡尔
GANLab 将GA
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top