超清还不够,商汤插帧算法让视频顺滑如丝丨NeurIPS 2019 Spotlight论文

2019 年 12 月 20 日 学术头条

(本文转载自“ 商汤科技SenseTime”微信公众号,转载请联系原作者)


Quadratic Video Interpolation


作者:

Xiangyu Xu, Li Siyao, Wenxiu Sun, Qian Yin, Ming-Hsuan Yang(卡内基梅隆大学,商汤科技,北京师范大学,加州大学)

地址:

https://www.aminer.cn/pub/5de799e39e795e7758069355/  



自相机被发明以来,人们对更高画质视频的追求就没有停止过。


分辨率从480p,720p,再到1080p,现在有了2K、4K;帧率也从25FPS到60FPS,再到240FPS,960FPS甚至更高……


如果仅靠相机的硬件迭代来提升帧率,存在局限性,因为相机传感器在单位时间内捕捉到的光有局限。而且相机硬件迭代的周期长,成本高。


最近,商汤移动智能研究总监孙文秀团队,提出了一种可以感知视频中运动加速度的视频插帧算法(Quadratic Video Interpolation)打破了之前插帧方法的线性模型,将二次方光流预测和深度卷积网络进行融合,让你的视频顺滑如丝。


这种方法有多厉害?来看一个对比:


如果把视频放慢就能明显感觉到,未经过插帧的慢放视频(左)会明显卡顿,而经过商汤Quadratic(二次方)视频插帧方法处理的视频(右)播放流畅


这个方法的论文被NeurIPS 2019接受为Spotlight论文,该方法还在ICCV AIM 2019 VideoTemporal Super-Resolution Challenge比赛中获得了冠军



二次方插帧 VS 传统线性插帧


之前的视频插帧方法(包括Phase[1]、DVF[2]、SepConv[3]和SuperSloMo[4]等)是假设相邻帧之间的运动是匀速的,即沿直线以恒定速度移动。然而,真实场景中的运动通常是复杂的、非线性的,传统线性模型会导致插帧的结果不准确。


以抛橄榄球的运动视频为例(如下图1),真实运动中的轨迹是一条抛物线,如果在第0帧和第1帧之间进行插帧,线性模型方法模拟出来轨迹是线性轨迹(右二),与真实运动轨迹(右三)相差较大。


图1 传统线性模型与商汤二次方视频插帧结果对比


但通过商汤二次方视频插帧模型模拟出来的运动轨迹是抛物线形(图1右一),更逼近真实轨迹。也就是说,它能够更准确地估计视频相邻帧之间的运动并合成中间帧,从而获得更精准的插帧结果。



二次方插帧是怎样“炼”成的?


商汤研究团队构建了一个可以感知视频运动加速度的网络模型。与传统线性插帧模型利用两帧输入不同,它利用了相邻四帧图像来预测输入帧到中间帧的光流,简易的流程图如下:

图2 二次方插帧模型的流程


 、 和 是输入视频连续的四帧。给定任意时刻t(0<t<1),该模型将最终生成t时刻的中间帧。而要得到,就需要更深入了解其中的两个关键技术:二次方光流预测和光流逆转


其中,二次方光流预测,就是中学物里面常讲到的求匀变速运动位移的过程:假设在[-1, 1]时刻的运动是匀加速运动,那么可以利用位移推测出0时刻的速度和区间内的加速度,即可以计算出0时刻到任意t时刻的位移:


图3:视频中物体运动的示意图

,,,分别表示物体,,, 中的位置


通过以上方法,对称地我们可以计算出。此时,我们得到了含有加速度信息


为了生成高质量的中间帧,我们需要得到反向光流


为此商汤研究团队提出一个可微分的“光流逆转层”来预测通过以下转换公式可以高效的将和转化为,但是可能会造成逆转的光流在运动边界处出现强烈的振铃效应(见图4)。



为了消除这些强烈震荡的部分,商汤研究团队提出了一种基于深度神经网络的、能够对逆转后光流进行自适应采样的滤波器(Adaptive Flow Filter)。



实验证明,自适应滤波器(ada.)能够明显削弱光流逆转造成的振铃效应,从而改善最终合成帧的质量。


图4 自适应滤波器能够改善

逆转的光流和合成的中间帧的质量



  实验结果


商汤研究团队在GOPRO、Adobe240、UCF101和DAVIS四个知名视频数据集上对提出的方法进行测评,并与业界前沿的插帧方法Phase、DVF、SepConv和SuperSloMo进行比较。在每个数据集上,商汤二次视频插针方法都大幅超过现有的方法(见表1、表2)。


表1 商汤提出的方法和业界前沿方法

在GOPRO和Adobe240数据集上的比较


表2 商汤提出的方法和业界前沿方法

在UCF101和DAVIS数据集上的比较


除此之外,商汤研究团队还对各种方法生成中间帧进行了关键点跟踪并进行可视化,从图5中两个案例的视频运动轨迹可以看出,用真实慢动作相机采集的中间帧(GT)的运动轨迹是曲线的。线性模型(SepConv、SuperSloMo、Oursw/o qua)生成的中间帧的运动轨迹都是直线,相反,商汤的模型(Ours)能够更精准的预测出非线性轨迹,获得更好的插帧结果。


图5 对不同方法的插帧结果进行可视化。第一行和第三行是每种方法的插帧结果和真实图像中间帧(GT)的平均。第二行和第四行对每种方法的插帧结果进行关键点跟踪。


综上,商汤提出的能够感知视频中运动加速度的插帧方法相比已有的线性插帧算法,能够过更好地预测中间帧。


参考文献:

[1]S.Meyer, O.Wang, H.Zimmer, M.Grosse, and A.Sorkine-Hornung. Phase-based frame interpolation for video.In CVPR, 2015

[2]Z.Liu,R.Yeh, X.Tang, Y.Liu, and A.Agarwala. Video frame synthesis using deepvoxel flow. In ICCV,2017.

[3]S.Niklaus, L.Mai, and F.Liu. Video frame interpolationvia adaptive separable convolution. In ICCV,2017

[4] H.Jiang, D.Sun, V.Jampani, M.Yang, E. G. Learned-Miller, and J.Kautz. Superslomo: High quality estimation of multiple intermediate frames for video interpolation. In CVPR, 2018.



NeurIPS100计划是AMiner新推出的一个针对顶会人才和顶会论文的平台化的智能挖掘服务,其目的是对每个顶级会议的100位作者和讲者(人才)进行深度洞察,分析作者之间的关联关系,形成的研究派系、作者的成长路径以及未来的成长脉络预测、跳槽指数等;另外,我们还将针对会议高影响力的100篇重要论文进行深入解读。



往期精彩回顾

【NeurIPS100】NeurIPS2019 七篇获奖论文揭晓 入选论文深度分析!

NeurIPS十年高引学者TOP100榜单发布!这些大牛值得膜拜!

【NeuIPS 2019】Yoshua Bengio报告:如何用深度学习来实现System2?



点击“阅读原文”查看NeurIPS 2019报道及论文解读集合↓

登录查看更多
3

相关内容

CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
少标签数据学习,54页ppt
专知会员服务
194+阅读 · 2020年5月22日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
25+阅读 · 2020年5月7日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
专知会员服务
109+阅读 · 2020年3月12日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
已删除
将门创投
7+阅读 · 2019年10月15日
CVPR 2019 论文大盘点-超分辨率篇
极市平台
77+阅读 · 2019年6月23日
Arxiv
5+阅读 · 2019年6月5日
Foreground-aware Image Inpainting
Arxiv
4+阅读 · 2019年1月17日
Arxiv
5+阅读 · 2018年2月26日
Arxiv
10+阅读 · 2017年11月22日
VIP会员
相关VIP内容
CVPR 2020 最佳论文与最佳学生论文!
专知会员服务
34+阅读 · 2020年6月17日
少标签数据学习,54页ppt
专知会员服务
194+阅读 · 2020年5月22日
【CVPR 2020-商汤】8比特数值也能训练卷积神经网络模型
专知会员服务
25+阅读 · 2020年5月7日
CVPR2020 | 商汤-港中文等提出PV-RCNN:3D目标检测新网络
专知会员服务
43+阅读 · 2020年4月17日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
专知会员服务
109+阅读 · 2020年3月12日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
深度学习视频中多目标跟踪:论文综述
专知会员服务
90+阅读 · 2019年10月13日
Top
微信扫码咨询专知VIP会员