刚刚 ECCV 2020放榜!Oral 论文抢先读-可逆图像缩放:完美恢复降采样后的高清图片

2020 年 7 月 3 日 极市平台

加入极市专业CV交流群,与10000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~




今天,计算机视觉三大顶会之一ECCV2020接收结果已经公布,本次ECCV 2020有效投稿5025篇,一共有1361篇论文入选,录取率是27%。

部分作者已经展示了自己被接收的工作,有些更是已经放出了开源代码。因此,经过小编的努力,我们收集了一批论文(因为无官方通知,如有错误,欢迎指出),大家可前往文末或者 阅读原文 获取。



来源:知乎
原文链接:https://zhuanlan.zhihu.com/p/150340687
作者:Shuxin Zheng
本文已获作者授权,未经作者授权,不得二次转载。


不知道同学们平日里上网有没有遇到过这种情况:自己精心拍摄的高清照片/视频,想发给朋友or分享到朋友圈/微博/抖音/知乎,结果上传文件之后,直接被无良服务器压成超低分辨率渣画质。甚至有些图片/表情包在经过多次传播之后,画质已经糊到惨不忍睹。

其实,图片的降采样(缩放)可以说是对数字图像最常见的操作了,它的用处多种多样:压缩图片尺寸、节省服务器存储or带宽、适配不同分辨率的屏幕等等。像现在服务器资源这么贵,大家发微博/知乎也不交钱,顶多给各位多塞点广告,所以高清图片和视频自然是能压则压,能分得清张一山和夏雨就可以了。

如何恢复降采样后的图片是图像处理中一个非常有挑战的问题,一直没有被很好的解决。今天给大家介绍一篇我们在ECCV2020上最新的Oral工作,巧妙地尝试从本质上解决这个问题。

论文地址:https://arxiv.org/abs/2005.05650

代码和预训练模型:(最后清理阶段,很快放出)

github :https://github.com/pkuxmq/Invertible-Image-Rescaling


对降采样后图片的原图求解是一个典型的病态(ill-posed)问题:

现在有一张图片有4个像素,值分别为1,3,5,7。假设对原图进行双线性插值降采样(Bilinear Interpolation),得到像素值为4的低分辨率图片。那么,如何从这一个像素还原出原图呢?

这个问题太难了,有太多种4个像素取值的组合都可以得到同样一张低分辨率图片。如果是4x降采样,则会有16个像素被采样成一个点。。想要精确地从一个像素还原出原图?你看看那些像素上的"?"眼熟不。。。

为什么这是一个病态问题?这是因为在降采样的过程中存在着信息的丢失(information loss), 以至于无法很好地还原回原图。而前人的做法一般是使用一个超分辨率的卷积神经网络,尝试从大量的数据中强行学习低分辨率到高分辨率的映射关系;或者使用encoder网络对原图进行降采样,同时使用decoder网络还原图片,二者进行联合训练(jointly training)达到更好的效果。但以上这些方法都没有从本质上解决病态问题,效果也不尽如人意。因此我们需要更聪明的方法来解决病态问题。

基于DNN的Encoder-Decoder结构对图像进行缩放和还原

刚才提到了病态问题的产生是由于信息的丢失,那么具体是什么信息被丢失了呢?

High-frequency content will get lost during sample rate conversion.”
                                                     --Nyquist-Shannon Sampling Theorem

正是由于高频信息的丢失导致了我们无法很好的还原高清原图,那么如果我们“保留”这些高频信息呢?

为了可以显式地保留高频信息,我们将降采样的过程替换为小波变换:由小波变换我们可以得到原图的一个低频分量和三个不同方向的高频分量。这里的低频分量与双线性插值降采样得到的低分辨率结果是一样的,而高频分量则是在降采样过程中被丢失的信息。

当我们选择保留全部信息时,我们可以使用小波变换的逆变换(即反函数,如果 ,那么 ),很轻松地将原图恢复出来。同理,对于使用DNN进行降采样的图片,我们如果保留了全部信息,那么也可以使用DNN的反函数将原图恢复回来。

对于深度学习模型这样一种复杂的非线性函数,它的反函数是什么呢?这里我们要用到可逆神经网络(Invertible NN, INN)模型。对可逆神经网络模型不熟悉的同学,推荐阅读Lilian Weng的博客:Flow-based Generative Model. 我们采用了最简单的Normalizing Flow的形式。这里需要注意,flow-based模型是严格可逆的。从另一个角度来思考这个问题,降采样和升采样本来就是一对逆任务,是否便应当使用可逆神经网络?

有了可逆神经网络模型,我们可以把之前的Encoder-Decoder网络换成INN和它的反函数,这样,如果我们可以保留全部信息,就能完美地恢复出原始高清图片。然而,我们显然无法在存储、传输低分辨率图片时还附带这些本应被丢失的信息(低分辨率图片的维度+丢失信息的维度=原始图片的维度),而丢弃这些信息又让我们无法使用INN来恢复出原图。所以,折腾了半天又把这条路堵死了?

别急,我们再来回顾一下前面的简单例子:

我们令 表示原始高清图片, 分别表示低频与高频分量。小波变换 转换为 本该被丢弃,然而却无法被丢弃(丢弃后无法通过 恢复),其原因在于 的分布是condition on ,即 是与样本相关的(case-specific),因此分布 是难以获知的。那我们的insight就是:只要捕捉到丢失信息(Lost Information)的分布,就能得到关于它最多的信息。因此如果能令 相互独立,并且使所有的 (over dataset)通过某个变换服从一个预定的简单分布(如高斯分布),那么 就可以被安全地丢弃,需要它时再采样就好了。

此时,轮到我们的INN出场了。我们引入变量 ,令 是一个INN,负责把 转换为 (这步有定理保证[1])。此使 的分布已经与 无关了,即case-agnoistic。同时,INN还可以生成符合我们要求的 (如视觉效果更好的/便于压缩的..)。

对于case-agnoistic的 ,我们可以放心地将其丢弃;而当需要恢复原图时,我们可以在高斯分布中进行采样来得到 。这里需要注意,整个过程并不是完全没有信息丢失,这是因为我们使用了一个分布(高斯分布)中的一次随机采样来代替符合该分布中的一个特定样本点。但是由于我们的INN已经学习到如何将符合高斯分布的点(结合 )恢复为case-specific的,因此相对于前人完全忽视ill-posed问题的做法,可以从本质上缓解求解ill-posed问题带来的困难,效果上的提升也是非常显著:

除了性能的大幅提升,更重要的是,得益于建模方法尝试直接解决任务的本质问题,模型所需参数量只需前人方法的1/10~1/30。下面是效果的可视化,请注意绿色框中对原图的还原程度。

更多的细节可以参考论文,包括具体的训练方法、不同采样的 如何影响图片还原、对于Out of Distribution的 模型又会有怎样的效果等等。这里再贴一次论文链接:

https://arxiv.org/abs/2005.05650

最后总结一下:其实Image Rescaling任务是一个很有挑战、同时在实际场景中应用广泛且商业价值巨大的任务。本文使用可逆神经网络对解决这一对逆任务进行了初步的尝试,沿着这条思路仍有很多值得发掘的点。同时,信息丢失(Information Loss)所导致的ill-posed问题在现实中也大量存在,本文提供的对Lost Information进行建模的视角,相信可以对类似任务有一定的参考价值。

参考

  1. ^Nonlinear independent component analysis: Existence and uniqueness results. https://www.sciencedirect.com/science/article/abs/pii/S0893608098001403




部分ECCV 2020 接收论文列表如下:


1.ECCV 2020 Oral | 可逆图像缩放:完美恢复降采样后的高清图片
论文:https://arxiv.org/abs/2005.05650
代码和预训练模型:https://github.com/pkuxmq/Invertible-Image-Rescaling


2.ECCV 2020 | 空间角度信息交互的光场图像超分辨方法
Spatial-Angular Interaction for Light Field Image Super-Resolution
论文PDF:https://arxiv.org/pdf/1912.07849.pdf
代码已公开:https://github.com/YingqianWang/LF-InterNet

3.ECCV 2020 | 图像超分辨率  Invertible Image Rescaling
论文:https://arxiv.org/abs/2005.05650
代码:https://github.com/pkuxmq/Invertible-Image-Rescaling

4.ECCV 2020 2D目标检测 | Dynamic R-CNN: Towards High Quality Object Detection via Dynamic Training
论文:https://arxiv.org/abs/2004.06002
代码:https://github.com/hkzhang95/DynamicRCNN


5.遥感旋转目标检测
Arbitrary-Oriented Object Detection with Circular Smooth Label
论文:https://arxiv.org/abs/2003.05597
代码:https://github.com/Thinklab-SJTU/CSL_RetinaNet_Tensorflow

6.3D目标检测
EPNet: Enhancing Point Features with Image Semantics for 3D Object Detection
代码:https://github.com/happinesslz/EPNet

  1. GAN | XingGAN for Person Image Generation
代码:https://github.com/Ha0Tang/XingGAN


  1. 3D点云补全\3D点云(分类/分割/配准/补全等)
    GRNet: Gridding Residual Network for Dense Point Cloud Completion
代码:https://github.com/hzxie/GRNet


  1. 显著性检测 | BBS-Net: RGB-D Salient Object Detection with a Bifurcated Backbone Strategy Network
代码:https://github.com/DengPingFan/BBS-Net

10.Highly Efficient Salient Object Detection with 100K Parameters
论文:https://arxiv.org/abs/2003.05643
代码:https://github.com/MCG-NKU/Sal100K

11.轨迹预测 | SimAug: Learning Robust Representations from 3D Simulation for Pedestrian Trajectory Prediction in Unseen Cameras


论文:https://arxiv.org/abs/2004.02022
代码:https://github.com/JunweiLiang/Multiverse

12.AiR: Attention with Reasoning Capability
代码:https://github.com/szzexpoi/AiR
数据集:https://github.com/szzexpoi/AiR


13.论文题目:Discriminative Partial Domain Adversarial Network


14.论文题目:Pepresentative Graph Neural Network

15.论文题目:Efficient Semantic Video Segmentation with Per-frame Inference

16.论文题目:Dynamic R-CNN :Towards High Quality Object Detection via Dynamic Training


17.论文题目Segmenting Transaparent Objects in the Wild


18.论文题目Sence Text Imang Super-Resolution in the Wild


19.论文题目:Generative Low-bitwidth Data Free Quantization

20..论文题目:Interpretable Visual Reasoning via Probabilistic Formulation under Natural Supervision

21.论文题目:Suppressing Mislabeled Data via Grouping and Self-Attention

22,.论文题目:Conditional Image Repainting via Semantic Bridge and Piecewise Value Function

欢迎大家在文章留言安利自己的ECCV2020论文,小编会把留言置顶~


-END-


点击   阅读原文 ,可跳转浏览本文内所有网址链接



*延伸阅读




添加极市小助手微信 (ID : cv-mart) ,备注: 研究方向-姓名-学校/公司-城市 (如:目标检测-小极-北大-深圳),即可申请加入 目标检测、目标跟踪、人脸、工业检测、医学影像、三维&SLAM、图像分割等极市技术交流群 ,更有 每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、 干货资讯汇总、行业技术交流 一起来让思想之光照的更远吧~


△长按添加极市小助手


△长按关注极市平台,获取最新CV干货


觉得有用麻烦给个在看啦~  

登录查看更多
1

相关内容

ECCV的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ,两年一次,是计算机视觉三大会议(另外两个是ICCV和CVPR)之一。每次会议在全球范围录用论文300篇左右,主要的录用论文都来自美国、欧洲等顶尖实验室及研究所,中国大陆的论文数量一般在10-20篇之间。
【ECCV2020】EfficientFCN:语义分割中的整体引导解码器
专知会员服务
15+阅读 · 2020年8月23日
专知会员服务
109+阅读 · 2020年3月12日
必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码
专知会员服务
31+阅读 · 2020年1月10日
ECCV 2020接受论文出炉,1361篇都在这了
专知
23+阅读 · 2020年7月4日
CVPR 2019 论文大盘点-超分辨率篇
极市平台
77+阅读 · 2019年6月23日
【学界】CVPR 2019 Oral | 华科开源效果超群的人体姿态迁移算法
GAN生成式对抗网络
22+阅读 · 2019年4月27日
Geometric Graph Convolutional Neural Networks
Arxiv
10+阅读 · 2019年9月11日
Arxiv
7+阅读 · 2018年12月10日
VIP会员
Top
微信扫码咨询专知VIP会员