Global spatial statistics, which are aggregated along entire spatial dimensions, are widely used in top-performance image restorers. For example, mean, variance in Instance Normalization (IN) which is adopted by HINet, and global average pooling (i.e. mean) in Squeeze and Excitation (SE) which is applied to MPRNet. This paper first shows that statistics aggregated on the patches-based/entire-image-based feature in the training/testing phase respectively may distribute very differently and lead to performance degradation in image restorers. It has been widely overlooked by previous works. To solve this issue, we propose a simple approach, Test-time Local Statistics Converter (TLSC), that replaces the region of statistics aggregation operation from global to local, only in the test time. Without retraining or finetuning, our approach significantly improves the image restorer's performance. In particular, by extending SE with TLSC to the state-of-the-art models, MPRNet boost by 0.65 dB in PSNR on GoPro dataset, achieves 33.31 dB, exceeds the previous best result 0.6 dB. In addition, we simply apply TLSC to the high-level vision task, i.e. semantic segmentation, and achieves competitive results. Extensive quantity and quality experiments are conducted to demonstrate TLSC solves the issue with marginal costs while significant gain. The code is available at https://github.com/megvii-research/tlsc.


翻译:在整个空间层面汇总的全球空间统计数据被广泛用于最高性能图像恢复器中,例如,在HINet(HINet)采用的情况正常化差异(IN),以及适用于MPRNet的Squeeze和Expuration(SE)全球平均集合(即平均),本文首先表明,在培训/测试阶段,基于补丁/entire-image(基于补丁/entire-image)的特征的汇总统计数据可能分布非常不同,导致图像恢复器中的性能退化。过去的工作已广泛忽略了这一点。为解决这一问题,我们提议了一个简单的方法,即测试时间本地统计转换器(IN),在测试期间取代全球到地方的统计汇总作业区域(即平均),在不进行再培训或微调的情况下,我们的方法可大大改进图像恢复器的性能。特别是,将基于TLSC(TLSC)的SE)与最新发行模型的MPRNet(0.65 dB) 图像恢复器的性能退化。 PSNSR(GPro dam) 数据集中,实现33-DB,超过以前的边际统计(TSC-SL) 质量部分, 和高额。

0
下载
关闭预览

相关内容

【普林斯顿大学-微软】加权元学习,Weighted Meta-Learning
专知会员服务
40+阅读 · 2020年3月25日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
综述 | 图像配准 Image registration
计算机视觉life
18+阅读 · 2019年9月12日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
【CVPR2019正式公布】行人重识别论文 附下载链接
极市平台
15+阅读 · 2019年4月26日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
On Variance Estimation of Random Forests
Arxiv
0+阅读 · 2022年2月18日
Hierarchy Parsing for Image Captioning
Arxiv
6+阅读 · 2019年9月10日
Local Relation Networks for Image Recognition
Arxiv
4+阅读 · 2019年4月25日
Arxiv
7+阅读 · 2018年1月21日
VIP会员
相关VIP内容
【普林斯顿大学-微软】加权元学习,Weighted Meta-Learning
专知会员服务
40+阅读 · 2020年3月25日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
相关资讯
综述 | 图像配准 Image registration
计算机视觉life
18+阅读 · 2019年9月12日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
【CVPR2019正式公布】行人重识别论文 附下载链接
极市平台
15+阅读 · 2019年4月26日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
Top
微信扫码咨询专知VIP会员