学界 | 南京理工大学ICCV 2017论文:图像超分辨率模型MemNet

2017 年 8 月 9 日 机器之心

选自arXiv

机器之心编译

参与:路雪


利用卷积神经网络让图片清晰化的研究目前正成为计算机视觉领域的热点方向。近日,南京理工大学邰颖、杨健、许春燕与密歇根州立大学刘小明等人提出的 MemNet 将技术又向前推进了一步,新模型在图像去噪、超分辨率和 JPEG 解锁任务中的表现均超过此前业内最佳水平。该研究已入选 ICCV 2017 Spotlight 论文,将在十月底于威尼斯举行的大会上进行演讲。




  • 论文链接:https://arxiv.org/abs/1708.02209

  • GitHub 链接:https://github.com/tyshiwo/MemNet


摘要:近期,深度卷积神经网络(CNN)在图像复原领域吸引了大量注意力。然而,随着深度的增加,这些深度模型很少意识到长期依赖问题(long-term dependency problem),这会导致前面的状态/层对后续的状态/层几乎没有影响。受到人类思想持续性的激励,我们提出了一个深度持续记忆网络(deep persistent memory network,MemNet),该网络引入了一个包含递归单元(recursive unit)和门控单元(gate unit)的内存块,以通过适应性学习过程明确地挖掘持续记忆。递归单元学习当前状态在不同接受域(receptive field)下的多层表征(multi-level representation)。这些表征和之前内存块的输出被合并并发送至门控单元,门控单元适应性控制应保留多少先前状态,并决定应储存多少当前状态。我们使用 MemNet 执行三种图像复原任务:图像去噪(image denosing)、超分辨率(super-resolution)和 JPEG 解锁(JPEG deblocking)。实验证明使用 MemNet 的必要性,且它在三种任务上的表现都很优秀,超出目前业内最佳水平。代码地址:https://github.com/tyshiwo/MemNet。



图 1. 之前的网络结构(a、b)和我们的内存块(c)。蓝色圆圈代表递归单元,它的无折叠结构可生成短期记忆。绿色箭头指来自之前内存块的长期记忆,直接输入到门控单元。



图 2. 基础 MemNet 结构。红色虚线框指多个堆栈内存块(stacked memory block)。



图 3. 多监督 MemNet 结构。紫色的输出受到监督。



图 4.(a)×4 超分辨率图像和不同网络的 PSNR/SSIM。(b)通过整个每个同心圆周围的光谱,我们将 2-D 功率谱转换成 1-D 谱密度。(c)两个网络中谱密度的差异。



图 5. 过滤器权重指标 Vm vs. 特征地图指数(feature map index)l。第 m 个块的曲线中,左侧的 (m × 64) 元素代表长期记忆,剩下的 (Lm − m × 64) 元素代表短期记忆。柱形图表示长期记忆、来自第一个 R − 1 递归的的短期记忆和来自最后一个递归的短期记忆的平均指数。如,黄色柱形代表递归单元中最后一个递归的短期记忆的平均指数(即,每个曲线的最后 64 个元素)。



图 7. 图像去噪定性比较。第一行是来自 14-图像数据集、噪声水平 30 的图像「10」。只有 MemNet 修复了褶皱。第二行是来自 BSD200、噪声水平 70 的图像「206062」。只有 MemNet 能够准确地修复柱子。



图 8. SISR 的定性比较。第一行是来自 BSD100、缩放因子×3 的图像「108005」。只有 MemNet 准确修复了图案。第二行识来自 Urban100、缩放因子×4 的图像「img_002」。MemNet 修复了尖锐的线条。



图 9. JPEG 解锁的定性比较。第一行是来自 Classic5、质量因子为 10 的图像「barbara」。MemNet 修复了线条,而其他网络输出的结果比较模糊。第二行是来自 LIVE1、质量因子为 10 的图像「lighthouse」。MemNet 精确地修复了人造边界(blocking artifact)。



本文为机器之心编译,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):hr@jiqizhixin.com

投稿或寻求报道:editor@jiqizhixin.com

广告&商务合作:bd@jiqizhixin.com

登录查看更多
4

相关内容

ICCV 的全称是 IEEE International Conference on Computer Vision,即国际计算机视觉大会,由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,被澳大利亚ICT学术会议排名和中国计算机学会等机构评为最高级别学术会议,在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV,ICCV在世界范围内每两年召开一次。ICCV论文录用率非常低,是三大会议中公认级别最高的。ICCV会议时间通常在四到五天,相关领域的专家将会展示最新的研究成果。
最新《知识蒸馏》2020综述论文,20页pdf,悉尼大学
专知会员服务
157+阅读 · 2020年6月14日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文
专知会员服务
78+阅读 · 2020年3月3日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
南洋理工大学,深度学习推荐系统综述
专知会员服务
174+阅读 · 2019年10月14日
图像超分辨率网络:RCAN
极市平台
7+阅读 · 2019年8月18日
CVPR 2019 论文大盘点-超分辨率篇
极市平台
77+阅读 · 2019年6月23日
CVPR 2019 | 微软亚洲研究院7篇精选论文解读
微软研究院AI头条
23+阅读 · 2019年6月18日
CVPR 2018 论文解读 | 基于GAN和CNN的图像盲去噪
PaperWeekly
13+阅读 · 2019年1月22日
Arxiv
5+阅读 · 2020年3月16日
Arxiv
12+阅读 · 2019年1月24日
SlowFast Networks for Video Recognition
Arxiv
19+阅读 · 2018年12月10日
VIP会员
相关VIP内容
最新《知识蒸馏》2020综述论文,20页pdf,悉尼大学
专知会员服务
157+阅读 · 2020年6月14日
【CVPR2020】图神经网络中的几何原理连接
专知会员服务
56+阅读 · 2020年4月8日
【CVPR2020-百度】用于视觉识别的门控信道变换
专知会员服务
12+阅读 · 2020年3月30日
近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文
专知会员服务
78+阅读 · 2020年3月3日
五篇 ICCV 2019 的【图神经网络(GNN)+CV】相关论文
专知会员服务
14+阅读 · 2020年1月9日
南洋理工大学,深度学习推荐系统综述
专知会员服务
174+阅读 · 2019年10月14日
相关资讯
图像超分辨率网络:RCAN
极市平台
7+阅读 · 2019年8月18日
CVPR 2019 论文大盘点-超分辨率篇
极市平台
77+阅读 · 2019年6月23日
CVPR 2019 | 微软亚洲研究院7篇精选论文解读
微软研究院AI头条
23+阅读 · 2019年6月18日
CVPR 2018 论文解读 | 基于GAN和CNN的图像盲去噪
PaperWeekly
13+阅读 · 2019年1月22日
Top
微信扫码咨询专知VIP会员