IAT:实时完成暗光增强, 曝光矫正的超轻量级Transformer网络

2022 年 7 月 5 日 极市平台
↑ 点击 蓝字  关注极市平台

作者丨信息门下奶狗@知乎(已授权)
来源丨https://zhuanlan.zhihu.com/p/535695807
编辑丨极市平台

极市导读

 

本工作提出了一种超轻量级的快速照明自适应Transforme—IAT,用于实时完成暗光增强和曝光矫正,网络总体的Parameter数量仅仅只需要 90k+。>>加入极市CV技术交流群,走在计算机视觉的最前沿

今年四月入学了UTokyo新办的RCAST的PHD项目,开始了新的PHD生涯。入学前曾在上海AI LAB实习了一段时间,认识了很多厉害的老师和志趣相投的伙伴。这段时间刚好隔离结束,整理一下我ai lab时期完成的工作Illumination-Adaptive-Transformer (IAT),用于实时完成暗光增强和曝光矫正(也可能是第一次把Transformer用上的工作)。IAT网络是全监督训练范式,网络总体的Parameter数量仅仅只需要 90k+ ,属于超轻量级的实时增强网络(相比之前的Transformer工作SWIN-IR[1]和Restormer[2]等)。

论文链接:https://arxiv.org/abs/2205.14871

代码链接:https://github.com/cuiziteng/Illumination-Adaptive-Transformer

有了IAT,愿你的科研道路不再黑暗

自然场景下存在着各种不良光照场景,如低光照环境和过(欠)曝光环境,相机在不良光照下完成摄影任务时,因为过多/过少的光子数量,和相机内部的处理(如低光照场景需要调高ISO,这会导致噪声也同时放大)以及后续的ISP,往往得到的图像也会收到影响,非正常光照的图像无论感观还是视觉任务都会收到很大的影响。区别于传统的HE或者RetiNex做法以及此前的CNN做法,IAT从光转换的角度出发,通过物理模型建立了一个Transformer-based方法来完成。

基于此前的工作[5],一张在光照 条件下的RGB图像可以通过一个inverse function的Unprocess过程来还原到RAW空间:

在RAW空间上,光照 条件下与光照 条件下的RAW图像光照强度和input光子数量有关,光照之间可以呈现线性关系,如下:

光照条件下的RAW图像 再通过正向的ISP流程来得到RGB图像 ,如下公式所示,其中 代表一些demosacing以及去噪或者黑电平矫正, 表示色彩校正比如白平衡和color转换矩阵, 是伽马矫正。

转换为 ,所获得如下关系,并且通过泰勒展开:

其中:

我们总体简化为公式: 其中 是我们希望得到的target图像, 是输入的不良光照图像, 是像素级别的乘法图,尺寸大小与 相同, 同时 是像素级别的加法图。 是控制颜色的色彩矩阵, 是gamma矫正的gamma数值。 负责控制像素级别的细节信息,同时 负责控制整张图像级别的全局信息。

因此我们设计的网络总体包含两个独立分支,local分支和global分支,local分支由两个独立支路负责预测像素级别乘法图 和加法图 ,global分支则是利用attention预测控制图像全局信息的色彩矩阵和gamma数值,最终通过上述公式来完成暗光场景增强和曝光纠正任务,网络结构如下图,其中每个local支路都由三个PEM(Pixel-wise Enhancement Module)模块组成,为了保证轻量性采用了Transformer的结构以及depth-wise convolution。

同时在global branch我们采用attention模块来更好的获得全局信息来产生色彩矩阵以及gamma数值,收到了DETR网络[3]的启发,我们将随机初始化的query输入到模块中来获得3x3的color matrix和1维的gamma数值,通过这样的dynamic query learning策略,随着网络的更新可以自适应的调整操控图像全局信息的矩阵以及gamma,同时可以更好的利用transformer擅长捕捉全局信息的特性。

区别于正统的ISP,我们设计的色彩矩阵与gamma数值都是针对每张图像进行调整,相当于给每张图像都假定一个专属的特定ISP数值来完成增强任务,曝光矫正任务以及高层次视觉任务。

网络结构
PEM模块与Glocal部分的attention模块

在high-level vision方面,IAT也可以链接后面的high level模块进行joint-training,同时可以加载在暗光增强和曝光纠正的预训练权重来进行更好的初始化,如下图所示:

high-level joint training

最后放一下实验结果。

实验结果(LOL数据集低光照增强):

暗光增强实验结果

实验结果(Exposure数据集[4]曝光纠正):

曝光纠正结果

实验结果(EXDark数据集暗光目标检测):

暗光场景检测结果

实验结果 (ACDC数据集暗光语义分割):

暗光语义分割结果

更多的实验结果以及详细的网络结构请见论文以及代码,Thx~

[1]. SwinIR: Image Restoration Using Swin Transformer (ICCVW 2021)

[2]. Restormer: Efficient Transformer for High-Resolution Image Restoration (CVPR 2022)

[3]. End-to-End Object Detection with Transformers (ECCV 2020)

[4]. Learning Multi-Scale Photo Exposure Correction (CVPR 2021)

[5]. Unprocessing Image for Learned RAW Denosing (ICCV 2019)

公众号后台回复“项目实践”获取50+CV项目实践机会~

△点击卡片关注极市平台,获取 最新CV干货
极市干货
最新数据集资源: 医学图像开源数据集汇总
实操教程 只用两行代码,我让Transformer推理加速了50倍android camera nanodet 实时物体检测的高效实现总结
极视角动态: 极视角作为重点项目入选「2022青岛十大资本青睐企业」榜单! 极视角发布EQP激励计划,招募优质算法团队展开多维度生态合作!


点击阅读原文进入CV社区

收获更多技术干货

暗光语义分割结果
登录查看更多
3

相关内容

可分离尺度Transformer
专知会员服务
22+阅读 · 2022年7月16日
CVPR 2021 Oral | 室内动态场景中的相机重定位
专知会员服务
15+阅读 · 2021年4月12日
专知会员服务
38+阅读 · 2021年3月29日
专知会员服务
56+阅读 · 2021年1月26日
【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介
专知会员服务
19+阅读 · 2020年10月18日
专知会员服务
74+阅读 · 2020年9月1日
深度学习框架如何优雅的做算子对齐任务?
极市平台
0+阅读 · 2022年1月20日
基于Pytorch的动态卷积复现
极市平台
2+阅读 · 2021年11月7日
BiSeNet:双向分割网络进行实时语义分割
统计学习与视觉计算组
22+阅读 · 2018年8月23日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年8月29日
Arxiv
33+阅读 · 2022年2月15日
Arxiv
17+阅读 · 2021年3月29日
Disentangled Information Bottleneck
Arxiv
12+阅读 · 2020年12月22日
Arxiv
27+阅读 · 2017年12月6日
VIP会员
相关VIP内容
可分离尺度Transformer
专知会员服务
22+阅读 · 2022年7月16日
CVPR 2021 Oral | 室内动态场景中的相机重定位
专知会员服务
15+阅读 · 2021年4月12日
专知会员服务
38+阅读 · 2021年3月29日
专知会员服务
56+阅读 · 2021年1月26日
【NeurIPS 2020】一种端到端全自由度抓取姿态估计网络简介
专知会员服务
19+阅读 · 2020年10月18日
专知会员服务
74+阅读 · 2020年9月1日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
相关论文
Arxiv
0+阅读 · 2022年8月29日
Arxiv
33+阅读 · 2022年2月15日
Arxiv
17+阅读 · 2021年3月29日
Disentangled Information Bottleneck
Arxiv
12+阅读 · 2020年12月22日
Arxiv
27+阅读 · 2017年12月6日
Top
微信扫码咨询专知VIP会员