会员服务 ·

腾讯优图CVPR中标论文：不靠硬件靠算法，暗光拍照也清晰

2019 年 5 月 4 日 量子位

雷刚发自凹非寺
量子位报道 | 公众号 QbitAI

暗光拍照也清晰，这是手机厂商目前激烈竞争的新拍照目标。

但除了堆摄像头和硬件，AI科学家带来算法方面的新突破。

他们提出基于深度学习优化光照的暗光下的图像增强模型，用端到端网络增强曝光不足的照片。

而且不是像以前的工作那样，直接学习图像到图像的映射，而是在新网络中引入中间照明，将输入与预期的增强结果相关联，增强网络从专家修饰的输入/输出图像学习复杂的摄影调整的能力。

结果证明，新算法模型，效果超过了市面上一众当红的多摄多硬手机。

这个新算法由腾讯优图实验室提出，王瑞星、沈小勇及贾佳亚是作者，论文已入选CVPR 2019.

传统图像增强算法不好用

优图方面称，人们在社交网络中，往往喜欢分享自己用不同设备拍摄的照片，尤其是使用手机拍摄的照片，不过很多时候，由于低光照或者背光的环境下拍摄到的照片经常会产生欠曝光的现象，由于在图像增强的整个过程不是线性的操作，并且增强的结果是很主观的，因此欠曝光图像增强是一个很具有挑战性的任务。

虽然目前市面上存在了一些专业的图像处理软件，可以让用户交互式的处理图像，如Adobe lightroom, PhotoShop。但是对于业余爱好者来说，能同时处理好颜色，对比度，调节光照等操作是非常困难的。

也有一些软件提供了一键自动的增强图像的功能，比如Lightroom的Auto Tone功能和iPhone的魔法棒增强功能，但是由于平衡各方面的调整是非常复杂的一件事。

这些软件依然会得到一些失败的案例。

传统夜景图像增强算法大致可以分为几个方面：直方图均衡化(Histogram equalization)，这种方法简单的利用了图像整体的统计性质，通常不能对复杂场景达到理想效果。

基于Retinex理论的增强算法，通常只能用单通道进行光照优化，颜色无法很好地回复，在光照复杂的情况下还容易出现过曝的现象。

这些传统方法还容易在增加图像亮度的同时，放大噪声等瑕疵，影响图像质量。

基于深度学习的方法，通常是直接训练回归(regression)模型，由于数据本身的特性，这种方法得到的结果通常清晰度、对比度比较低，而且会有一些人工痕迹。

转换方法+网络结构设计

对此，腾讯优图将图像增强问题，转化为光照优化问题。

之前的神经网络都是从训练数据，学习原始图像到清晰图像之间的回归映射。

优图则是希望通过神经网络学习出中间结果图像的光照图（illumination）, 进而再通过输入图像和光照图的关系，得到增强后的图片。

与几个具有代表性的商业软件效果对比：

具体方面及网络结构：

在网络结构的设计方面，本方案采用创新的双分支的网络结构。

网络分成了全分辨率分支和低分辨率分支。其中低分辨率分支用于学习到全图光照的整体信息，低分辨率图像的使用，有助于增大网络感受野，提高算法速度。

低分辨率分支的结果将会传递给高分辨率网络分支，用于重建全分辨率下的亮度图，并最终得到增强后的图像。

此外，优图设计的新的损失函数，包括：图像重建损失、光照局部平滑损失以及颜色损失，进一步帮助腾讯优图的网络产生更加稳定、清晰、颜色真实鲜艳的结果。

得益于双分支网络的设计，以及全分辨率分支中的双边上采样模块的设计，本方法可以在保证效果的同时，在GPU上对于高分辨率图片（例如：3000x2000）进行实时的增强。

实现细节如下：

夜景图像增强的任务中，一个难点是难以获取到成对的增强前后的训练图像。在该项目中，优图使用了MIT-Adobe 5K数据集，该数据集包含了5000组原始图片和专业美工调节后的图像。

此外，为了适应光照程度更加复杂的场景，优图自行采集数千组高清暗光照片作为训练数据。由此构建出的数据集，使得本算法在复杂光照下，也能得到稳定结果。

对于上边描述的深度神经网络结构，优图利用对应的暗光和清晰图片进行网络的训练。因为卷积网络不限制输入图片的大小，研究人员随机从图片中截取256x256尺寸大小的图片块进行网络训练来更好地利用GPU显存。训练好的模型可以利用在任何尺寸的图片上。

除了对于欠曝光图像增强外，优图对于一些市面上常见的手机（华为P20, 小米MiX3, iPhoneX, 三星S9+）拍摄的结果，利用新算法也进行了进一步的美化，效果图如下：

论文传送门

Underexposed Photo Enhancement using Deep Illumination Estimation

《基于深度学习优化光照的暗光下的图像增强》

http://jiaya.me/papers/photoenhance_cvpr19.pdf

One more thing

不过，近日腾讯优图最受热议的还有一桩AI公益的案例。

央视栏目《等着我》报道称，优图突破“跨年龄人脸识别”，帮助警方寻回了被拐十年儿童。

优图方面介绍，这是优图创新性技术在公益领域的成果。

依托腾讯海量数据，腾讯优图首创了跨年龄人脸识别技术，重点解决寻人场景中婴幼儿被拐的情况。

为了充分的从数据中学习人脸自然的跨年龄变化规律，腾讯优图提出了基于DDL（分布式蒸馏学习法则）学习策略的正则化迁移学习策略。

基于该策略，算法模型可充分进行跨年龄人脸识别学习，从而让困难的跨年龄识别更加可靠和精准。

腾讯方面称，这是对“科技向善”的最好实践。

— 完 —

小程序|get更多AI资讯与资源

加入社群

量子位AI社群开始招募啦，量子位社群分：AI讨论群、AI+行业群、AI技术群；

欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“微信群”，获取入群方式。（技术群与AI+行业群需经过审核，审核较严，敬请谅解）

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

图像增强

关注 4

CVPR 2020 最佳论文与最佳学生论文！

专知会员服务

36+阅读 · 2020年6月17日

【华为-诺亚实验室】动态BERT, Dynamic BERT with Adaptive Width and Depth

专知会员服务

24+阅读 · 2020年4月13日

【CVPR 2020 Oral-北大华为】只用加法的神经网络，重磅开源

专知会员服务

31+阅读 · 2020年4月6日

【FAIR-CVPR2020】PIFuHD:多级像素对齐隐式功能，实现高分辨率三维人体数字化

专知会员服务

29+阅读 · 2020年4月5日

Google 发布图片配对基准及挑战：从系列图像重建三维物体和建筑物

专知会员服务

40+阅读 · 2020年4月4日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

必读的10篇 CVPR 2019【生成对抗网络】相关论文和代码

专知会员服务

33+阅读 · 2020年1月10日

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

专知会员服务

48+阅读 · 2019年11月8日

【CCF优秀博士学位论文奖-2019初评】基于深度学习的场景分割技术研究，中科院计算所张蕊

专知会员服务

32+阅读 · 2019年11月8日

2019年人工智能行业现状与发展趋势报告，52页ppt

专知会员服务

124+阅读 · 2019年10月10日

CVPR 2019 | 旷视研究院提出一种行人重识别监督之下的纹理生成网络

极市平台

5+阅读 · 2019年7月3日

CVPR2019 | 港中文&腾讯优图等提出：暗光下的图像增强

极市平台

15+阅读 · 2019年6月5日

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

计算机视觉life

16+阅读 · 2019年4月25日

CVPR 2018 最酷的十篇论文

AI研习社

6+阅读 · 2019年2月13日

小米开源FALSR算法：快速精确轻量级的超分辨率模型

AI100

11+阅读 · 2019年1月31日

learn to see in the dark-低照度图像增强算法

计算机视觉life

16+阅读 · 2019年1月14日

干货 | 张宇伦：基于残差密集网络的图像超分辨率（CVPR 2018 亮点论文）

AI研习社

4+阅读 · 2018年8月3日

CVPR 2018 | 腾讯优图提出SRN-DeblurNet：高效高质量去除复杂图像模糊

机器之心

10+阅读 · 2018年5月30日

深度学习之图像超分辨重建技术

机器学习研究会

12+阅读 · 2018年3月24日

CVPR 2018 论文概述：有损压缩视频的多帧质量增强方法

极市平台

4+阅读 · 2018年3月19日

Mesh R-CNN

Arxiv

4+阅读 · 2019年6月6日

Deep High-Resolution Representation Learning for Human Pose Estimation

Arxiv

5+阅读 · 2019年2月25日

Foreground-aware Image Inpainting

Arxiv

4+阅读 · 2019年1月17日

Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method

Arxiv

5+阅读 · 2018年12月19日

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

Neural Machine Translation for Bilingually Scarce Scenarios: A Deep Multi-task Learning Approach

Arxiv

9+阅读 · 2018年5月11日

The Lovász-Softmax loss: A tractable surrogate for the optimization of the intersection-over-union measure in neural networks

Arxiv

4+阅读 · 2018年4月9日

SEARNN: Training RNNs with Global-Local Losses

Arxiv

5+阅读 · 2018年1月29日

3D Reconstruction in Canonical Co-ordinate Space from Arbitrarily Oriented 2D Images

Arxiv

4+阅读 · 2018年1月23日

Dual Path Networks for Multi-Person Human Pose Estimation

Arxiv

3+阅读 · 2017年10月27日

VIP会员

腾讯优图CVPR中标论文：不靠硬件靠算法，暗光拍照也清晰

雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitAI

传统图像增强算法不好用

转换方法+网络结构设计

论文传送门

One more thing

相关内容

雷刚发自凹非寺
量子位报道 | 公众号 QbitAI