你的二次元老婆，被AI变成了暗黑系

会员服务 ·

你的二次元老婆，被AI变成了暗黑系

2020 年 8 月 31 日 量子位

鱼羊萧箫发自凹非寺
量子位报道 | 公众号 QbitAI

现在，AI对光影的理解越来越深入了。

不仅能自动给二次元萌妹的线稿上色，绘制出合理的光影变化。

反向操作，提取图片中的纹理和光影也不在话下。

大师级作品、或是摄影海报，只需要拿过来「扫描」一下，就能分解出纯色层、阴影层和反射层。

这下，想要调整图片的纹理和光影，再也不用苦恼没有psd、图层被合并了。

这只全新AI的一作，还是那位打造了火遍二次元圈的自动线稿上色AI Style2Paints 的Lvmin Zhang小哥。

论文已经中了ECCV 2020 Spotlight。

抠掉多余的像素

分解图像最需要解决的问题，就是图像平滑，它能让图像变得更模糊，但与此同时，调节光影、纹理也变得更容易。

而图像平滑的核心问题，可以被理解成估计图像中的像素是否被需要。

图像平滑

换种说法，图像平滑要解决的最大问题，是在图像去噪和外观保留这两者之间，找一个平衡点。

也就是说，与锐化相反，平滑既要最大程度上保留图像的本质，又希望能消除图像的噪音。

下图就是经过平滑处理的一张图像。可以看见，即使平滑处理后的图像变得模糊不清，我们依稀能辨认出这是一片海。

那么，平滑图像究竟有什么用？

看，调节色温方便多了，让图中的天和海从蓝变绿再变紫，看起来都不是问题。

此外，图像平滑也是图像处理中纹理去除、材料处理、重新着色、层提取等操作的基本处理步骤。

那么，如何让一个AI实现图像平滑呢？

研究者发现，对图像中物体的部分外观进行「擦除」（手动消除部分噪声），似乎能给图像平滑带来更好的效果。

如果你是一个PS大神，那么，选择图像中该擦除的部位肯定不是难事。

然而，AI它并不会PS…这就需要人为制定一些「规则」，告诉AI，哪些像素应该被擦除。

这里又回到了开头提到的，图像平滑的本质：在图像去噪和外观保留二者之间，找寻一个平衡点。

说白了，就是估计图像中哪些像素是需要的，哪些是可以被「擦除」的。

作者将这一步骤称之为擦除外观保留（Erasing Appearance Preservation ，EAP）。

这里就涉及到一个像素选择的算法，作者制作了一个0-1背包，将它解决了。

0-1背包问题

这个问题在像素中的场景描述如下：如何选择这个位置的像素值，使图像平滑效果最好？

把这个位置比作一个背包（knapsack），像素值就是填入背包中的选项。而最好的像素值，就是能刚好填满背包的最优解。

如下图，用最快的速度，计算哪些部分的像素是必需保留的，能最大程度上还原图像特征。

但如果让计算机用穷举法列举出算法，效率就会很慢。

0-1背包问题，旨在用最少的步骤，列出每一步的最优解，并不断与新结果进行对比。

这个算法的核心思想在于，子问题的最优解，同样可以用于解决母问题。

这样，既能保留图像的纹理结构，又能让图像最大程度上模糊化。

归根结底，0-1背包的思想在于，一个像素值的最优解，同样可以被用于解决像素块最优解的问题。

这个算法，比暴力堆叠算力，穷举像素最优解的方法快多了。

如果用伪代码简单呈现的话，算法的步骤是这样的：

这一算法基于Matlab实现。作者表示，由于Python的稀疏优化比较捉急，目前没能把EAP迁移到Python中。

与人类水平相当

研究人员将L0和L1两种平滑方式的结果，与专业人士的处理结果进行了比较。

结果显示，在擦除位置的选择上，AI的操作与专家的选择相似，并且平滑结果与专家的处理结果表现相当。

而消融实验的结果显示：

（1）在原来的L1平滑中使用极端lambda(10.0)，不使用EAP，这会导致图像结构被破坏。

（2）重复原L1平滑多次（10次，与EAP配置相同），不使用EAP，这会导致低饱和度和低对比度伪影出现。

（3）在EAP方案中，不使用背包权重w_p，而是给背包的值设定一个固定的阈值（0.1），所有高于这个阈值的像素都会被视作擦除位置。这会导致图像被压缩成少数几种颜色。

（4）在EAP方案中，用常数（1.0）代替所有背包权重w_p。这将导致所有不想要的图案仍在最终结果中被保留。

（5）在EAP方案中，不使用knapsak值v_p，而是给背包的权重设定一个固定的阈值（0.1），所有低于这个阈值的像素都会被视作擦除位置。这会导致图像中所有明显的构件都被消除。

（6）在EAP方案中，用常数（1.0）代替所有背包值v_p。这使得突出的构件得以保留，但原有的结构会被破坏。

（7）本文中提出的解决方案，能够在不造成其他伪影的情况下，使图像充分平滑。

另外，使用PSNR（峰值信噪比）指标，对几种不同的平滑方法进行对比。结果表明，基于EAP的方法PSNR值明显高于其他方法，也就是说，实现了更彻底的纹理分解。

应用场景

看到这样的AI能力，你想到要在哪些场景中应用它了吗？

作者也举了几个例子。

比如，轻松实现纹理替换。

比如，给图片调光影、调颜色。

就有网友表示：这不就是我一直想要的那种AI嘛！

也有网友联想到了火爆二次元圈的那只上色AI Style2Paints。

鹅妹子嘤，所以这项技术会用到Style2Paints V5中吗？

目前，这项研究的代码已经开源，如果感兴趣，就戳进文末链接试一试吧~

传送门

GitHub地址：
https://github.com/lllyasviel/AppearanceEraser

项目地址：
https://lllyasviel.github.io/AppearanceEraser/

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容，未经账号授权，禁止随意转载。

每天5分钟，抓住行业发展机遇

如何关注、学习、用好人工智能？

每个工作日，量子位AI内参精选全球科技和研究最新动态，汇总新技术、新产品和新应用，梳理当日最热行业趋势和政策，搜索有价值的论文、教程、研究等。

同时，AI内参群为大家提供了交流和分享的平台，更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅：

加入AI社群，与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

图像平滑

关注 2

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

[CVPR2020-Oral-FAIR-UIUC]使用原力，卢克!学习通过模拟效应来预测物理力

专知会员服务

10+阅读 · 2020年3月27日

自回归模型:PixelCNN

专知会员服务

27+阅读 · 2020年3月21日

【慕尼黑工业大学-Matthias Niessner】人工智能驱动的视频合成及其意义，104页ppt

专知会员服务

23+阅读 · 2020年3月15日

姿势服装随心换-CVPR2019

专知会员服务

36+阅读 · 2020年1月26日

【清华大学】知识增强的常识性故事生成预训练模型，A Knowledge-Enhanced Pretraining Model for Commonsense Story Generation

专知会员服务

52+阅读 · 2020年1月20日

【GitHub实战】Pytorch实现的小样本逼真的视频到视频转换

专知会员服务

36+阅读 · 2019年12月15日

【CCF优秀博士学位论文奖-2019】融合结构先验的图像及视频去模糊研究，天津大学任文琦

专知会员服务

48+阅读 · 2019年11月8日

你跳宅舞的样子很专业：不，这都是AI合成的结果

机器之心

11+阅读 · 2019年9月28日

加强版CycleGAN！贾佳亚等提出卡通图与真实人脸转换模型，看女神突破次元壁长啥样

量子位

10+阅读 · 2019年7月11日

女神背心变内衣，只需草图画几笔 | 中山+字节跳动等新研究

量子位

5+阅读 · 2019年6月7日

AI还原半世纪前的黑白电影和照片：效果惊艳在线可玩，网友大呼“鹅妹子嘤”

量子位

11+阅读 · 2019年5月7日

新式隐身术：只要在肚子上贴一张图片，AI就当你不存在

果壳网

5+阅读 · 2019年4月28日

草图秒变风景照，英伟达神笔马良GaoGAN终于开源了

新智元

14+阅读 · 2019年4月17日

朱茵和杨幂被大换脸！这个“黑科技”暗藏一个大“坑”...

凤凰财经

10+阅读 · 2019年2月28日

你用Deepfakes给小电影换个脸，人脸识别AI也看不出来：95%萌混过关

量子位

12+阅读 · 2018年12月31日

降维打击：这款GAN可以让真人「二次元化」

机器之心

6+阅读 · 2018年12月11日

AI都可以将文字轻松转成图像

计算机视觉战队

5+阅读 · 2018年7月24日

Foreground-aware Image Inpainting

Arxiv

4+阅读 · 2019年1月17日

Fast and Accurate 3D Medical Image Segmentation with Data-swapping Method

Arxiv

5+阅读 · 2018年12月19日

GAN-QP: A Novel GAN Framework without Gradient Vanishing and Lipschitz Constraint

Arxiv

5+阅读 · 2018年12月15日

W-net: Bridged U-net for 2D Medical Image Segmentation

Arxiv

20+阅读 · 2018年7月12日

Consensus Based Medical Image Segmentation Using Semi-Supervised Learning And Graph Cuts

Arxiv

11+阅读 · 2018年5月21日

Constructing Narrative Event Evolutionary Graph for Script Event Prediction

Arxiv

11+阅读 · 2018年5月16日

Constrained-CNN losses forweakly supervised segmentation

Arxiv

5+阅读 · 2018年5月12日

Cross-Domain Adversarial Auto-Encoder

Arxiv

4+阅读 · 2018年4月17日

Arxiv

5+阅读 · 2018年4月3日

Unsupervised Cipher Cracking Using Discrete GANs

Arxiv

11+阅读 · 2018年1月15日

VIP会员