照片你随便拍，「光影」我任意调，MIT谷歌新研究，器材党老法师看了会沉默

会员服务 ·

照片你随便拍，「光影」我任意调，MIT谷歌新研究，器材党老法师看了会沉默

2020 年 8 月 13 日 量子位

金磊发自凹非寺
量子位报道 | 公众号 QbitAI

在摄影这件事上，「光影」简直不要太重要。

毕竟大师们摄影作品，大多都是对「光」和「影」的拿捏。

△来自俄罗斯摄影师George Mayer

而最近，MIT 和谷歌等机构联手提出了一种用神经网络「打光」的新方法，大大降低了对「光影」拿捏的门槛——神经光线传输 （Nerual Light Transport，NLT）。

例如下图所示，只要拍好人物照片，无论背景如何转换，都可以相应的调节人物身上的「光影」。

去背景后的「AI 打光」效果更加明显。

还有这样的。

虽说「打光」效果是出来了，但这画风…有点像阴间的东西了。

言归正传，继续聊聊 NLT 这项技术。

NLT——拿捏光线的一把好手

光线传输（LT）可以描述一个场景中，物体在不同光照和方向下所呈现出来的样子。

而完整地了解一个场景的 LT，还可以实现任意光照下的新视图合成。

于是，MIT 和谷歌的研究人员基于图像 LT 采集（以人体为主），提出了一种半参数的深度学习框架，来学习 LT 的神经表示，名曰NLT。

总体而言，NLT 可以单独或同时完成以下两项任务：

用定向光或HDRI图，重新照亮场景的光线真实性。
合成具有视图依赖性效果的新视图。

来看下 NLT 在不同任务下的效果。

首先是「定向重打光」 （Directional Relighting）。

可以看到人物在光线的变化下，阴影、高亮的变化非常自然。

接下来，是基于「背景图的重打光」 （Image-Based Relighting）。

从背景图中，大致可以判断光源（太阳）的方向，而随着背景图的转动，人物身上的阴影也会随之发生改变。

最后，是「视图合成+同步光源」 （View Synthesis & Simultaneous）。

除了视觉效果惊艳之外，从定性角度来看，NLT 方法也取得了不错的效果。

例如，在「重打光」（Redlighting）任务中，与其它基线方法相比，在 PSNR 和 SSIM 两个指标中都取得了最先进的结果。

同样，在「视图合成」任务中，NLT 的结果也是相当不错。

那么，NLT 具体是如何实现这般效果的呢？

NLT模型：「查询」、「观测」两步走

NLT 的模型网络主要由2条路径构成，分别是查询路径 （Query Path）和观测路径 （Observation Path）。

「观测路径」将附近的 K 个观测值作为输入，在目标光和观察方向周围采样，并将它们编码成多尺度特征，汇集起来用来消除对其顺序和数量的依赖。

接下来，这些汇集起来的特征将被连接到「查询路径」的特征激活上。

这条路径将所需的光线和观察方向，以及物理上精确的 disue base 作为输入。

「查询路径」预测了一个残差图，该残差图被添加到diuse base上，用来产生纹理渲染。

最后，通过将深度神经网络嵌入到UV纹理空间中，便可以合成与可见光线和观看角度对应的纹理空间RGB图像。

华人小哥一作

这项研究的第一作者，是来自MIT的博士生，张修明。

张修明目前在 MIT 计算机科学与人工智能实验室（CSAIL），从事计算机视觉和计算机图形学领域的工作，尤其对重光照、视图合成和材料建模感兴趣。

另一位主要作者是Sean Fanello。

Sean Fanello是一名研究科学家，也是谷歌的经理，在谷歌领导容量性能捕获方面的工作。

研究兴趣主要包括数字人类、体积重建、高质量的深度传感和非刚性跟踪。

最后，项目将在近日开源，感兴趣的朋友持续关注下方参考链接中的信息更新。

参考链接：

http://nlt.csail.mit.edu/

— 完 —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容，未经账号授权，禁止随意转载。

每天5分钟，抓住行业发展机遇

如何关注、学习、用好人工智能？

每个工作日，量子位AI内参精选全球科技和研究最新动态，汇总新技术、新产品和新应用，梳理当日最热行业趋势和政策，搜索有价值的论文、教程、研究等。

同时，AI内参群为大家提供了交流和分享的平台，更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅：

加入AI社群，与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

登录查看更多

相关内容

视图合成

关注 0

量子计算密码攻击进展

专知会员服务

25+阅读 · 2020年9月14日

【ACM MM2020】对偶注意力GAN语义图像合成

专知会员服务

36+阅读 · 2020年9月2日

【ECCV2020】自动化所&QMUL联合发布 light-reid：首个轻量化行人重识别开源工具箱！

专知会员服务

16+阅读 · 2020年8月28日

【2020 最新论文】对比学习中什么应该不是对比的？

专知会员服务

39+阅读 · 2020年8月16日

【ECCV2020-Oral-谷歌】对抗生成语法的人体活动预测

专知会员服务

5+阅读 · 2020年8月12日

对抗样本生成技术综述

专知会员服务

65+阅读 · 2020年7月21日

【SIGGRAPH 2020】人像阴影处理，Portrait Shadow Manipulation

专知会员服务

29+阅读 · 2020年5月19日

【伯克利】黑盒机器翻译系统的模仿攻击与防御，Imitation Attacks and Defenses for Black-box Machine Translation Systems

专知会员服务

7+阅读 · 2020年5月4日

【天津大学】知识图谱划分算法研究综述

专知会员服务

111+阅读 · 2020年4月27日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知会员服务

24+阅读 · 2020年3月31日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

女神背心变内衣，只需草图画几笔 | 中山+字节跳动等新研究

量子位

5+阅读 · 2019年6月7日

业界 | 单个运动摄像头估计运动物体深度，谷歌挑战新难题

AI科技评论

3+阅读 · 2019年6月4日

朱茵和杨幂被大换脸！这个“黑科技”暗藏一个大“坑”...

凤凰财经

10+阅读 · 2019年2月28日

你用Deepfakes给小电影换个脸，人脸识别AI也看不出来：95%萌混过关

量子位

12+阅读 · 2018年12月31日

谷歌新研究用深度学习合成运动模糊效果，手抖也能拍出摄影师级照片

新智元

7+阅读 · 2018年12月28日

谷歌神经网络人声分离技术再突破！词错率低至23.4%

新智元

4+阅读 · 2018年10月14日

基于ARKit的iOS无限屏实现，还原锤子发布会效果

CocoaChina

3+阅读 · 2018年9月7日

开源 AI 技术潜在危机爆发，被大肆用于色情方向

程序猿

6+阅读 · 2018年2月27日

新 iPhone 推出的人像光效功能让人惊叹，这都是它的功劳

少数派

3+阅读 · 2017年9月15日

Deformable Style Transfer

Arxiv

14+阅读 · 2020年3月24日

Foreground-aware Image Inpainting

Arxiv

4+阅读 · 2019年1月17日

"Factual" or "Emotional": Stylized Image Captioning with Adaptive Learning and Attention

Arxiv

4+阅读 · 2018年7月29日

CIRL: Controllable Imitative Reinforcement Learning for Vision-based Self-driving

Arxiv

8+阅读 · 2018年7月10日

Variance Reduction Methods for Sublinear Reinforcement Learning

Arxiv

4+阅读 · 2018年4月25日

Facial Aging and Rejuvenation by Conditional Multi-Adversarial Autoencoder with Ordinal Regression

Arxiv

5+阅读 · 2018年4月8日

Iterative Manifold Embedding Layer Learned by Incomplete Data for Large-scale Image Retrieval

Arxiv

8+阅读 · 2018年4月3日

Show, Tell and Discriminate: Image Captioning by Self-retrieval with Partially Labeled Data

Arxiv

8+阅读 · 2018年3月22日

Stack-Captioning: Coarse-to-Fine Learning for Image Captioning

Arxiv

6+阅读 · 2018年3月14日

DeepSeek: Content Based Image Search & Retrieval

Arxiv

13+阅读 · 2018年1月11日

VIP会员