谷歌新研究用深度学习合成运动模糊效果，手抖也能拍出摄影师级照片

会员服务 ·

谷歌新研究用深度学习合成运动模糊效果，手抖也能拍出摄影师级照片

2018 年 12 月 28 日 新智元

新智元报道

来源：techxplore

作者：Ingrid Fadelli 编辑：肖琴

【新智元导读】要想拍摄运动模糊效果的照片，需要高超的摄影技术。最近，谷歌两名研究员开发了一种新算法，能够使用两张清晰图像合成运动模糊效果。该技术也可用来合成训练去模糊算法所需的训练数据。

谷歌的研究人员最近开发了一种新技术，使用连续拍摄的一对非模糊图像，能够合成运动模糊图像。在发表在arXiv上的预印版论文中，研究人员概述了他们的方法，并与几种基线方法对比，对其进行了评估。

当场景中的物体或相机本身在拍摄时发生移动，运动模糊就会自然产生。这导致移动的物体或整个图像看起来是模糊的。在某些情况下，运动模糊可以用来表示被摄对象的速度或将其与背景分离。

“在图像理解方面，运动模糊是一个有价值的线索，”进行这项研究的谷歌研究员Tim Brooks和Jonathan Barron在论文中写道：“给定一个包含运动模糊的图像，我们可以估计导致观察到的模糊的场景运动的相对方向和幅度。这种运动估计在语义上可能是有意义的，或者可以用去模糊算法来合成一个清晰的图像。”

最近的研究已经探讨了使用深度学习算法从图像中去除不想要的运动模糊或推断给定场景的运动动力学。然而，为了训练这些算法，研究人员需要大量的数据，这些数据通常是通过合成模糊图像生成的。最终，深度学习算法在多大程度上能够有效去除真实图像中的运动模糊，很大程度上取决于用于训练运动模糊的合成数据的真实性。

“在这篇论文中，我们将这个已经有充分研究的模糊估计/模糊去除任务的逆向问题视为一个头等问题。”Brooks和Barron在他们的论文中写道：“我们提出了一种快速有效的方法来合成训练运动去模糊算法所需的训练数据，并且我们定量地证明了我们的技术能够从合成的训练数据推广到真实的运动模糊图像。”

图1：(a)中展示了一个物体在图像平面上移动的两幅图像。我们的系统利用这些图像合成(b)中的运动模糊图像，它传达了一种运动的感觉，并将主体与背景分离。

他们设计的神经网络架构包括一个新的“线性预测”(line prediction)层，它会教一个系统从连续拍摄的两张图像退回到跨越这两张输入图像捕获时间的运动模糊图像。他们的模型需要大量的训练数据，因此研究人员设计并执行了一种新策略，该策略使用帧插值技术(frame interpolation)生成运动模糊图像及其各自输入的大型合成数据集。