AI研习社按:这里是,雷锋字幕组编译的 Two minutes paper 专栏,每周带大家用碎片时间阅览前沿技术,了解AI领域的最新研究成果。
原标题: DeepMind's AI Learns To See - Two Minute Papers#263
翻译 | 祁晓君 校对 | 陈涛 整理 | 余杭 MY
这是一篇关于神经渲染的DeepMind论文,这种基于学习的技术为了使机器以人类的方式看事物。它充分理解关于几何,视点,阴影,遮挡,甚至是自阴影和自遮挡等等许多复杂的概念。
那么它究竟做了什么以及它究竟是如何正常工作的?
它包含表征和生成网络,表征网络需要保持观察以及一些截图,并将此视觉感官数据编码为包含场景中基础信息的简明描述,这些观察仅来自少数摄像机位置和视点。
神经渲染或观察部分意味着我们选择一个位置和视点。该算法尚未见过,并要求生成网络创建一个合适的图像来与现实相结合。
现在,我们必须暂时坚持我们的论文,并理解为什么这是一个如此疯狂的想法。计算机图形学研究人员非常努力地创建类似的渲染和光模拟,这需要大量计算能力来计算光传输所有方面的程序,然后返回了一张美丽的图片。如果我们略微改变摄像机角度 就必须重复做大量相同的计算,以彻底猜测信息的剩余部分。
通过依靠这两个网络学到的东西,它可以很好地概括,甚至可以处理以前未被观察到的场景。我在神经渲染器上工作了大约3000个小时,并创建了一个可以完美预测逼真图像的AIO:不同之处在于它采用的是固定的摄像机视点,并预测对象的样子。
如果我们开始改变其材料属性的话,这两件作品的结合是非常令人兴奋的。
视频描述中有一个链接到这两个作品,您能想到这些技术的其他可能用途吗?
视频原址:https://www.youtube.com/watch?v=gnctSz2ofU4&t=1s
号外号外~
一个专注于
AI技术发展和AI工程师成长的求知求职社区
诞生啦!
欢迎大家扫码体验
Deepmind AMA:关于最强ALphaGo如何炼成的真心话,都在这里了!
▼▼▼