计算机视觉(Computer Vision)是一门多学科科学,致力于让机器具备“看”的能力。 这个问题是很具有挑战性的,因为我们从现实的视觉世界中观察到了巨大的复杂性和外观的变化。迄今为止,机器学习技术提供了最有有效的方法来设计具有人类图像理解能力的系统。今天为大家再来了剑桥大学Alex Kendall的博士论文-计算机视觉深度学习中的几何结构与不确定性。
针对一些核心计算机视觉问题,包括语义分割,实例分割,深度预测,定位,立体视觉和视频场景理解等等问题,论文中的介绍了一些端到端深度学习架构。这些的框架优于传统方法,并在许多具有挑战性的计算机视觉问题上具有很不错的效果。