【导读】计算机视觉(Computer Vision)是一门多学科科学,致力于让机器具备“看”的能力。 这个问题是很具有挑战性的,因为我们从现实的视觉世界中观察到了巨大的复杂性和外观的变化。迄今为止,机器学习技术提供了最有有效的方法来设计具有人类图像理解能力的系统。今天为大家再来了剑桥大学Alex Kendall的博士论文-计算机视觉深度学习中的几何结构与不确定性。
针对一些核心计算机视觉问题,包括语义分割,实例分割,深度预测,定位,立体视觉和视频场景理解等等问题,论文中的介绍了一些端到端深度学习架构。这些的框架优于传统方法,并在许多具有挑战性的计算机视觉问题上具有很不错的效果。
论文目录:
介绍(Introduction)
场景理解(Scene Understanding )
本地化(Localisation)
立体视觉(Stereo Vision)
运动场景(Motion)
结论(Conclusions)
参考链接:
https://alexgkendall.com/computer_vision/phd_thesis/
https://alexgkendall.com/media/papers/alex_kendall_phd_thesis_compressed.pdf
请关注专知公众号(扫一扫最下面专知二维码,或者点击上方蓝色专知)
后台回复“AKCV208” 就可以获取全书208页 PDF下载链接~
全文pdf
-END-
专 · 知
人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!
请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!
请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~
请关注专知公众号,获取人工智能的专业知识!
点击“阅读原文”,使用专知