论文题目: Monocular Depth Estimation: A Survey

论文摘要: 单目深度估计常被描述为一个不适定和固有的模糊问题。从二维图像中估计深度是场景重建、三维目标识别、分割和检测的关键步骤。该问题可以分为:给定单个RGB图像作为输入,预测每个像素的稠密深度图。由于大多数场景具有较大的纹理和结构变化、对象遮挡和丰富的几何细节,这一问题更加严重。所有这些因素都造成了准确估计深度的困难。在本文中,我们回顾了五篇试图用各种技术来解决深度估计问题的论文,这些技术包括有监督、弱监督和无监督学习技术。然后,我们比较这些文件,了解彼此之间的改进。最后,我们探讨可以帮助更好地解决这个问题的潜在改进。

成为VIP会员查看完整内容
0
55

相关内容

现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习

论文题目: Salient Object Detection in the Deep Learning Era: An In-Depth Survey

论文摘要: 作为计算机视觉中的一个重要问题,图像中的显著目标检测(SOD)近年来得到了越来越多的研究。最近在超氧化物歧化酶方面的进展主要是基于深度学习的解决方案(称为深超氧化物歧化酶)。为了便于深入理解深层SODs,本文提供了一个全面的综述,涵盖了从算法分类到未解决的开放问题的各个方面。特别是,我们首先从网络结构、监控级别、学习范式和对象/实例级别检测等不同角度对深度超氧化物歧化酶算法进行了综述。在此基础上,总结了现有的SOD评价数据集和指标体系。然后,在前人工作的基础上,认真编写了一个完整的SOD方法的基准测试结果,并对对比结果进行了详细的分析。另外,通过构造一个新的具有丰富属性标注的SOD数据集,研究了不同属性下的SOD算法的性能,这在以前的研究中是很少的。我们首次在现场进一步分析了deep-SOD模型的鲁棒性和可转移性。我们还研究了输入扰动的影响,以及现有SOD数据集的通用性和硬度。最后,讨论了超氧化物歧化酶存在的问题和挑战,并指出了未来可能的研究方向。

成为VIP会员查看完整内容
Salient Object Detection in the Deep Learning Era An In-Depth Survey.pdf
0
34

Recent techniques in self-supervised monocular depth estimation are approaching the performance of supervised methods, but operate in low resolution only. We show that high resolution is key towards high-fidelity self-supervised monocular depth prediction. Inspired by recent deep learning methods for Single-Image Super-Resolution, we propose a sub-pixel convolutional layer extension for depth super-resolution that accurately synthesizes high-resolution disparities from their corresponding low-resolution convolutional features. In addition, we introduce a differentiable flip-augmentation layer that accurately fuses predictions from the image and its horizontally flipped version, reducing the effect of left and right shadow regions generated in the disparity map due to occlusions. Both contributions provide significant performance gains over the state-of-the-art in self-supervised depth and pose estimation on the public KITTI benchmark. A video of our approach can be found at https://youtu.be/jKNgBeBMx0I.

0
5
下载
预览
小贴士
相关论文
MetaFuse: A Pre-trained Fusion Model for Human Pose Estimation
Rongchang Xie,Chunyu Wang,Yizhou Wang
4+阅读 · 2020年3月30日
Sparse2Dense: From direct sparse odometry to dense 3D reconstruction
Jiexiong Tang,John Folkesson,Patric Jensfelt
9+阅读 · 2019年3月21日
3D Hand Shape and Pose Estimation from a Single RGB Image
Liuhao Ge,Zhou Ren,Yuncheng Li,Zehao Xue,Yingying Wang,Jianfei Cai,Junsong Yuan
15+阅读 · 2019年3月3日
Ke Sun,Bin Xiao,Dong Liu,Jingdong Wang
5+阅读 · 2019年2月25日
Shaoshuai Shi,Xiaogang Wang,Hongsheng Li
7+阅读 · 2018年12月11日
Sudeep Pillai,Rares Ambrus,Adrien Gaidon
5+阅读 · 2018年10月3日
Viewpoint Estimation-Insights & Model
Gilad Divon,Ayellet Tal
3+阅读 · 2018年7月3日
Kurt Riedel
4+阅读 · 2018年3月14日
Samuel Scheidegger,Joachim Benjaminsson,Emil Rosenberg,Amrit Krishnan,Karl Granstrom
9+阅读 · 2018年2月27日
Daniel Oñoro-Rubio,Roberto J. López-Sastre,Carolina Redondo-Cabrera,Pedro Gil-Jiménez
5+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员