深入探究自监督单目深度估计的泛化能力 (Deep Digging into the Generalization of Self-Supervised Monocular Depth Estimation) - 专知论文

会员服务 ·

0

泛化理论 · 估计/估计量 · Performer · 有偏 · Networking ·

2023 年 3 月 20 日

Deep Digging into the Generalization of Self-Supervised Monocular Depth Estimation

翻译：深入探究自监督单目深度估计的泛化能力

Jinwoo Bae,Sungho Moon,Sunghoon Im

from arxiv, Accepted to AAAI 2023

Self-supervised monocular depth estimation has been widely studied recently. Most of the work has focused on improving performance on benchmark datasets, such as KITTI, but has offered a few experiments on generalization performance. In this paper, we investigate the backbone networks (e.g. CNNs, Transformers, and CNN-Transformer hybrid models) toward the generalization of monocular depth estimation. We first evaluate state-of-the-art models on diverse public datasets, which have never been seen during the network training. Next, we investigate the effects of texture-biased and shape-biased representations using the various texture-shifted datasets that we generated. We observe that Transformers exhibit a strong shape bias and CNNs do a strong texture-bias. We also find that shape-biased models show better generalization performance for monocular depth estimation compared to texture-biased models. Based on these observations, we newly design a CNN-Transformer hybrid network with a multi-level adaptive feature fusion module, called MonoFormer. The design intuition behind MonoFormer is to increase shape bias by employing Transformers while compensating for the weak locality bias of Transformers by adaptively fusing multi-level representations. Extensive experiments show that the proposed method achieves state-of-the-art performance with various public datasets. Our method also shows the best generalization ability among the competitive methods.

翻译：自监督单目深度估计近期受到广泛研究。大部分工作关注提高在基准数据集（如KITTI）上的性能，但在泛化性能上给出的实验较少。本文研究了主干网络（例如CNN、Transformer和CNN-Transformer混合模型）对单目深度估计的泛化能力。首先在多样的公共数据集上评估了最先进的模型，这些数据集在网络训练期间从未被观察过。接着，使用我们生成的多个不同纹理偏移数据集研究了纹理偏向和形状偏向两种表征的影响。我们观察到Transformers有很强的形状偏向而CNNs则有很强的纹理偏向。我们还发现，比起纹理偏向模型，形状偏向模型对单目深度估计展示出更好的泛化性能。基于这些观测结果，我们新设计了一个CNN-Transformer混合网络，其中包括一个多级自适应特征融合模块，称为MonoFormer。MonoFormer的设计思想是通过采用Transformers来增加形状偏向，同时通过自适应地融合多级表示来弥补Transformers的弱点。大量实验证明，所提出的方法在各种公共数据集上均取得了最先进的性能。我们的方法还显示出最佳的泛化能力，优于竞争方法。

0

相关内容

泛化理论

【AAAI2023】FoPro:少样本引导的鲁棒维布监督原型学习

【AAAI2023】FoPro:少样本引导的鲁棒维布监督原型学习

专知会员服务

14+阅读 · 2022年12月3日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知会员服务

34+阅读 · 2022年8月1日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

专知会员服务

23+阅读 · 2021年6月3日

【AAAI2021】属性引导对抗训练的自然扰动鲁棒性

专知会员服务

26+阅读 · 2021年1月21日

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

专知会员服务

32+阅读 · 2020年5月14日

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

专知会员服务

23+阅读 · 2020年4月9日

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

专知会员服务

43+阅读 · 2020年4月1日

【NeurIPS 2019 Apple成果汇总】《Apple at NeurIPS 2019》

【NeurIPS 2019 Apple成果汇总】《Apple at NeurIPS 2019》

专知会员服务

11+阅读 · 2019年12月6日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

MIT博士论文 | 图指导的预测（含GNN的泛化能力和表示能力分析）

MIT博士论文 | 图指导的预测（含GNN的泛化能力和表示能力分析）

图与推荐

0+阅读 · 2022年11月14日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

浅聊对比学习（Contrastive Learning）第一弹

浅聊对比学习（Contrastive Learning）第一弹

PaperWeekly

0+阅读 · 2022年6月10日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

泡泡机器人SLAM

11+阅读 · 2018年10月6日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

纳米尺度晶体/非晶复合材料的耐辐照特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

原噬菌体SE14促进肠炎沙门氏菌在鸡蛋蛋清中存活的分子机制

国家自然科学基金

0+阅读 · 2014年12月31日

非晶材料部件控性控型一体化成形机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于上下文协作、多级观测和数据关联的复杂场景多目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

La1-xSrxMnO3/In-MgZnO全氧化物外延异质结器件的制备与性能研究

国家自然科学基金

0+阅读 · 2012年12月31日

剧烈塑性变形条件下金属间化合物相变研究

国家自然科学基金

0+阅读 · 2012年12月31日

视频监控中活动人物的视觉理解

国家自然科学基金

1+阅读 · 2009年12月31日

放电等离子烧结法制备CeO2 基无孔致密扩散障碍层型极限电流氧传感器的研究

国家自然科学基金

0+阅读 · 2009年12月31日

生物视觉信息处理机制建模及形状目标识别

国家自然科学基金

0+阅读 · 2008年12月31日

p-n复合半导体CoO/CdS敏化TiO2可见光催化分解水制氢

国家自然科学基金

0+阅读 · 2008年12月31日

Two Steps Forward and One Behind: Rethinking Time Series Forecasting with Deep Learning

Arxiv

0+阅读 · 2023年5月8日

Pose-disentangled Contrastive Learning for Self-supervised Facial Representation

Arxiv

0+阅读 · 2023年5月8日

The envelope of a complex Gaussian random variable

Arxiv

0+阅读 · 2023年5月7日

Contrastive Learning for Low-light Raw Denoising

Arxiv

0+阅读 · 2023年5月5日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

A Probabilistic Representation of DNNs: Bridging Mutual Information and Generalization

Arxiv

17+阅读 · 2021年6月18日

Self-supervised Learning: Generative or Contrastive

Arxiv

25+阅读 · 2021年3月20日

Self-supervised Geometric Perception

Arxiv

24+阅读 · 2021年3月4日

The Causal Learning of Retail Delinquency

Arxiv

14+阅读 · 2020年12月17日

Self-correcting Q-Learning

Arxiv

11+阅读 · 2020年12月2日

VIP会员

文章信息

相关主题

估计/估计量

相关VIP内容

【AAAI2023】FoPro:少样本引导的鲁棒维布监督原型学习

【AAAI2023】FoPro:少样本引导的鲁棒维布监督原型学习

专知会员服务

14+阅读 · 2022年12月3日

【KDD2022】自监督超图Transformer推荐系统

【KDD2022】自监督超图Transformer推荐系统

专知会员服务

34+阅读 · 2022年8月1日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

【MIT】自监督几何感知，22页ppt，Self-supervised Geometric Perception

专知会员服务

23+阅读 · 2021年6月3日

【AAAI2021】属性引导对抗训练的自然扰动鲁棒性

专知会员服务

26+阅读 · 2021年1月21日

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

专知会员服务

32+阅读 · 2020年5月14日

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

【CVPR2020-Oral】自监督单目场景流量估计，Self-Supervised Monocular SFE

专知会员服务

23+阅读 · 2020年4月9日

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

【CVPR2020-哈工大-京东】自监督结构建模的目标识别，Self-supervised Structure Modeling

专知会员服务

43+阅读 · 2020年4月1日

【NeurIPS 2019 Apple成果汇总】《Apple at NeurIPS 2019》

【NeurIPS 2019 Apple成果汇总】《Apple at NeurIPS 2019》

专知会员服务

11+阅读 · 2019年12月6日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】以人为中心的强化学习

任务规划与地形分析：现代复杂环境作战导航体系

认知优势：人工智能在国家安全决策中的核心作用

大模型赋能的具身智能：决策与具身学习综述

相关资讯

MIT博士论文 | 图指导的预测（含GNN的泛化能力和表示能力分析）

MIT博士论文 | 图指导的预测（含GNN的泛化能力和表示能力分析）

图与推荐

0+阅读 · 2022年11月14日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

浅聊对比学习（Contrastive Learning）第一弹

浅聊对比学习（Contrastive Learning）第一弹

PaperWeekly

0+阅读 · 2022年6月10日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

【泡泡图灵智库】密集相关的自监督视觉描述学习（RAL）

泡泡机器人SLAM

11+阅读 · 2018年10月6日

【SIGIR2018】五篇对抗训练文章

【SIGIR2018】五篇对抗训练文章

专知

12+阅读 · 2018年7月9日

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

【论文推荐】最新八篇生成对抗网络相关论文—BRE、图像合成、多模态图像生成、非配对多域图、注意力、对抗特征增强、深度对抗性训练

专知

16+阅读 · 2018年5月14日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

相关论文

Two Steps Forward and One Behind: Rethinking Time Series Forecasting with Deep Learning

Arxiv

0+阅读 · 2023年5月8日

Pose-disentangled Contrastive Learning for Self-supervised Facial Representation

Arxiv

0+阅读 · 2023年5月8日

The envelope of a complex Gaussian random variable

Arxiv

0+阅读 · 2023年5月7日

Contrastive Learning for Low-light Raw Denoising

Arxiv

0+阅读 · 2023年5月5日

Prompt Distribution Learning

Arxiv

14+阅读 · 2022年5月6日

A Probabilistic Representation of DNNs: Bridging Mutual Information and Generalization

Arxiv

17+阅读 · 2021年6月18日

Self-supervised Learning: Generative or Contrastive

Arxiv

25+阅读 · 2021年3月20日

Self-supervised Geometric Perception

Arxiv

24+阅读 · 2021年3月4日

The Causal Learning of Retail Delinquency

Arxiv

14+阅读 · 2020年12月17日

Self-correcting Q-Learning

Arxiv

11+阅读 · 2020年12月2日

相关基金

纳米尺度晶体/非晶复合材料的耐辐照特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

原噬菌体SE14促进肠炎沙门氏菌在鸡蛋蛋清中存活的分子机制

国家自然科学基金

0+阅读 · 2014年12月31日

非晶材料部件控性控型一体化成形机理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于上下文协作、多级观测和数据关联的复杂场景多目标跟踪

国家自然科学基金

0+阅读 · 2013年12月31日

La1-xSrxMnO3/In-MgZnO全氧化物外延异质结器件的制备与性能研究

国家自然科学基金

0+阅读 · 2012年12月31日

剧烈塑性变形条件下金属间化合物相变研究

国家自然科学基金

0+阅读 · 2012年12月31日

视频监控中活动人物的视觉理解

国家自然科学基金

1+阅读 · 2009年12月31日

放电等离子烧结法制备CeO2 基无孔致密扩散障碍层型极限电流氧传感器的研究

国家自然科学基金

0+阅读 · 2009年12月31日

生物视觉信息处理机制建模及形状目标识别

国家自然科学基金

0+阅读 · 2008年12月31日

p-n复合半导体CoO/CdS敏化TiO2可见光催化分解水制氢

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员