Due to the rapid increase in the diversity of image data, the problem of domain generalization has received increased attention recently. While domain generalization is a challenging problem, it has achieved great development thanks to the fast development of AI techniques in computer vision. Most of these advanced algorithms are proposed with deep architectures based on convolution neural nets (CNN). However, though CNNs have a strong ability to find the discriminative features, they do a poor job of modeling the relations between different locations in the image due to the response to CNN filters are mostly local. Since these local and global spatial relationships are characterized to distinguish an object under consideration, they play a critical role in improving the generalization ability against the domain gap. In order to get the object parts relationships to gain better domain generalization, this work proposes to use the self attention model. However, the attention models are proposed for sequence, which are not expert in discriminate feature extraction for 2D images. Considering this, we proposed a hybrid architecture to discover the spatial relationships between these local features, and derive a composite representation that encodes both the discriminative features and their relationships to improve the domain generalization. Evaluation on three well-known benchmarks demonstrates the benefits of modeling relationships between the features of an image using the proposed method and achieves state-of-the-art domain generalization performance. More specifically, the proposed algorithm outperforms the state-of-the-art by 2.2% and 3.4% on PACS and Office-Home databases, respectively.


翻译:由于图像数据多样性的迅速增加,域的普及问题最近得到了越来越多的关注。域的普及问题虽然是一个具有挑战性的问题,但由于计算机视野中AI技术的快速发展,域的普及问题已经取得了巨大的发展。这些先进的算法大多是用基于卷发神经网(CNN)的深层结构提出的。然而,尽管有线电视新闻网非常有能力找到歧视特征,但是由于对有线电视新闻网过滤器的反应,在图像中不同地点之间关系的建模工作大多是地方性的。由于这些地方和全球空间关系的特点是区分一个正在审议的对象,因此它们在改进针对域间差距的通用能力方面发挥着关键的作用。为了使对象部分关系得到更好的域内化,这项工作提议采用自我注意模式。然而,虽然有线电视新闻网有很强的能力找到歧视特征的提取方法,但是它们却没有很好地进行这样的建模工作。由于这些地方特征之间的空间关系,我们提出了一种混合的架构,并形成了一种综合的表述方式,将区别性特征和它们之间的关系编码,从而改进域域内总体化的能力。为了使目标部分关系获得更好的域域域域内通用化,对域域域域域内的拟议的模型化,用更清楚的模型和一般的模型化,评估,用三个域域域域域域域域域内的拟议的评标法的效益,具体地标法的效益显示。用比较法的效益,用比较法的效益,用比较的研标法的研标法的效益,用比较法的研。比较的研。

0
下载
关闭预览

相关内容

最新《Transformers模型》教程,64页ppt
专知会员服务
312+阅读 · 2020年11月26日
【NeurIPS2020-北大】非凸优化裁剪算法的改进分析
专知会员服务
29+阅读 · 2020年10月11日
【NeurIPS2020】点针图网络,Pointer Graph Networks
专知会员服务
40+阅读 · 2020年9月27日
【ICLR2020】图神经网络与图像处理,微分方程,27页ppt
专知会员服务
48+阅读 · 2020年6月6日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
论文浅尝 | Distant Supervision for Relation Extraction
开放知识图谱
4+阅读 · 2017年12月25日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
16+阅读 · 2021年7月18日
Graph Analysis and Graph Pooling in the Spatial Domain
Explanatory Graphs for CNNs
Arxiv
4+阅读 · 2018年12月18日
Arxiv
8+阅读 · 2018年5月1日
VIP会员
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
论文浅尝 | Distant Supervision for Relation Extraction
开放知识图谱
4+阅读 · 2017年12月25日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员