Domain generalization (DG) methods aim to achieve generalizability to an unseen target domain by using only training data from the source domains. Although a variety of DG methods have been proposed, a recent study shows that under a fair evaluation protocol, called DomainBed, the simple empirical risk minimization (ERM) approach works comparable to or even outperforms previous methods. Unfortunately, simply solving ERM on a complex, non-convex loss function can easily lead to sub-optimal generalizability by seeking sharp minima. In this paper, we theoretically show that finding flat minima results in a smaller domain generalization gap. We also propose a simple yet effective method, named Stochastic Weight Averaging Densely (SWAD), to find flat minima. SWAD finds flatter minima and suffers less from overfitting than does the vanilla SWA by a dense and overfit-aware stochastic weight sampling strategy. SWAD shows state-of-the-art performances on five DG benchmarks, namely PACS, VLCS, OfficeHome, TerraIncognita, and DomainNet, with consistent and large margins of +1.6% averagely on out-of-domain accuracy. We also compare SWAD with conventional generalization methods, such as data augmentation and consistency regularization methods, to verify that the remarkable performance improvements are originated from by seeking flat minima, not from better in-domain generalizability. Last but not least, SWAD is readily adaptable to existing DG methods without modification; the combination of SWAD and an existing DG method further improves DG performances.


翻译:虽然提出了各种DG方法,但最近的一项研究显示,在称为DomeBed的公平评估协议下,简单的经验风险最小化(ERM)方法与以往方法相似,甚至优于以往方法。不幸的是,只要在一个复杂、非Convex损失函数上解决机构风险管理,就很容易通过寻求锐利的迷你来达到最优化的通用性。在本文中,我们理论上表明,找到平淡的微粒会导致缩小域的广域化差距。我们还提出了一个简单而有效的方法,即Stochatical Weight Averabilating Denely(SWADD),以找到平坦的迷你。SWAD发现,简单的经验风险最小化方法与以往方法相比,甚至比Vanilla SWA相比,更不那么简单。 SWAD 简单化方法的现有五大组合基准(即PACS、VLCS、OffornalHome、TerIngondoD、DomainalalityNet, 也比SWAAAD的更稳定化方法更一致, 也比SWADAVAL-LLOG), 和SOLVAL-LVAL-L-L-L-LVAL-L-L-L-L-L-L-L-SD-L-L-SD-L-L-L-SD-SD-L-L-SD-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-SD-SD-SD-L-L-L-L-SD-L-L-L-SAD-L-L-L-S-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-L-S-S-S-S-S-L-L-L-L-S-S-S-S-S-S-S-S-S-SA-S-S-L-S-S-S-SA-S-S-S

2
下载
关闭预览

相关内容

【DeepMind】强化学习教程,83页ppt
专知会员服务
154+阅读 · 2020年8月7日
迁移学习简明教程,11页ppt
专知会员服务
108+阅读 · 2020年8月4日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
【Google-CMU】元伪标签的元学习,Meta Pseudo Labels
专知会员服务
32+阅读 · 2020年3月30日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
55+阅读 · 2020年2月18日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
31+阅读 · 2019年10月17日
利用Uncertainty修正Domain Adaptation中的伪标签
极市平台
3+阅读 · 2020年4月16日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
迁移学习之Domain Adaptation
全球人工智能
18+阅读 · 2018年4月11日
Generalized Source-free Domain Adaptation
Arxiv
0+阅读 · 2021年8月3日
Arxiv
3+阅读 · 2020年7月16日
VIP会员
相关VIP内容
【DeepMind】强化学习教程,83页ppt
专知会员服务
154+阅读 · 2020年8月7日
迁移学习简明教程,11页ppt
专知会员服务
108+阅读 · 2020年8月4日
Fariz Darari简明《博弈论Game Theory》介绍,35页ppt
专知会员服务
111+阅读 · 2020年5月15日
【Google-CMU】元伪标签的元学习,Meta Pseudo Labels
专知会员服务
32+阅读 · 2020年3月30日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
55+阅读 · 2020年2月18日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
31+阅读 · 2019年10月17日
相关资讯
利用Uncertainty修正Domain Adaptation中的伪标签
极市平台
3+阅读 · 2020年4月16日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
迁移学习之Domain Adaptation
全球人工智能
18+阅读 · 2018年4月11日
Top
微信扫码咨询专知VIP会员