领域自适应研究综述

2021 年 5 月 5 日 专知


经典机器学习算法假设训练数据和测试数据具有相同的输入特征空间和相同的数据分布。在诸多现实问题中,这一假设往往不能满足,导致经典机器学习算法失效。领域自适应是一种新的学习范式,其关键技术在于通过学习新的特征表达来对齐源域和目标域的数据分布,使得在有标签源域训练的模型可以直接迁移到没有标签的目标域上,同时不会引起性能的明显损失。本文介绍领域自适应的定义,分类和代表性算法,重点讨论基于度量学习的领域自适应算法和基于对抗学习的领域自适应算法。最后,分析领域自适应的典型应用和存在挑战,明确领域自适应的发展趋势,并提出未来可能的研究方向。 


https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=JSJC20210429001&v=g9BjGJf5ZLV%25mmd2FknkFRqwbuiNYcv3b3wgdMPAKTB0vn3jfk9VluWprby0eIXzCZilW


在海量数据的支撑下,机器学习,尤其是深度 学习算法在诸如计算机视觉、自然语言处理等领域 取得了巨大的成功。机器学习的理想场景是有大量 带标记的训练实例,并且训练数据与测试数据具有 相同的分布。然而在许多现实应用中,收集足够的 带标记的训练数据通常是耗时、代价昂贵甚至是无 法实现的。并且在机器学习被使用的诸多领域中, 数据独立同分布的假设往往并不能够成立。因为数 据分布的差异,传统的机器学习算法训练得到的模 型往往不能在相似的新领域中取得预期的结果,这 限制了机器学习模型的泛化能力和知识复用能力。


迁移学习和领域自适应技术可以被用来改善机 器学习模型在跨领域任务上的性能。当目标领域中 无法获得大量带标签数据用于训练具有良好性能的 机器学习模型时,可以考虑在不同但相关的有大量 带标签数据可以被获取的辅助领域进行模型的预训 练,然后将训练好的模型进行调整后应用于目标领 域,这克服了实际应用中目标域带标签数据稀有、 难以获取的困境。然而,跨域的数据分布差异成为 了模型迁移的障碍。领域自适应(Domain Adaptation) 旨在学习一个模型使得在辅助领域获取的知识能够 在目标领域得到很好地泛化,引入领域自适应技术 可以减小辅助领域与目标域的数据分布差异,从而 实现领域不变知识的跨域迁移和复用。领域自适应 是机器学习与计算机视觉范畴内前沿的研究方向之 一,并在计算机视觉、生物信息学等方面有极大的 应用前景。迁移学习和领域自适应技术有望处理目 标领域标注数据稀缺的问题,避免从头进行模型训 练的高额成本,提高机器学习模型的普适性和知识 迁移复用的能力,因而具备较大的理论研究价值和 宽广的应用前景。


本文对领域自适应在国内外的研究现状进行了 总结,并介绍了领域自适应的相关概念、算法分类、 该领域的代表性方法、典型应用以及存在的挑战, 明确了该领域的发展趋势以及探讨了未来可能的研 究方向。



专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“DAS” 就可以获取领域自适应研究综述》专知下载链接


专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!


欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
6

相关内容

领域自适应是与机器学习和转移学习相关的领域。 当我们的目标是从源数据分布中学习在不同(但相关)的目标数据分布上的良好性能模型时,就会出现这种情况。 例如,常见垃圾邮件过滤问题的任务之一在于使模型从一个用户(源分发)适应到接收显着不同的电子邮件(目标分发)的新模型。 注意,当有多个源分发可用时,该问题被称为多源域自适应。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
182+阅读 · 2021年2月4日
专知会员服务
68+阅读 · 2021年1月16日
专知会员服务
32+阅读 · 2020年12月25日
基于深度学习的数据融合方法研究综述
专知会员服务
130+阅读 · 2020年12月10日
专知会员服务
200+阅读 · 2020年12月5日
最新《低资源自然语言处理》综述论文,21页pdf
专知会员服务
58+阅读 · 2020年10月27日
时空序列预测方法综述
专知会员服务
152+阅读 · 2020年10月18日
最新《多任务学习》综述,39页pdf
专知会员服务
258+阅读 · 2020年7月10日
【伯克利-滴滴出行】深度学习多源领域自适应综述论文
专知会员服务
53+阅读 · 2020年2月28日
多模态视觉语言表征学习研究综述
专知
25+阅读 · 2020年12月3日
时空序列预测方法综述
专知
18+阅读 · 2020年10月19日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
【综述】迁移自适应学习十年进展
专知
41+阅读 · 2019年11月26日
关于GANs在医学图像领域应用的总结
计算机视觉life
13+阅读 · 2019年7月25日
迁移自适应学习最新综述,附21页论文下载
2017年领域自适应发展回顾
AI研习社
3+阅读 · 2018年10月28日
【回顾】迁移学习的发展和现状
AI研习社
8+阅读 · 2017年11月17日
Arxiv
7+阅读 · 2020年10月7日
Arxiv
7+阅读 · 2020年5月25日
A Comprehensive Survey on Transfer Learning
Arxiv
117+阅读 · 2019年11月7日
Arxiv
5+阅读 · 2019年4月25日
Transfer Adaptation Learning: A Decade Survey
Arxiv
37+阅读 · 2019年3月12日
A Comprehensive Survey on Graph Neural Networks
Arxiv
13+阅读 · 2019年3月10日
VIP会员
相关VIP内容
专知会员服务
182+阅读 · 2021年2月4日
专知会员服务
68+阅读 · 2021年1月16日
专知会员服务
32+阅读 · 2020年12月25日
基于深度学习的数据融合方法研究综述
专知会员服务
130+阅读 · 2020年12月10日
专知会员服务
200+阅读 · 2020年12月5日
最新《低资源自然语言处理》综述论文,21页pdf
专知会员服务
58+阅读 · 2020年10月27日
时空序列预测方法综述
专知会员服务
152+阅读 · 2020年10月18日
最新《多任务学习》综述,39页pdf
专知会员服务
258+阅读 · 2020年7月10日
【伯克利-滴滴出行】深度学习多源领域自适应综述论文
专知会员服务
53+阅读 · 2020年2月28日
相关资讯
多模态视觉语言表征学习研究综述
专知
25+阅读 · 2020年12月3日
时空序列预测方法综述
专知
18+阅读 · 2020年10月19日
最新《多任务学习》综述,39页pdf
专知
28+阅读 · 2020年7月10日
【综述】迁移自适应学习十年进展
专知
41+阅读 · 2019年11月26日
关于GANs在医学图像领域应用的总结
计算机视觉life
13+阅读 · 2019年7月25日
迁移自适应学习最新综述,附21页论文下载
2017年领域自适应发展回顾
AI研习社
3+阅读 · 2018年10月28日
【回顾】迁移学习的发展和现状
AI研习社
8+阅读 · 2017年11月17日
相关论文
Arxiv
7+阅读 · 2020年10月7日
Arxiv
7+阅读 · 2020年5月25日
A Comprehensive Survey on Transfer Learning
Arxiv
117+阅读 · 2019年11月7日
Arxiv
5+阅读 · 2019年4月25日
Transfer Adaptation Learning: A Decade Survey
Arxiv
37+阅读 · 2019年3月12日
A Comprehensive Survey on Graph Neural Networks
Arxiv
13+阅读 · 2019年3月10日
Top
微信扫码咨询专知VIP会员