迁移学习旨在将知识或信息从源领域转移到相关的目标领域。在本文中,我们从知识可迁移性和可信度的角度理解迁移学习。这涉及两个研究问题: 1. 如何定量测量和增强跨领域的知识可迁移性? 1. 我们能否信任迁移学习过程中转移的知识? 为回答这些问题,本文从多个方面对可信迁移学习进行了全面的综述,包括问题定义、理论分析、经验算法和现实应用。具体而言,我们总结了在(同域)独立同分布(IID)和非独立同分布(non-IID)假设下,理解知识可迁移性的最新理论和算法。除了知识可迁移性外,我们还回顾了可信度对迁移学习的影响,例如,迁移的知识是否具有对抗鲁棒性或算法公平性,如何在隐私保护约束下进行知识转移等。除了讨论当前的进展外,我们还强调了在可靠和可信的方式下理解迁移学习的开放问题和未来发展方向。 1. 引言

标准的机器学习假设训练样本和测试样本是独立同分布(IID)的。在这一IID假设下,现代机器学习模型(如深度神经网络(LeCun et al., 2015))在各种高影响力的应用中取得了良好的表现。然而,这一IID假设在实际场景中常常被违反,特别是在样本来自不同来源和环境时(Pan & Yang, 2010;Wu et al., 2024)。迁移学习应运而生,用于解决训练(源领域)和测试(目标领域)数据集之间的分布变化。与仅涉及单一领域样本的标准机器学习不同,迁移学习着重于建模从不同领域收集的异构数据。迁移学习的直觉是通过发现并转移源领域和目标领域的共享知识,弥合它们之间的差距(Pan & Yang, 2010)。与仅从目标领域学习相比,迁移的知识可以显著提高目标领域的预测性能,尤其是在目标领域标注数据有限或不存在的情况下(Ben-David et al., 2010;Tripuraneni et al., 2020)。近年来,通过将学习模型实例化为现代神经网络,引入了具有更强迁移能力的深度迁移学习范式(Yosinski et al., 2014)。如(Pan & Yang, 2010)所示,迁移学习是一个广泛的术语,用于描述从源领域向目标领域转移知识或信息。根据数据和模型假设的不同,它可以导致各种具体问题设置,例如数据层面的知识迁移(领域自适应(Ben-David et al., 2010;Ganin et al., 2016;Mansour et al., 2009a)、分布外泛化(Blanchard et al., 2011;Muandet et al., 2013)和自我学习(Raina et al., 2007)),以及模型层面的知识迁移(微调(Shachaf et al., 2021)、无源适应(Liang et al., 2020a;Aghbalou & Staerman, 2023)、知识蒸馏(Hinton et al., 2015))。过去几十年,关于迁移学习技术在不同数据和模型假设下的泛化性能已有大量研究(Tripuraneni et al., 2020;Zhao et al., 2019b;Minami et al., 2023;Mohri et al., 2019)。除了泛化性能外,理解迁移学习过程中转移知识的可信度(Eshete, 2021)也是至关重要的,尤其是在自驾车和医学诊断等安全关键应用中。正如(Varshney, 2022)所解释的,“信任是信任者与被信任者之间的关系:信任者信任被信任者”。在迁移学习的背景下,信任者可以是源领域或目标领域的所有者/用户/监管者,而被信任者可以是迁移学习模型本身,或是从源领域转移到目标领域的知识。正如早期研究所总结的(Eshete, 2021;Varshney, 2022;Kaur et al., 2023),各种可信度属性可以促使“信任者”在实际场景中信任“被信任者”,包括对抗鲁棒性、隐私、公平性、透明度等。因此,本文聚焦于可信迁移学习(Wu & He, 2023a),旨在从知识可迁移性和知识可信度两个角度理解迁移学习。图1展示了精准农业中可信迁移学习的一个激励性例子(Adve et al., 2024)。在这个例子中,目标农民希望在收集的高粱数据上训练模型,任务是使用叶片高光谱反射率(Wang et al., 2023b;Wu et al., 2022)预测高粱样本的生化特征(例如,氮含量、叶绿素等)。然而,收集标注的训练样本既昂贵又耗时。一种可行的解决方案是利用来自相关玉米数据集的知识,这些数据集由源农民收集。这个迁移学习过程可能涉及源领域和目标领域农民之间的若干可信度问题。例如,迁移学习过程中源数据的隐私是否会泄露?源领域中被污染或存在偏差的知识如何负面影响目标领域的预测性能?迁移性能与可信度属性之间的根本权衡是什么?更一般来说,从数据和AI模型市场(Pei et al., 2023)的角度来看,这强调了在购买AI模型和共享个人数据时建立客户与卖家之间信任的重要性。本综述提供了关于可信迁移学习的最新理论分析和算法的全面回顾。更具体地,我们总结了理解知识可迁移性的最新理论和算法,从IID和非IID两方面进行讨论。IID可迁移性假设每个领域内的样本是独立同分布的。在这种情况下,我们回顾了三种主要的定量指标来评估跨领域的可迁移性,包括(数据层面)分布差异、(任务层面)任务多样性和(模型层面)迁移可估计性。与此不同,非IID可迁移性考虑了更为宽松的假设,即每个领域内的样本可以是相互依赖的,例如,图中的连接节点(Kipf & Welling, 2017)、文本中的词汇出现(Lee et al., 2018)、时间序列中的时间观察(Purushotham et al., 2017)等。接着,我们回顾了在这些复杂情形下如何定量测量和增强跨领域的可迁移性。除了知识可迁移性外,我们还回顾了可信度对迁移学习技术的影响,包括隐私、对抗鲁棒性、公平性、透明度等。最后,我们将突出可信迁移学习的开放问题和未来发展方向。本文的其余部分组织如下:第2节介绍了可信迁移学习的主要符号和一般问题定义;第3节和第4节分别总结了在不同迁移学习场景下的知识可迁移性和可信度;第5节提供了迁移学习技术在现实世界应用中的应用;第6节总结了可信迁移学习的开放问题和未来趋势;最后,第7节对本文进行了总结。

成为VIP会员查看完整内容
2

相关内容

《计算流体力学中的机器学习最新进展》综述
专知会员服务
31+阅读 · 8月24日
《图持续学习》综述
专知会员服务
40+阅读 · 2月13日
《基于自然语言的人工智能军事决策支持》
专知会员服务
116+阅读 · 1月25日
《大型语言模型归因》综述
专知会员服务
69+阅读 · 2023年11月8日
《军事背景下能力规划的概念模型》
专知会员服务
128+阅读 · 2023年3月28日
《量子技术中的人工智能和机器学习》
专知会员服务
38+阅读 · 2023年3月14日
【干货书】优化算法,232页pdf
专知
25+阅读 · 2022年9月8日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
神经网络的基础数学,95页pdf
专知
26+阅读 · 2022年1月23日
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
《计算流体力学中的机器学习最新进展》综述
专知会员服务
31+阅读 · 8月24日
《图持续学习》综述
专知会员服务
40+阅读 · 2月13日
《基于自然语言的人工智能军事决策支持》
专知会员服务
116+阅读 · 1月25日
《大型语言模型归因》综述
专知会员服务
69+阅读 · 2023年11月8日
《军事背景下能力规划的概念模型》
专知会员服务
128+阅读 · 2023年3月28日
《量子技术中的人工智能和机器学习》
专知会员服务
38+阅读 · 2023年3月14日
相关基金
国家自然科学基金
25+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
15+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员