The challenge of effectively transferring knowledge across multiple tasks is of critical importance and is also present in downstream tasks with foundation models. However, the nature of transfer, its transitive-intransitive nature, is still an open problem, and negative transfer remains a significant obstacle. Selection of beneficial auxiliary task sets in multi-task learning is frequently hindered by the high computational cost of their evaluation, the high number of plausible candidate auxiliary sets, and the varying complexity of selection across target tasks. To address these constraints, we introduce BandiK, a novel three-stage multi-task auxiliary task subset selection method using multi-bandits, where each arm pull evaluates candidate auxiliary sets by training and testing a multiple output neural network on a single random train-test dataset split. Firstly, BandiK estimates the pairwise transfers between tasks, which helps in identifying which tasks are likely to benefit from joint learning. In the second stage, it constructs a linear number of candidate sets of auxiliary tasks (in the number of all tasks) for each target task based on the initial estimations, significantly reducing the exponential number of potential auxiliary task sets. Thirdly, it employs a Multi-Armed Bandit (MAB) framework for each task, where the arms correspond to the performance of candidate auxiliary sets realized as multiple output neural networks over train-test data set splits. To enhance efficiency, BandiK integrates these individual task-specific MABs into a multi-bandit structure. The proposed multi-bandit solution exploits that the same neural network realizes multiple arms of different individual bandits corresponding to a given candidate set. This semi-overlapping arm property defines a novel multi-bandit cost/reward structure utilized in BandiK.


翻译:在多任务学习中有效迁移知识是一项至关重要的挑战,这一挑战同样存在于基于基础模型的下游任务中。然而,迁移的本质,即其传递性与非传递性特性,仍是一个开放性问题,而负迁移依然是重大障碍。在多任务学习中,有益辅助任务集的选择常受到以下因素阻碍:评估计算成本高昂、可能的候选辅助集数量庞大,以及不同目标任务的选择复杂度各异。为应对这些限制,我们提出了BandiK,一种新颖的三阶段多任务辅助任务子集选择方法,该方法采用多臂赌博机框架,其中每次拉动臂(arm pull)通过在一个随机划分的训练-测试数据集上训练和测试一个多输出神经网络来评估候选辅助集。首先,BandiK估计任务间的成对迁移,这有助于识别哪些任务可能从联合学习中受益。第二阶段,它基于初始估计为每个目标任务构建线性数量(相对于总任务数)的候选辅助任务集,从而显著减少潜在的指数级辅助任务集数量。第三阶段,它为每个任务采用一个多臂赌博机(MAB)框架,其中每个臂对应一个候选辅助集的性能,该性能通过在训练-测试数据集划分上实现为多输出神经网络来评估。为提高效率,BandiK将这些针对单个任务的MAB整合到一个多赌博机结构中。所提出的多赌博机解决方案利用了以下特性:同一个神经网络实现了对应于给定候选集的不同独立赌博机的多个臂。这种半重叠臂特性定义了BandiK所采用的一种新颖的多赌博机成本/奖励结构。

0
下载
关闭预览

相关内容

【ICCV2023】保留模态结构改进多模态学习
专知会员服务
31+阅读 · 2023年8月28日
【CVPR2022】MSDN: 零样本学习的互语义蒸馏网络
专知会员服务
21+阅读 · 2022年3月8日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员