多任务学习对于机器学习的实际应用至关重要。现代方法以算法复杂性为特征,往往并无充分的理由,导致解决方案不切实际。相比之下,这篇论文证明了一种极简主义的替代方案是可行的,展示了简单方法的吸引力。"为深度多任务学习的统一标量化辩护"激励了本论文的其余部分,证明在公平的比较下,没有更复杂的多任务优化器超过简单的每任务梯度求和方法。此外,它从正则化的角度提出了一种新的看待多任务优化器的方式。本论文的其余部分关注深度强化学习,这是一个用于顺序决策的通用框架。特别是,我们关注当观察(输入到模型的)被表示为图(即,相互连接的节点的集合)时的设定。在"将GNNs扩展到高维连续控制"和"形态在基于图的不兼容控制中的作用"中,我们通过将观察集元素表示为图并部署图神经网络(包括变换器)来学习一个针对不同形态的代理的单一控制策略。在前一章中,我们设计了一种简单的方法来扩展图网络,通过冻结网络的一部分来稳定学习并防止过拟合。在后一章中,我们显示图连接性可能对下游任务来说并不是最优的,证明了在没有图连接性信息的情况下,限制较少的变换器表现显著更好。最后,在"对SAT求解器的可推广分支启发式"中,我们将多任务强化学习应用于布尔满足性,这是学术界和工业应用中的基本问题。我们证明了,配备了图神经网络进行函数逼近的Q-learning(一种强化学习算法的基础)可以学习一种可推广的分支启发式。我们希望我们的发现将推动该领域的进一步发展:创建更复杂的基准,增加对任务相似性和模型容量的假设,以及探索其他目标函数,而不是专注于跨任务的平均性能。

成为VIP会员查看完整内容
40

相关内容

牛津大学是一所英国研究型大学,也是罗素大学集团、英国“G5超级精英大学”,欧洲顶尖大学科英布拉集团、欧洲研究型大学联盟的核心成员。牛津大学培养了众多社会名人,包括了27位英国首相、60位诺贝尔奖得主以及数十位世界各国的皇室成员和政治领袖。2016年9月,泰晤士高等教育发布了2016-2017年度世界大学排名,其中牛津大学排名第一。

【牛津大学博士论文】高效深度学习优化,192页pdf
专知会员服务
48+阅读 · 2023年7月13日
【博士论文】多任务学习视觉场景理解,140页pdf
专知会员服务
88+阅读 · 2022年4月5日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
125+阅读 · 2020年8月27日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
A Survey of Large Language Models
Arxiv
346+阅读 · 2023年3月31日
Arxiv
14+阅读 · 2022年5月6日
Lifelong Learning Metrics
Arxiv
47+阅读 · 2022年1月20日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
12+阅读 · 2018年1月12日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
相关论文
A Survey of Large Language Models
Arxiv
346+阅读 · 2023年3月31日
Arxiv
14+阅读 · 2022年5月6日
Lifelong Learning Metrics
Arxiv
47+阅读 · 2022年1月20日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
12+阅读 · 2018年1月12日
微信扫码咨询专知VIP会员