多任务学习对于机器学习的实际应用至关重要。现代方法以算法复杂性为特征,往往并无充分的理由,导致解决方案不切实际。相比之下,这篇论文证明了一种极简主义的替代方案是可行的,展示了简单方法的吸引力。"为深度多任务学习的统一标量化辩护"激励了本论文的其余部分,证明在公平的比较下,没有更复杂的多任务优化器超过简单的每任务梯度求和方法。此外,它从正则化的角度提出了一种新的看待多任务优化器的方式。本论文的其余部分关注深度强化学习,这是一个用于顺序决策的通用框架。特别是,我们关注当观察(输入到模型的)被表示为图(即,相互连接的节点的集合)时的设定。在"将GNNs扩展到高维连续控制"和"形态在基于图的不兼容控制中的作用"中,我们通过将观察集元素表示为图并部署图神经网络(包括变换器)来学习一个针对不同形态的代理的单一控制策略。在前一章中,我们设计了一种简单的方法来扩展图网络,通过冻结网络的一部分来稳定学习并防止过拟合。在后一章中,我们显示图连接性可能对下游任务来说并不是最优的,证明了在没有图连接性信息的情况下,限制较少的变换器表现显著更好。最后,在"对SAT求解器的可推广分支启发式"中,我们将多任务强化学习应用于布尔满足性,这是学术界和工业应用中的基本问题。我们证明了,配备了图神经网络进行函数逼近的Q-learning(一种强化学习算法的基础)可以学习一种可推广的分支启发式。我们希望我们的发现将推动该领域的进一步发展:创建更复杂的基准,增加对任务相似性和模型容量的假设,以及探索其他目标函数,而不是专注于跨任务的平均性能。
牛津大学是一所英国研究型大学,也是罗素大学集团、英国“G5超级精英大学”,欧洲顶尖大学科英布拉集团、欧洲研究型大学联盟的核心成员。牛津大学培养了众多社会名人,包括了27位英国首相、60位诺贝尔奖得主以及数十位世界各国的皇室成员和政治领袖。2016年9月,泰晤士高等教育发布了2016-2017年度世界大学排名,其中牛津大学排名第一。