现代机器学习系统在高效探索庞大搜索空间时面临关键挑战,从生成结构化输出到发现最优架构均是如此。搜索在结构化预测架构搜索中扮演着重要角色。

在结构化预测中,模型必须在一个组合规模极大的输出空间中进行搜索以生成预测结果。而在架构搜索中,则需要研究人员或自动化搜索程序系统性地探索架构设计空间,以找到具备期望性能特征的模型(例如速度与任务性能的理想权衡)。因此,在设计新型机器学习方法时,必须高度重视搜索。

本论文从两个互补层面探讨了搜索挑战:模型推理阶段(结构化预测)模型设计阶段(架构搜索)

第一部分针对结构化预测中的暴露偏差问题(即训练条件与测试推理之间的不匹配)。我们提出了一种统一的面向集束(beam-aware)训练的元算法,该算法在训练过程中引入搜索。该元算法将此类算法分解为三个关键选择:集束大小展开策略(rollout strategy)损失函数。这不仅统一了相关文献中的方法,还提出了新的变体,更好地缓解了暴露偏差。通过理论分析与在超标签(supertagging)任务上的实证评估,我们展示了在训练时同时结合搜索与模型展开能够显著提升性能,尤其是在生成过程中需要处理大量不确定性的情况下。

第二部分则针对神经架构搜索问题,引入了 DeepArchitect —— 一个用于定义架构搜索空间并将其暴露给搜索算法的模块化框架。该方法的主要优势在于,它允许研究人员使用一种搜索空间规范语言来定义搜索空间。随后,这种语言可以通过统一接口将架构提供给搜索算法,而无需依赖对搜索空间的具体先验知识。从根本上来说,这一框架通过模块化分解问题,促进了架构搜索的科学化,使得不同搜索算法能够在相同条件下进行公平比较,而不受实现细节差异的干扰。我们首先介绍了定义单输入单输出架构搜索空间所需的语言构件,然后扩展到具有无环图结构的任意架构。通过对比不同搜索策略和架构空间的大量实验,我们验证了该框架的有效性。进一步地,在语义角色标注任务上的应用展示了如何通过多目标优化发现能在准确率与推理速度之间实现优良权衡的架构,从而在实际相关区域拓展帕累托前沿(Pareto frontier)。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【剑桥大学博士论文】使用检索方法增强多模态问答系统
【ETHZ博士论文】在弱监督学习中施加和揭示群组结构
专知会员服务
21+阅读 · 2023年10月15日
【UFPE大学博士论文】基于熵损失的鲁棒深度学习
专知会员服务
43+阅读 · 2022年11月11日
【迪肯大学博士论文】深度神经网络视觉推理
专知会员服务
47+阅读 · 2022年10月3日
【伯克利博士论文】学习跨领域的可迁移表示
专知会员服务
47+阅读 · 2022年8月17日
【CMU博士论文】通过记忆的元强化学习
专知会员服务
57+阅读 · 2021年10月16日
专知会员服务
25+阅读 · 2021年7月8日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
39+阅读 · 2020年6月22日
【AI与医学】多模态机器学习精准医疗健康
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
国家自然科学基金
15+阅读 · 2017年12月31日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
482+阅读 · 2023年3月31日
Arxiv
79+阅读 · 2023年3月26日
Arxiv
174+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关VIP内容
【剑桥大学博士论文】使用检索方法增强多模态问答系统
【ETHZ博士论文】在弱监督学习中施加和揭示群组结构
专知会员服务
21+阅读 · 2023年10月15日
【UFPE大学博士论文】基于熵损失的鲁棒深度学习
专知会员服务
43+阅读 · 2022年11月11日
【迪肯大学博士论文】深度神经网络视觉推理
专知会员服务
47+阅读 · 2022年10月3日
【伯克利博士论文】学习跨领域的可迁移表示
专知会员服务
47+阅读 · 2022年8月17日
【CMU博士论文】通过记忆的元强化学习
专知会员服务
57+阅读 · 2021年10月16日
专知会员服务
25+阅读 · 2021年7月8日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
39+阅读 · 2020年6月22日
相关基金
国家自然科学基金
15+阅读 · 2017年12月31日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
28+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
微信扫码咨询专知VIP会员