深度神经网络通过扩展模型容量、数据和计算,达到了当前最先进的性能。然而,这种扩展也放大了模型在资源受限、工作负载波动环境中的部署成本。本论文论证了环境可变性——无论是不可预测的还是渐进的——都可以作为实现效率的杠杆,从而构建自适应系统,在保持离线性能的同时,将计算量减少一个数量级甚至更多。 第一部分聚焦于任意环境,在这种环境中,机器学习推理预算可能在不同查询之间发生变化。第二章中,我们提出了 b-distil,一种渐进式集成蒸馏算法,它能够将单一、刚性的教师模型转化为具有可调成本旋钮的弹性学生模型。在多种视觉、语音和传感任务上,该学生模型在大幅降低推理成本的同时,性能可与教师模型匹敌。第三章介绍了 ABC,一种无需训练的级联方法,它能够重用现有模型(无需进一步修改),并依赖集成一致性来实时检测“简单”查询,使平均推理成本相比最佳单模型降低 2–5 倍。 第二部分聚焦于性质随时间缓慢漂移的良性环境。第四章提出了 持续优化(Continual Optimization, CO),一种面向相关优化问题序列的有状态范式,旨在跨轮次摊销计算开销。以 GPU 集群调度问题为例,从 CO 的视角出发,我们定义了其潜在的良性结构,并提出了 COpter,一种 CO 方法。通过跨轮次复用计算,COpter 将最新求解器的速度提升了 10–100 倍,同时产出的调度结果仍可与离线最优解相媲美。第五章将 CO 应用于两个超出机器学习范围的资源分配问题——分片负载均衡与广域网流量工程,在这些任务中,COpter 同样实现了 10–50 倍的平均求解时间降低,而解的质量几乎无损。 综上所述,这些研究成果表明,自适应计算能够支撑高效、准确且广泛可部署的机器学习系统。

成为VIP会员查看完整内容
0

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【NYU博士论文】机器学习仿真
专知会员服务
18+阅读 · 7月14日
【ETZH博士论文】深度神经网络的数学理解
专知会员服务
35+阅读 · 4月27日
【博士论文】在缺失数据情况下的深度自监督学习
专知会员服务
35+阅读 · 2024年12月27日
【MIT博士论文】理解与提升机器学习模型的表征鲁棒性
专知会员服务
27+阅读 · 2024年8月26日
【CMU博士论文】经典方法对现代机器学习的改进
专知会员服务
29+阅读 · 2024年8月16日
SFFAI报告 | 常建龙 :深度卷积网络中的卷积算子研究进展
人工智能前沿讲习班
11+阅读 · 2018年10月22日
【优青论文】深度神经网络压缩与加速综述
计算机研究与发展
15+阅读 · 2018年9月20日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Arxiv
171+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
482+阅读 · 2023年3月31日
Arxiv
79+阅读 · 2023年3月26日
Arxiv
174+阅读 · 2023年3月24日
Arxiv
25+阅读 · 2023年3月17日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员