在这项工作中,我们探索了提高机器学习系统各方面效率的理论和算法。首先,我们研究了在ML中实现高效机器不学习的算法原理。我们提出了两种无监督学习算法,它们在在线数据删除方面实现了超过100倍的改进,同时产生了统计质量与标准k-means++基线相当的集群。

其次,我们探索混合维嵌入,这是一种嵌入层架构,其中特定嵌入向量的维数随其查询频率的变化而变化。通过理论分析和系统实验,我们证明了使用混合维可以大大减少内存使用,同时保持甚至提高预测性能。使用Criteo Kaggle数据集上一半的参数或使用16倍的参数进行点击率预测,混合维层将精度提高0.1%。他们在GPU上的训练速度也超过2倍。

最后,我们提出了一种用于ML部署监控的新方法MLDemon。MLDemon集成了未标记数据和少量按需标签,从而对给定数据流上部署的模型当前的准确性进行实时估计。受预算限制,MLDemon决定何时获得额外的、可能昂贵的、专家监督标签来验证模型。在基准测试中,MLDemon优于之前的方法。我们还提供了理论分析,表明MLDemon对于广泛的一类分布漂移是极小极大速率最优的。

成为VIP会员查看完整内容
46

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【伯克利博士论文】硬件感知的高效深度学习,154页pdf
专知会员服务
73+阅读 · 2022年10月20日
【伯克利博士论文】学习在动态环境中泛化,103页pdf
专知会员服务
71+阅读 · 2022年10月12日
【MIT博士论文】数据高效强化学习,176页pdf
专知会员服务
85+阅读 · 2022年7月11日
专知会员服务
34+阅读 · 2021年7月19日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
1+阅读 · 2022年10月20日
Arxiv
0+阅读 · 2022年10月19日
Arxiv
39+阅读 · 2021年11月11日
VIP会员
相关基金
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员