【斯坦福博士论文】机器学习系统高效部署的理论和算法，155页pdf

在这项工作中，我们探索了提高机器学习系统各方面效率的理论和算法。首先，我们研究了在ML中实现高效机器不学习的算法原理。我们提出了两种无监督学习算法，它们在在线数据删除方面实现了超过100倍的改进，同时产生了统计质量与标准k-means++基线相当的集群。

其次，我们探索混合维嵌入，这是一种嵌入层架构，其中特定嵌入向量的维数随其查询频率的变化而变化。通过理论分析和系统实验，我们证明了使用混合维可以大大减少内存使用，同时保持甚至提高预测性能。使用Criteo Kaggle数据集上一半的参数或使用16倍的参数进行点击率预测，混合维层将精度提高0.1%。他们在GPU上的训练速度也超过2倍。

最后，我们提出了一种用于ML部署监控的新方法MLDemon。MLDemon集成了未标记数据和少量按需标签，从而对给定数据流上部署的模型当前的准确性进行实时估计。受预算限制，MLDemon决定何时获得额外的、可能昂贵的、专家监督标签来验证模型。在基准测试中，MLDemon优于之前的方法。我们还提供了理论分析，表明MLDemon对于广泛的一类分布漂移是极小极大速率最优的。

成为VIP会员查看完整内容

相关内容

博士论文

关注 126

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【伯克利博士论文】硬件感知的高效深度学习，154页pdf

专知会员服务

74+阅读 · 2022年10月20日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知会员服务

44+阅读 · 2022年10月15日

【伯克利博士论文】学习在动态环境中泛化，103页pdf

专知会员服务

72+阅读 · 2022年10月12日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知会员服务

37+阅读 · 2022年9月16日