机器学习和大数据的进步正在颠覆每个行业。然而,即使公司部署到生产中,他们也面临着巨大的挑战,随着时间的推移,性能会明显低于离线基准,这是一种被称为性能漂移的现象。由于数据分布的变化,在很长一段时间内部署的模型常常会经历性能漂移。

在这次演讲中,我们讨论了减轻性能漂移影响的方法,并举例说明了我们的方法在一个样本预测任务。利用我们在初创公司部署和监控生产级ML管道以进行预测性维护的经验,我们还解决了机器学习的几个方面,这些方面在学术界经常被忽视,比如整合非技术合作伙伴,以及将机器学习集成到敏捷框架中。这次演讲的内容包括:

  • 使用Python、Dask和开源数据集演示一个在离线设置中训练和验证模型的示例,该模型在部署后会出现性能下降。

  • 使用MLFlow、Prometheus和Grafana来展示如何构建工具来监视生产管道,并使不同涉众的团队能够使用正确的度量标准快速识别性能下降。

  • 就何时在生产中对机器学习模型进行再训练提出一份标准清单。

  • 这次演讲将是一个幻灯片演示,并附带一个Python笔记本演示。它的目标是在生产中部署和调试模型的工程师,但可能对构建基于机器学习的产品的人有更广泛的兴趣,并要求熟悉机器学习基础知识(训练/测试集,决策树)。

成为VIP会员查看完整内容
29

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
18+阅读 · 2021年9月4日
【2021新书】Python流数据实用机器学习,127页pdf
专知会员服务
71+阅读 · 2021年5月23日
最新《图算法: Neo4j实战》书籍,266页pdf
专知会员服务
159+阅读 · 2020年11月26日
【KDD2020-Google】动态图设计的图学习
专知会员服务
34+阅读 · 2020年7月28日
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
337+阅读 · 2020年1月27日
2019年春季全栈深度学习训练营课程分享
深度学习与NLP
3+阅读 · 2019年4月24日
Auto-Keras与AutoML:入门指南
云栖社区
16+阅读 · 2019年2月9日
AI 图像识别项目从入门到上线
人工智能头条
3+阅读 · 2019年1月2日
从入门到头秃,2018年机器学习图书TOP10
新智元
14+阅读 · 2018年12月8日
Kaggle 大神 Eureka 的高手进阶之路
AI研习社
4+阅读 · 2018年3月6日
Arxiv
7+阅读 · 2021年10月19日
VIP会员
相关VIP内容
专知会员服务
18+阅读 · 2021年9月4日
【2021新书】Python流数据实用机器学习,127页pdf
专知会员服务
71+阅读 · 2021年5月23日
最新《图算法: Neo4j实战》书籍,266页pdf
专知会员服务
159+阅读 · 2020年11月26日
【KDD2020-Google】动态图设计的图学习
专知会员服务
34+阅读 · 2020年7月28日
【2020新书】图机器学习,Graph-Powered Machine Learning
专知会员服务
337+阅读 · 2020年1月27日
相关资讯
2019年春季全栈深度学习训练营课程分享
深度学习与NLP
3+阅读 · 2019年4月24日
Auto-Keras与AutoML:入门指南
云栖社区
16+阅读 · 2019年2月9日
AI 图像识别项目从入门到上线
人工智能头条
3+阅读 · 2019年1月2日
从入门到头秃,2018年机器学习图书TOP10
新智元
14+阅读 · 2018年12月8日
Kaggle 大神 Eureka 的高手进阶之路
AI研习社
4+阅读 · 2018年3月6日
微信扫码咨询专知VIP会员