In practice, machine learning (ML) workflows require various different steps, from data preprocessing, missing value imputation, model selection, to model tuning as well as model evaluation. Many of these steps rely on human ML experts. AutoML - the field of automating these ML pipelines - tries to help practitioners to apply ML off-the-shelf without any expert knowledge. Most modern AutoML systems like auto-sklearn, H20-AutoML or TPOT aim for high predictive performance, thereby generating ensembles that consist almost exclusively of black-box models. This, in turn, makes the interpretation for the layperson more intricate and adds another layer of opacity for users. We propose an AutoML system that constructs an interpretable additive model that can be fitted using a highly scalable componentwise boosting algorithm. Our system provides tools for easy model interpretation such as visualizing partial effects and pairwise interactions, allows for a straightforward calculation of feature importance, and gives insights into the required model complexity to fit the given task. We introduce the general framework and outline its implementation autocompboost. To demonstrate the frameworks efficacy, we compare autocompboost to other existing systems based on the OpenML AutoML-Benchmark. Despite its restriction to an interpretable model space, our system is competitive in terms of predictive performance on most data sets while being more user-friendly and transparent.


翻译:在实践中,机器学习(ML)工作流程需要各种不同的步骤,从数据处理前处理、缺失的价值估算、模型选择,到模型调整和模型评价等不同步骤,其中许多步骤依靠人类ML专家。Automil(这些ML管道自动化领域)试图帮助从业者在没有任何专家知识的情况下将ML从现成的现场应用。大多数现代AutoML系统,如自动滑动、H20-Automal或TPOT系统,都是为了高预测性能,从而产生几乎完全由黑盒模型组成的组合。这反过来又使得对外行人的诠释更加复杂,为用户增加了另一层不透明性层。我们提议建立一个AutoMLL系统,建立一个可解释的添加模型,可以使用高度伸缩的组件提升算法来安装。我们的系统提供了简单易懂的模型解释工具,例如可视化部分效应和双向互动,便于直接计算特征重要性,并使人们了解所需的模型复杂性,以适应给特定任务。我们介绍了总框架,并概述了其对普通人的诠释,为用户最易操作的另外一层的一层不透明性。我们现有的自动修正的系统,以展示了现有的自动定义。

0
下载
关闭预览

相关内容

专知会员服务
36+阅读 · 2021年10月14日
专知会员服务
18+阅读 · 2021年6月29日
【微软】自动机器学习系统,70页ppt
专知会员服务
68+阅读 · 2021年6月28日
专知会员服务
17+阅读 · 2020年9月6日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
《可解释的机器学习-interpretable-ml》238页pdf
专知会员服务
193+阅读 · 2020年2月24日
强化学习最新教程,17页pdf
专知会员服务
166+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
96+阅读 · 2019年10月9日
8月最新-《可解释机器学习-Christoph Molnar》-新书分享
深度学习与NLP
10+阅读 · 2019年8月12日
概述自动机器学习(AutoML)
人工智能学家
18+阅读 · 2019年8月11日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
Interpretable Adversarial Training for Text
Arxiv
5+阅读 · 2019年5月30日
Interpretable Active Learning
Arxiv
3+阅读 · 2018年6月24日
Arxiv
4+阅读 · 2017年11月14日
VIP会员
相关VIP内容
专知会员服务
36+阅读 · 2021年10月14日
专知会员服务
18+阅读 · 2021年6月29日
【微软】自动机器学习系统,70页ppt
专知会员服务
68+阅读 · 2021年6月28日
专知会员服务
17+阅读 · 2020年9月6日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
《可解释的机器学习-interpretable-ml》238页pdf
专知会员服务
193+阅读 · 2020年2月24日
强化学习最新教程,17页pdf
专知会员服务
166+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
96+阅读 · 2019年10月9日
相关资讯
8月最新-《可解释机器学习-Christoph Molnar》-新书分享
深度学习与NLP
10+阅读 · 2019年8月12日
概述自动机器学习(AutoML)
人工智能学家
18+阅读 · 2019年8月11日
计算机视觉近一年进展综述
机器学习研究会
8+阅读 · 2017年11月25日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】决策树/随机森林深入解析
机器学习研究会
5+阅读 · 2017年9月21日
【推荐】SVM实例教程
机器学习研究会
17+阅读 · 2017年8月26日
Top
微信扫码咨询专知VIP会员