由于多种因素的影响,自动机器学习(AutoML)这些年一直在快速发展,数据科学家需要创建机器学习管道原型来决定如何进行解决,并为非专业人士提供解决方案。已经创建了一些AutoML框架,但它们受到能解决的问题类型、机器学习原语的数量、管道表示语言和严格数据描述的限制。这些限制大多是由相当大的工程量造成的。D3M项目旨在扩大AutoML的范围,提供创建AutoML系统所需的工具,使其能够解决超出大部分框架的问题类型,并为用户提供工具,使机器学习工具不需要太多的专业知识。此外,该项目还致力于实现AutoML组件的标准化,以便对不同的框架进行公平的比较,并通过开源共享该项目期间创建的基础设施来帮助研发界改善该领域。
本文在D3M上的工作主要集中在两个方面:在D3M小组内创建标准化AutoML工具,以及创建具有不同目的的AutoML系统和框架。在这份报告中,将介绍对该项目的主要贡献以及AutoML系统的演变。在该项目中,创建了评估AutoML系统的工具,开发了三个AutoML系统,开发了被多个系统广泛使用的原型,设计了测试原型的自动化框架,并通过创建AutoKeras对AutoML研发界产生了巨大影响。