自动化机器学习(AutoML)有望将原始数据转换为准确的预测,而不需要大量的人力、专业知识和人工实验。在这个讲座式的教程中,我们将演示多模态AutoML的基本技术。与大多数专注于解决包含分类和数字特征的表格任务的AutoML系统不同,我们考虑对各种类型的数据(包括表格特征、文本和图像及其组合)进行监督学习任务。我们强调的不是单个ML模型如何工作的技术描述,而是如何在接受原始训练数据并输出测试数据预测的整体ML流程中最好地使用模型。
我们教程的主要重点是自动构建和训练深度学习模型,这些模型功能强大,但手动管理起来很麻烦。本教程中涉及的每个主题都附带了一个实践的Jupyter笔记本,它实现了最佳实践(教程前后都可以在GitHub上获得)。大部分代码采用了AutoGluon,这是一个最新的开源AutoML工具包,它既先进又易于使用。