最近机器学习(ML),或“人工智能(AI)的第三波”的成功,是建立在优化和统计领域的计算方法,大规模训练数据和计算能力的可用性,以及部分模仿人类认知功能(如卷积网络)的基础上的。然而,目前的机器学习技术在实际应用中可能非常低效,并且容易出现不完美的数据,例如,当数据有噪声、无标记、不平衡或包含冗余、偏差、协变量偏移等时。另一方面,人类学习在规划和选择不同学习阶段的训练内容时更具战略性和适应性。与在所有阶段对相同数据的随机小批次重复训练的机器学习技术相比,人类学习在解决这些实际挑战时,在效率和鲁棒性方面表现出巨大优势。因此,如何制定机器学习的战略性“课程”成为弥合人类智能与机器智能之间鸿沟的重要挑战。课程学习是一种基于人类学习策略的、适用于不同学习阶段的数据选择方法,即先选择较容易的样本,再逐步增加较难的样本。然而,人类用于设计课程的培训材料的特性不仅限于难度,还可以包括多样性、一致性、代表性、激励、对未来培训的影响或效用等。在机器学习中,开发高效准确的得分函数来衡量这些属性及其对最终/以后学习目标的贡献是具有挑战性的。此外,鉴于分数函数,课程策略如何规划多个训练阶段并根据每个阶段自适应地调整选择标准仍然是一个公开的挑战。课程学习的另一个主要挑战是缺乏模型参数和课程联合优化的原理和理论激励公式。如果没有这样的公式,就很难将选择标准和分数函数与课程学习的潜在目标联系起来,例如,训练进度,泛化表现等。因此,很难解释一个课程何时以及为什么可以提高ML。而且,在开发课程学习算法时,需要针对不同的ML应用,专门设计不同学习阶段的选择标准的规划和调度,例如半监督学习、集成学习等。为了实现一个实际有效的算法,研究是否以及如何将为特定应用开发的现有技术与课程结合起来也很重要。本文旨在解决上述关键挑战。它由四部分组成。在第一部分中,我们介绍了几个新的课程学习公式。例如,我们可以将人类的学习策略转换为离散-连续优化,并在训练过程中联合优化模型和课程,如第2章和第5章所示。我们还可以从一个新的课程学习目标中推导出权重或分数的解析形式,如第3章和第4章所示。此外,我们在第6章讨论了几个潜在的公式,以供未来的研究。在第二部分中,我们将深入探讨在课程学习中起着重要作用的分数函数设计。例如,所选数据的多样性在减少冗余和鼓励早期探索方面发挥着至关重要的作用。除了多样性,我们主要关注第8章中一类新的得分函数,它基于样本在整个历史上的训练动态,而不是其在特定步骤的瞬时反馈。与广泛应用的瞬时分数相比,它们显著减少了分数评估所需的额外计算,并且由于其可区分的动态模式,它们在分配信息量最大的训练样本方面更准确。在第三部分中,我们基于所开发的公式和分数函数构建了实用的课程学习算法。这些算法涵盖了几个重要的机器学习问题,包括监督学习、半监督学习、噪声标签学习、集成学习等。在每个问题的算法中,研究和比较了不同的规划或调度策略,这些策略决定了选择标准如何在不同的学习阶段发生变化。通过详细的实证分析和比较,验证了所提出调度策略的有效性。为在每个问题上实现最先进的性能,研究了每个问题的课程和现有技术之间的相互作用,然后在算法设计中结合它们的优势。在第四部分中,在每个应用问题的基准数据集上,评估了所提出的方法,并与各种强大的基线进行了广泛的实验比较。与设计的课程相结合的方法在所有应用中都持续提高了训练效率和最终测试的准确性。值得注意的是,课程在不完美数据的更具有挑战性的应用上表现出更显著的优势,如半监督学习和噪声标签学习。第18章总结了本文的主要贡献。除了提出的公式、分数函数和课程学习的算法外,还强调了在工作中弥合差距并结合人类启发式方法、理论公式和经验算法的优势的努力。此外,还列举了未来工作中几个潜在的研究方向,这些方向可以显著拓展课程学习的现有方案和应用领域,并深入理解机器学习中的训练动力学及其与人类教育和认知的联系。