【华盛顿大学博士论文】课程学习：从人类策略到学习动力学，304页pdf

近期机器学习（ML）的成功，也被称为“人工智能（AI）的第三次浪潮”，建立在来自优化和统计领域的计算方法之上，以及大规模训练数据和计算能力的可用性，以及部分模仿人类认知功能（如卷积网络）。然而，在实际应用中，当前的机器学习技术可能非常低效，容易受到不完美数据的影响，例如，当数据嘈杂、无标签、不平衡或包含冗余、偏差、协变量漂移等时。另一方面，人类学习在规划和选择不同学习阶段的训练内容方面更具策略性和适应性。与在所有阶段重复在相同数据的随机小批量上进行训练的机器学习技术相比，人类学习在应对这些实际挑战时表现出更高的效率和鲁棒性。因此，如何为机器学习制定一个战略性的“课程”，成为缩小人类智能与机器智能差距的重要挑战。

课程学习最早被引入作为一种基于人类学习策略的数据选择方法，应用于不同的学习阶段，例如，先选择较简单的样本，然后逐渐添加更多更难的样本。然而，人类用于设计课程的训练材料的属性不仅限于难度，还可以包括多样性、一致性、代表性、激励性、对未来训练的影响或效用等。在机器学习中，开发能够有效且准确度量这些属性及其对最终/后期学习目标贡献的评分函数具有挑战性。此外，给定评分函数，课程策略如何规划多个训练阶段并调整适应每个阶段的选择标准仍然是一个悬而未决的挑战。

课程学习的另一个主要挑战是缺乏原则性和理论驱动的公式来实现模型参数和课程的联合优化。没有这样的公式，很难将选择标准和评分函数与课程学习的潜在目标联系起来，例如，训练进度、泛化性能等。因此，很难解释何时以及为什么课程可以改善机器学习。此外，在开发课程学习算法时，需要为不同的机器学习应用特别设计不同学习阶段的选择标准的计划和调度，例如，半监督学习、集成学习等。为了实现实际有效的算法，研究是否以及如何将针对特定应用开发的现有技术与课程结合起来也很重要。

本论文旨在解决上述关键挑战。它包括四个部分。在第一部分，我们引入了几种新颖的课程学习公式。例如，我们可以将人类学习策略转化为离散-连续优化，并在训练过程中联合优化模型和课程，如第2章和第5章所示。我们还可以从一个新颖的课程学习目标推导出权重或分数的解析形式，如第3章和第4章所示。此外，我们在第6章讨论了未来研究的几种潜在公式。

在第二部分，我们深入研究在课程学习中起重要作用的评分函数设计。例如，选定数据的多样性在减少冗余和鼓励早期探索方面起着至关重要的作用。除多样性外，我们在第8章主要关注一类新的评分函数，它基于样本在整个历史过程中的训练动态，而不是在特定步骤中的瞬时反馈。与广泛应用的瞬时评分相比，它们显著降低了评分评估所需的额外计算量，并且由于其可区分的动态模式，它们在分配最具信息量的训练样本方面更加准确

在第三部分，我们基于开发的公式和评分函数构建实用的课程学习算法。这些算法涵盖了几个重要的机器学习问题，包括监督学习、半监督学习、噪声标签学习、集成学习等。在针对每个问题的算法中，我们研究并比较不同的规划或调度策略，以确定选择标准如何在学习阶段之间变化。我们通过详细的实证分析和比较证明了所提出的调度策略的有效性。此外，为了在每个问题上实现最先进的性能，我们研究课程与每个问题的现有技术之间的相互作用，然后在算法设计中结合它们的优势。

在第四部分，针对每个应用问题的基准数据集，我们评估我们的方法，并与各种强大的基线进行广泛的实验比较。在所有应用中，我们所设计的课程始终提高了训练效率和最终测试准确性。值得注意的是，课程在具有不完美数据的更具挑战性的应用中表现出更显著的优势，如半监督学习和噪声标签学习。

在第18章中，我们总结了本论文的主要贡献。除了为课程学习提出的公式、评分函数和算法外，我们还强调了我们在一系列工作中弥合人类启发式、理论公式和实证算法之间差距以及结合它们优势的努力。此外，我们列出了未来工作中可以探索的几个潜在研究方向，这些方向可以显著扩展课程学习的当前方案和应用领域，并提高我们对机器学习训练动态的深入理解以及其与人类教育和认知的联系。

总之，本论文旨在通过提出新颖的课程学习公式、设计评分函数并构建实用的课程学习算法来解决课程学习领域的关键挑战。我们关注了多种机器学习问题，并在各种应用场景中验证了我们方法的有效性。通过这些努力，我们希望能在缩小人类智能与机器智能差距方面取得一定的进展，并为未来研究提供新的方向