什么可控学习？人大最新《可控学习》综述，信息检索中的方法和应用

可控学习（Controllable Learning，CL）作为可信机器学习的关键组成部分，确保学习者能够满足预定义目标，并且能够根据这些目标的变化自适应调整而无需重新训练。我们提供了CL的正式定义，并讨论了其在信息检索（Information Retrieval，IR）中的应用，因为信息需求通常是复杂且动态的。该调查根据控制者（用户或平台）、可控内容（如检索目标、用户的历史行为、可控的环境适应）、控制的实现方式（如基于规则的方法、帕累托优化、超网络）以及控制的实施位置（如预处理、处理中、后处理方法）对CL进行了分类。然后，我们识别了CL在在线环境中的训练、评估、任务设置和部署方面面临的挑战。此外，我们概述了CL在理论分析、高效计算、增强大语言模型、应用场景和评估框架在IR中的有前途方向。

https://www.zhuanzhi.ai/paper/675f39d88d6a523e30daabea22bae51d 在机器学习中，可信度变得越来越重要，诸如可控性、公平性、隐私和可解释性等方面的考虑正获得广泛关注【38】【39】【40】。本文聚焦于机器学习方法的可控性及其应用。网络控制论的创始人诺伯特·维纳（Norbert Wiener）在六十多年前预见了学习机器的伦理挑战，他指出【41】：“随着机器学习的发展，它们可能会以令人困惑的速度开发出程序员无法预见的策略。” 维纳还解释了学习机器中可控性的重要性【41】：“如果我们使用一种机械手段来实现我们的目的，而一旦启动后我们不能有效干预其操作，因为动作太快且不可逆转，以至于在动作完成之前我们没有数据进行干预，那么我们最好确保输入机器的目的是我们真正想要的，而不仅仅是其一个色彩斑斓的模仿品等。”** 这强调了AI可控性的两个基本方面**： 1. 可控的学习机器需要确保其预测/决策符合AI用户的目标； 1. 在学习机器部署后进行干预是一个关键但具有挑战性的任务。

可控性在生成式机器学习模型领域（也称为可控生成）中得到了广泛讨论。例如，在文本生成【42】【43】【44】或视觉生成【45】【46】【47】中，AI模型以给定的任务描述（通常称为“提示”）为输入，生成与该描述一致的内容。然而，在判别式机器学习模型和应用领域中，对可控性缺乏统一的定义和深入的讨论。目前流行的基于提示的可控生成方法可以看作是一种预处理，在固定模型参数的情况下，通过改变输入特征使模型满足AI用户的目标。现有理论结果表明，当给定任务要求时，控制模型参数可能比控制模型输入更能促进收敛【27】。这揭示了在机器学习中实现可控性需要采用各种方法，而不仅仅是基于提示的方法。因此，可控学习（Controllable Learning，CL）是一个值得全面回顾和探索的关键类别，确保学习模型满足用户期望并遵守伦理标准。同时，在信息检索（Information Retrieval，IR）应用的背景下，CL使得模型能够在不进行大量再训练的情况下适应多样的任务描述（例如用户的信息需求），提供个性化和相关的结果。 鉴于上述背景，本综述试图提供可控学习的正式定义，分类并讨论其在信息检索中的应用范式。总而言之，本综述聚焦于可控学习这一主题，旨在寻找能够适应不同任务需求而无需再训练的学习者，从而满足AI用户的预期任务目标。从商业角度来看，大规模机器学习模型的持续进化，包括先进的大型语言模型（如ChatGPT），推动了机器学习（ML）算法部署的转变，从传统的“软件即服务”（Software-as-a-Service，SaaS）向“模型即服务”（Model-as-a-Service，MaaS）过渡。MaaS通过用户友好的界面（如应用程序接口，API）为用户提供访问训练过的ML模型的途径。具体来说，MaaS允许用户通过调用API访问训练过的模型，而无需承担与模型训练和更新相关的巨大成本。MaaS使公司和个人能够利用强大的大型模型能力。然而，它也为ML模型的可控性带来了新的挑战，特别是如何使ML模型识别不同下游任务的需求并输出符合任务目标的个性化结果，而无需重新训练模型。 在MaaS的背景下，信息检索（Information Retrieval，IR）应用中对ML模型可控性的需求变得更加显著。这归因于IR任务中信息需求的复杂性，其中精确和定制的结果至关重要。在传统设置中，例如基于关键字的搜索引擎，检索过程相对简单，依赖于预定义的规则和算法。然而，随着MaaS的出现和大型语言模型的利用，景观发生了变化。现在，用户期望根据其信息需求获得更细粒度和上下文感知的响应。这种提升的期望强调了ML模型可控性的重要性，特别是需要机制使个人或平台能够轻松表达和传达其对IR任务的具体要求。例如，在电子商务环境中，用户搜索“黑色T恤”时，可能会根据不同的评价指标权重（如偏爱多样性以同时展示与黑色T恤搭配良好的服装）或设置特定过滤器以排除不相关内容（如不展示以前购买过的T恤）来期望不同的结果。实现这种级别的可控性需要复杂的ML模型能够根据任务需求动态调整模型参数或输出，而无需大量再训练。因此，在IR领域，MaaS不仅提供了前所未有的访问强大ML模型的途径，还突出了在不同领域和应用中满足用户多样化需求时可控性和定制化的重要性。 上述领域的研究和应用部署现状促使我们撰写一篇关于可控学习的综合综述。如图1所示，本综述将涵盖以下各个方面，包括可控学习的正式定义、在信息检索中的方法和应用、评估、挑战和未来方向。 * 可控学习的正式定义：综述将首先提供一个清晰简洁的可控学习正式定义。 * 可控学习在IR中的应用：然后，我们将深入探讨可控学习在IR领域的应用，研究由谁控制、可控的内容是什么以及如何在IR系统中实现控制。 * 未来方向和挑战：最后，综述将讨论可控学习领域的未来方向和潜在挑战。

总体而言，关于可控学习的综述将为学生、研究人员、从业者和政策制定者提供一个宝贵的资源，使他们了解这一重要领域的原理、应用和未来前景。

1.1 与现有综述的比较

关于可信推荐系统的综述【51】也讨论了可控性，将其分为两类：显性可控性和隐性可控性。前者允许用户显式编辑或更新用户偏好，表明用户确切了解自己的喜好。后者意味着用户可以通过重新排序、修改历史信息等方式在动态交互中间接微调其偏好。类似地，关于推荐系统中用户控制的综述【52】也将可控性分为两部分，一部分是在偏好引导阶段的控制，另一部分是在推荐结果背景下的控制，这两部分分别对应上述的显性可控性和隐性可控性。 上述综述主要集中在推荐系统中，用户要么显式调整其偏好，要么隐式允许系统从其行为中推断偏好。然而，它们缺乏对如何在机器学习中正式定义可控性的总结。此外，可能存在更广泛意义上的可控性，例如平台侧可控性或具有多重目标的可控性，这些尚未被彻底定义和分类。这些综述也相对较早，许多新的可控技术（如超网络【53】、大语言模型【48】等）自那时以来已经出现。考虑到现有综述的局限性，在本综述中，我们提供了可控学习的正式定义，并讨论了可控学习及其在信息检索中的应用。

在本节中，我们首先从任务需求的角度给出可控学习的正式定义，并描述可控学习的过程。可控学习的概念在各种AI研究方向中都有体现，但目前缺乏统一的正式定义。为了明确表达可控学习的组成部分并统一现有的可控学习方法，我们首先从任务规范的角度定义可控学习。简而言之，可控学习是找到能够适应不同任务需求的学习者的能力，而无需重新训练，从而满足预期的任务目标，如定义1中详细描述。

这种定义明确了可控学习的核心目标，即通过控制函数在无需重新训练的情况下，使学习者能够适应和满足不同的任务需求。这为实现灵活和高效的AI系统提供了理论基础。与领域适应或迁移学习不同【54】【55】【56】，可控学习在面对新的任务需求时自适应调整模型，消除了在部署阶段为新任务重新训练的需要。更具体地说，在测试阶段，可控学习者根据任务描述进行调整可以分为以下几类：更改模型输入属于预处理方法，修改模型参数构成处理中的方法，而改变模型输出可以视为后处理方法。然而，这也在训练阶段为可控学习带来了挑战，特别是在引导控制函数有效识别和适应各种任务需求方面。 对于定义1中的任务需求，任务目标stgts_{\text{tgt}}stgt 可以被视为可控学习者旨在达到的理想定量指标。任务描述sdescs_{\text{desc}}sdesc 是可以输入算法的stgts_{\text{tgt}}stgt 的具体表示。sdescs_{\text{desc}}sdesc 可以表示为自然语言提示或包含多个权重的向量等形式。任务需求中的上下文sctxs_{\text{ctx}}sctx 可以包括历史数据和当前用户的资料等特征，为可控学习者提供更多的背景知识用于预测。根据该定义，可控学习的过程如图2所示。当定义1中的输出空间YYY 不是标签或列表，而是生成的内容时，这被称为可控生成。在本综述中，我们主要关注信息检索应用中的可控学习方法，这通常属于可控判别而非可控生成。

可控学习过程示意图（图2）

任务需求收集：包括任务描述sdescs_{\text{desc}}sdesc、上下文sctxs_{\text{ctx}}sctx 和任务目标stgts_{\text{tgt}}stgt。 1. 控制函数构建：开发和训练控制函数hhh，使其能够将任务需求映射到新学习者fTf_TfT。 1. 模型调整：

预处理方法：通过修改输入特征来满足任务需求。 * 处理中方法：通过调整模型参数来满足任务需求。 * 后处理方法：通过修改输出结果来满足任务需求。 1. 输出新学习者：生成满足新任务需求的学习者fT′f_{T'}fT′。 1. 模型评估和调整：评估新学习者的表现，进一步优化控制函数hhh。

这种过程确保可控学习者能够在部署阶段适应新的任务需求，而无需重新训练模型，从而实现灵活和高效的AI系统。

结论

通过整合多种方法以增强机器学习的可信度，可控学习（CL）的研究领域得到了显著丰富。CL能够根据预定义目标动态调整学习者，并在这些目标发生变化时无需重新训练而自适应调整，这使其成为培养可靠和自适应机器学习模型的关键组件。特别是在信息检索（IR）领域，CL提供了一种手段来解决信息需求中固有的复杂性和动态性。然而，在理论保证、计算效率以及将大语言模型（LLMs）整合到可控学习中的方面，还有许多需要探索的内容。这些领域的进一步进展可能会带来更复杂、以用户为中心且自适应的AI模型，满足IR应用中多样且不断变化的需求。

成为VIP会员查看完整内容