AI 模型正日益被用于面向人类的应用场景,从临床诊断工具到通用型助手不一而足。随着这些模型的普及和能力的提升,我们亟需更深入地理解人类与 AI 的交互方式。在本论文中,我主张:要实现有效的人机交互,必须将人类用户直接纳入 AI 系统的设计与优化过程中。
首先,我介绍了自己开发的一种 AI 机制,它可为皮肤病患者提供实时指导,并显著提升远程医疗中数据采集的质量。接着,我阐述了自己构建的人类行为算法模型,并展示了如何利用该模型来调整 AI 的目标函数,从而优化模型,实现更优的人机协同表现。我还展示了对用户在使用生成式模型过程中的偏好与交互模式的分析工作,以理解其交互策略、量化 AI 的可引导性(steerability),并更好地刻画人类用户特征,这对于实现个性化和模型评估具有关键意义。
贯穿上述研究,我始终强调:要构建更加协作的人机系统,就必须将人类视为模型设计与优化过程中的核心组成部分。
深度学习系统的一大优势在于:只需给出示例输入与期望输出,便可对模型进行端到端的优化。然而,尽管人工智能(AI)模型如今越来越多地应用于面向人类的实际场景,这种端到端的设计方式却很少真正纳入 AI 模型的人类使用者。例如,在医学 AI 领域,已有模型在诊断任务中超越了受过专业训练的医生,部分系统甚至已被部署为辅助诊断工具。然而,这些模型在优化过程中从未考虑到其实际使用者——即医生本身,导致了性能上的次优表现。 随着这些模型的广泛应用与能力的不断提升,我们亟需更深入地理解人机交互的本质。特别是在当下生成式 AI 助手被广泛采用的背景下,理解人类用户并将其融入有效协作的人机系统设计与优化中变得尤为重要。 本论文旨在重新聚焦端到端系统的设计与优化,将人类用户直接纳入其中。考虑经典的经验风险最小化(empirical risk minimization)框架:
我们从两个互补的角度研究这一问题: 1. 将人类适配于 AI 模型:我们将展示,如何通过引导用户调整数据分布,使其集中在模型表现更优的子集上(即 D→Dh\mathcal{D} \rightarrow \mathcal{D}_hD→Dh)。简而言之,我们旨在帮助人类更有效地使用模型。 1. 将 AI 模型适配于人类用户:我们首先对人类用户 HHH 进行建模,随后基于该模型调整损失函数与模型参数(即 f,θ→fh,θhf, \theta \rightarrow f_h, \theta_hf,θ→fh,θh)。在该设定下,我们试图优化模型,以适应用户及其对模型输出的使用与误用。