开发能够将人工智能和人类智能结合起来的分析科学方法,让半人马的概念从神话变成了现实。在希腊神话中,半人马是半人半马的生物(见上图)。在现代分析科学中,半人马指的是通过结合人类和训练有素的算法的力量来实现卓越决策的系统。美国的主要用户之一是国防部,它一直在与科技公司合作,将算法的力量与人类的能力结合起来[1]。在美国国防部高级研究计划局的研究项目和五角大楼的第三次抵消军事优势战略中,这一概念都引起了美国军方的关注[2]。例如,曾在特朗普总统和巴拉克-奥巴马总统时期担任国防部副部长的罗伯特-O-沃克(Robert O. Work)就主张采用半人马武器系统,这种系统需要人类控制,而不是纯粹的人工智能(AI)系统,可以将人工智能的力量与人类的能力结合起来[3]。
半人马的概念并不新鲜,但由于其在支付自由式国际象棋等应用中的成功,它在分析科学领域受到了聚光灯的关注。具体来说,加里-卡斯帕罗夫(Gary Kasparov)等自由式国际象棋的著名倡导者一再认为,人类与算法的搭配可以比国际象棋中最强的单一计算机程序做得更好[4]。正如这位国际象棋传奇所说 “弱人加机器加更好的程序要优于单独的强计算机,更显著的是,要优于强人加机器加劣质程序"。[5]
除了自由式国际象棋,半人马模型还被广泛应用于分析科学的各种领域。例如,在与康复评估相关的临床决策中,算法为治疗师提供了关于病人状态的详细分析,治疗师与这种算法的合作被证明可以改善康复评估的实践[6]。
在哈佛大学的实验室与梅奥诊所合作开展的研究显示,开发的半人马模型取得了非常有前景的成果,该模型旨在加强决策,降低大量接受移植手术的患者的再入院风险。我们发现,通过人类-算法半人马模型,将人类专家的直觉与强大的机器学习算法的力量结合起来,可以超越最佳算法和最佳人类专家[7]。
利用半人马模型产生公众影响的其他例子包括:发现异常和预防网络攻击的系统、改进制造系统中的设计组件,以及协助官员平衡其工作量并帮助他们更好地确保公共安全[2]。开发和利用半人马的潜力是无穷的。因此,我们有理由期待大多数数据驱动型组织在不久的将来利用它们。例如,人类服务部门可以使用算法来帮助预测哪些儿童福利案件可能导致儿童死亡,并对高风险案件亮起红旗。然后由人类专家对这些案例进行审查,并与一线工作人员分享审查结果,然后他们可能会选择旨在降低风险和改善结果的补救措施[8]。然后,可以利用与具体案例相关的人类直觉来增强算法,从而创建一个人类-算法半人马系统(human-algorithm centaur)。
在本文中,将重点讨论生成式人工智能的最新进展,尤其是大型语言模型(LLMs)。首先,我们提出了一个可以理解半人马核心特征的框架。我们认为,共生学习和人类直觉的融入是半人马的两个主要特征,它们区别于机器学习(ML)和人工智能领域的其他模型。利用这些核心特征,我们还介绍了创建半人马的一些具体方法。然后,我们认为,LLM 的发展和成功在很大程度上是由于它们从纯粹的 ML 算法转变为人类-算法半人马。我们提出了各种证据来证明这一点,特别是通过重点介绍所谓 “微调 ”方法的优势,例如各种 LLM(例如 OpenAI 的 GPT4、Antropic 的 Claude、Google 的 Bard 和 Meta 的 LLaMA 2-Chat)中使用的 “强化学习与人工反馈”(RLHF)方法。我们还讨论了一些证据,表明这些微调方法可以将生成式人工智能工具转化为认知模型,能够代表人类行为。此外,我们还阐述了半人马的三大优势:消除算法厌恶、人类厌恶和随意厌恶的障碍。
最后,简要讨论了两个要点:(1) 最近在创造半人马方面取得的进展使我们更接近于实现人工智能奠基人--约翰-麦卡锡、马文-明斯基、纳撒尼尔-罗切斯特和克劳德-香农--在 1955 年提出的目标,即在达特茅斯举行为期 2 个月、由 10 人组成的人工智能研究会;(2) 与其他传统的 ML 和人工智能方法相比,未来许多领域的人工智能开发和应用很可能需要关注半人马。
图 1:创建半人马的两种现代方法。上图:通过输入代表人类专家直觉的 ML 模型的输出来增强基线 ML 模型(见,例如,[7])。下图:通过直接调整嵌入或 ML 模型的其他方面(如为底层神经网络添加一层)来创建半人马(见,例如,[40])。