本期发布术语热词:人智协同(Human AI Collaboration)。
人智协同(Human AI Collaboration)
作者:龚江涛(清华大学)、王大阔(麻省理工学院-IBM人工智能实验室/东北大学)、孙婧婧(清华大学)、兴军亮(清华大学)、易鑫(清华大学)
开篇导语
以人为中心的人工智能(Human-centered AI)强调我们设计与研究人工智能技术时应以辅助人类任务、增强人类能力为目的,而非取代人类,并且要关注人工智能技术的公平性和对社会产生的影响。根据不同的侧重点又发展出人在环路、人智交互、可解释人工智能、人智协同等理念。其中,人智协同(Human-AI Collaboration)是人机交互与人工智能的一个交叉研究方向,重点强调由人类工作者和人工智能系统组成团队的整体工作结果的综合质量和效率(而非单一算法准确度),以期将AI系统无缝集成到人类现有工作流程之中。在协同工作的过程中,需要将人类工作者的经验、知识和理性判断能力与AI的高速计算和模式识别的能力进行合理融合,打破人与AI算法的信息壁垒,在人类和机器之间实现知识传递,从而充分发挥各自优势,提升协同工作结果的质量和效率。
InfoBox:
中文名:人智协同
外文名:Human AI Collaboration
学科:人机交互;人工智能
实质:人智协同的实质是人与人工智能利用各自的优势弥补对方的短板以共同完成一项任务。在这个过程中,人和人工智能需要树立一致目标,通过交互来传达信息、通过学习理解双方意图,形成有效知识之后进行任务管理和共享进度跟踪,相互支持,达成并维持合作共识,最终能更高效或者更好地完成任务。
研究背景:
人工智能(AI)研究领域的高速发展为将AI系统广泛应用于各个领域提供了巨大机遇。从早期的简单模式识别任务与推荐系统、到最近的决策辅助系统,算法的不断进步使得AI系统正在处理并承担更多更复杂的任务。在某些场景中,AI正在作为合作伙伴与人共同完成任务,形成了人智协同的工作模式,这也是AI在人类社会中真正大规模落地应用的重要发展趋势。
人智协同最为核心的目标是:提升一个由人类工作者和AI组成的团队的整体工作结果的综合质量和效率。除了需要通过特定设计提升人与机器的交互体验,还需要考虑人类工作者原本的工作流程、角色分工,将AI系统无缝集成到工作流程中、承担相应角色。在协同工作的过程中,需要将人类工作者的经验知识与AI的运行计算结果进行合理融合,在人类和机器之间实现知识传递,打破人与AI算法的信息壁垒。AI算法运行过程的中间结果需要通过良好的用户界面反馈给人,人类工作者可以同时充分应用自身常识、专业知识及其他高阶认知技能与AI进行交互,从而充分发挥各自优势,提升协同工作结果的质量和效率。
人智协同与以下相似概念的简单区分说明为:
与人智交互(Human-AI Interaction)相比:人智交互研究与体验设计的重点是AI系统的界面设计和交互流程,以期达到更清晰、舒适、流畅的用户体验的目的(Better UX)。
与人在环路机器学习或交互式机器学习(Human-in-the-loop ML或interactive ML)相比:人在环路机器学习重点关注如何能将人的常识、专业知识、或认知技能设计进机器学习算法或者人工智能系统的架构中,以期达到提升AI算法准确度或降低计算复杂度的目的(Better Algorithm)。
与可解释AI(Explainable AI)的概念相比:可解释AI重点关注AI模型是否是不可解释的“黑匣子”问题,研究如何去解释AI模型的预测过程或结果,以期达到人类用户(尤其是AI模型的搭建者)可以理解并改进AI算法的目的(Better Interpretability)。
研究概况:
人智协同研究与设计由于其实质决定了它需要涉及人工智能、机器人学、人机交互、心理学、认知神经学、设计学等多个学科领域。从人智协同工作性质来分类,可以分为操作维度、规划决策维度和创作维度三种不同类型的人智协同研究:
操作维度 - 人智协同控制(Shared Control)
在自主智能系统、机器人等领域的研究中,已有研究者针对与不同自主水平的共享控制展开了研究。AI可以在高度精细化操作、重复性操作取得更好的结果并减轻人类操作者的负担,而人可以在机器无法完成的高阶认知任务中进行主导控制。比起完全自主的AI系统,人智协同控制可以允许人的接管控制,实现临时、短期的操作意图,一方面可以满足人对于主导权的偏好,一方面也可以避免AI系统出错时产生不可挽回的后果。例如,人智协同控制的手术机器人[1]、人智协同控制的轮椅[2]、允许人类司机接管的自动驾驶车辆[3]等。
规划决策维度 - 人智协同决策
AI可以在短时间内处理海量样本数据,并基于图像、文本或其他用户数据,自动学习相似性指标来分类、预测新的样本,与人类医生一同预测病症[5],与数据科学家一同设计机器学习模型[4],与HR一同进行简历筛选等等[6],以及作为陪练帮助围棋运动员完成高水平对战[7]。AI算法基于大量训练数据,可以协助人类工作者快速检索、筛选新样本、作出预测判断,并减少人为因素产生的误差。然而,研究发现人智协同决策系统中,面临着由于AI不可解释的“黑匣子”带来的信任问题,以及对于人类专家“对专业自主权”受到威胁的体验问题,需要通过以人为中心的设计方法,增强AI在实际使用中的可用性[5],同时通过人智之间的交互学习过程实现互理解,提升系统的透明性,使其逐步具备可解释性。
创作维度 - 人智协同创作
随着AI生成技术的发展,引起了人们在音乐、绘画、写作、设计、舞蹈等领域中实现与AI协同创作的研究兴趣。AI生成技术可以基于特定数据集,快速地生成符合规范的新样本,使新手也能快速展开创作,或者减轻设计师的重复劳动;同时,AI生成技术基于广泛海量数据,生成具有启发性的新样本,可以给设计师补充灵感。例如,通过建模和可视化技术分析服装设计的大数据以扩展服装设计师的想法、获得洞察力[8]。通过应用AI深度生成模型,使没有音乐创作基础的用户可以与AI实时共同创作音乐[9]。但是,研究者发现,人智协同创作中创作算法的信息超载和不确定性输出是面临的关键挑战[9],同时发现AI算法会产生不准确的判断,但又缺乏解释,降低了用户对于系统的信赖[8]。也有研究发现,用户在与AI协同创作中,更加喜欢自己处于主导地位,而AI如想提供建议,需要提供足够多的解释和细节[10]。
未来展望:
从历史来看,人工智能与人机交互的研究浪潮呈现交替沉浮的趋势[11]。随着这一波人工智能技术热潮逐渐趋于稳定,落地应用场景的日渐增多但面临着许多新的人机交互相关的挑战,人智协同的相关设计与研究也会越来越重要。人工智能顶级学术会议如ACL,NeurIPS,AAAI 等已经展开了以人为中心的人工智能的研究方向,人机交互领域顶级学术会议CHI,FAccT等有专门关注以人为中心的人工智能的研究方向。
由于其涉及到多个学科的知识背景,相关项目就对研究者或研究团队的跨学科创新与合作能力提出了新的要求。在这一点上,我们可能可以参考计算机支持协同工作(CSCW,Computer-Support Collaborative Work)这一成熟的跨学科领域,组织行为学、传播学、计算机科学等学科学者们几十年的研究,将人类团队如何协同工作、如何分工、工作流程和设计准则进行了非常深入的探索,我们今天才能拥有(微信和Zoom等)优秀的即时通信和视频会议系统[12,13]。这些人与人如何合作的研究发现、以及如何设计计算机系统去帮助人类团队的经验可以启发我们设计未来的人智协同系统,使人类工作者可以将基于AI的系统无缝地、自然地集成到已建立的工作流程中[14]。
同时,信任是人与人之间一切合作的基础,对人与人工智能系统之间也适用。面对“黑匣子”的AI算法,除了需要提升其性能,我们还需要研究可解释AI技术,以增强人类工作者以及其他利益相关方对AI产生决策的背景的理解,并且能够支持接受法律的监管,从而建立信任和社会接受度[15,16,17]。
此外,鉴于人工智能问责制仍然未达成广泛共识,人类工作者作为人智协同工作结果的最终负责人,其专业自主性应该首先得到充分的尊重和保护,让人类工作者拥有决策主导权[5,10],能够充分利用、但又不过度依赖AI[18],也是未来人智协作中的关键研究问题。
人智协同研究是实践以人为中心的人工智能的重要环节,同样也需要技术研发、人因设计研究和社会道德法律三方面多学科的共同努力[19],从而在第四次AI的热潮下,实现AI算法在关键行业中真正的大规模落地应用。
参考文献
作者介绍
龚江涛
gongjiangtao@mail.tsinghua.edu.cn
主要研究领域:人机交互与协同、认知科学、以人为中心的智能系统设计
王大阔
dakuo@mit.edu
主要研究方向为以人为本的人工智能系统设计、人机交互、和协同与社会计算
孙婧婧
jingjingxs@outlook.com
主要研究方向为人机交互、人智协同系统设计、可解释人工智能。
兴军亮
jlxing@tsinghua.edu.cn
主要研究方向为人机交互学习、计算机博弈和计算机视觉。
易鑫
yixin@tsinghua.edu.cn
主要研究方向为应用安全、人机交互、普适计算。
术语工委及术语平台介绍:
计算机术语审定委员会(Committee on Terminology)主要职能为收集、翻译、释义、审定和推荐计算机新词,并在CCF平台上宣传推广。这对厘清学科体系,开展科学研究,并将科学和知识在全社会广泛传播,都具有十分重要的意义。
术语众包平台CCFpedia的建设和持续优化,可以有效推进中国计算机术语的收集、审定、规范和传播工作,同时又能起到各领域规范化标准定制的推广作用。
新版的CCFpedia计算机术语平台(http://term.ccf.org.cn)将术语的编辑运营与浏览使用进行了整合,摒弃老版中跨平台操作的繁琐步骤,在界面可观性上进行了升级,让用户能够简单方便地查阅术语信息。同时,新版平台中引入知识图谱的方式对所有术语数据进行组织,通过图谱多层关联的形式升级了术语浏览的应用形态。
计算机术语审定工作委员会
主任:
刘挺(哈尔滨工业大学)
副主任:
王昊奋(同济大学)
李国良(清华大学)
主任助理:
李一斌(上海海乂知信息科技有限公司)
执行委员:
丁军(上海海乂知信息科技有限公司)
林俊宇(中国科学院信息工程研究所)
兰艳艳(清华大学)
张伟男(哈尔滨工业大学)
点击“阅读原文”,加入CCF。