可解释生成人工智能 (GenXAI)：综述、概念化与研究议程

生成人工智能（GenAI）标志着人工智能从“识别”能力转变为能够为广泛任务“生成”解决方案的能力。随着生成的解决方案和应用变得日益复杂和多面，解释性（XAI）的新需求、目标和可能性也随之涌现。在本工作中，我们详细讨论了随着GenAI兴起，XAI为何变得重要及其对解释性研究的挑战。我们还揭示了解释应满足的新兴和出现的期望，例如涵盖可验证性、互动性、安全性和成本方面。为此，我们专注于综述现有工作。此外，我们提供了一个相关维度的分类体系，使我们能更好地描述现有的XAI机制和GenAI的方法。我们讨论了从训练数据到提示的不同途径以确保XAI。我们的论文为非技术读者提供了简短但精确的GenAI技术背景，重点介绍文本和图像以更好地理解为GenAI新颖或调整的XAI技术。然而，由于关于GenAI的作品众多，我们决定忽略与评估和使用解释相关的XAI的详细方面。因此，该手稿既适合技术导向的人员，也适合其他学科，如社会科学家和信息系统研究者。我们的研究路线图提供了超过十个未来调查的方向。

生成人工智能（GenAI）展示了引起全球广泛关注的显著能力，涉及多个领域——从监管机构（欧洲联盟，2023年），教育工作者（Baidoo-Anu和Ansah，2023年），程序员（Sobania等人，2023年）到医疗人员（Thirunavukarasu等人，2023年）。对于企业（Porter，2023年），GenAI有潜力每年解锁数万亿美元的价值（麦肯锡公司，2023年）。同时，它也被认为是对人类的威胁（《卫报》，2023年）。这些相反的观点是理解和解释GenAI的关键动力。生成人工智能代表了由基础模型驱动的AI的下一个层次（Schneider等人，2024b），AI能够创造文本、图像、音频、3D解决方案和视频（Gozalo-Brizuela和Garrido-Merchan，2023年；Cao等人，2023年），可以通过文本提示（White等人，2023年）由人类控制——参见表1，了解公共GenAI系统的示例。这是AI从主要能“识别”到能“生成”的重大进步。GenAI展示了前所未有的能力，如通过大学级考试（Choi等人，2021年；Katz等人，2024年）。它在被认为不适合机器的领域也取得了显著的成果，例如创造力（Chen等人，2023a）。它对每个人都是可访问的，如商业系统ChatGPT（Achiam等人，2023年）和Dall-E（Betker等人，2023年；Ramesh等人，2022年）所示。早期的生成人工智能方法，如生成对抗网络（GANs），也能生成作品，但通常比现代模型如变压器和扩散架构更难以控制。对于GenAI的可解释人工智能（GenXAI）技术能够生成帮助理解AI的解释，例如针对单个输入或整个模型的输出。传统上，解释由于多种需求而服务于多种目的；例如，它们可以增加信任并支持模型的调试（Meske等人，2022年）。对AI的理解需求在前GenAI时代更为广泛。例如，解释可以支持生成内容的可验证性，从而有助于解决GenAI的主要问题之一：幻觉（如第3.1节所论述）。不幸的是，尽管过去几年试图设计解决方案来解决这些问题，可解释人工智能（即使是前GenAI模型）仍然存在一些尚未解决的问题（Longo等人，2024年；Meske等人，2022年）。例如，最近一项关于XAI对人机交互影响的方法比较（Silva等人，2023年）发现，最好的方法（反事实）和最差的方法（仅使用概率分数）之间的得分差距仅为20%，这暗示复杂的现有方法与更复杂的方法相比优势有限。因此，XAI技术距离最佳状态仍有很大差距。其他工作甚至公开称解释性研究的“现状大体上是无效的”（R¨auker等人，2023年）。因此，还有很多工作要做，了解当前的努力并在此基础上进行改进是至关重要的——尤其是在减少高风险（《卫报》，2023年）的同时利用机会（Schneider等人，2024b）。这篇研究手稿是朝这个方向进展的真诚尝试。我们的目标不仅是（仅）列出和结构现有的XAI技术，因为在当前领域阶段，需要解决更基本的问题，如识别GenXAI的关键挑战和期望。为此，我们因此选择了更多叙述性的审查方法（King和He，2005年）并伴随着来自信息系统领域的分类发展方法（Nickerson等人，2013年）。已有多篇关于XAI的综述关注前GenAI时代，主要是技术焦点（Adadi和Berrada，2018年；Zini和Awad，2022年；Dwivedi等人，2023年；Schwalbe和Finzel，2023年；R¨auker等人，2023年；Saeed和Omlin，2023年；Speith，2022年；Minh等人，2022年；Bodria等人，2023年；Theissler等人，2022年；Guidotti等人，2019年；Guidotti，2022年）和跨学科或社会科学焦点（Miller，2019年；Meske等人，2022年；Longo等人，2024年）。特别是，通过利用这些综述，我们进行了一项元综述来构建我们的方法，同时也借鉴了前GenAI的知识。然而，我们也揭示了与GenAI相关的尚未涵盖的新方面。许多综述调查了GenAI的各个方面（不包括XAI）（Xu等人，2023年；Lin等人，2022年；Xing等人，2023年；Yang等人，2023b；Zhang等人，2023a,c；Pan等人，2023年）。我们利用这些综述为我们的技术背景。GenAI的某些子领域，例如知识识别和编辑（Zhang等人，2024年），使用孤立的XAI技术作为工具，但不旨在一般性地详细论述它。虽然我们未能识别任何讨论GenAI的XAI的综述，但一些研究手稿对大型语言模型（LLM）的XAI采取了更全面、部分带有观点的观点（Singh等人，2024年；Liao和Vaughan，2023年）或显式综述LLM的XAI（Zhao等人，2023a；Luo和Specia，2024年）。以前的工作没有提供一份全面的GenAI XAI的期望、动机和挑战清单和分类。特别是，我们的许多新方面在之前的工作中找不到。除此之外，即使只关注LLM，我们与以前的工作也有相当大的不同。我们首先提供技术背景。为了推导出贡猩，我们按照图1所述进行：然后，我们提供了GenAI的XAI的动机和挑战，尤其指向GenAI带来的新方面，如GenAI在整个社会的广泛影响和用户需要交互调整通常复杂、难以评估的输出的需求。基于此，我们推导出期望，即解释应 ideally fulfill的要求，如支持互动和验证输出。然后，我们为GenAI的现有和未来的XAI技术推导出一个分类，为了分类XAI，我们使用与GenXAI技术的输入、输出和内部属性相关的维度，这些维度将它们与前GenAI区分开来，例如自我解释以及不同的来源和XAI的驱动因素，例如提示和训练数据。使用识别的挑战和期望，本手稿的其余部分专注于讨论GenXAI的新维度和 RESULTING TAXONOMY，讨论与GenAI相关的XAI方法。最后，我们提供未来的方向我们的关键贡献包括描述GenAI的XAI需求、解释的期望和包括新维度的机制和算法的分类。

成为VIP会员查看完整内容

相关内容

生成式人工智能

关注 19

生成式人工智能是利用复杂的算法、模型和规则，从大规模数据集中学习，以创造新的原创内容的人工智能技术。这项技术能够创造文本、图片、声音、视频和代码等多种类型的内容，全面超越了传统软件的数据处理和分析能力。2022年末，OpenAI推出的ChatGPT标志着这一技术在文本生成领域取得了显著进展，2023年被称为生成式人工智能的突破之年。这项技术从单一的语言生成逐步向多模态、具身化快速发展。在图像生成方面，生成系统在解释提示和生成逼真输出方面取得了显著的进步。同时，视频和音频的生成技术也在迅速发展，这为虚拟现实和元宇宙的实现提供了新的途径。生成式人工智能技术在各行业、各领域都具有广泛的应用前景。

视频生成、理解与流媒体的生成式人工智能和大型语言模型综述

专知会员服务

27+阅读 · 4月27日

大型语言模型与智能机器人集成的综述

专知会员服务

36+阅读 · 4月22日

大型语言模型在软件工程：调查与待解决的问题

专知会员服务

67+阅读 · 2023年10月6日

因果性与大型语言模型：一个新的前沿，51页ppt

专知会员服务

75+阅读 · 2023年9月17日