多模态大语言模型(Multi-modal Large Language Models, MLLMs)作为一种整合视觉与文本信息的强大范式,已广泛应用于各类多模态任务。然而,这类模型常常存在幻觉(hallucination)问题,即生成看似合理却与输入内容或常识知识相悖的信息。本文综述了图像到文本(Image-to-Text, I2T)和文本到图像(Text-to-Image, T2I)生成任务中幻觉评估基准和检测方法的研究进展。 具体而言,我们首先基于忠实性(faithfulness)与事实性(factuality)构建了一套幻觉分类体系,并涵盖了实践中常见的幻觉类型。随后,我们系统回顾了现有用于 T2I 和 I2T 任务的幻觉评估基准,重点介绍其构建流程、评估目标与采用的指标。此外,我们还总结了近年来幻觉检测方法的研究进展,这些方法能够在实例级别识别幻觉内容,并作为基于评估基准方法的有力补充。最后,本文指出当前评估基准与检测方法存在的关键局限,并展望未来可能的研究方向。 关键词:多模态大语言模型、视觉-语言模型、扩散模型、幻觉评估、幻觉检测

1 引言

近年来,多模态大语言模型(Multi-Modal Large Language Models,MLLMs)在融合视觉与文本信息方面取得了显著进展,支持了广泛的多模态理解与生成任务。图像到文本(Image-to-Text,I2T)模型,如 GPT-4o(OpenAI, 2024)、Gemini(Team et al., 2023)和 Qwen-VL(Wang et al., 2024),在视觉问答和图像描述等任务上表现出色,具备强大的图像识别与推理能力,且无需依赖外部工具。相对地,文本到图像(Text-to-Image,T2I)模型,如 Stable Diffusion(Rombach et al., 2022)和 DALL·E(Ramesh et al., 2021),在基于文本提示生成高质量图像方面也取得了长足进展,能够准确对齐用户指定的内容或艺术风格。

尽管进展显著,I2T 与 T2I 模型仍面临诸多挑战,包括对分布变化的鲁棒性不足(Zhang et al., 2024;Guo et al., 2024;Aafaq et al., 2022;Liu et al., 2023)、易受攻击(Vice et al., 2024;Zhang et al., 2025;Fan et al., 2024),以及幻觉(hallucination)现象(Huang et al., 2023;Bai et al., 2024;Lan et al., 2024;Liu et al., 2024)。其中,幻觉问题尤为关键,指的是模型生成表面看似合理、实则与输入信息或事实知识不符的输出内容。

幻觉问题在大模型的实际应用中仍是一项重大挑战。早期研究主要关注 I2T 模型中的幻觉,强调生成文本输出与对应视觉输入之间的不一致性(Rohrbach et al., 2018;Li et al., 2023)。而近期的研究已将关注扩展至 T2I 模型(Chen et al., 2024;Hu et al., 2023),此类幻觉体现为生成图像与文本提示之间的不对齐。 本综述聚焦于 MLLMs 中 I2T 与 T2I 两类任务中的幻觉现象,并将幻觉划分为忠实性幻觉(faithfulness hallucination)与事实性幻觉(factuality hallucination)两类。忠实性幻觉指模型输出与用户输入或先前输出之间存在不一致,例如错误识别物体或生成图像与提示不符;而事实性幻觉则指模型输出与常识或世界知识相冲突,例如地标识别错误或医学图像中的不合理生成结果。

如图 1 所示,幻觉评估与基准构建近年来受到广泛关注,涌现出大量面向 I2T(Li et al., 2023;Wu et al., 2024;Fu et al., 2023;Seth et al., 2024;Zhou et al., 2023)与 T2I(Hu et al., 2023;Feng et al., 2023;Gokhale et al., 2022;Huang et al., 2024)模型幻觉的评估基准,覆盖不同研究视角。本文系统综述了 I2T 与 T2I 任务中针对忠实性与事实性幻觉的评估基准,详细比较了它们在数据来源、评估任务、图文对构建方式与幻觉类型等方面的异同,重点指出评估方法正朝着自动化构建与细粒度评估方向演进。此外,我们还提供了一个统一视角,以比较不同任务中幻觉评估的共性与差异。

MLLMs 的自由响应格式也为幻觉评估带来了额外挑战,尤其是在图像描述和图像生成等自由文本任务中。因此,幻觉检测方法在构建评估基准中发挥着关键作用,能够减少对昂贵人工标注的依赖,并实现更具扩展性的评估。反过来,评估基准提供了带标注的数据和标准化指标,有助于幻觉检测方法的开发与评估。为了更全面地展现评估与检测之间的互补关系,本文进一步总结了现有幻觉检测方法,并从统一视角探讨其在 I2T 与 T2I 模型中的可行性。

总之,本文旨在通过对 I2T 与 T2I 任务中幻觉评估基准与检测方法的全面综述,推进 MLLMs 幻觉研究的发展。相较于已有主要聚焦 I2T 任务幻觉的综述(Huang et al., 2023;Bai et al., 2024;Lan et al., 2024;Liu et al., 2024),我们拓展了视野,纳入 T2I 任务中的幻觉研究,并对忠实性与事实性幻觉进行了统一梳理。此外,我们对现有评估与检测方法进行了系统分类,并引入清晰的分类框架,例如将幻觉检测方法划分为黑盒方法与白盒方法,并按照不同粒度进行整理。同时,我们也强调了近年来在统一 I2T 与 T2I 模型幻觉评估与检测方面的努力,有助于更全面地理解幻觉现象。

本文结构安排:为帮助读者更清晰地理解相关研究进展,如图 2 所示,本文结构安排如下:第二节我们首先定义 I2T 与 T2I 任务中的幻觉类型,并阐明不同任务间幻觉类型的联系;第三节分析与总结现有 I2T 与 T2I 幻觉评估基准,重点讨论幻觉类型、构建方法与评估指标,并强调评估基准的发展趋势;在此基础上,第四节我们对当前 MLLMs 幻觉检测方法进行分类,探讨统一检测方法的可行性;最后,第五节讨论当前幻觉评估的局限性与挑战,并提出未来研究的潜在方向。

成为VIP会员查看完整内容
3

相关内容

多模态大型语言模型:综述
专知会员服务
40+阅读 · 6月14日
多模态基础模型的机制可解释性综述
专知会员服务
36+阅读 · 2月28日
大规模视觉-语言模型的基准、评估、应用与挑战
视觉自回归模型综述
专知会员服务
25+阅读 · 2024年11月14日
大型视觉语言模型中幻觉现象的综述
专知会员服务
46+阅读 · 2024年10月24日
基础模型时代的图像分割研究综述
专知会员服务
26+阅读 · 2024年8月26日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
46+阅读 · 2022年7月10日
专知会员服务
80+阅读 · 2021年5月30日
数据受限条件下的多模态处理技术综述
专知
20+阅读 · 2022年7月16日
深度学习图像检索(CBIR): 十年之大综述
专知
66+阅读 · 2020年12月5日
实体关系抽取方法研究综述
专知
12+阅读 · 2020年7月19日
综述:基于GAN的图像翻译模型盘点
GAN生成式对抗网络
21+阅读 · 2019年9月2日
再谈人脸识别损失函数综述
人工智能前沿讲习班
14+阅读 · 2019年5月7日
2018年深度学习优化算法最新综述
计算机视觉战队
10+阅读 · 2018年12月11日
现代情感分析方法
算法与数学之美
14+阅读 · 2018年1月12日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
473+阅读 · 2023年3月31日
Arxiv
10+阅读 · 2020年11月26日
VIP会员
相关VIP内容
多模态大型语言模型:综述
专知会员服务
40+阅读 · 6月14日
多模态基础模型的机制可解释性综述
专知会员服务
36+阅读 · 2月28日
大规模视觉-语言模型的基准、评估、应用与挑战
视觉自回归模型综述
专知会员服务
25+阅读 · 2024年11月14日
大型视觉语言模型中幻觉现象的综述
专知会员服务
46+阅读 · 2024年10月24日
基础模型时代的图像分割研究综述
专知会员服务
26+阅读 · 2024年8月26日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
46+阅读 · 2022年7月10日
专知会员服务
80+阅读 · 2021年5月30日
相关资讯
数据受限条件下的多模态处理技术综述
专知
20+阅读 · 2022年7月16日
深度学习图像检索(CBIR): 十年之大综述
专知
66+阅读 · 2020年12月5日
实体关系抽取方法研究综述
专知
12+阅读 · 2020年7月19日
综述:基于GAN的图像翻译模型盘点
GAN生成式对抗网络
21+阅读 · 2019年9月2日
再谈人脸识别损失函数综述
人工智能前沿讲习班
14+阅读 · 2019年5月7日
2018年深度学习优化算法最新综述
计算机视觉战队
10+阅读 · 2018年12月11日
现代情感分析方法
算法与数学之美
14+阅读 · 2018年1月12日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员