**摘要: 视觉语言大模型(large vision-language models,LVLMs)代表了自然语言处理与计算机视觉交叉领域的一项重要进展. 通过结合预训练的视觉编码器、视觉语言适配器和大语言模型,LVLMs能够同时理解图像与文本信息,并通过自然语言进行响应,适用于图像描述、视觉问答等多种视觉语言下游任务. 然而,这类模型普遍存在幻觉现象,即模型对于图像内容进行了错误感知,制约了其在医学图像诊断 、自动驾驶等高风险领域的赋能应用. 旨在系统梳理并深入分析幻觉成因、评估方法及治理策略,为LVLMs的可靠性研究提供指导. 首先,介绍LVLMs的基础概念及其幻觉现象的定义与分类;随后,从训练数据、训练任务、视觉编码、文本生成4方面分析LVLMs的幻觉成因,并讨论这些成因间的交互关系;接着,从任务形式、数据构建和评估指标3方面介绍LVLMs的幻觉评估策略;此外,从训练数据、视觉感知、训练策略、模型推理、事后修正5方面讨论LVLMs的幻觉治理技术;最后,为这类幻觉的成因分析、评估和治理3方面提供未来的研究方向.**关键词:

  • 自然语言处理 /
  • 计算机视觉 /
  • 视觉语言大模型 /
  • 多模态大语言模型 /
  • 幻觉

成为VIP会员查看完整内容
4

相关内容

视觉语言动作模型:概念、进展、应用与挑战
专知会员服务
17+阅读 · 5月18日
开放环境下的协作多智能体强化学习进展综述
专知会员服务
32+阅读 · 1月19日
大规模语言模型中的知识机制:综述与展望
专知会员服务
55+阅读 · 2024年7月26日
视觉语言导航:大模型时代的综述
专知会员服务
48+阅读 · 2024年7月10日
大型语言模型在软件工程:调查与待解决的问题
专知会员服务
76+阅读 · 2023年10月6日
基于模型的强化学习综述
专知
40+阅读 · 2022年7月13日
一文看懂自然语言处理中迁移学习的现状
AI前线
10+阅读 · 2019年8月27日
论文浅尝 | 时序与因果关系联合推理
开放知识图谱
35+阅读 · 2019年6月23日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
论文浅尝 | 图神经网络综述:方法及应用
开放知识图谱
114+阅读 · 2019年2月14日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
467+阅读 · 2023年3月31日
Arxiv
76+阅读 · 2023年3月26日
Arxiv
169+阅读 · 2023年3月24日
Arxiv
24+阅读 · 2023年3月17日
VIP会员
相关VIP内容
视觉语言动作模型:概念、进展、应用与挑战
专知会员服务
17+阅读 · 5月18日
开放环境下的协作多智能体强化学习进展综述
专知会员服务
32+阅读 · 1月19日
大规模语言模型中的知识机制:综述与展望
专知会员服务
55+阅读 · 2024年7月26日
视觉语言导航:大模型时代的综述
专知会员服务
48+阅读 · 2024年7月10日
大型语言模型在软件工程:调查与待解决的问题
专知会员服务
76+阅读 · 2023年10月6日
相关资讯
基于模型的强化学习综述
专知
40+阅读 · 2022年7月13日
一文看懂自然语言处理中迁移学习的现状
AI前线
10+阅读 · 2019年8月27日
论文浅尝 | 时序与因果关系联合推理
开放知识图谱
35+阅读 · 2019年6月23日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
论文浅尝 | 图神经网络综述:方法及应用
开放知识图谱
114+阅读 · 2019年2月14日
论文浅尝 | 基于神经网络的知识推理
开放知识图谱
14+阅读 · 2018年3月12日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员