如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测 - 专知VIP

会员服务 ·

20

大模型 · SelfCheckGPT · 大型语言模型 · 知识幻觉 ·

2023 年 8 月 22 日

如何检测大模型“幻觉”？剑桥提出SelfCheckGPT: 针对生成型大型语言模型的零资源黑盒子幻觉检测

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

生成型大型语言模型（LLMs）如 GPT-3 能够为各种用户提示生成流畅的响应。但是，LLMs 有时会产生错误的事实，这可能会损害人们对它们输出的信任。现有的事实检查方法要么需要访问输出概率分布（这对于如 ChatGPT 这样的系统可能不可用），要么需要通过复杂的模块接口外部数据库。在这项工作中，我们提出了 "SelfCheckGPT"，一个简单的基于抽样的方法，可用于在不需要外部数据库的情况下对黑盒模型进行事实检查。SelfCheckGPT 的核心思想是，如果LLM知道某个概念，抽样的响应很可能会类似并包含一致的事实。但对于错误的事实，随机抽样的响应可能会有所不同并互相矛盾。我们使用 GPT-3 生成 WikiBio 数据集中的个人文章，并手动注释生成的文章的事实性。我们证明 SelfCheckGPT 可以：i) 检测非事实性和事实性的句子；以及 ii) 根据事实性对文章进行排名。我们将我们的方法与几种基线方法进行比较，结果显示在句子错误检测中，我们的方法的 AUC-PR 分数与灰盒方法相当或更好，而 SelfCheckGPT 在文章事实性评估方面表现最佳。

成为VIP会员查看完整内容

42

相关内容

大模型

大模型是基于海量多源数据打造的预训练模型，是对原有算法模型的技术升级和产品迭代，用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习，以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。

【KDD2023】协同过滤的高效联合超参数和架构搜索

【KDD2023】协同过滤的高效联合超参数和架构搜索

专知会员服务

23+阅读 · 2023年7月23日

【COLING2022教程】自然语言处理的不确定性估计教程

【COLING2022教程】自然语言处理的不确定性估计教程

专知会员服务

31+阅读 · 2022年10月17日

【CVPR2022】基于密集学习的半监督目标检测

【CVPR2022】基于密集学习的半监督目标检测

专知会员服务

20+阅读 · 2022年4月19日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【ICML2021】图对比学习自动化

专知会员服务

41+阅读 · 2021年6月19日

【WWW2021】高效的非抽样知识图谱嵌入

专知会员服务

38+阅读 · 2021年4月25日

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

专知会员服务

63+阅读 · 2021年4月21日

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

专知会员服务

40+阅读 · 2021年2月10日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

36+阅读 · 2020年11月29日

【EMNLP2020】自然语言分类任务的自监督元学习

专知会员服务

30+阅读 · 2020年9月18日

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知

5+阅读 · 2023年4月8日

【AAAI2023】对比掩码自动编码器的自监督视频哈希

【AAAI2023】对比掩码自动编码器的自监督视频哈希

专知

1+阅读 · 2022年11月26日

【NeurIPS 2022】扩散模型的深度平衡方法

【NeurIPS 2022】扩散模型的深度平衡方法

专知

0+阅读 · 2022年11月6日

图学习如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图学习如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知

4+阅读 · 2022年10月24日

【COLING2022教程】自然语言处理的不确定性估计教程

【COLING2022教程】自然语言处理的不确定性估计教程

专知

1+阅读 · 2022年10月17日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

多模态图学习怎么用？哈佛最新《几何多模态表示学习》综述，28页pdf阐述多模态图学习在图像、语言、自然科学等应用

多模态图学习怎么用？哈佛最新《几何多模态表示学习》综述，28页pdf阐述多模态图学习在图像、语言、自然科学等应用

专知

2+阅读 · 2022年9月8日

【CIKM2022】基于双向Transformers对比学习的序列推荐

【CIKM2022】基于双向Transformers对比学习的序列推荐

专知

6+阅读 · 2022年8月10日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

PMSSC: Parallelizable multi-subset based self-expressive model for subspace clustering

Arxiv

0+阅读 · 2023年10月5日

Algorithmic analysis towards time-domain extended source waveform inversion

Arxiv

0+阅读 · 2023年10月5日

Minimax optimal density estimation using a shallow generative model with a one-dimensional latent variable

Arxiv

0+阅读 · 2023年10月5日

Progressive reduced order modeling: empowering data-driven modeling with selective knowledge transfer

Arxiv

0+阅读 · 2023年10月4日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

VIP会员

相关主题

大型语言模型

相关VIP内容

【KDD2023】协同过滤的高效联合超参数和架构搜索

【KDD2023】协同过滤的高效联合超参数和架构搜索

专知会员服务

23+阅读 · 2023年7月23日

【COLING2022教程】自然语言处理的不确定性估计教程

【COLING2022教程】自然语言处理的不确定性估计教程

专知会员服务

31+阅读 · 2022年10月17日

【CVPR2022】基于密集学习的半监督目标检测

【CVPR2022】基于密集学习的半监督目标检测

专知会员服务

20+阅读 · 2022年4月19日

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

【AAAI2022】基于对比学习的预训练语言模型剪枝压缩

专知会员服务

29+阅读 · 2022年1月24日

【ICML2021】图对比学习自动化

专知会员服务

41+阅读 · 2021年6月19日

【WWW2021】高效的非抽样知识图谱嵌入

专知会员服务

38+阅读 · 2021年4月25日

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架

专知会员服务

63+阅读 · 2021年4月21日

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

【WWW2021】自监督学习上下文嵌入的异构网络链接预测

专知会员服务

40+阅读 · 2021年2月10日

【WSDM 2021】面向信息检索的预训练语言模型

专知会员服务

36+阅读 · 2020年11月29日

【EMNLP2020】自然语言分类任务的自监督元学习

专知会员服务

30+阅读 · 2020年9月18日

热门VIP内容

开通专知VIP会员享更多权益服务

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

《生态建模密码破译：建模与编程实践》美陆军最新报告

大模型解决方案白皮书：社交陪伴场景全流程落地指南

面向具身操作的视觉-语言-动作模型综述

相关资讯

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

【CVPR2023】基于图像特定提示学习的零样本生成模型自适应

专知

5+阅读 · 2023年4月8日

【AAAI2023】对比掩码自动编码器的自监督视频哈希

【AAAI2023】对比掩码自动编码器的自监督视频哈希

专知

1+阅读 · 2022年11月26日

【NeurIPS 2022】扩散模型的深度平衡方法

【NeurIPS 2022】扩散模型的深度平衡方法

专知

0+阅读 · 2022年11月6日

图学习如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图学习如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知

4+阅读 · 2022年10月24日

【COLING2022教程】自然语言处理的不确定性估计教程

【COLING2022教程】自然语言处理的不确定性估计教程

专知

1+阅读 · 2022年10月17日

【NeurIPS2022】通过模型转换的可解释强化学习

【NeurIPS2022】通过模型转换的可解释强化学习

专知

1+阅读 · 2022年10月4日

多模态图学习怎么用？哈佛最新《几何多模态表示学习》综述，28页pdf阐述多模态图学习在图像、语言、自然科学等应用

多模态图学习怎么用？哈佛最新《几何多模态表示学习》综述，28页pdf阐述多模态图学习在图像、语言、自然科学等应用

专知

2+阅读 · 2022年9月8日

【CIKM2022】基于双向Transformers对比学习的序列推荐

【CIKM2022】基于双向Transformers对比学习的序列推荐

专知

6+阅读 · 2022年8月10日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于最大相关熵准则的支持向量机模型与算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

28+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

PMSSC: Parallelizable multi-subset based self-expressive model for subspace clustering

Arxiv

0+阅读 · 2023年10月5日

Algorithmic analysis towards time-domain extended source waveform inversion

Arxiv

0+阅读 · 2023年10月5日

Minimax optimal density estimation using a shallow generative model with a one-dimensional latent variable

Arxiv

0+阅读 · 2023年10月5日

Progressive reduced order modeling: empowering data-driven modeling with selective knowledge transfer

Arxiv

0+阅读 · 2023年10月4日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

103+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

216+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Is Prompt All You Need? No. A Comprehensive and Broader View of Instruction Learning

Arxiv

20+阅读 · 2023年3月21日

微信扫码咨询专知VIP会员