【NeurIPS 2024】HaloScope：利用未标记的大型语言模型生成进行幻觉检测 - 专知VIP

会员服务 ·

1

NeurIPS 2024 · HaloScope · 大型语言模型 · 幻觉检测 ·

【NeurIPS 2024】HaloScope：利用未标记的大型语言模型生成进行幻觉检测

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大型语言模型（LLMs）应用的激增引发了人们对生成误导性或虚假信息（即幻觉）的担忧。因此，检测幻觉已成为维护 LLM 生成内容可信度的关键。学习真实分类器的一大挑战是缺乏大量标记的真实和幻觉数据。为了解决这一挑战，我们推出了 HaloScope，这是一种新颖的学习框架，利用未标记的 LLM 生成文本进行幻觉检测。这种未标记数据在 LLM 部署到开放世界时自由产生，包含真实和幻觉信息。为了有效利用这些未标记数据，我们提出了一种自动化的成员资格估计评分，用于区分未标记混合数据中的真实与不真实生成，从而实现二元真实分类器的训练。重要的是，我们的框架不需要额外的数据收集和人工标注，为实际应用提供了很大的灵活性和可行性。大量实验表明，HaloScope 在幻觉检测性能上表现优越，显著超过了竞争对手。代码可在 https://github.com/deeplearning-wisc/haloscope 获取。

成为VIP会员查看完整内容

1

相关内容

NeurIPS 2024

【NeurIPS2024】Text2CAD：从初学者到专家级文本提示生成连续CAD模型

【NeurIPS2024】Text2CAD：从初学者到专家级文本提示生成连续CAD模型

专知会员服务

8+阅读 · 9月26日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

18+阅读 · 3月30日

【WWW2024】元认知检索-增强大型语言模型

【WWW2024】元认知检索-增强大型语言模型

专知会员服务

49+阅读 · 2月26日

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

专知会员服务

22+阅读 · 2023年8月22日

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

专知会员服务

28+阅读 · 2022年4月26日

【NeurIPS 2021】基于潜在空间能量模型的可控和组分生成

【NeurIPS 2021】基于潜在空间能量模型的可控和组分生成

专知会员服务

15+阅读 · 2021年10月23日

【NeurIPS 2021】使用动态图进行3D目标检测

专知会员服务

14+阅读 · 2021年10月15日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

18+阅读 · 2021年9月13日

【CVPR2020高分接受论文-3个strong accept-商汤港中文】FineGym:用于细粒度动作理解的分层视频数据集

【CVPR2020高分接受论文-3个strong accept-商汤港中文】FineGym:用于细粒度动作理解的分层视频数据集

专知会员服务

23+阅读 · 2020年4月15日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

56+阅读 · 2020年3月6日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

16+阅读 · 2023年4月12日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

37+阅读 · 2019年7月25日

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

9+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

利用同步辐射技术研究Gd@C82(OH)22调控肿瘤细胞EMT的作用机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

36+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

SHVC质量可伸缩视频编码的快速算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于免疫的Rootkit隐遁攻击动态内存取证方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

149+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

35+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

166+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

67+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

378+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

112+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

64+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

133+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

44+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

19+阅读 · 2023年3月17日

VIP会员

相关主题

大型语言模型

相关VIP内容

【NeurIPS2024】Text2CAD：从初学者到专家级文本提示生成连续CAD模型

【NeurIPS2024】Text2CAD：从初学者到专家级文本提示生成连续CAD模型

专知会员服务

8+阅读 · 9月26日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

18+阅读 · 3月30日

【WWW2024】元认知检索-增强大型语言模型

【WWW2024】元认知检索-增强大型语言模型

专知会员服务

49+阅读 · 2月26日

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

【CIKM2023】GiGaMAE: 通过协同潜在空间重建的可泛化图掩码自编码器

专知会员服务

22+阅读 · 2023年8月22日

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

【CVPR2022】DiRA:用于自监督医学图像分析的判别性、恢复性和对抗性学习

专知会员服务

28+阅读 · 2022年4月26日

【NeurIPS 2021】基于潜在空间能量模型的可控和组分生成

【NeurIPS 2021】基于潜在空间能量模型的可控和组分生成

专知会员服务

15+阅读 · 2021年10月23日

【NeurIPS 2021】使用动态图进行3D目标检测

专知会员服务

14+阅读 · 2021年10月15日

【ICML2021】通过文本生成统一视觉和语言任务

专知会员服务

18+阅读 · 2021年9月13日

【CVPR2020高分接受论文-3个strong accept-商汤港中文】FineGym:用于细粒度动作理解的分层视频数据集

【CVPR2020高分接受论文-3个strong accept-商汤港中文】FineGym:用于细粒度动作理解的分层视频数据集

专知会员服务

23+阅读 · 2020年4月15日

【Amazon】使用预先训练的Transformer模型进行数据增强

【Amazon】使用预先训练的Transformer模型进行数据增强

专知会员服务

56+阅读 · 2020年3月6日

热门VIP内容

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

16+阅读 · 2023年4月12日

【AAAI2021】自监督对应学习的对比转换

【AAAI2021】自监督对应学习的对比转换

专知

12+阅读 · 2020年12月11日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

【CVPR2020-旷视】DPGN：分布传播图网络的小样本学习

专知

12+阅读 · 2020年4月1日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知

10+阅读 · 2020年3月31日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【CVPR2019】弱监督图像分类建模

【CVPR2019】弱监督图像分类建模

深度学习大讲堂

37+阅读 · 2019年7月25日

相关基金

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于抽象语义切片和后向求精分析的静态分析警报自动确认研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

9+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

2+阅读 · 2015年12月31日

利用同步辐射技术研究Gd@C82(OH)22调控肿瘤细胞EMT的作用机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

36+阅读 · 2015年12月31日

基于上下文感知和异质特征集成的SAR图像分割与评价

国家自然科学基金

2+阅读 · 2015年12月31日

SHVC质量可伸缩视频编码的快速算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于免疫的Rootkit隐遁攻击动态内存取证方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

149+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

35+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

166+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

67+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

378+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

112+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

64+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

133+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

44+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

19+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员