虚假信息在在线平台上的传播对社会构成了严重挑战,亟需采取有效措施进行信息验证。尽管人工事实核查依然非常重要,但虚假信息的不断增加需要自动化的方法来应对。大型语言模型(LLMs)为帮助事实核查员提供了有前景的机会,利用LLMs广泛的知识和强大的推理能力。在这篇综述论文中,我们探讨了生成型LLMs在事实核查领域的应用,展示了已采用的各种方法和用于提示或微调LLMs的技术。通过概述现有方法,这篇综述旨在提高对LLMs在事实核查中应用的理解,并促进LLMs在这一过程中进一步的发展。

引言 当代数字时代带来了各种挑战,其中包括虚假信息的传播。社交媒体的普及使这个问题更加严峻,成为一个严重的社会关注点。有效应对虚假信息的策略之一是事实核查(Vlachos 和 Riedel,2014),这主要由事实核查员手动完成。然而,事实核查员的数量有限,而虚假信息的传播却在增加(Aïmeur 等,2023)。因此,有必要通过使用数字工具和大型语言模型(LLMs)来开发自动化的事实核查流程,以协助事实核查员(Nakov 等,2021a)。

LLMs利用大规模数据集,结合数十亿参数来模拟语言的细微差别和自然语言的模式。此外,生成型LLMs代表了一种专门用于文本生成的LLMs子集。它们在手动事实核查中的应用显示出提高效率和准确性的良好前景。本研究首次综合总结了将生成型LLMs整合到事实核查过程中的各种方法和技术。

现有的综述已探讨了事实核查员的需求和可自动化的任务(Nakov 等,2021a),任务定义、传统方法或类似BERT的架构(Thorne 和 Vlachos,2018;Zeng 等,2021)。此外,还有几位作者审查了现有的事实核查数据集(Guo 等,2022)。另一项综述旨在利用LLMs对抗虚假信息,并探索LLMs带来的机会和挑战(Chen 和 Shu,2023b)。然而,这项研究并未详细探讨所使用的方法,这为更深入研究生成型LLMs在事实核查中的作用提供了机会。

我们的主要贡献是提供生成型LLMs在自动化事实核查中应用的概述。我们概述了70篇相关方法和新颖提示技术的论文,供研究人员深入研究LLMs辅助的信息验证。我们确定了四个主要任务和各种提出的解决策略。此外,我们讨论了未来的挑战和利用LLMs进行信息验证的可能方向。

成为VIP会员查看完整内容
35

相关内容

生成式人工智能是利用复杂的算法、模型和规则,从大规模数据集中学习,以创造新的原创内容的人工智能技术。这项技术能够创造文本、图片、声音、视频和代码等多种类型的内容,全面超越了传统软件的数据处理和分析能力。2022年末,OpenAI推出的ChatGPT标志着这一技术在文本生成领域取得了显著进展,2023年被称为生成式人工智能的突破之年。这项技术从单一的语言生成逐步向多模态、具身化快速发展。在图像生成方面,生成系统在解释提示和生成逼真输出方面取得了显著的进步。同时,视频和音频的生成技术也在迅速发展,这为虚拟现实和元宇宙的实现提供了新的途径。生成式人工智能技术在各行业、各领域都具有广泛的应用前景。
大语言模型增强知识表示学习综述
专知会员服务
64+阅读 · 7月2日
大语言模型的终身学习综述
专知会员服务
63+阅读 · 6月15日
《高效多模态大型语言模型》综述
专知会员服务
61+阅读 · 5月20日
大型语言模型自动程序修复的系统文献综述
专知会员服务
40+阅读 · 5月5日
《大型语言模型持续学习》综述
专知会员服务
79+阅读 · 4月26日
大型语言模型的模型压缩与高效推理:综述
专知会员服务
79+阅读 · 2月17日
大型语言模型图表示学习:技术的全面综述
专知会员服务
49+阅读 · 2月14日
专知会员服务
119+阅读 · 2020年12月9日
数据受限条件下的多模态处理技术综述
专知
16+阅读 · 2022年7月16日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
时空数据挖掘:综述
专知
24+阅读 · 2022年6月30日
【KDD2020】动态知识图谱的多事件预测
专知
88+阅读 · 2020年8月31日
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
19+阅读 · 2019年10月28日
无人机集群、蜂群与蜂群算法
无人机
89+阅读 · 2018年9月25日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Arxiv
158+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
408+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2023年3月26日
Arxiv
147+阅读 · 2023年3月24日
Arxiv
21+阅读 · 2023年3月17日
VIP会员
相关VIP内容
大语言模型增强知识表示学习综述
专知会员服务
64+阅读 · 7月2日
大语言模型的终身学习综述
专知会员服务
63+阅读 · 6月15日
《高效多模态大型语言模型》综述
专知会员服务
61+阅读 · 5月20日
大型语言模型自动程序修复的系统文献综述
专知会员服务
40+阅读 · 5月5日
《大型语言模型持续学习》综述
专知会员服务
79+阅读 · 4月26日
大型语言模型的模型压缩与高效推理:综述
专知会员服务
79+阅读 · 2月17日
大型语言模型图表示学习:技术的全面综述
专知会员服务
49+阅读 · 2月14日
专知会员服务
119+阅读 · 2020年12月9日
相关资讯
数据受限条件下的多模态处理技术综述
专知
16+阅读 · 2022年7月16日
基于模型的强化学习综述
专知
33+阅读 · 2022年7月13日
时空数据挖掘:综述
专知
24+阅读 · 2022年6月30日
【KDD2020】动态知识图谱的多事件预测
专知
88+阅读 · 2020年8月31日
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
19+阅读 · 2019年10月28日
无人机集群、蜂群与蜂群算法
无人机
89+阅读 · 2018年9月25日
Spark机器学习:矩阵及推荐算法
LibRec智能推荐
16+阅读 · 2017年8月3日
相关基金
国家自然科学基金
41+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员