事实核查(Fact-checking)是评估主张真实性的过程,通常十分耗时,可能需要数小时甚至数天来验证一个主张,因此推动了自动化事实核查(或部分自动化)计算方法的发展。该挑战在自然语言处理领域中被具体化为事实验证(fact verification)任务,通常通过从知识源中提取文本证据并利用神经蕴含系统对主张的真实性进行推理来建模。 然而,这类系统的推理过程本质上不透明,存在鲁棒性问题,并且难以捕捉诸如单调性等形式良好的语义概念。 为了解决这些问题,本论文探索了用于事实验证的神经-符号方法(neuro-symbolic methods),将符号系统与神经表示相结合。我们特别关注自然逻辑(natural logic)这一组合性蕴含推理框架,它直接作用于自然语言,通过捕捉主张和文本证据之间的集合论关系进行推理。作为一个旨在通过确定性推理识别有效推断的逻辑系统,自然逻辑特别适用于事实验证任务,其中主张需由证据蕴含(entail),同时能够保障诸如忠实性(faithfulness)可执行性(actionability)等可解释性属性。 本论文的首个贡献是构建了 FEVEROUS数据集,这是一个大规模数据集,要求对检索到的文本和表格证据进行复杂推理(如算术推理或多跳推理),以推动神经-符号方法的发展。 随后,我们探索了将自然逻辑作为符号推理框架与自回归语言建模的最新进展相结合的方式,以提升事实验证系统的可解释性、鲁棒性和泛化能力。我们提出了如下系统: 1. 将自然逻辑作为自回归多跳文档检索的动态且透明的停止准则; 1. 消除训练自然逻辑推理系统对大规模标注数据的依赖; 1. 将自然逻辑扩展至表格证据算术运算,以应对复杂主张验证中的关键挑战。

最后,我们将这三项贡献统一到一个基于自然逻辑的事实验证系统中,致力于在文本和表格证据上进行推理的同时满足关键的可解释性需求。

成为VIP会员查看完整内容
1

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
神经图推理:复杂逻辑查询回答的综述
专知会员服务
28+阅读 · 2024年12月10日
【伯克利博士论文】神经网络中的结构与表征
专知会员服务
47+阅读 · 2024年5月12日
【剑桥大学博士论文】卷积条件神经过程,226页pdf
专知会员服务
49+阅读 · 2024年1月30日
清华最新《解耦表征学习》综述
专知会员服务
69+阅读 · 2023年2月23日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
46+阅读 · 2022年7月10日
【AAAI2022】谣言粉碎机!可解释事实检验算法研究
专知会员服务
17+阅读 · 2022年1月30日
【MIT博士论文】数据高效强化学习,176页pdf
论文浅尝 | 使用循环神经网络的联合事件抽取
开放知识图谱
25+阅读 · 2019年4月28日
现代情感分析方法
算法与数学之美
14+阅读 · 2018年1月12日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
A Survey of Large Language Models
Arxiv
461+阅读 · 2023年3月31日
Arxiv
18+阅读 · 2021年3月16日
Arxiv
10+阅读 · 2020年11月26日
Augmentation for small object detection
Arxiv
11+阅读 · 2019年2月19日
VIP会员
相关VIP内容
神经图推理:复杂逻辑查询回答的综述
专知会员服务
28+阅读 · 2024年12月10日
【伯克利博士论文】神经网络中的结构与表征
专知会员服务
47+阅读 · 2024年5月12日
【剑桥大学博士论文】卷积条件神经过程,226页pdf
专知会员服务
49+阅读 · 2024年1月30日
清华最新《解耦表征学习》综述
专知会员服务
69+阅读 · 2023年2月23日
【NAACL2022】自然语言处理的对比数据与学习
专知会员服务
46+阅读 · 2022年7月10日
【AAAI2022】谣言粉碎机!可解释事实检验算法研究
专知会员服务
17+阅读 · 2022年1月30日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员