【剑桥博士论文】神经-符号事实验证

事实核查（Fact-checking）是评估主张真实性的过程，通常十分耗时，可能需要数小时甚至数天来验证一个主张，因此推动了自动化事实核查（或部分自动化）计算方法的发展。该挑战在自然语言处理领域中被具体化为事实验证（fact verification）任务，通常通过从知识源中提取文本证据并利用神经蕴含系统对主张的真实性进行推理来建模。然而，这类系统的推理过程本质上不透明，存在鲁棒性问题，并且难以捕捉诸如单调性等形式良好的语义概念。为了解决这些问题，本论文探索了用于事实验证的神经-符号方法（neuro-symbolic methods），将符号系统与神经表示相结合。我们特别关注自然逻辑（natural logic）这一组合性蕴含推理框架，它直接作用于自然语言，通过捕捉主张和文本证据之间的集合论关系进行推理。作为一个旨在通过确定性推理识别有效推断的逻辑系统，自然逻辑特别适用于事实验证任务，其中主张需由证据蕴含（entail），同时能够保障诸如忠实性（faithfulness）和可执行性（actionability）等可解释性属性。本论文的首个贡献是构建了 FEVEROUS数据集，这是一个大规模数据集，要求对检索到的文本和表格证据进行复杂推理（如算术推理或多跳推理），以推动神经-符号方法的发展。随后，我们探索了将自然逻辑作为符号推理框架与自回归语言建模的最新进展相结合的方式，以提升事实验证系统的可解释性、鲁棒性和泛化能力。我们提出了如下系统： 1. 将自然逻辑作为自回归多跳文档检索的动态且透明的停止准则； 1. 消除训练自然逻辑推理系统对大规模标注数据的依赖； 1. 将自然逻辑扩展至表格证据与算术运算，以应对复杂主张验证中的关键挑战。

最后，我们将这三项贡献统一到一个基于自然逻辑的事实验证系统中，致力于在文本和表格证据上进行推理的同时满足关键的可解释性需求。

成为VIP会员查看完整内容

相关内容

博士论文

关注 116

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【牛津大学博士论文】机器学习中的对称性与泛化

专知会员服务

22+阅读 · 1月8日

神经图推理：复杂逻辑查询回答的综述

专知会员服务

28+阅读 · 2024年12月10日

【牛津大学博士论文】迈向具有类人自然语言理解的语言模型

专知会员服务

27+阅读 · 2024年10月28日

【伯克利博士论文】神经网络中的结构与表征

专知会员服务

47+阅读 · 2024年5月12日