论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答 - 专知

会员服务 ·

0

论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答

2021 年 10 月 5 日 开放知识图谱

笔记整理：陈永锐，东南大学博士

论文链接：https://arxiv.org/pdf/2101.03737.pdf

概述

该论文处理多跳知识库问答（KBQA）任务，主要关注训练过程在中间步骤缺乏监督信号的挑战。由于这一挑战，多跳 KBQA 算法只能接收来自最终答案的反馈，这使得学习不稳定或无效。

为了应对这一挑战，该论文提出了一种师生网络方法。方法主要由两个网络组成，分别是教师网络和学生网络。其中，学生网络旨在找到查询的正确答案，而教师网络则试图学习中间监督信号以提高学生网络的推理能力。主要的新颖之处在于教师网络的设计，利用前向和后向推理来增强对中间实体分布的学习。通过考虑双向推理，教师网络可以产生更可靠的中间监督信号，从而缓解虚假推理问题。

动机

在某些情况下，推理即使正确找到答案，关系路径也可能是虚假的。以上图为例，问题是“what types are the films starred by actors in the nine lives of fritz the cat?”。除了正确的路径（红色箭头）外，包含第一步中的实体的两条虚假路径（蓝色箭头）也可以得到正确答案。主要是由于中间推理步骤缺少监督信号（称之为中间监督信号）。如果将这些虚假路径作为监督信号进行训练，会使模型朝向错误的方向优化。

该论文受到双向搜索算法，（例如BFS）的启发，通过双向探索可以更有效地识别连接源和目的地的理想路径。事实上，对于 KBQA，前向推理找到从主题实体（即查询中的实体）开始到答案实体的路径，以及从答案实体返回到答案实体的反向推理主题实体。然而大多数现有方法只考虑前向推理。该论文对两个推理过程进行联合建模，以便在中间步骤中加入额外的自我监督信号。

在上图中，第二步正向推理得到的实体分布应该与第一步反向推理得到的实体分布相似。不相关的实体“Devil's Doorway”和“Coffin Rock”很可能在正向推理的第二步推理中到达，但在反向推理的第一步中无法到达。为了保持两个过程之间的对应关系，应该避免在前向推理的第一步中包含导演“Robert Taylor”。这种潜在的对应关系有助于在中间步骤中改进每个单独推理过程的学习。这就是该论文如何学习可靠的中间监督信号的关键。

NSM模型

本文的基本模型主要基于Neural State Machine（NSM）

上图展示了两步的推理过程。模型主要包括两个组件，指令组件（蓝色虚线框）和推理组件（黄色虚线框）。在推理过程的每一步：

•指令组件在推理过程的每一步会关注问句的不同部分，而得到指令向量 $i^{(k)}$ 。•推理组件先利用 $i^{(k)}$ 的信息并结合的周围实体的信息更新每个实体的embedding，得到新实体embedding $E^{(k)}$ ，最后再更新实体分布 $p^{(k)}$ 。

师生网络

•学生网络即使用NSM模型•教师网络采用两个NSM分别进行正向和反向的推理，并借此优化每一步的实体分布 $p^{(k)}$ 。论文提出了以下两种模式：

1.平行推理（parallel reasoning）：

两个 NSM 网络相对隔离，不共享任何参数。只考虑在它们之间的中间实体分布上加入对应约束。

2.层级推理（hybrid reasoning）

共享相同的指令组件，将两个推理过程安排在一个循环的流水线中。除了对应约束之外，两个进程接收相同的指令向量。此外，前向推理最后一步的派生信息作为初始值输入后向推理。形式上，在这种情况下，以下等式成立：

训练过程

训练教师网络，考虑两种loss：

•推理损失：

这里 $D_{KL}$ 表示KL散度。

•通信损失：

这里， $D_{JS}$ 表示JS散度。

对于教师网络，结合上述两种损失：

•等教师网络收敛后，利用其得到的中间分布 $p_t^{(k)}$ 训练学生网络，考虑以下两种loss：

实验结果

论文使用了CWQ, MetaQA，WebQSP三个数据集进行了实验。

可见，NSM+h在多跳问答的数据集上均取得了最优的结果。

OpenKG

OpenKG（中文开放知识图谱）旨在推动以中文为核心的知识图谱数据的开放、互联及众包，并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文，进入 OpenKG 网站。

登录查看更多

0

相关内容

ACL2022 | 基于强化学习的实体对齐

ACL2022 | 基于强化学习的实体对齐

专知会员服务

35+阅读 · 2022年3月15日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【ACL2021】ERICA:通过对比学习提高预训练语言模型的实体和关系理解

专知会员服务

26+阅读 · 2021年8月12日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

35+阅读 · 2021年8月11日

ACL2021 | 探讨跨句事件联合抽取问题

专知会员服务

21+阅读 · 2021年7月19日

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

专知会员服务

44+阅读 · 2020年12月27日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

论文浅尝 | AutoETER: 用于知识图谱嵌入的自动实体类型表示

论文浅尝 | AutoETER: 用于知识图谱嵌入的自动实体类型表示

开放知识图谱

3+阅读 · 2021年8月17日

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

AI科技评论

18+阅读 · 2020年6月29日

论文浅尝 | 重新实验评估知识图谱补全方法

论文浅尝 | 重新实验评估知识图谱补全方法

开放知识图谱

28+阅读 · 2020年3月29日

论文浅尝 | 基于复杂查询图编码的知识库问答

论文浅尝 | 基于复杂查询图编码的知识库问答

开放知识图谱

17+阅读 · 2019年7月22日

论文浅尝 | 利用 KG Embedding 进行问题回答

论文浅尝 | 利用 KG Embedding 进行问题回答

开放知识图谱

22+阅读 · 2019年7月7日

论文浅尝 | 一种用于多关系问答的可解释推理网络

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

开放知识图谱

14+阅读 · 2018年7月5日

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

开放知识图谱

25+阅读 · 2018年6月26日

论文浅尝 | 基于神经网络的知识推理

论文浅尝 | 基于神经网络的知识推理

开放知识图谱

14+阅读 · 2018年3月12日

论文浅尝 | 基于置信度的知识图谱表示学习框架

论文浅尝 | 基于置信度的知识图谱表示学习框架

开放知识图谱

24+阅读 · 2018年2月27日

基于改进型视觉注意模型的多模态极相似图像检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

Survivin在低氧诱导喉癌淋巴管生成中的调控作用及其分子机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于事前约束的XML关键字查询处理技术

国家自然科学基金

0+阅读 · 2014年12月31日

具有优异部分相关特性的参考信号序列设计及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于网络知识和人工知识的图像语义建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于无标度网络及噪声诱导随机共振的低误码平底LDPC码编解码方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

铜螯合剂由抑制SOD1的活性调控胞内氧化还原信号转导

国家自然科学基金

0+阅读 · 2012年12月31日

基于神经网络的非线性系统合作学习辨识与控制

国家自然科学基金

0+阅读 · 2011年12月31日

强相关信道中的空时信号设计及检测关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

A mixed finite element method with piecewise linear elements for the biharmonic equation on surfaces

Arxiv

0+阅读 · 2022年4月20日

Mention Memory: incorporating textual knowledge into Transformers through entity mention attention

Arxiv

0+阅读 · 2022年4月19日

Graph-based Approximate Message Passing Iterations

Arxiv

0+阅读 · 2022年4月19日

Making Progress Based on False Discoveries

Arxiv

0+阅读 · 2022年4月19日

Single-shot Embedding Dimension Search in Recommender System

Arxiv

0+阅读 · 2022年4月15日

Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering

Arxiv

16+阅读 · 2019年12月16日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN

Arxiv

11+阅读 · 2018年5月27日

Constructing Narrative Event Evolutionary Graph for Script Event Prediction

Arxiv

11+阅读 · 2018年5月16日

VIP会员

相关主题

知识库问答

相关VIP内容

ACL2022 | 基于强化学习的实体对齐

ACL2022 | 基于强化学习的实体对齐

专知会员服务

35+阅读 · 2022年3月15日

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

【AAAI2022】用于视觉常识推理的场景图增强图像-文本学习

专知会员服务

50+阅读 · 2021年12月20日

【ACL2021】ERICA:通过对比学习提高预训练语言模型的实体和关系理解

专知会员服务

26+阅读 · 2021年8月12日

【ACL2021】可学习知识引导的事件因果关系识别数据增强方法

专知会员服务

35+阅读 · 2021年8月11日

ACL2021 | 探讨跨句事件联合抽取问题

专知会员服务

21+阅读 · 2021年7月19日

【CVPR2021】一种基于知识蒸馏的弱监督图像文本匹配模型

专知会员服务

35+阅读 · 2021年4月8日

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

【伯克利博士论文】通过对齐表示和图像来跨域自适应，95页pdf

专知会员服务

44+阅读 · 2020年12月27日

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

【CMU博士论文】信息检索中的神经匹配和重要性学习，163页pdf

专知会员服务

58+阅读 · 2020年7月20日

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知会员服务

45+阅读 · 2020年2月12日

热门VIP内容

开通专知VIP会员享更多权益服务

模型提取攻击与防御的系统综述：最新进展与展望

【博士论文】低维与高维空间中潜在表征的分析、建模与变换

【CMU博士论文】用于物理模拟的高效深度学习模型

大模型解决方案白皮书：社交陪伴场景全流程落地指南

相关资讯

论文浅尝 | AutoETER: 用于知识图谱嵌入的自动实体类型表示

论文浅尝 | AutoETER: 用于知识图谱嵌入的自动实体类型表示

开放知识图谱

3+阅读 · 2021年8月17日

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

ACL2020 | 基于Knowledge Embedding的多跳知识图谱问答

AI科技评论

18+阅读 · 2020年6月29日

论文浅尝 | 重新实验评估知识图谱补全方法

论文浅尝 | 重新实验评估知识图谱补全方法

开放知识图谱

28+阅读 · 2020年3月29日

论文浅尝 | 基于复杂查询图编码的知识库问答

论文浅尝 | 基于复杂查询图编码的知识库问答

开放知识图谱

17+阅读 · 2019年7月22日

论文浅尝 | 利用 KG Embedding 进行问题回答

论文浅尝 | 利用 KG Embedding 进行问题回答

开放知识图谱

22+阅读 · 2019年7月7日

论文浅尝 | 一种用于多关系问答的可解释推理网络

论文浅尝 | 一种用于多关系问答的可解释推理网络

开放知识图谱

18+阅读 · 2019年5月21日

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

开放知识图谱

14+阅读 · 2018年7月5日

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

论文浅尝 | 基于知识图谱子图匹配以回答自然语言问题

开放知识图谱

25+阅读 · 2018年6月26日

论文浅尝 | 基于神经网络的知识推理

论文浅尝 | 基于神经网络的知识推理

开放知识图谱

14+阅读 · 2018年3月12日

论文浅尝 | 基于置信度的知识图谱表示学习框架

论文浅尝 | 基于置信度的知识图谱表示学习框架

开放知识图谱

24+阅读 · 2018年2月27日

相关基金

基于改进型视觉注意模型的多模态极相似图像检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于神经网络的跨语言实体链指研究

国家自然科学基金

4+阅读 · 2015年12月31日

Survivin在低氧诱导喉癌淋巴管生成中的调控作用及其分子机制

国家自然科学基金

0+阅读 · 2015年12月31日

基于事前约束的XML关键字查询处理技术

国家自然科学基金

0+阅读 · 2014年12月31日

具有优异部分相关特性的参考信号序列设计及其应用

国家自然科学基金

0+阅读 · 2013年12月31日

基于网络知识和人工知识的图像语义建模方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于无标度网络及噪声诱导随机共振的低误码平底LDPC码编解码方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

铜螯合剂由抑制SOD1的活性调控胞内氧化还原信号转导

国家自然科学基金

0+阅读 · 2012年12月31日

基于神经网络的非线性系统合作学习辨识与控制

国家自然科学基金

0+阅读 · 2011年12月31日

强相关信道中的空时信号设计及检测关键技术研究

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Dependent Optics

Arxiv

0+阅读 · 2022年4月20日

A mixed finite element method with piecewise linear elements for the biharmonic equation on surfaces

Arxiv

0+阅读 · 2022年4月20日

Mention Memory: incorporating textual knowledge into Transformers through entity mention attention

Arxiv

0+阅读 · 2022年4月19日

Graph-based Approximate Message Passing Iterations

Arxiv

0+阅读 · 2022年4月19日

Making Progress Based on False Discoveries

Arxiv

0+阅读 · 2022年4月19日

Single-shot Embedding Dimension Search in Recommender System

Arxiv

0+阅读 · 2022年4月15日

Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering

Arxiv

16+阅读 · 2019年12月16日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

Question Answering over Freebase via Attentive RNN with Similarity Matrix based CNN

Arxiv

11+阅读 · 2018年5月27日

Constructing Narrative Event Evolutionary Graph for Script Event Prediction

Arxiv

11+阅读 · 2018年5月16日

大家都在搜

久别重逢话双塔

CMU博士论文

无人机集群

国防科技创新

软件无线电

论文浅尝 - ICLR2020 | 通过神经逻辑归纳学习有效地解释

微信扫码咨询专知VIP会员