论文浅尝 | 使用变分推理做KBQA - 专知

会员服务 ·

1

论文浅尝 | 使用变分推理做KBQA

2018 年 4 月 15 日 开放知识图谱 王梁

Yuyu Zhang, Hanjun Dai, Zornitsa Kozareva, Alexander J.Smola, and Le Song: Variational Reasoning for Question Answering with KnowledgeGraph. AAAI 2018

链接：https://arxiv.org/abs/1709.04071

本文提出了一个可端到端训练的 KBQA 框架，可以在模型内部完成实体链接，并且在找到用户 query 的 topic entity 后，可以通过变分推断完成多跳推理，找到答案。本文的框架将实体链接得到的实体 y 看做是隐变量，通过求解包含隐变量的极大似然函数得到模型参数。

具体而言，第一步，给定用户 query，计算出知识库中每个实体可能是 topic entity 的概率。做法是用一个神经网络得到 query 的向量表示，然后做 softmax 多分类即可。由于这里并没有使用传统的类似于字符串匹配的方式做实体链接，因此用户 query 的形式比较自由，可以使文本的，也可以是语音的。

第二步，给定了问题和一个链接到的实体 y，要找到在 y 的邻域 (T 跳之内，T 是一个超参数，文中为3)内每个实体可能是 query 答案的概率。文中的做法是给从y到a的所有路径构成的子图 G_(y→a) 训练一个向量表示 g(G_(y→a))，那么如果给从y到其邻域内的每个实体的路径都训练了一个向量表示，就可以用如下方式计算出所有实体可能是答案的概率。

如何计算 g(G_(y→a)) 是本文中体现出推理的地方。本文计算路径的向量表示采用了传播式的方法，即假设 b 是从 y 到 a 的路径上 a 的所有父节点的集合，那么计算 g(G_(y→a))，只需要利用到所有的 g(G_(y→b) ) 即可。

以上虽然解决了极大似然函数 p_θ1(y|q_i) 中和 p_θ2(a_i |y,q_i) 的求解问题，但是如果要优化这个包含隐变量的极大似然函数，由于后验概率 p(y|q_i,a_i) 无法求解，因此无法直接使用EM算法。故本文采用变分推断的方法，由神经网络训练出另一个分布 Q_φ(y│q_i,a_i) 来近似代替。由于计算 Q_φ(y│q_i,a_i) 和计算p_θ2 (a_i |y,q_i) 的过程刚好相反，因此可以同样使用前面传播式的方法计算 g(G_(a→y))，只是方向相反。

本文框架的总体结构为：

最后，本文采用了 REINFORCE 算法来求解参数，具体而言，是用变分推断近似替代后的新的损失函数为

求梯度得到

然后迭代至收敛即可。

实验结果：在本文新发布的 KBQA 数据集 Meta QA 上相比对照模型提升较为明显，尤其是要求多跳推理的问题。另外，在问题的形式是语音，机器翻译后的结果，以及训练时不给定标注好的 topic entity 的情况下，都有较大的提升。

笔记整理：王梁，浙江大学硕士，研究方向为自然语言处理，知识图谱。

OpenKG.CN

中文开放知识图谱（简称OpenKG.CN）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

转载须知：转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题，请注明原标题。

点击阅读原文，进入 OpenKG 博客。

登录查看更多

13

相关内容

entity

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

专知会员服务

42+阅读 · 2020年7月1日

近期必读的六篇顶会 ICML 2020【图神经网络 (GNN) 】相关论文

近期必读的六篇顶会 ICML 2020【图神经网络 (GNN) 】相关论文

专知会员服务

143+阅读 · 2020年6月23日

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

Query2box: 使用盒嵌入对向量空间中的知识图谱进行推理，Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings

专知会员服务

46+阅读 · 2020年5月11日

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

专知会员服务

105+阅读 · 2020年2月20日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

专知会员服务

136+阅读 · 2019年11月7日

论文浅尝 | 基于复杂查询图编码的知识库问答

论文浅尝 | 基于复杂查询图编码的知识库问答

开放知识图谱

17+阅读 · 2019年7月22日

论文浅尝 | 面向单关系事实问题的中文问答模型

论文浅尝 | 面向单关系事实问题的中文问答模型

开放知识图谱

28+阅读 · 2019年2月11日

基于知识图谱的问答系统入门—NLPCC2016KBQA数据集

基于知识图谱的问答系统入门—NLPCC2016KBQA数据集

PaperWeekly

70+阅读 · 2019年1月8日

论文浅尝 | 在生成式多跳机器阅读任务中引入外部常识知识

论文浅尝 | 在生成式多跳机器阅读任务中引入外部常识知识

开放知识图谱

10+阅读 · 2018年10月19日

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

开放知识图谱

14+阅读 · 2018年7月5日

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

开放知识图谱

21+阅读 · 2018年5月24日

论文浅尝 | 基于知识图的问答变分推理

论文浅尝 | 基于知识图的问答变分推理

开放知识图谱

7+阅读 · 2018年5月6日

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

开放知识图谱

11+阅读 · 2018年4月25日

论文浅尝 | 基于Freebase的问答研究

论文浅尝 | 基于Freebase的问答研究

开放知识图谱

5+阅读 · 2018年3月26日

揭开知识库问答KB-QA的面纱3·向量建模篇

揭开知识库问答KB-QA的面纱3·向量建模篇

PaperWeekly

8+阅读 · 2017年8月23日

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

Arxiv

5+阅读 · 2018年9月25日

Commonsense for Generative Multi-Hop Question Answering Tasks

Arxiv

4+阅读 · 2018年9月17日

Convolutional 2D Knowledge Graph Embeddings

Arxiv

4+阅读 · 2018年7月4日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

Variational Knowledge Graph Reasoning

Arxiv

8+阅读 · 2018年3月17日

Efficient Parallel Translating Embedding For Knowledge Graphs

Arxiv

9+阅读 · 2018年1月9日

Analysis of Wikipedia-based Corpora for Question Answering

Arxiv

7+阅读 · 2018年1月6日

Knowledge-based Word Sense Disambiguation using Topic Models

Arxiv

5+阅读 · 2018年1月5日

Depth-Adaptive Computational Policies for Efficient Visual Tracking

Arxiv

8+阅读 · 2018年1月1日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日

VIP会员

相关主题

相关VIP内容

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

【翻译-ACL2020】使用知识库嵌入改进知识图上的多跳问答

专知会员服务

70+阅读 · 2020年7月3日

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

【ACL20-哈工大】基于图注意力网络的多粒度机器阅读理解文档建模

专知会员服务

42+阅读 · 2020年7月1日

近期必读的六篇顶会 ICML 2020【图神经网络 (GNN) 】相关论文

近期必读的六篇顶会 ICML 2020【图神经网络 (GNN) 】相关论文

专知会员服务

143+阅读 · 2020年6月23日

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

Query2box: 使用盒嵌入对向量空间中的知识图谱进行推理，Query2box: Reasoning over Knowledge Graphs in Vector Space Using Box Embeddings

专知会员服务

46+阅读 · 2020年5月11日

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全

专知会员服务

105+阅读 · 2020年2月20日

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020

专知会员服务

134+阅读 · 2020年2月13日

17篇知识图谱Knowledge Graphs论文 @AAAI2020

17篇知识图谱Knowledge Graphs论文 @AAAI2020

专知会员服务

172+阅读 · 2020年2月13日

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

【CCF优秀博士学位论文奖-2019】面向多种学习任务的深度生成模型，清华大学李崇轩

专知会员服务

49+阅读 · 2019年11月8日

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

【清华大学博士论文】大规模结构化知识的表示学习、自动获取与计算应用，林衍凯

专知会员服务

136+阅读 · 2019年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

《俄乌战争背景下俄罗斯的战略性海军分析（2022-2025年）》最新100页报告

【斯坦福博士论文】数据、决策与依赖：构建可信人工智能的挑战

人工智能时代背景下的未来海战

接触战中的无人机优势：美军旅级部队面临的小型无人机系统挑战与调整

相关资讯

论文浅尝 | 基于复杂查询图编码的知识库问答

论文浅尝 | 基于复杂查询图编码的知识库问答

开放知识图谱

17+阅读 · 2019年7月22日

论文浅尝 | 面向单关系事实问题的中文问答模型

论文浅尝 | 面向单关系事实问题的中文问答模型

开放知识图谱

28+阅读 · 2019年2月11日

基于知识图谱的问答系统入门—NLPCC2016KBQA数据集

基于知识图谱的问答系统入门—NLPCC2016KBQA数据集

PaperWeekly

70+阅读 · 2019年1月8日

论文浅尝 | 在生成式多跳机器阅读任务中引入外部常识知识

论文浅尝 | 在生成式多跳机器阅读任务中引入外部常识知识

开放知识图谱

10+阅读 · 2018年10月19日

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

论文浅尝 | 用可微的逻辑规则学习完成知识库推理

开放知识图谱

14+阅读 · 2018年7月5日

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

论文浅尝 | 用增强学习进行推理：问答与知识库完善（KBC）

开放知识图谱

21+阅读 · 2018年5月24日

论文浅尝 | 基于知识图的问答变分推理

论文浅尝 | 基于知识图的问答变分推理

开放知识图谱

7+阅读 · 2018年5月6日

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

开放知识图谱

11+阅读 · 2018年4月25日

论文浅尝 | 基于Freebase的问答研究

论文浅尝 | 基于Freebase的问答研究

开放知识图谱

5+阅读 · 2018年3月26日

揭开知识库问答KB-QA的面纱3·向量建模篇

揭开知识库问答KB-QA的面纱3·向量建模篇

PaperWeekly

8+阅读 · 2017年8月23日

相关论文

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering

Arxiv

5+阅读 · 2018年9月25日

Commonsense for Generative Multi-Hop Question Answering Tasks

Arxiv

4+阅读 · 2018年9月17日

Convolutional 2D Knowledge Graph Embeddings

Arxiv

4+阅读 · 2018年7月4日

QA4IE: A Question Answering based Framework for Information Extraction

Arxiv

4+阅读 · 2018年4月10日

Variational Knowledge Graph Reasoning

Arxiv

8+阅读 · 2018年3月17日

Efficient Parallel Translating Embedding For Knowledge Graphs

Arxiv

9+阅读 · 2018年1月9日

Analysis of Wikipedia-based Corpora for Question Answering

Arxiv

7+阅读 · 2018年1月6日

Knowledge-based Word Sense Disambiguation using Topic Models

Arxiv

5+阅读 · 2018年1月5日

Depth-Adaptive Computational Policies for Efficient Visual Tracking

Arxiv

8+阅读 · 2018年1月1日

VQA: Visual Question Answering

Arxiv

9+阅读 · 2016年10月27日

大家都在搜

大型语言模型

蓝牙安全攻防

精排模型-从MLP到行为序列：DIN、DIEN、MIMN、SIM、DSIN

微信扫码咨询专知VIP会员