论文浅尝 | 用对抗学习做知识表示(NAACL2018)

2019 年 1 月 2 日 开放知识图谱

论文链接:https://arxiv.org/pdf/1711.04071.pdf

代码链接:https:// github.com/cai-lw/KBGAN

 

本文针对在生成负样本时有大部分负样本可以很好地和正样本区分开,对训练的影响不大,提出了使用生成对抗网络(GANs)的方法,解决生成的负样本不够好的问题。它是第一个考虑用对抗学习生成负样本的工作。

设计模型时,本文把基于概率的log损失的表示学习模型作为生成器得到更好的负样本质量;使用基于距离的边缘损失的表示学习模型作为判别器得到表示学习的最终结果。由于生成器的步骤离散导致不能直接运用梯度反向传播,对此作者使用了一步强化学习设置,使用一个降低方差的强化方法实现这个目标。

方法上本文先列举了两种损失函数:

(1)Margin loss function:

(2)Log-softmax loss function:

再通过分析均匀负采样的缺陷:等概率替换会使容易区分的负样本对学习的贡献较小,会让模型学到一些简单的特征,而不是尽可能去理解语义,对此作者认为使用log损失函数从替换实体得到的所有负样本中筛选出更有用的负样本很有必要。

最后通过模型图我们发现论文使用softmax概率模型为生成器G,通过概率分布进行采样;判别器部分D接收生成的负样本和ground truth triple并计算分数;G通过梯度策略最小化生成的负三元组的分数,D通过梯度下降最小化正样本和负样本的边缘损失。

假设生成器得到的负样本概率分布为

1)那么判别器的score function

2)生成器的目标是最大化负距离的期望为

由于 R_G 是一个离散采样步骤得不到梯度,本文借鉴了其他论文提到的梯度策略理论获取梯度进行优化【这一部分论文把这个过程对标到强化学习,认为生成器是agent,判别器是environment (h, r, t) state,负样本概率分布 P_G policy(h’, r, t’)action,-f_D(h’, r, t’)reward,认为是 one-step RL 是在每个 epochactions 不会影响 state,但每个 action 后会重新从一个不相关的state开始;为减小算法方差而不引入新参数,作者从 reward 减掉一个常量】

概率分布的计算使用以下公式,f_G(h, r, t)为生成器的scorefunction

算法伪代码如下:

实验部分

论文选用的数据集有FB15K-237, WN18, WN18RR,结果发现使用 DISMULTCOMPLEX 作为生成器都不会对性能有较大影响,且 TransD, TransEKBGAN 中很明显优于它们的 baseline

笔记整理:李娟,浙江大学直博生,研究方向为表示学习.



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

登录查看更多
5

相关内容

【斯坦福大学-论文】实体上下文关系路径的知识图谱补全
【AAAI2020知识图谱论文概述】Knowledge Graphs @ AAAI 2020
专知会员服务
133+阅读 · 2020年2月13日
17篇知识图谱Knowledge Graphs论文 @AAAI2020
专知会员服务
171+阅读 · 2020年2月13日
论文浅尝 | 知识图谱三元组置信度的度量
开放知识图谱
24+阅读 · 2019年5月16日
论文浅尝 | TuckER:基于张量分解的知识图谱补全
开放知识图谱
34+阅读 · 2019年3月17日
论文浅尝 | 基于深度强化学习的远程监督数据集的降噪
开放知识图谱
29+阅读 · 2019年1月17日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
论文浅尝 | 基于局内去噪和迁移学习的关系抽取
开放知识图谱
16+阅读 · 2018年12月2日
论文浅尝 | 用可微的逻辑规则学习完成知识库推理
开放知识图谱
14+阅读 · 2018年7月5日
论文浅尝 | 基于开放世界的知识图谱补全
开放知识图谱
11+阅读 · 2018年7月3日
论文浅尝 | 基于知识图的问答变分推理
开放知识图谱
7+阅读 · 2018年5月6日
论文浅尝 | 使用变分推理做KBQA
开放知识图谱
13+阅读 · 2018年4月15日
Adversarial Mutual Information for Text Generation
Arxiv
13+阅读 · 2020年6月30日
Arxiv
3+阅读 · 2019年10月31日
Arxiv
15+阅读 · 2019年9月11日
Arxiv
9+阅读 · 2018年10月18日
VIP会员
相关资讯
论文浅尝 | 知识图谱三元组置信度的度量
开放知识图谱
24+阅读 · 2019年5月16日
论文浅尝 | TuckER:基于张量分解的知识图谱补全
开放知识图谱
34+阅读 · 2019年3月17日
论文浅尝 | 基于深度强化学习的远程监督数据集的降噪
开放知识图谱
29+阅读 · 2019年1月17日
论文浅尝 | 基于知识库的类型实体和关系的联合抽取
开放知识图谱
35+阅读 · 2018年12月9日
论文浅尝 | 基于局内去噪和迁移学习的关系抽取
开放知识图谱
16+阅读 · 2018年12月2日
论文浅尝 | 用可微的逻辑规则学习完成知识库推理
开放知识图谱
14+阅读 · 2018年7月5日
论文浅尝 | 基于开放世界的知识图谱补全
开放知识图谱
11+阅读 · 2018年7月3日
论文浅尝 | 基于知识图的问答变分推理
开放知识图谱
7+阅读 · 2018年5月6日
论文浅尝 | 使用变分推理做KBQA
开放知识图谱
13+阅读 · 2018年4月15日
Top
微信扫码咨询专知VIP会员