论文浅尝 | 基于知识图谱和注意力图卷积神经网络的可解释零样本学习

2020 年 11 月 29 日 图与推荐

论文题目:Explainable Zero-shot Learning via Attentive Graph Convolutional Network and Knowledge Graphs

本文作者:耿玉霞,浙江大学在读博士,研究方向为知识图谱、零样本学习、可解释性

发表期刊:Semantic Web Journal (IF=3.524)

论文链接:http://www.semantic-web-journal.net/content/explainable-zero-shot-learning-attentive-graph-convolutional-network-and-knowledge-graphs-1




零样本学习(Zero-shot Learning, ZSL近年来引起了广泛关注,它可以将训练类别(Seen Classes)学习到的样本特征迁移到未出现在训练集中的新类别(Unseen Classes)上,有效减少了机器学习模型尤其是深度学习模型对标记数据的依赖。然而,目前大部分的ZSL方法是缺乏可解释性的,其模型预测的结果很容易被人质疑。因此,本文基于知识图谱和注意力图卷积神经网络提出了一个ZSL的可解释性框架,解释ZSL场景中样本特征的可迁移性,以此提升模型的可信赖度。

1 KG-based ZSL 可解释性框架说明图

本文提出了一个基于知识图谱的ZSL可解释框架,在使用知识图谱帮助ZSL特征迁移的同时,利用知识图谱中丰富的类别知识,对特征的可迁移性作出解释。框架如图1所示,主要包括两部分:注意力ZSL学习器Attentive ZSL Learner)和解释生成器Explanation Generator)。其中:

(1) 注意力ZSL学习器(Attentive ZSL Learner)主要负责ZSL中的特征迁移并为后续可解释性奠定基础。具体地,学习器首先利用知识图谱如WordNet建立seen classesunseen classes之间的语义关系,随后借助注意力图卷积神经网络(Attentive Graph Convolutional Network, AGCN)中的图卷积层(Graph Convolutional Layer)和注意力层(Attention Layer)将图结构的语义关系编码映射到样本空间并与类别对应的样本特征(即classifier)进行对齐。在训练阶段,学习器以seen classesclassifiers作监督,同时在图卷积层的聚合操作下进行特征迁移为unseen classes学习 classifiers。其中,注意力层为不同的类别尤其是seen classes学习不同的权重,最终,为每一个unseen class学习到在特征迁移过程中最有贡献的一些seen classes(即impressive seen classes, IMSCs),学习器的模型结构图如图2所示。
2 注意力ZSL学习器模型结构图

(2) 给定unseen class和它学习到的IMSCs,解释生成器(Explanation Generator)将它们分别对齐到外部知识图谱如Attribute GraphDBpedia中抽取类别间的共有知识,并生成自然语言的解释,以此验证IMSCs的特征迁移到该unseen class的合理性,对类别间特征的可迁移性作出解释。其中,考虑到不同知识图谱中知识类型的不同,本文设计了三种知识抽取的算法,如基于关联规则挖掘的属性抽取算法、基于三元组模式和SPARQL查询语句的三元组抽取算法、以及基于TextRank的关键词抽取算法分别抽取类别间共有的属性、三元组及关键词。对应地,本文为抽取到的不同类型的知识,设计了不同的模版,以自然语言句子的形式组织这些知识,最终生成人可以理解的解释,生成器的模型结构图如图3所示。

3 解释生成器模型结构图

最终,本文在AwAImageNet两个数据集以及更稠密的ImageNet*数据集上验证了ZSL学习器的效果,同时邀请志愿者对生成的解释在可信度和可读性两方面进行了评估,并给出了一些案例。基于生成的解释,本文对ZSL模型中特征迁移的情况进行了更深入的讨论。评估结果分别如下:

4 注意力ZSL学习器实验结果

5 注意力层权重学习可视化结果

6 可迁移性解释案例,包括:类别对应的图片、DBpedia实体,从不同的知识图谱中抽取的知识,以及最终生成的解释和人工评分结果


总而言之,这篇文章研究工作的主要贡献是:

(1) 首次提出了基于知识图谱的ZSL可解释框架,用于解释ZSL中特征的可迁移性;      

(2) 提出了一个新的、基于知识图谱和注意力图卷积神经网络的ZSL算法,它利用知识图谱建模类别间的语义关系,并且将样本特征由seen classes迁移到unseen classes,在标准数据集上提升ZSL模型效果的同时,为后面的可解释工作提供了基础;

(3) 提出了一个可解释生成器,包含多个知识抽取算法抽取外部知识图谱如领域特定的Attribute Graph和通用域的DBpedia中丰富的类别知识;本文同时设计了一系列模板用于将从外部知识图谱中抽取的知识组织为自然语言句子,增加生成解释的可阅读性。
(4) 实验表明,基于知识图谱和注意力图卷积神经网络的ZSL可解释性框架可有效地对ZSL模型中特征的可迁移性作出解释,同时一定程度上保证ZSL算法本身的预测能力。
如果对本文的工作感兴趣,欢迎大家阅读原文,也欢迎大家和我们交流。


   

浙江大学知识引擎实验室

登录查看更多
0

相关内容

零样本学习是AI识别方法之一。简单来说就是识别从未见过的数据类别,即训练的分类器不仅仅能够识别出训练集中已有的数据类别,还可以对于来自未见过的类别的数据进行区分。这是一个很有用的功能,使得计算机能够具有知识迁移的能力,并无需任何训练数据,很符合现实生活中海量类别的存在形式。
专知会员服务
37+阅读 · 2020年11月24日
【SIGIR 2020】 基于协同注意力机制的知识增强推荐模型
专知会员服务
89+阅读 · 2020年7月23日
注意力图神经网络的小样本学习
专知会员服务
191+阅读 · 2020年7月16日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
新加坡南洋理工最新37页《零样本学习综述》论文
专知会员服务
113+阅读 · 2019年10月20日
论文浅尝 | 利用问题生成提升知识图谱问答
开放知识图谱
20+阅读 · 2019年11月5日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
论文浅尝 | 为基于知识库的问答构建形式查询生成
开放知识图谱
10+阅读 · 2019年3月8日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
Arxiv
0+阅读 · 2021年1月27日
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning
Arxiv
3+阅读 · 2018年2月7日
Arxiv
10+阅读 · 2018年2月4日
VIP会员
相关VIP内容
相关资讯
论文浅尝 | 利用问题生成提升知识图谱问答
开放知识图谱
20+阅读 · 2019年11月5日
论文浅尝 | 基于属性嵌入的知识图谱间实体对齐方法
开放知识图谱
30+阅读 · 2019年3月26日
论文浅尝 | 为基于知识库的问答构建形式查询生成
开放知识图谱
10+阅读 · 2019年3月8日
基于注意力机制的图卷积网络
科技创新与创业
73+阅读 · 2017年11月8日
Top
微信扫码咨询专知VIP会员