Multi-hop reasoning has been widely studied in recent years to obtain more interpretable link prediction. However, we find in experiments that many paths given by these models are actually unreasonable, while little works have been done on interpretability evaluation for them. In this paper, we propose a unified framework to quantitatively evaluate the interpretability of multi-hop reasoning models so as to advance their development. In specific, we define three metrics including path recall, local interpretability, and global interpretability for evaluation, and design an approximate strategy to calculate them using the interpretability scores of rules. Furthermore, we manually annotate all possible rules and establish a Benchmark to detect the Interpretability of Multi-hop Reasoning (BIMR). In experiments, we run nine baselines on our benchmark. The experimental results show that the interpretability of current multi-hop reasoning models is less satisfactory and is still far from the upper bound given by our benchmark. Moreover, the rule-based models outperform the multi-hop reasoning models in terms of performance and interpretability, which points to a direction for future research, i.e., we should investigate how to better incorporate rule information into the multi-hop reasoning model. Our codes and datasets can be obtained from https://github.com/THU-KEG/BIMR.


翻译:近些年来,我们广泛研究了多希望推理,以获得更可解释的联系预测。然而,我们从实验中发现,这些模型提供的许多路径实际上都是不合理的,虽然在可解释性评价方面没有做多少工作。在本文件中,我们提议了一个统一框架,对多希望推理模型的可解释性进行定量评估,以推动其发展。具体地说,我们界定了三个尺度,包括路径回顾、可当地解释性和评价的全球可解释性,并设计了使用可解释性规则分数来计算这些模型的粗略战略。此外,我们人工说明所有可能的规则,并建立一个基准,以发现多希望解释性(BIMR)的可解释性。在实验中,我们运行了9个基准基线。实验结果显示,目前多希望推理模型的可解释性不那么好,而且距离我们基准所设定的上限还远。此外,基于规则的模型在性能和可解释性方面超越多希望推理模型,这指出了未来研究的方向,也就是说,我们应该研究如何更好地将规则信息纳入多希望理论模型中。我们的数据和AGIBIS/AGIS可以获取的数据。

0
下载
关闭预览

相关内容

【机器推理可解释性】Machine Reasoning Explainability
专知会员服务
34+阅读 · 2020年9月3日
《可解释的机器学习-interpretable-ml》238页pdf
专知会员服务
200+阅读 · 2020年2月24日
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
【资源】问答阅读理解资源列表
专知
3+阅读 · 2020年7月25日
AI可解释性文献列表
专知
42+阅读 · 2019年10月7日
Hierarchically Structured Meta-learning
CreateAMind
24+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
王嘉陵·决策思维30讲
商业人物
6+阅读 · 2018年10月17日
未来人类会关注可解释性吗?
待字闺中
5+阅读 · 2018年8月9日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
已删除
将门创投
3+阅读 · 2017年11月3日
【推荐】卷积神经网络类间不平衡问题系统研究
机器学习研究会
6+阅读 · 2017年10月18日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Reasoning on Knowledge Graphs with Debate Dynamics
Arxiv
14+阅读 · 2020年1月2日
Arxiv
15+阅读 · 2018年4月5日
VIP会员
相关VIP内容
【机器推理可解释性】Machine Reasoning Explainability
专知会员服务
34+阅读 · 2020年9月3日
《可解释的机器学习-interpretable-ml》238页pdf
专知会员服务
200+阅读 · 2020年2月24日
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
相关资讯
【资源】问答阅读理解资源列表
专知
3+阅读 · 2020年7月25日
AI可解释性文献列表
专知
42+阅读 · 2019年10月7日
Hierarchically Structured Meta-learning
CreateAMind
24+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
王嘉陵·决策思维30讲
商业人物
6+阅读 · 2018年10月17日
未来人类会关注可解释性吗?
待字闺中
5+阅读 · 2018年8月9日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
已删除
将门创投
3+阅读 · 2017年11月3日
【推荐】卷积神经网络类间不平衡问题系统研究
机器学习研究会
6+阅读 · 2017年10月18日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
Top
微信扫码咨询专知VIP会员