题目: L2R2: Leveraging Ranking for Abductive Reasoning

摘要:

外展自然语言推理任务(αNLI)提出了评价诱导的学习系统的推理能力。对于αNLI任务,两个观测给出最合理的假设被要求选出的候选。现有的方法简单地将其表示为一个分类问题,因此在训练过程中使用了交叉熵对数损失目标。然而,区分真假并不能衡量一个假设的可信性,因为所有的假设都有发生的机会,只有概率是不同的。为了填补这个空白,我们切换到一个排序的角度,按照假设的可信性排序。在此基础上,提出了一种新的基于学习排序的L2R2方法。首先,将训练样本重新组织成一个排序形式,将两个观察值及其假设分别作为查询和一组候选文档。然后,得到一个ESIM模型或预先训练好的语言模型,如BERT或RoBERTa,作为打分函数。最后,对于训练,排序任务的损失函数可以是成对的,也可以是列表式的。在ART数据集上的实验结果达到了公共排行榜上的最高水平。

成为VIP会员查看完整内容
10

相关内容

[ICML2020]层次间消息传递的分子图学习
专知会员服务
33+阅读 · 2020年6月27日
专知会员服务
85+阅读 · 2020年1月20日
生成式对抗网络GAN异常检测
专知会员服务
114+阅读 · 2019年10月13日
论文浅尝 | XQA:一个跨语言开放域问答数据集
开放知识图谱
25+阅读 · 2019年9月11日
【清华大学】元知识图谱推理
专知
127+阅读 · 2019年9月2日
赛尔原创 | ACL 2019 检索增强的对抗式回复生成
哈工大SCIR
12+阅读 · 2019年7月4日
赛尔推荐 | 第20期
哈工大SCIR
4+阅读 · 2018年5月30日
论文浅尝 | 使用变分推理做KBQA
开放知识图谱
12+阅读 · 2018年4月15日
论文浅尝 | Improved Neural Relation Detection for KBQA
开放知识图谱
13+阅读 · 2018年1月21日
论文浅尝 | Leveraging Knowledge Bases in LSTMs
开放知识图谱
6+阅读 · 2017年12月8日
Arxiv
6+阅读 · 2018年3月28日
Arxiv
3+阅读 · 2018年3月22日
Arxiv
7+阅读 · 2018年3月17日
VIP会员
相关资讯
论文浅尝 | XQA:一个跨语言开放域问答数据集
开放知识图谱
25+阅读 · 2019年9月11日
【清华大学】元知识图谱推理
专知
127+阅读 · 2019年9月2日
赛尔原创 | ACL 2019 检索增强的对抗式回复生成
哈工大SCIR
12+阅读 · 2019年7月4日
赛尔推荐 | 第20期
哈工大SCIR
4+阅读 · 2018年5月30日
论文浅尝 | 使用变分推理做KBQA
开放知识图谱
12+阅读 · 2018年4月15日
论文浅尝 | Improved Neural Relation Detection for KBQA
开放知识图谱
13+阅读 · 2018年1月21日
论文浅尝 | Leveraging Knowledge Bases in LSTMs
开放知识图谱
6+阅读 · 2017年12月8日
微信扫码咨询专知VIP会员