This work demonstrates that, contrary to a common belief, using the objective with independence assumption for modelling the span probability $P(a_s,a_e) = P(a_s)P(a_e)$ of span starting at position $a_s$ and ending at position $a_e$ has adverse effects. Therefore we propose multiple approaches to modelling joint probability $P(a_s,a_e)$ directly. Among those, we propose a compound objective, composed from the joint probability while still keeping the objective with independence assumption as an auxiliary objective. We find that the compound objective is consistently superior or equal to other assumptions in exact match. Additionally, we identified common errors caused by the assumption of independence and manually checked the counterpart predictions, demonstrating the impact of the compound objective on the real examples. Our findings are supported via experiments with three extractive QA models (BIDAF, BERT, ALBERT) over six datasets and our code, individual results and manual analysis are available online.


翻译:这项工作表明,与一个共同的信念相反,利用目标和独立假设来模拟美元(a_s,a_e)=P(a_s)P(a_e)美元(a_e)美元(a_e)美元(美元)美元(美元)美元(美元)美元(美元)美元(美元)美元(美元)美元(美元)美元(美元)美元(美元)(美元)美元(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)美元(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)美元(美元)(美元)(美元)(美元)(美元)(美元)(美元)美元(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)(美元(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元)(美元(美元)(美元)(美元)(美元)(美元)(美元)(美元

0
下载
关闭预览

相关内容

专知会员服务
38+阅读 · 2021年8月20日
【CCL2020】基于深度学习的实体关系抽取研究综述
专知会员服务
51+阅读 · 2020年11月4日
【机器推理可解释性】Machine Reasoning Explainability
专知会员服务
34+阅读 · 2020年9月3日
FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
28+阅读 · 2019年10月18日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
已删除
将门创投
11+阅读 · 2019年4月26日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
自然语言处理顶会EMNLP2018接受论文列表!
专知
87+阅读 · 2018年8月26日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Arxiv
14+阅读 · 2020年12月17日
IQ-VQA: Intelligent Visual Question Answering
Arxiv
5+阅读 · 2020年7月8日
Arxiv
5+阅读 · 2019年8月22日
Arxiv
21+阅读 · 2019年3月25日
Learning to Focus when Ranking Answers
Arxiv
5+阅读 · 2018年8月8日
VIP会员
相关资讯
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
已删除
将门创投
11+阅读 · 2019年4月26日
逆强化学习-学习人先验的动机
CreateAMind
15+阅读 · 2019年1月18日
综述 | 事件抽取及推理 (下)
开放知识图谱
38+阅读 · 2019年1月14日
Unsupervised Learning via Meta-Learning
CreateAMind
41+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
自然语言处理顶会EMNLP2018接受论文列表!
专知
87+阅读 · 2018年8月26日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员