Answering questions about why characters perform certain actions is central to understanding and reasoning about narratives. Despite recent progress in QA, it is not clear if existing models have the ability to answer "why" questions that may require commonsense knowledge external to the input narrative. In this work, we introduce TellMeWhy, a new crowd-sourced dataset that consists of more than 30k questions and free-form answers concerning why characters in short narratives perform the actions described. For a third of this dataset, the answers are not present within the narrative. Given the limitations of automated evaluation for this task, we also present a systematized human evaluation interface for this dataset. Our evaluation of state-of-the-art models show that they are far below human performance on answering such questions. They are especially worse on questions whose answers are external to the narrative, thus providing a challenge for future QA and narrative understanding research.


翻译:回答为什么字符执行某些行动的问题,对于理解和推理叙事至关重要。尽管质量评估最近有所进展,但尚不清楚现有模型是否有能力回答“为什么”问题,这些问题可能需要投入叙事的外部常识知识。在这项工作中,我们介绍了“TellMehary”,这是一个由30公里以上的问题组成的新的众源数据集,对短叙事中字符为何执行所述行动的问题提供了自由解答。对于三分之一的这一数据集,答案不在叙述中。鉴于对这项任务的自动评估的局限性,我们还为这一数据集提出了一个系统化的人类评价界面。我们对最新模型的评估表明,这些模型远远低于人类在回答此类问题时的表现。对于那些与叙述无关的问题来说,它们尤其糟糕,因此对未来质量保证和叙述理解研究提出了挑战。

0
下载
关闭预览

相关内容

【如何做研究】How to research ,22页ppt
专知会员服务
109+阅读 · 2021年4月17日
专知会员服务
18+阅读 · 2020年9月6日
【Manning新书】现代Java实战,592页pdf
专知会员服务
100+阅读 · 2020年5月22日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
154+阅读 · 2019年10月12日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
论文浅尝 | Question Answering over Freebase
开放知识图谱
18+阅读 · 2018年1月9日
推荐|Andrew Ng计算机视觉教程总结
全球人工智能
3+阅读 · 2017年11月23日
已删除
将门创投
5+阅读 · 2017年11月20日
【推荐】视频目标分割基础
机器学习研究会
9+阅读 · 2017年9月19日
CoQA: A Conversational Question Answering Challenge
Arxiv
7+阅读 · 2018年8月21日
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
Arxiv
9+阅读 · 2016年10月27日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员