普林斯顿大学陈丹琦和 Facebook的Danqi Chen在ACL2020的tutorial-开放域问答
自然语言处理领域顶级会议 ACL 2020 将于 7 月 5 日至 10 日在线上举行。本届 ACL 共接收论文 779 篇,接收率 25.2%。
本教程提供了关于开放域问答(QA)方面前沿研究的全面概述,QA的任务是使用大量不同主题的文档集合回答问题。我们将首先给出一个简要的历史背景,讨论研究问题的基本设置和核心技术挑战,然后描述具有共同评价指标和基准的现代数据集。然后,重点将转向为开放领域QA提出的最新模型,包括两阶段检索-读者方法、密集检索和端到端训练,以及无检索方法。最后,我们将介绍一些使用文本和大型知识库的混合方法,并以一些重要的开放问题结束本教程。我们希望本教程不仅能帮助读者获得最新的知识,还能提供新的视角,以促进下一阶段开放领域QA研究的进展。