【WWW2020-推荐】医疗领域答案检索，基于上下文文档表示学习- 专知

【WWW2020-推荐】医疗领域答案检索，基于上下文文档表示学习

题目： Learning Contextualized Document Representations for Healthcare Answer Retrieval

摘要： 我们提出了 Contextual Discourse Vectors(CDV)，这是一种分布式的文档表示，可用于从较长的医疗文档中有效地检索答案。我们的方法基于来自自由文本和医疗分类法的实体和aspects的结构化查询元组。我们的模型利用hierarchical LSTM层和多任务训练的双重编码器体系结构来编码临床实体的位置和aspects。我们使用连续表示来解决具有短延迟的查询，在句子级使用近似近邻搜索。我们将CDV模型应用于网上的9个英语公共卫生资源中检索连贯的回答段落，以解决患者和医疗专业人员的问题。由于没有适用于所有应用程序场景的端到端训练数据，我们使用来自Wikipedia的自监督数据来训练我们的模型。我们证明了我们的模型显著地优于几个最先进的healthcare passage ranking基准，并且能够适应不需要额外微调的异构领域。

地址：

https://arxiv.org/abs/2002.00835