题目: Learning Contextualized Document Representations for Healthcare Answer Retrieval
摘要: 我们提出了 Contextual Discourse Vectors(CDV),这是一种分布式的文档表示,可用于从较长的医疗文档中有效地检索答案。我们的方法基于来自自由文本和医疗分类法的实体和aspects的结构化查询元组。我们的模型利用hierarchical LSTM层和多任务训练的双重编码器体系结构来编码临床实体的位置和aspects。我们使用连续表示来解决具有短延迟的查询,在句子级使用近似近邻搜索。我们将CDV模型应用于网上的9个英语公共卫生资源中检索连贯的回答段落,以解决患者和医疗专业人员的问题。由于没有适用于所有应用程序场景的端到端训练数据,我们使用来自Wikipedia的自监督数据来训练我们的模型。我们证明了我们的模型显著地优于几个最先进的healthcare passage ranking基准,并且能够适应不需要额外微调的异构领域。
地址: