题目: Learning Contextualized Document Representations for Healthcare Answer Retrieval

摘要: 我们提出了 Contextual Discourse Vectors(CDV),这是一种分布式的文档表示,可用于从较长的医疗文档中有效地检索答案。我们的方法基于来自自由文本和医疗分类法的实体和aspects的结构化查询元组。我们的模型利用hierarchical LSTM层和多任务训练的双重编码器体系结构来编码临床实体的位置和aspects。我们使用连续表示来解决具有短延迟的查询,在句子级使用近似近邻搜索。我们将CDV模型应用于网上的9个英语公共卫生资源中检索连贯的回答段落,以解决患者和医疗专业人员的问题。由于没有适用于所有应用程序场景的端到端训练数据,我们使用来自Wikipedia的自监督数据来训练我们的模型。我们证明了我们的模型显著地优于几个最先进的healthcare passage ranking基准,并且能够适应不需要额外微调的异构领域。

地址:

https://arxiv.org/abs/2002.00835

成为VIP会员查看完整内容
36

相关内容

【SIGIR2020】用于冷启动推荐的内容感知神经哈希
专知会员服务
22+阅读 · 2020年6月2日
17篇知识图谱Knowledge Graphs论文 @AAAI2020
专知会员服务
171+阅读 · 2020年2月13日
FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
28+阅读 · 2019年10月18日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
论文浅尝 | 基于复杂查询图编码的知识库问答
开放知识图谱
17+阅读 · 2019年7月22日
跨多个异构数据源的实体对齐
FCS
15+阅读 · 2019年3月13日
基于Wikipedia知识源的开放领域问答系统(读书报告)
科技创新与创业
9+阅读 · 2017年11月7日
Arxiv
9+阅读 · 2019年11月6日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Learning to Focus when Ranking Answers
Arxiv
5+阅读 · 2018年8月8日
Arxiv
4+阅读 · 2017年10月30日
VIP会员
微信扫码咨询专知VIP会员