The Coronavirus (COVID-19) pandemic has led to a rapidly growing 'infodemic' of health information online. This has motivated the need for accurate semantic search and retrieval of reliable COVID-19 information across millions of documents, in multiple languages. To address this challenge, this paper proposes a novel high precision and high recall neural Multistage BiCross encoder approach. It is a sequential three-stage ranking pipeline which uses the Okapi BM25 retrieval algorithm and transformer-based bi-encoder and cross-encoder to effectively rank the documents with respect to the given query. We present experimental results from our participation in the Multilingual Information Access (MLIA) shared task on COVID-19 multilingual semantic search. The independently evaluated MLIA results validate our approach and demonstrate that it outperforms other state-of-the-art approaches according to nearly all evaluation metrics in cases of both monolingual and bilingual runs.


翻译:Corona病毒(COVID-19)大流行导致在线健康信息“信息”迅速增长,因此,需要以多种语言对数百万份文件的可靠COVID-19信息进行准确的语系搜索和检索。为了应对这一挑战,本文件建议采用新的高精度和高回声神经多阶段双晶体编码器方法。这是一个连续的三级输油管,利用Okapi BM25检索算法和基于变压器的双编码器和跨编码器对文件进行有效排序。我们介绍了参加多语言信息存取(MLIA)的实验结果,分享了COVID-19多语言语种语义搜索任务。独立评估的MLIA结果验证了我们的方法,并表明,根据单一语言和双语运行的几乎所有评价指标,它优于其他最先进的方法。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
专知会员服务
30+阅读 · 2021年7月30日
深度学习图像检索(CBIR): 十年之大综述
专知会员服务
47+阅读 · 2020年12月5日
最新《Transformers模型》教程,64页ppt
专知会员服务
311+阅读 · 2020年11月26日
轻量级神经网络架构综述
专知会员服务
97+阅读 · 2020年4月29日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
深度学习医学图像分析文献集
机器学习研究会
19+阅读 · 2017年10月13日
论文共读 | Attention is All You Need
黑龙江大学自然语言处理实验室
14+阅读 · 2017年9月7日
已删除
将门创投
5+阅读 · 2017年8月15日
Arxiv
0+阅读 · 2021年10月14日
Arxiv
3+阅读 · 2018年8月27日
Arxiv
3+阅读 · 2017年12月18日
VIP会员
相关资讯
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
分布式并行架构Ray介绍
CreateAMind
9+阅读 · 2019年8月9日
深度自进化聚类:Deep Self-Evolution Clustering
我爱读PAMI
15+阅读 · 2019年4月13日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
深度学习医学图像分析文献集
机器学习研究会
19+阅读 · 2017年10月13日
论文共读 | Attention is All You Need
黑龙江大学自然语言处理实验室
14+阅读 · 2017年9月7日
已删除
将门创投
5+阅读 · 2017年8月15日
Top
微信扫码咨询专知VIP会员