点击上方蓝字
关注我们
导读
实体排序旨在自动计算实体在文档集合中的相对重要性。大多数现有实体排序的研究旨在从网络语料库中检索基于用户查询的实体排序,实体排序由用户查询和实体的上下文之间的相关性决定。 然而,实体可以根据它们在文档集合中的相对重要性直接排序,而独立于任何用户查询。 本文提出一种基于文档集合的实体排序图算法NERank+。 给定一个文档集合作为输入,NERank +首先构造一个图模型,名为主题三部图(TTG),这一个三部图由文档,主题和实体三种节点组成。 基于上述TTG模型,本文首先利用TextRank排序函数来计算实体的先验排序值,并且提出三种主题质量度量值来计算主题的先验排序值。 在此基础上,我们提出了基于图模型的元路径约束随机游走算法,将实体和主题的先验排序值传播至所有节点。 我们在多个真实数据集上对NERank+进行评测,并将其与基线方法进行比较,实验结果印证了NERank+算法的准确性。
文章精要
请长按下方二维码识别,阅读该文。
相关文章推荐:
Frontiers of Computer Science
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社出版、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为李未院士,执行主编为熊璋教授和周志华教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”。
长按二维码关注Frontiers of Computer Science公众号