主题分类法的自动构建可以使许多应用程序受益,包括web搜索、推荐和知识发现。自动分类构建的主要优点之一是能够捕获特定于语料库的信息并适应不同的场景。为了更好地反映语料库的特点,我们考虑了文档的元数据,将语料库看作是一个文本丰富的网络。在本文中,我们提出了NetTaxo,这是一个新的自动主题分类构建框架,它超越了现有的范式,允许文本数据与网络结构协作。具体来说,我们从文本和网络作为上下文学习术语嵌入。采用网络图形来捕获适当的网络上下文。我们对motifs进行实例级选择,该选择根据每个分类节点的粒度和语义进一步细化术语嵌入。然后应用集群来获得分类法节点下的子主题。在两个真实数据集上的大量实验证明了我们的方法优于最先进的,并进一步验证了实例级基序选择的有效性和重要性。

成为VIP会员查看完整内容
39

相关内容

分类学是分类的实践和科学。Wikipedia类别说明了一种分类法,可以通过自动方式提取Wikipedia类别的完整分类法。截至2009年,已经证明,可以使用人工构建的分类法(例如像WordNet这样的计算词典的分类法)来改进和重组Wikipedia类别分类法。 从广义上讲,分类法还适用于除父子层次结构以外的关系方案,例如网络结构。然后分类法可能包括有多父母的单身孩子,例如,“汽车”可能与父母双方一起出现“车辆”和“钢结构”;但是对某些人而言,这仅意味着“汽车”是几种不同分类法的一部分。分类法也可能只是将事物组织成组,或者是按字母顺序排列的列表;但是在这里,术语词汇更合适。在知识管理中的当前用法中,分类法被认为比本体论窄,因为本体论应用了各种各样的关系类型。 在数学上,分层分类法是给定对象集的分类树结构。该结构的顶部是适用于所有对象的单个分类,即根节点。此根下的节点是更具体的分类,适用于总分类对象集的子集。推理的进展从一般到更具体。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
42+阅读 · 2020年7月2日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
29+阅读 · 2020年4月12日
必读的7篇 IJCAI 2019【图神经网络(GNN)】相关论文
专知会员服务
91+阅读 · 2020年1月10日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
论文浅尝 | 基于知识图谱中图卷积神经网络的推荐系统
开放知识图谱
67+阅读 · 2019年8月27日
KDD 2019论文解读:异构信息网络上的对抗生成学习
云栖社区
22+阅读 · 2019年8月21日
关系推理:基于表示学习和语义要素
计算机研究与发展
18+阅读 · 2017年8月22日
Arxiv
15+阅读 · 2019年6月25日
Arxiv
3+阅读 · 2019年3月1日
Arxiv
3+阅读 · 2018年4月5日
VIP会员
微信扫码咨询专知VIP会员