【WWW2021】大规模层次结构中的元数据感知文本分类

2021 年 2 月 17 日 专知


多标签文本分类涉及到从标签集中为每个给定文档分配其最相关标签的问题。通常,给定文档的元数据和标签的层次结构在实际应用是可用的。然而,现有的研究大多只关注于文本信息的建模,也有少数尝试使用元数据或层次信号,但没有同时使用它们。在本文中,我们通过在一个大的标签层次结构(例如,有成千上万个标签)中形式化元数据感知文本分类的问题来弥补这一差距。为了解决这个问题,我们提出了MATCH解决方案——一个利用元数据和层次结构信息的端到端框架。为了整合元数据,我们预先训练文本和元数据在同一空间的嵌入,并利用完全连接的注意力来捕捉它们之间的相互关系。为了充分利用标签层次结构,我们提出了不同的方法来规整每个子标签的参数和输出概率。在两个具有大规模标签层次的大规模文本数据集上进行的大量实验证明了在最先进的深度学习基线上匹配的有效性。


https://www.zhuanzhi.ai/paper/f6f0aa93aec55dee2e115f8c40147b79


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“MATCH” 可以获取《【WWW2021】大规模层次结构中的元数据感知文本分类》专知下载链接索引

专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取5000+AI主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取5000+AI主题知识资源
登录查看更多
3

相关内容

元数据(Metadata),又称元数据、中介数据、中继数据[来源请求],为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件纪录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。
专知会员服务
20+阅读 · 2021年4月15日
专知会员服务
32+阅读 · 2021年4月6日
专知会员服务
39+阅读 · 2021年4月5日
【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
【WWW2021】兴趣感知消息传递图卷积神经网络的推荐
专知会员服务
44+阅读 · 2021年2月23日
【WWW2021】挖掘双重情感的假新闻检测
专知会员服务
36+阅读 · 2021年1月18日
【WSDM2021】弱监督下的分层元数据感知文档分类
专知会员服务
10+阅读 · 2020年11月16日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
【KDD2020】图神经网络生成式预训练
专知
22+阅读 · 2020年7月3日
注意力图神经网络的多标签文本分类
专知
8+阅读 · 2020年3月28日
Arxiv
5+阅读 · 2017年11月13日
Arxiv
5+阅读 · 2017年7月23日
VIP会员
相关VIP内容
专知会员服务
20+阅读 · 2021年4月15日
专知会员服务
32+阅读 · 2021年4月6日
专知会员服务
39+阅读 · 2021年4月5日
【WWW2021】基于图层次相关性匹配信号的Ad-hoc 检索
专知会员服务
13+阅读 · 2021年2月25日
【WWW2021】兴趣感知消息传递图卷积神经网络的推荐
专知会员服务
44+阅读 · 2021年2月23日
【WWW2021】挖掘双重情感的假新闻检测
专知会员服务
36+阅读 · 2021年1月18日
【WSDM2021】弱监督下的分层元数据感知文档分类
专知会员服务
10+阅读 · 2020年11月16日
【KDD2020】自适应多通道图卷积神经网络
专知会员服务
119+阅读 · 2020年7月9日
注意力图神经网络的多标签文本分类
专知会员服务
111+阅读 · 2020年3月28日
Top
微信扫码咨询专知VIP会员