中科院自动化所智能感知与计算研究中心张羽丰、吴书等人,受到图结构数据易于建立整体关联关系的启发,提出一种基于图神经网络的归纳式文本分类方法。不再以完全顺序化的方式学习文本内容,而是将文本构建为复杂关联的图结构进行学习,为上述问题提供了解决思路。相关成果发表于顶级国际会议ACL 2020。

该工作以单词为节点、单词间的共现关系为边,将每个文档构建为拥有自身结构的图,将文本分类任务转化为图分类任务。通过应用图神经网络模型,单词可聚合学习所有关联单词的表示,同时也可捕获中长距离的上下文关系。最后使用最大池化加平均池化的方法,将所有单词聚合为该文本的表示,进而得到其分类标签。

基于图神经网络的文本分类模型示意图

该模型在多个数据集中均取得最好性能,同时适用于归纳式学习,即当文本包含较多新词的时候,也能取得不错的效果。

该项研究在自然语言处理、信息组织和管理、内容信息过滤等领域都有着广泛的应用,例如舆情监测、新闻分类、垃圾邮件过滤、个性化推荐等,也为相关领域的问题提供了新的研究思路。

成为VIP会员查看完整内容
69

相关内容

最新《图神经网络模型与应用》综述论文
专知会员服务
294+阅读 · 2020年8月2日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
156+阅读 · 2020年7月29日
基于多头注意力胶囊网络的文本分类模型
专知会员服务
78+阅读 · 2020年5月24日
注意力图神经网络的多标签文本分类
专知会员服务
112+阅读 · 2020年3月28日
一文综述经典的深度文本分类方法
AI100
12+阅读 · 2019年6月8日
一文读懂深度学习文本分类方法
AINLP
15+阅读 · 2019年6月6日
R语言自然语言处理:文本分类
R语言中文社区
7+阅读 · 2019年4月27日
图神经网络综述:方法及应用 | Deep Reading
AI100
36+阅读 · 2019年3月17日
论文浅尝 | 图神经网络综述:方法及应用
开放知识图谱
113+阅读 · 2019年2月14日
深度学习在文本分类中的应用
AI研习社
13+阅读 · 2018年1月7日
基于 word2vec 和 CNN 的文本分类 :综述 & 实践
Arxiv
29+阅读 · 2020年3月16日
Arxiv
110+阅读 · 2020年2月5日
Arxiv
4+阅读 · 2019年9月5日
Arxiv
8+阅读 · 2019年3月21日
Arxiv
10+阅读 · 2018年2月4日
VIP会员
相关资讯
一文综述经典的深度文本分类方法
AI100
12+阅读 · 2019年6月8日
一文读懂深度学习文本分类方法
AINLP
15+阅读 · 2019年6月6日
R语言自然语言处理:文本分类
R语言中文社区
7+阅读 · 2019年4月27日
图神经网络综述:方法及应用 | Deep Reading
AI100
36+阅读 · 2019年3月17日
论文浅尝 | 图神经网络综述:方法及应用
开放知识图谱
113+阅读 · 2019年2月14日
深度学习在文本分类中的应用
AI研习社
13+阅读 · 2018年1月7日
基于 word2vec 和 CNN 的文本分类 :综述 & 实践
相关论文
微信扫码咨询专知VIP会员