文本序列中各单词的重要程度以及其之间的依赖关系对于识别文本类别有重要影响.胶囊网络不能选择性关注文本中重要单词,并且由于不能编码远距离依赖关系,在识别具有语义转折的文本时有很大局限性.为解决上述问题,该文提出了一种基于多头注意力的胶囊网络模型,该模型能编码单词间的依赖关系、捕获文本中重要单词,并对文本语义编码,从而有效提高文本分类任务的效果.结果表明:该文模型在文本分类任务中效果明显优于卷积神经网络和胶囊网络,在多标签文本分类任务上效果更优,能更好地从注意力中获益。
http://kns.cnki.net/kcms/detail/11.2223.N.20200313.1714.001.html
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“ CPTC” 可以获取《基于多头注意力胶囊网络的文本分类模型 》专知下载链接索引