Text classification systems based on contextual embeddings are not viable options for many of the low resource languages. On the other hand, recently introduced capsule networks have shown performance in par with these text classification models. Thus, they could be considered as a viable alternative for text classification for languages that do not have pre-trained contextual embedding models. However, current capsule networks depend upon spatial patterns without considering the sequential features of the text. They are also sub-optimal in capturing the context-level information in longer sequences. This paper presents a novel Dual-State Capsule (DS-Caps) network-based technique for text classification, which is optimized to mitigate these issues. Two varieties of states, namely sentence-level and word-level, are integrated with capsule layers to capture deeper context-level information for language modeling. The dynamic routing process among capsules was also optimized using the context-level information obtained through sentence-level states. The DS-Caps networks outperform the existing capsule network architectures for multiple datasets, particularly for tasks with longer sequences of text. We also demonstrate the superiority of DS-Caps in text classification for a low resource language.


翻译:对许多低资源语言而言,基于背景嵌入的文本分类系统并不是可行的选择。另一方面,最近引进的胶囊网络显示了与这些文本分类模型相同的性能。因此,可以将它们视为对于没有经过事先培训的背景嵌入模型的语文的文本分类的一种可行的替代方法。然而,目前的胶囊网络依赖于空间模式,而没有考虑到文本的顺序特征。在以较长的顺序获取上下文级信息时,它们也是次优的。本文件展示了一种新的基于文本分类的双州胶囊(DS-Caps)网络技术(DS-Caps),这是为缓解这些问题而最优化的。两种类型的国家,即句级和字级,都与胶囊层融合在一起,以获取更深的上下文级语言建模信息。在胶囊间动态定线过程也利用通过判决级状态获得的上下文级信息加以优化。DS-Caps网络超越了现有多数据集的胶囊网络结构,特别是较长的文本序列。我们还展示了DS-Caps的优越性。

0
下载
关闭预览

相关内容

最新《Transformers模型》教程,64页ppt
专知会员服务
308+阅读 · 2020年11月26日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
95+阅读 · 2020年5月31日
Capsule Networks,胶囊网络,57页ppt,布法罗大学
专知会员服务
67+阅读 · 2020年2月29日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
CVPR2019教程《胶囊网络(Capsule Networks)综述》,附93页PPT
GAN生成式对抗网络
29+阅读 · 2019年6月21日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
胶囊网络(Capsule Network)在文本分类中的探索
PaperWeekly
13+阅读 · 2018年4月5日
Capsule Networks教程
全球人工智能
10+阅读 · 2017年11月24日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Highway Networks For Sentence Classification
哈工大SCIR
4+阅读 · 2017年9月30日
Arxiv
4+阅读 · 2019年12月2日
Arxiv
31+阅读 · 2018年11月13日
Text Classification using Capsules
Arxiv
3+阅读 · 2018年8月14日
VIP会员
相关资讯
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
CVPR2019教程《胶囊网络(Capsule Networks)综述》,附93页PPT
GAN生成式对抗网络
29+阅读 · 2019年6月21日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
胶囊网络(Capsule Network)在文本分类中的探索
PaperWeekly
13+阅读 · 2018年4月5日
Capsule Networks教程
全球人工智能
10+阅读 · 2017年11月24日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Highway Networks For Sentence Classification
哈工大SCIR
4+阅读 · 2017年9月30日
Top
微信扫码咨询专知VIP会员