Github项目推荐 | Sentence Classification - 神经网络句子分类(陈述/疑问/感叹/祈使)

2019 年 1 月 16 日 AI研习社

项目地址:

https://github.com/lettergram/sentence-classification

(注:划线链接部分内容需要点击文末【阅读原文】方可访问)


本项目的目标是根据句子的类型对句子进行分类:

语句(陈述句)

问题(疑问句)

感叹(感叹句)

命令(祈使句)

上述每个广义句子类别都可以扩展,并且可以更加深入。 设计这些网络和脚本的方式应该可以扩展到对其他句子类型进行分类,前提是需要提供数据。

这是为Metacortex的应用程序开发的,并附有在austingwalters.com上构建实用/应用神经网络的指南。

请随意添加PR以更新,改进和自由使用!



补充材料

本项目仓库是由名为《Neural Networks to Production, From an Engineer》的指南结合创建的。

以下是指南目录:

  • 获取和格式化深度学习应用程序的数据

  • 单词嵌入和数据分割

  • 用于对句子类型进行分类的词袋(词典)

  • 利用多层感知器(MLP)对句子进行分类

  • 利用递归神经网络(LSTM)对句子进行分类

  • 用卷积神经网络对句子进行分类(CNN)

  • 句子分类的快速文本(快速文本)

  • 用于句子分类的超参数调优

数据集

通过解析出SQUAD数据集并将其与SPAADIA数据集组合来创建数据集。

数据集中的示例:

  • 命令1672

  • 声明81065

  • 问题131219

注:在这种情况下,问题只有一句话,陈述只有一句话或更多。他们能被正确分类,但不包括句子之前的问题。


结果

综上所述,我们可以得到以下准确度:

下表注:Model-模型,Accuracy-准确度,Train Speed-训练速度,Classification Speed-分类速度

经过一些超参数调整:

电脑配置

  • GTX 1080

  • 32 Gb RAM

  • 12x 3.6 Ghz内核(AMD)

  • Arch Linux,最新版本为12/16/2018

CNN超参数调整

【AI求职百题斩 - 每日一题】

赶紧来看看今天的题目吧!

想知道正确答案?

点击今日推文【第4条】或 在公众号回复“0116挑战”即可答题获取!

点击阅读原文,查看更多内容

登录查看更多
14

相关内容

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。 最近十多年来,人工神经网络的研究工作不断深入,已经取得了很大的进展,其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题,表现出了良好的智能特性。
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
【经典书】机器学习高斯过程,266页pdf
专知会员服务
195+阅读 · 2020年5月2日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
212+阅读 · 2020年4月26日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
129+阅读 · 2020年3月15日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
【新书】Python编程基础,669页pdf
专知会员服务
194+阅读 · 2019年10月10日
Github项目推荐 | PyTorch文本分类教程
AI研习社
7+阅读 · 2019年6月7日
用CNN做在NLP句子分类
数据挖掘入门与实战
7+阅读 · 2018年5月9日
实践 | 使用fasttext进行文档分类
黑龙江大学自然语言处理实验室
7+阅读 · 2018年4月29日
用神经网络训练一个文本分类器
Python开发者
3+阅读 · 2017年8月19日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
4+阅读 · 2018年9月6日
Arxiv
3+阅读 · 2018年6月1日
Arxiv
4+阅读 · 2017年10月30日
VIP会员
相关VIP内容
相关资讯
Github项目推荐 | PyTorch文本分类教程
AI研习社
7+阅读 · 2019年6月7日
用CNN做在NLP句子分类
数据挖掘入门与实战
7+阅读 · 2018年5月9日
实践 | 使用fasttext进行文档分类
黑龙江大学自然语言处理实验室
7+阅读 · 2018年4月29日
用神经网络训练一个文本分类器
Python开发者
3+阅读 · 2017年8月19日
Top
微信扫码咨询专知VIP会员