项目地址:
https://github.com/lettergram/sentence-classification
(注:划线链接部分内容需要点击文末【阅读原文】方可访问)
本项目的目标是根据句子的类型对句子进行分类:
语句(陈述句)
问题(疑问句)
感叹(感叹句)
命令(祈使句)
上述每个广义句子类别都可以扩展,并且可以更加深入。 设计这些网络和脚本的方式应该可以扩展到对其他句子类型进行分类,前提是需要提供数据。
这是为Metacortex的应用程序开发的,并附有在austingwalters.com上构建实用/应用神经网络的指南。
请随意添加PR以更新,改进和自由使用!
补充材料
本项目仓库是由名为《Neural Networks to Production, From an Engineer》的指南结合创建的。
以下是指南目录:
获取和格式化深度学习应用程序的数据
单词嵌入和数据分割
用于对句子类型进行分类的词袋(词典)
利用多层感知器(MLP)对句子进行分类
利用递归神经网络(LSTM)对句子进行分类
用卷积神经网络对句子进行分类(CNN)
句子分类的快速文本(快速文本)
用于句子分类的超参数调优
通过解析出SQUAD数据集并将其与SPAADIA数据集组合来创建数据集。
数据集中的示例:
命令1672
声明81065
问题131219
注:在这种情况下,问题只有一句话,陈述只有一句话或更多。他们能被正确分类,但不包括句子之前的问题。
综上所述,我们可以得到以下准确度:
下表注:Model-模型,Accuracy-准确度,Train Speed-训练速度,Classification Speed-分类速度
经过一些超参数调整:
GTX 1080
32 Gb RAM
12x 3.6 Ghz内核(AMD)
Arch Linux,最新版本为12/16/2018
【AI求职百题斩 - 每日一题】
赶紧来看看今天的题目吧!
想知道正确答案?
点击今日推文【第4条】或 在公众号回复“0116挑战”即可答题获取!